JP2006185311A - Device, method and program for setting document anonymity, and document management device - Google Patents

Device, method and program for setting document anonymity, and document management device Download PDF

Info

Publication number
JP2006185311A
JP2006185311A JP2004380066A JP2004380066A JP2006185311A JP 2006185311 A JP2006185311 A JP 2006185311A JP 2004380066 A JP2004380066 A JP 2004380066A JP 2004380066 A JP2004380066 A JP 2004380066A JP 2006185311 A JP2006185311 A JP 2006185311A
Authority
JP
Japan
Prior art keywords
document
expression
anonymous
anonymization
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004380066A
Other languages
Japanese (ja)
Other versions
JP4622514B2 (en
Inventor
Susumu Akamine
享 赤峯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004380066A priority Critical patent/JP4622514B2/en
Publication of JP2006185311A publication Critical patent/JP2006185311A/en
Application granted granted Critical
Publication of JP4622514B2 publication Critical patent/JP4622514B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To dynamically adjust an anonymity setting level in setting a proper name in a document in anonymity in accordance with usage environment. <P>SOLUTION: An anonymity setting level adjusting means 21 inputs a document ID set of documents to be accessed and the condition of the usage environment of electronic documents. The anonymity setting level adjusting means 21 determines an anonymity setting level according to user's attributes and place and conditions of using methods of browsing, copying and the like. A proper name anonymity level setting means 22 determines an anonymity expression for setting a proper name in anonymity according to the anonymity setting level determined by the anonymity setting level adjusting means 21. A document outputting means 24 replaces the proper name in the document with the anonymity expression determined by the proper name anonymity setting means 22 and outputs the electronic document to be accessed. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、電子文書を匿名化する文書匿名化装置、文書匿名化方法及び文書匿名化プログラムに関し、特に、顧客と企業との間や企業内等でやり取りされる文書をデータベース化し、顧客名等の固有名を匿名化したり一般化したりできる文書匿名化装置、文書匿名化方法及び文書匿名化プログラムに関する。また、本発明は、文書匿名化装置を用いた文書管理装置、情報共有システム、文書管理方法及び情報共有方法に関する。   The present invention relates to a document anonymization device, a document anonymization method, and a document anonymization program for anonymizing an electronic document, in particular, a database of documents exchanged between a customer and a company, within a company, etc. The present invention relates to a document anonymization apparatus, a document anonymization method, and a document anonymization program that can anonymize and generalize the proper name of a document. The present invention also relates to a document management apparatus, an information sharing system, a document management method, and an information sharing method using a document anonymization apparatus.

電子文書を管理する文書管理装置を用いて、顧客と企業との間や企業内等で取り扱う電子文書を管理したり情報共有したりする場合、文書に含まれる固有名(人物名等の固有名詞)を匿名化し顧客情報等の秘密情報を保護することが考えられる。また、この種の文書管理装置では、個人名等の情報だけを参照して固有名を匿名化するのではなく、個人が所属する組織名等の個人の周辺情報も考慮して、個人名等の固有名の匿名化や一般化が行われている。   When using a document management device that manages electronic documents to manage and share information between customers and companies or within the company, proper names (proper nouns such as person names) included in the documents ) May be anonymized to protect confidential information such as customer information. In addition, this type of document management device does not anonymize the unique name by referring only to the information such as the personal name, but also considers the personal peripheral information such as the name of the organization to which the individual belongs. Anonymization and generalization of the proper name is performed.

例えば、従来の文書管理装置の一例として、特許文献1には、文書内の個人を特定するような表現を匿名化できる文書匿名化装置が記載されている。特許文献1に記載された文書管理装置は、入力文書から抽出した匿名対象表記がどの程度の強さで個人を特定できるかを評価する特定度計算部と、所定の閾値より大きい特定度を持つ入力文書中の表記を匿名化する匿名化処理部とを備える。   For example, as an example of a conventional document management apparatus, Patent Document 1 describes a document anonymization apparatus that can anonymize an expression that identifies an individual in a document. The document management apparatus described in Patent Literature 1 has a degree of specificity that evaluates how strong an anonymous target notation extracted from an input document can identify an individual, and a degree of specificity that is greater than a predetermined threshold An anonymization processing unit for anonymizing the notation in the input document.

特許文献1に記載された文書管理装置は、入力文書から人名と周辺表記とを抽出し、抽出した人名と周辺表記とがどの程度の強さで個人を特定できるかを評価する特定度を算出する。そして、文書管理装置は、所定の閾値よりも大きい特定度をもつ人名と周辺表記とを、伏せ字化や一般化、低特定度化、暗号化等を行うことによって匿名化する。そのようにすることによって、「○○首相」等の公の人物の人名や、「△△情報研究所のA所長」等の人名を匿名化するか否かの判断を行うことができる。   The document management apparatus described in Patent Document 1 extracts a person name and a surrounding notation from an input document, and calculates a degree of specificity for evaluating how strong the extracted person name and the surrounding notation can identify an individual. To do. Then, the document management apparatus anonymizes a person name having a degree of specificity greater than a predetermined threshold and a peripheral notation by performing obfuscation, generalization, lower degree of specificity, encryption, and the like. By doing so, it is possible to determine whether or not to anonymize the name of a public person such as “Prime Minister XX” or the name of a person such as “Director-General A of the Information Research Laboratory”.

また、例えば、特許文献2には、文書中の固有名を抽出して、固有名を自動的に伏せ字化できる文書伏字加工装置が記載されている。   For example, Patent Document 2 describes a document script processing apparatus that can extract a unique name in a document and automatically convert the unique name into a hidden character.

特開2002−269081号公報(段落0033−0059、図2−3)JP 2002-269081 A (paragraphs 0033-0059, FIG. 2-3) 特開2002−259363号公報(段落0010−0018、図1−2)JP 2002-259363 A (paragraphs 0010-0018, FIG. 1-2)

特許文献1に記載された従来の文書管理装置を用いれば、文書中の個人名や周辺表記が個人情報として保護すべき情報であるか、公的な人物名等のように保護の必要がない情報であるかを判断して匿名化できる。また、特許文献2に記載された文書管理装置を用いれば、文書中の固有名を自動的に伏せ字化できる。しかし、特許文献1や特許文献2に記載された従来の文書管理装置では、匿名化した文書を再利用することが考慮されておらず、利用環境に応じて、文書中の固有名の匿名化レベルを調整することができない。   If the conventional document management apparatus described in Patent Document 1 is used, the personal name and peripheral notation in the document should be protected as personal information, or there is no need for protection such as a public person name. It can be anonymized by judging whether it is information. Further, if the document management apparatus described in Patent Document 2 is used, the proper name in the document can be automatically converted into a hidden character. However, in the conventional document management apparatuses described in Patent Document 1 and Patent Document 2, it is not considered to reuse an anonymized document, and anonymization of a proper name in a document is performed according to the use environment. The level cannot be adjusted.

例えば、(a)「その文書を処理する特定の部門や特定の部屋では、伏せ字化する前の元の情報のまま扱うこととする」、(b)「社内の情報共用の場合、「△△研究所のA部長」等の個人の特定はできないが部門名等を特定できる情報として保存する」、(c)「外部に公開する場合、「Aさん」等の個人も部門名等も特定できない情報として保存する」等、文書を利用する環境や文書を共有する範囲に合わせて、動的に匿名表現を変更することはできない。   For example, (a) “In a specific department or a specific room that processes the document, the original information before being turned over is handled as it is”, (b) “in-house information sharing,“ △△ ” Individuals such as "A department manager" cannot be specified, but they are stored as information that can specify the department name, etc. ", (c)" When disclosed to the outside, the individual such as "Mr. A" cannot be specified. The anonymous expression cannot be dynamically changed in accordance with the environment in which the document is used or the range in which the document is shared, such as “save as information”.

また、特許文献1や特許文献2に記載された従来の文書管理装置では、複数の文書を扱う場合に、同一の人物の人物名を必ず同一の名称で伏せ字化/一般化したり、異なる人物の人物名を必ず異なる名称で伏せ字化/一般化したりすることを保証できない。例えば、特許文献1や特許文献2に記載された文書管理装置を用いて文書Aと文書Bとを匿名化した場合、文書Aに出現する匿名「Aさん」と文書Bに出現する匿名「Aさん」とが同一の人物を表しているのか、異なる人物を表しているのか分からない。   In addition, in the conventional document management apparatus described in Patent Document 1 or Patent Document 2, when handling a plurality of documents, the same person's person name is always converted to the same name, or the person name is different. It cannot be guaranteed that a person's name will always be hidden / generalized with a different name. For example, when the document A and the document B are anonymized using the document management apparatus described in Patent Document 1 or Patent Document 2, an anonymous “A” who appears in the document A and an anonymous “A” that appears in the document B I do n’t know if “san” represents the same person or a different person.

そこで、本発明は、上記課題を解決するためになされたものであって、文書アクセス環境に従って、匿名化のレベルを動的に調整できる文書匿名化装置、文書管理装置、情報共有システム、文書匿名化方法、文書管理方法、情報共有方法及び文書匿名化プログラムを提供することを目的とする。また、本発明は、参照対象の複数の文書間で、同一の対象を同じ匿名表現で表し、異なる対象を異なる匿名表現で表すことが可能な文書匿名化装置、文書管理装置、情報共有システム、文書匿名化方法、文書管理方法、情報共有方法及び文書匿名化プログラムを提供することを目的とする。   Accordingly, the present invention has been made to solve the above-described problem, and a document anonymization device, a document management device, an information sharing system, and a document anonymity that can dynamically adjust the level of anonymization according to a document access environment. An object of the present invention is to provide a conversion method, a document management method, an information sharing method, and a document anonymization program. Further, the present invention provides a document anonymization device, a document management device, an information sharing system, which can represent the same target with the same anonymous expression and a different target with a different anonymous expression among a plurality of documents to be referred to. An object is to provide a document anonymization method, a document management method, an information sharing method, and a document anonymization program.

本発明による文書匿名化装置は、電子文書を匿名化する文書匿名化装置であって、電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定する匿名化レベル決定手段(例えば、匿名化レベル調整手段21によって実現される)と、匿名化レベル決定手段が決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定する匿名表現決定手段(例えば、固有名匿名化手段22によって実現される)と、処理対象の電子文書中の固有名詞を、匿名表現決定手段が決定した匿名表現に置き換える文書変換手段(例えば、文書出力手段24によって実現される)とを備えたことを特徴とする。   The document anonymization device according to the present invention is a document anonymization device for anonymizing an electronic document, and anonymization indicating the degree of anonymization of an electronic document based on usage environment information indicating a usage environment for using the electronic document Anonymization level determination means for determining the level (for example, realized by anonymization level adjustment means 21) and anonymization level determined by the anonymization level determination means anonymize proper nouns in the electronic document to be processed Anonymous expression determination means (for example, realized by the proper name anonymization means 22) for determining the anonymous expression to be used, and the proper noun in the electronic document to be processed are replaced with the anonymous expression determined by the anonymous expression determination means Document conversion means (for example, realized by the document output means 24) is provided.

また、文書匿名化装置は、予め利用環境情報と匿名化レベルとを対応付けて記憶する匿名化レベル記憶手段(例えば、利用環境データベース11と、ユーザが電子文書を利用する利用環境の条件を入力する利用条件入力手段(例えば、匿名化レベル調整手段21によって実現される)とを備え、匿名化レベル決定手段は、匿名化レベル記憶手段が記憶する利用環境情報のうち、利用条件入力手段が入力した利用環境の条件に合致する利用環境情報があるか否かを判断し、利用環境の条件に合致する利用環境情報があると判断すると、利用環境の条件に合致する利用環境情報に対応する匿名化レベルを匿名化レベル記憶手段から抽出するものであってもよい。そのような構成によれば、ユーザが電子文書を利用する利用環境の条件に適合する匿名化レベルを容易に決定することができる。   Further, the document anonymization apparatus inputs an anonymization level storage unit (for example, a usage environment database 11 and a usage environment condition for a user to use an electronic document) that stores usage environment information and anonymization level in association with each other. Use condition input means (for example, realized by the anonymization level adjustment means 21), and the anonymization level determination means inputs the use condition input means among the use environment information stored in the anonymization level storage means. If there is usage environment information that matches the usage environment conditions, and if there is usage environment information that matches the usage environment conditions, anonymity corresponding to the usage environment information that matches the usage environment conditions According to such a configuration, a concealment level that conforms to the conditions of the usage environment in which the user uses the electronic document may be used. It can readily determine the levels.

また、匿名化レベル記憶手段は、電子文書へのアクセス権限の有無、電子文書の利用場所又は電子文書の利用方法の情報を、利用環境情報として匿名化レベルに対応付けて記憶し、利用条件入力手段は、利用環境の条件として、ユーザのアクセス権限の有無、ユーザが電子文書を利用する場所、又はユーザが電子文書を利用する方法を入力し、匿名化レベル決定手段は、匿名化レベル記憶手段が記憶するアクセス権限の有無、利用場所又は利用方法の情報と、利用条件入力手段が入力したアクセス権限の有無、利用する場所又は利用する方法とが合致するか否かを判断するものであってもよい。そのような構成によれば、ユーザのアクセス権限の有無や、ユーザが電子文書を利用する場所、利用する方法に適合する匿名化レベルを容易に決定することができる。   The anonymization level storage means stores information on presence / absence of access authority to the electronic document, usage location of the electronic document or usage method of the electronic document in association with the anonymization level as usage environment information, and input usage conditions The means inputs the presence / absence of the user's access authority, the location where the user uses the electronic document, or the method where the user uses the electronic document as the conditions of the usage environment, and the anonymization level determination means is the anonymization level storage means Is used to determine whether the access authority information, usage location or usage method information matches the access authority input, usage location or usage method entered by the usage condition input means. Also good. According to such a configuration, it is possible to easily determine the presence / absence of the user's access authority, the place where the user uses the electronic document, and the anonymization level suitable for the method used.

また、文書匿名化装置は、予め匿名表現を固有名詞に対応付けて記憶する匿名表現記憶手段(例えば、固有名属性データベース14によって実現される)を備え、匿名表現決定手段は、処理対象の電子文書に含まれる固有名詞を特定し、特定した固有名詞に対応する匿名表現を匿名表現記憶手段から抽出するものであってもよい。そのような構成によれば、特定した固有名詞を匿名化するための匿名表現を容易に決定することができる。   Further, the document anonymization apparatus includes an anonymous expression storage unit (for example, realized by the proper name attribute database 14) that stores an anonymous expression in association with a proper noun in advance, and the anonymous expression determination unit is an electronic device to be processed. A proper noun included in the document may be specified, and an anonymous expression corresponding to the specified proper noun may be extracted from the anonymous expression storage unit. According to such a configuration, an anonymous expression for anonymizing the specified proper noun can be easily determined.

また、匿名表現記憶手段は、匿名化レベル毎の匿名表現を固有名詞に対応付けて予め記憶し、匿名表現決定手段は、匿名化レベル決定手段が決定した匿名化レベルに対応する匿名表現を匿名表現記憶手段から抽出するものであってもよい。そのような構成によれば、匿名化レベルに適合した匿名表現を容易に決定することができる。   The anonymity expression storage means stores the anonymity expression for each anonymization level in advance in association with the proper noun, and the anonymity expression determination means anonymizes the anonymity expression corresponding to the anonymization level determined by the anonymization level determination means. It may be extracted from the expression storage means. According to such a configuration, an anonymous expression suitable for the anonymization level can be easily determined.

また、文書匿名化装置は、匿名表現決定手段が処理対象の電子文書中の固有名詞に対する匿名表現を決定すると、匿名化の度合を評価するための所定の評価情報(例えば、実世間評価情報)にもとづいて、決定した匿名表現の匿名化レベルが実社会における匿名化の度合に合致しているか否かを評価する匿名表現評価手段(例えば、固有名匿名化手段22によって実現される)を備えたものであってもよい。そのような構成によれば、決定した匿名表現の匿名化レベルが実社会の実際の匿名化のレベルに合致するか否かを評価することができる。   Further, the document anonymization apparatus, when the anonymous expression determination means determines an anonymous expression for the proper noun in the electronic document to be processed, predetermined evaluation information for evaluating the degree of anonymization (for example, real-world evaluation information) And anonymity expression evaluation means (e.g., realized by the proper name anonymization means 22) for evaluating whether or not the anonymization level of the determined anonymous expression matches the degree of anonymization in the real world. It may be a thing. According to such a configuration, it is possible to evaluate whether or not the determined anonymization level of the anonymous expression matches the actual anonymization level of the real world.

また、文書匿名化装置は、匿名表現決定手段が決定した匿名表現を所定の条件に従って変更する匿名表現変更手段(例えば、表現区別手段23によって実現される)を備え、匿名表現変更手段は、匿名表現決定手段が決定した複数の匿名表現のうち、異なる表現であって同じ固有名詞を示す匿名表現が存在するか否かを判断し、異なる表現であって同じ固有名詞を示す匿名表現が存在すると判断すると、異なる表現であって同じ固有名詞を示す各匿名表現を同じ表現に変更し、匿名表現決定手段が決定した複数の匿名表現のうち、同じ表現であって異なる固有名詞を示す匿名表現が存在するか否かを判断し、同じ表現であって異なる固有名詞を示す匿名表現が存在すると判断すると、同じ表現であって異なる固有名詞を示す各匿名表現を異なる表現に変更し、文書変換手段は、処理対象の電子文書中の固有名詞を、匿名表現変更手段が変更した匿名表現に置き換えるものであってもよい。そのような構成によれば、複数の文書間で同一の固有名に対して同一の匿名表現を選択して匿名化し、異なる固有名に対して異なる匿名表現を選択して匿名化する。従って、参照対象の複数の文書間で、同一の対象を同じ匿名表現で表し、異なる対象を異なる匿名表現で表すことができる。また、匿名化によって複数の文書間の対応関係が損なわれないように、匿名化した電子文書を出力することができる。   Further, the document anonymization device includes an anonymous expression changing means (for example, realized by the expression distinguishing means 23) for changing the anonymous expression determined by the anonymous expression determining means according to a predetermined condition, and the anonymous expression changing means is anonymous. Among the plurality of anonymous expressions determined by the expression determining means, it is determined whether there is an anonymous expression that is a different expression and indicates the same proper noun, and there is an anonymous expression that is a different expression and indicates the same proper noun. If it is determined, each anonymous expression indicating the same proper noun is changed to the same expression with different expressions, and among the plurality of anonymous expressions determined by the anonymous expression determining means, an anonymous expression indicating the same proper expression and different proper nouns is obtained. If there is an anonymous expression indicating the same expression and different proper nouns, the anonymous expression indicating the same expression and different proper nouns is different. Change in expression, the document conversion means, a proper noun in the electronic document to be processed, or may be replaced with an anonymous representation changed anonymous expression changing means. According to such a configuration, the same anonymous expression is selected and anonymized for the same unique name among a plurality of documents, and different anonymous expressions are selected and anonymized for different unique names. Therefore, the same object can be represented by the same anonymous expression and different objects can be represented by different anonymous expressions among the plurality of documents to be referred to. In addition, an anonymized electronic document can be output so that the correspondence between a plurality of documents is not impaired by anonymization.

本発明による文書管理装置は、電子文書を蓄積し管理する文書管理装置であって、電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定する匿名化レベル決定手段と、匿名化レベル決定手段が決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定する匿名表現決定手段と、処理対象の電子文書中の固有名詞を、匿名表現決定手段が決定した匿名表現に置き換える文書変換手段とを備えたことを特徴とする。   A document management apparatus according to the present invention is a document management apparatus for accumulating and managing electronic documents, and an anonymization level indicating a degree of anonymizing an electronic document based on usage environment information indicating a usage environment in which the electronic document is used Anonymization level determination means for determining anonymity expression determination means for determining anonymity expression for anonymizing proper nouns in the electronic document to be processed according to the anonymization level determined by the anonymization level determination means, and processing Document conversion means for replacing the proper noun in the target electronic document with the anonymous expression determined by the anonymous expression determination means is provided.

また、文書管理装置は、電子文書を複数蓄積する文書蓄積手段(例えば、文書データベース12によって実現される)と、処理対象の電子文書を文書蓄積手段から抽出する文書抽出手段(例えば、固有名匿名化手段22によって実現される)とを備え、文書変換手段は、文書抽出手段が抽出した電子文書中の固有名詞を匿名表現に置き換えて電子文書を出力するものであってもよい。   The document management apparatus also includes a document storage unit (for example, realized by the document database 12) that stores a plurality of electronic documents, and a document extraction unit (for example, anonymized name) that extracts a processing target electronic document from the document storage unit. The document conversion means may output the electronic document by replacing the proper noun in the electronic document extracted by the document extraction means with an anonymous expression.

また、文書管理装置は、匿名表現決定手段が処理対象の電子文書中の固有名詞に対する匿名表現を決定すると、匿名化の度合を評価するための所定の評価情報にもとづいて、決定した匿名表現の匿名化レベルが実社会における匿名化の度合に合致しているか否かを評価する匿名表現評価手段を備えたものであってもよい。そのような構成によれば、決定した匿名表現の匿名化レベルが実社会の実際の匿名化のレベルに合致するか否かを評価することができる。   Further, when the anonymous expression determining means determines the anonymous expression for the proper noun in the electronic document to be processed, the document management apparatus determines the anonymous expression determined based on the predetermined evaluation information for evaluating the degree of anonymization. Anonymity level evaluation means for evaluating whether or not the anonymization level matches the degree of anonymization in the real world may be provided. According to such a configuration, it is possible to evaluate whether or not the determined anonymization level of the anonymous expression matches the actual anonymization level of the real world.

また、文書管理装置は、匿名表現決定手段が決定した匿名表現を所定の条件に従って変更する匿名表現変更手段を備え、匿名表現変更手段は、匿名表現決定手段が決定した複数の匿名表現のうち、異なる表現であって同じ固有名詞を示す匿名表現が存在するか否かを判断し、異なる表現であって同じ固有名詞を示す匿名表現が存在すると判断すると、異なる表現であって同じ固有名詞を示す各匿名表現を同じ表現に変更し、匿名表現決定手段が決定した複数の匿名表現のうち、同じ表現であって異なる固有名詞を示す匿名表現が存在するか否かを判断し、同じ表現であって異なる固有名詞を示す匿名表現が存在すると判断すると、同じ表現であって異なる固有名詞を示す各匿名表現を異なる表現に変更し、文書変換手段は、処理対象の電子文書中の固有名詞を、匿名表現変更手段が変更した匿名表現に置き換えるものであってもよい。そのような構成によれば、複数の文書間で同一の固有名に対して同一の匿名表現を選択して匿名化し、異なる固有名に対して異なる匿名表現を選択して匿名化する。従って、参照対象の複数の文書間で、同一の対象を同じ匿名表現で表し、異なる対象を異なる匿名表現で表すことができる。   Further, the document management device includes an anonymous expression changing means for changing the anonymous expression determined by the anonymous expression determining means according to a predetermined condition, and the anonymous expression changing means is a plurality of anonymous expressions determined by the anonymous expression determining means, Judge whether there is an anonymous expression with different expressions and indicating the same proper noun, and if it is determined that there is an anonymous expression with different expressions and indicating the same proper noun, it will show the same proper noun with different expressions Each anonymous expression is changed to the same expression, and it is determined whether or not there is an anonymous expression that is the same expression and indicates a different proper noun among a plurality of anonymous expressions determined by the anonymous expression determination means. If there is an anonymous expression indicating a different proper noun, each anonymous expression indicating the same specific but different proper noun is changed to a different expression, and the document conversion means converts the electronic sentence to be processed. Proper nouns in, or may be replaced with an anonymous representation changed anonymous expression changing means. According to such a configuration, the same anonymous expression is selected and anonymized for the same unique name among a plurality of documents, and different anonymous expressions are selected and anonymized for different unique names. Therefore, the same object can be represented by the same anonymous expression and different objects can be represented by different anonymous expressions among the plurality of documents to be referred to.

本発明による情報共有システムは、電子文書を共有するための情報共有システムであって、ユーザ端末と、電子文書を蓄積し管理する文書管理装置とを備え、ユーザ端末は、処理対象の電子文書の抽出要求を、ネットワークを介して文書管理装置に送信し、文書管理装置は、電子文書を複数蓄積する文書蓄積手段と、ユーザ端末から要求された電子文書を文書蓄積手段から抽出する文書抽出手段と、電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定する匿名化レベル決定手段と、匿名化レベル決定手段が決定した匿名化レベルに従って、電子文書中の固有名詞を匿名化するための匿名表現を決定する匿名表現決定手段と、文書抽出手段が抽出した電子文書中の固有名詞を、匿名表現決定手段が決定した匿名表現に置き換える文書変換手段と、文書変換手段が固有名詞を匿名表現に置き換えた電子文書を、ネットワークを介してユーザ端末に送信する文書送信手段(例えば、文書管理サーバ2AのCPU及びネットワークインタフェース部によって実現される)とを含むことを特徴とする。   An information sharing system according to the present invention is an information sharing system for sharing an electronic document, and includes a user terminal and a document management device that stores and manages the electronic document. An extraction request is transmitted to a document management apparatus via a network. The document management apparatus stores a plurality of electronic documents, a document storage unit that extracts electronic documents requested from a user terminal from the document storage unit, and Anonymization level determination means for determining anonymization level indicating the degree of anonymization of the electronic document based on usage environment information indicating the usage environment for using the electronic document, and anonymization level determined by the anonymization level determination means In accordance with the anonymity expression determination means for determining the anonymous expression for anonymizing the proper noun in the electronic document, and the proper noun in the electronic document extracted by the document extraction means, Document converting means for replacing the anonymous expression determined by the name expression determining means, and document transmitting means for transmitting the electronic document in which the proper noun is replaced with the anonymous expression to the user terminal via the network (for example, a document management server) 2A CPU and a network interface unit).

本発明による文書匿名化方法は、電子文書を匿名化する文書匿名化方法であって、電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定するステップと、決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定するステップと、処理対象の電子文書中の固有名詞を、決定した匿名表現に置き換えるステップとを含むことを特徴とする。   The document anonymization method according to the present invention is a document anonymization method for anonymizing an electronic document, and anonymization indicating the degree of anonymization of an electronic document based on usage environment information indicating a usage environment for using the electronic document A step of determining a level, a step of determining an anonymous expression for anonymizing the proper noun in the electronic document to be processed according to the determined anonymization level, and a proper noun in the electronic document to be processed are determined And a step of replacing it with an anonymous expression.

本発明による文書管理方法は、電子文書を蓄積し管理する文書管理方法であって、電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定するステップと、決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定するステップと、処理対象の電子文書中の固有名詞を、決定した匿名表現に置き換えて電子文書を出力するステップとを含むことを特徴とする。   A document management method according to the present invention is a document management method for accumulating and managing electronic documents, and an anonymization level indicating a degree of anonymizing an electronic document based on usage environment information indicating a usage environment in which the electronic document is used Determining anonymity expression for anonymizing the proper noun in the processing target electronic document according to the determined anonymization level, and determining the proper noun in the processing target electronic document. And a step of outputting an electronic document by replacing it with an expression.

また、文書管理方法は、処理対象の電子文書中の固有名詞に対する匿名表現を決定すると、匿名化の度合を評価するための所定の評価情報にもとづいて、決定した匿名表現の匿名化レベルが実社会における匿名化の度合に合致しているか否かを評価するステップを含むものであってもよい。そのような構成によれば、決定した匿名表現の匿名化レベルが実社会の実際の匿名化のレベルに合致するか否かを評価することができる。   In addition, when the document management method determines the anonymous expression for the proper noun in the electronic document to be processed, the anonymization level of the determined anonymous expression is based on predetermined evaluation information for evaluating the degree of anonymization. It may include a step of evaluating whether or not it matches the degree of anonymization. According to such a configuration, it is possible to evaluate whether or not the determined anonymization level of the anonymous expression matches the actual anonymization level of the real world.

また、文書管理方法は、決定した複数の匿名表現のうち、異なる表現であって同じ固有名詞を示す匿名表現が存在するか否かを判断するステップと、異なる表現であって同じ固有名詞を示す匿名表現が存在すると判断すると、異なる表現であって同じ固有名詞を示す各匿名表現を同じ表現に変更するステップと、処理対象の電子文書中の固有名詞を、変更した匿名表現に置き換えるステップとを含むものであってもよい。そのような構成によれば、複数の文書間で同一の固有名に対して同一の匿名表現を選択して匿名化する。従って、参照対象の複数の文書間で、同一の対象を同じ匿名表現で表すことができる。   In addition, the document management method includes a step of determining whether or not there is an anonymous expression indicating the same proper noun among different determined anonymous expressions, and a different expression indicating the same proper noun. If it is determined that an anonymous expression exists, a step of changing each anonymous expression that is a different expression and indicating the same proper noun to the same expression, and a step of replacing the proper noun in the electronic document to be processed with the changed anonymous expression It may be included. According to such a configuration, the same anonymous expression is selected and anonymized with respect to the same proper name among a plurality of documents. Therefore, the same object can be expressed by the same anonymous expression among a plurality of documents to be referenced.

また、文書管理方法は、決定した複数の匿名表現のうち、同じ表現であって異なる固有名詞を示す匿名表現が存在するか否かを判断するステップと、同じ表現であって異なる固有名詞を示す匿名表現が存在すると判断すると、同じ表現であって異なる固有名詞を示す各匿名表現を異なる表現に変更するステップと、処理対象の電子文書中の固有名詞を、変更した匿名表現に置き換えるステップとを含むものであってもよい。そのような構成によれば、複数の文書間で異なる固有名に対して異なる匿名表現を選択して匿名化する。従って、参照対象の複数の文書間で、異なる対象を異なる匿名表現で表すことができる。   In addition, the document management method includes a step of determining whether or not there is an anonymous expression that indicates the same proper expression and a different proper noun among the plurality of determined anonymous expressions, and indicates a proper proper noun that is the same expression. If it is determined that an anonymous expression exists, the steps of changing each anonymous expression indicating the same proper and different proper noun to a different expression and replacing the proper noun in the electronic document to be processed with the changed anonymous expression. It may be included. According to such a configuration, different anonymous expressions are selected for anonymity different among a plurality of documents and anonymized. Therefore, different objects can be represented by different anonymous expressions among a plurality of documents to be referenced.

本発明による情報共有方法は、電子文書を共有するための情報共有方法であって、電子文書を蓄積し管理する文書管理装置が、電子文書を予め複数蓄積するステップと、ユーザ端末が、処理対象の電子文書の抽出要求を、ネットワークを介して文書管理装置に送信するステップと、文書管理装置が、ユーザ端末から要求された電子文書を抽出するステップと、文書管理装置が、電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定するステップと、文書管理装置が、決定した匿名化レベルに従って、電子文書中の固有名詞を匿名化するための匿名表現を決定するステップと、文書管理装置が、抽出した電子文書中の固有名詞を、決定した匿名表現に置き換えるステップと、文書管理装置が、固有名詞を匿名表現に置き換えた電子文書を、ネットワークを介してユーザ端末に送信するステップとを含むことを特徴とする。   An information sharing method according to the present invention is an information sharing method for sharing an electronic document, in which a document management apparatus that stores and manages electronic documents stores a plurality of electronic documents in advance, and a user terminal that performs processing Transmitting the electronic document extraction request to the document management apparatus via the network, the document management apparatus extracting the electronic document requested from the user terminal, and the document management apparatus using the electronic document. A step of determining an anonymization level indicating the degree of anonymization of an electronic document based on usage environment information indicating a usage environment, and a document management device anonymizing proper nouns in the electronic document according to the determined anonymization level Determining an anonymous expression to be performed, replacing the proper noun in the extracted electronic document with the determined anonymous expression by the document management device, and a document Management device, an electronic document replacing proper names anonymous representation, characterized in that it comprises the steps of transmitting to the user terminal via the network.

本発明による文書匿名化プログラムは、電子文書を匿名化するための文書匿名化プログラムであって、コンピュータに、電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定する処理と、決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定する処理と、処理対象の電子文書中の固有名詞を、決定した匿名表現に置き換える処理とを実行させることを特徴とする。   A document anonymization program according to the present invention is a document anonymization program for anonymizing an electronic document, and anonymizes the electronic document based on usage environment information indicating a usage environment in which the electronic document is used. A process for determining the anonymization level indicating the degree, a process for determining an anonymous expression for anonymizing the proper noun in the electronic document to be processed according to the determined anonymization level, and a uniqueness in the electronic document to be processed And processing for replacing the noun with the determined anonymous expression.

また、文書匿名化プログラムは、コンピュータに、処理対象の電子文書中の固有名詞に対する匿名表現を決定すると、匿名化の度合を評価するための所定の評価情報にもとづいて、決定した匿名表現の匿名化レベルが実社会における匿名化の度合に合致しているか否かを評価する処理を実行させるものであってもよい。そのような構成によれば、決定した匿名表現の匿名化レベルが実社会の実際の匿名化のレベルに合致するか否かを評価することができる。   Further, when the document anonymization program determines an anonymous expression for the proper noun in the electronic document to be processed in the computer, the anonymity of the determined anonymous expression is determined based on predetermined evaluation information for evaluating the degree of anonymization. You may perform the process which evaluates whether the conversion level is in agreement with the degree of anonymization in the real world. According to such a configuration, it is possible to evaluate whether or not the determined anonymization level of the anonymous expression matches the actual anonymization level of the real world.

また、文書匿名化プログラムは、コンピュータに、決定した複数の匿名表現のうち、異なる表現であって同じ固有名詞を示す匿名表現が存在するか否かを判断する処理と、異なる表現であって同じ固有名詞を示す匿名表現が存在すると判断すると、異なる表現であって同じ固有名詞を示す各匿名表現を同じ表現に変更する処理と、処理対象の電子文書中の固有名詞を、変更した匿名表現に置き換える処理とを実行させるものであってもよい。そのような構成によれば、複数の文書間で同一の固有名に対して同一の匿名表現を選択して匿名化する。従って、参照対象の複数の文書間で、同一の対象を同じ匿名表現で表すことができる。   In addition, the document anonymization program is the same as the processing for determining whether or not there is an anonymous expression indicating the same proper noun among different determined anonymous expressions in the computer. If it is determined that there is an anonymous expression indicating a proper noun, the process of changing each anonymous expression indicating the same proper noun to the same expression that is a different expression and the proper noun in the electronic document to be processed into the changed anonymous expression The replacement process may be executed. According to such a configuration, the same anonymous expression is selected and anonymized with respect to the same proper name among a plurality of documents. Therefore, the same object can be expressed by the same anonymous expression among a plurality of documents to be referenced.

また、文書匿名化プログラムは、コンピュータに、決定した複数の匿名表現のうち、同じ表現であって異なる固有名詞を示す匿名表現が存在するか否かを判断する処理と、同じ表現であって異なる固有名詞を示す匿名表現が存在すると判断すると、同じ表現であって異なる固有名詞を示す各匿名表現を異なる表現に変更する処理と、処理対象の電子文書中の固有名詞を、変更した匿名表現に置き換える処理とを実行させるものであってもよい。そのような構成によれば、複数の文書間で異なる固有名に対して異なる匿名表現を選択して匿名化する。従って、参照対象の複数の文書間で、異なる対象を異なる匿名表現で表すことができる。   Further, the document anonymization program is the same expression and different from the process of determining whether or not there is an anonymous expression indicating the same proper and different proper nouns among a plurality of determined anonymous expressions on the computer. If it is determined that there is an anonymous expression indicating a proper noun, the process of changing each anonymous expression indicating the same specific and different proper noun to a different expression and the proper noun in the electronic document to be processed are changed to the changed anonymous expression. The replacement process may be executed. According to such a configuration, different anonymous expressions are selected for anonymity different among a plurality of documents and anonymized. Therefore, different objects can be represented by different anonymous expressions among a plurality of documents to be referenced.

本発明によれば、ユーザの利用環境に合わせて、匿名化レベルを柔軟に調整した文書を出力できる。従って、文書アクセス環境に従って、匿名化のレベルを動的に調整できるようにすることができる。また、情報漏洩のリスクが少なく、可読性の高い文書を出力できるようにすることができる。   ADVANTAGE OF THE INVENTION According to this invention, the document which adjusted the anonymization level flexibly according to a user's utilization environment can be output. Therefore, the anonymization level can be dynamically adjusted according to the document access environment. In addition, it is possible to output a highly readable document with little risk of information leakage.

実施の形態1.
以下、本発明の第1の実施の形態を図面を参照して説明する。図1は、本発明による文書匿名化装置を用いた文書管理装置の構成の一例を示すブロック図である。図1に示すように、文書管理装置は、各種情報を記憶する記憶装置1と、プログラム制御により動作するデータ処理装置2とを含む。なお、文書管理装置は、具体的には、ワークステーションやパーソナルコンピュータ等の情報処理装置、及び磁気ディスク装置等のデータベース装置によって実現される。
Embodiment 1 FIG.
Hereinafter, a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an example of a configuration of a document management apparatus using a document anonymization apparatus according to the present invention. As shown in FIG. 1, the document management apparatus includes a storage device 1 that stores various information and a data processing device 2 that operates under program control. The document management device is specifically realized by an information processing device such as a workstation or a personal computer, and a database device such as a magnetic disk device.

本実施の形態において、文書管理装置は、各種電子文書を蓄積する。そして、文書管理装置は、ユーザの要求に従って電子文書を抽出し出力する。また、文書管理装置は、例えば、電子文書を関係部門で共有するための情報共有システムに適用される。例えば、顧客からの電子メールや電話を受け付けるコンタクトセンタやコールセンタにおいて、情報共有システムは、顧客からの電子メールや顧客から受け付けたアンケート結果、掲示板の書き込み情報等の電子文書を蓄積し情報共有する。この場合、情報共有システムにおいて、例えば、文書管理装置は、ユーザ端末からの要求に従って蓄積する電子文書を抽出し、抽出した電子文書をネットワークを介してユーザ端末に送信する。   In the present embodiment, the document management apparatus stores various electronic documents. Then, the document management apparatus extracts and outputs an electronic document according to a user request. The document management apparatus is applied to, for example, an information sharing system for sharing electronic documents with related departments. For example, in a contact center or call center that accepts e-mails and telephone calls from customers, the information sharing system accumulates and shares information such as e-mails from customers, questionnaire results received from customers, and information written on bulletin boards. In this case, in the information sharing system, for example, the document management apparatus extracts an electronic document to be stored according to a request from the user terminal, and transmits the extracted electronic document to the user terminal via the network.

記憶装置1は、具体的には、磁気ディスク装置等のデータベース装置によって実現される。図1に示すように、記憶装置1は、利用環境データベース11と、文書データベース12と、固有名出現位置データベース13と、固有名属性データベース14と、実世間情報データベース15とを含む。   Specifically, the storage device 1 is realized by a database device such as a magnetic disk device. As shown in FIG. 1, the storage device 1 includes a usage environment database 11, a document database 12, a proper name appearance position database 13, a proper name attribute database 14, and a real world information database 15.

利用環境データベース11は、電子文書を利用する利用環境を示す利用環境情報を予め記憶する。本実施の形態では、利用環境データベース11は、利用環境情報として、ユーザが個人情報にアクセスできる権限を有する否かを示す属性情報(以下、固有名アクセス属性ともいう)、電子文書の利用場所(例えば、社内や社外)及び利用方法(例えば、閲覧やコピー)の情報を記憶する。また、利用環境データベース11は、電子文書を匿名化する場合の匿名化の度合を示す匿名化レベルを予め記憶する。本実施の形態では、利用環境データベース11は、利用環境情報と匿名化レベルとを対応付けて予め記憶する。   The usage environment database 11 stores in advance usage environment information indicating a usage environment in which an electronic document is used. In the present embodiment, the usage environment database 11 includes, as usage environment information, attribute information indicating whether the user has the authority to access personal information (hereinafter also referred to as a unique name access attribute), a usage location of an electronic document ( For example, information on the inside and outside) and usage methods (for example, browsing and copying) are stored. In addition, the usage environment database 11 stores in advance an anonymization level indicating the degree of anonymization when an electronic document is anonymized. In the present embodiment, the usage environment database 11 stores the usage environment information and the anonymization level in association with each other in advance.

文書データベース12は、電子文書を複数蓄積する。例えば、文書データベース12は、顧客からの電子メールや、顧客から受け付けたアンケート結果、掲示板の書き込み情報等の電子文書を複数蓄積する。本実施の形態では、文書データベース12は、電子文書を識別するための文書ID(例えば、文書のファイル名や所定の識別番号)と、オリジナルの電子文書とを対応付けて記憶している。   The document database 12 stores a plurality of electronic documents. For example, the document database 12 stores a plurality of electronic documents such as e-mails from customers, questionnaire results received from customers, and information written on bulletin boards. In the present embodiment, the document database 12 stores a document ID (for example, a document file name or a predetermined identification number) for identifying an electronic document in association with the original electronic document.

また、文書データベース12が蓄積する各電子文書には、文書中に個人名等の固有名表現(固有名詞)が含まれる。本実施の形態では、文書データベース12は、文書中の固有名表現の位置が分かる状態で各電子文書を記憶している。すなわち、文書データベース12は、文書中の固有名表現の位置を示す付加情報を付加した状態で各電子文書を記憶している。例えば、文書データベース12は、文書中の固有名表現の箇所に下線を付加した状態で各電子文書を記憶している。   Each electronic document stored in the document database 12 includes a proper name expression (proper noun) such as a personal name in the document. In the present embodiment, the document database 12 stores each electronic document in a state where the position of the proper name expression in the document is known. That is, the document database 12 stores each electronic document with additional information indicating the position of the proper name expression in the document. For example, the document database 12 stores each electronic document with an underline added to the location of the proper name expression in the document.

固有名出現位置データベース13は、固有名表現の出現位置を示す出現位置情報を予め記憶する。本実施の形態では、固有名出現位置データベース13は、固有名表現を識別するための固有名IDと、文書データベース12上で固有名表現が出現する位置を示す出現位置情報(例えば、固有名が出現する文書名や、文書中の何文字目に出現するかを示す情報)とを対応付けて記憶している。   The proper name appearance position database 13 stores in advance appearance position information indicating the appearance position of the proper name expression. In the present embodiment, the unique name appearance position database 13 includes a unique name ID for identifying the proper name expression, and appearance position information (for example, the proper name is shown) indicating the position where the proper name expression appears on the document database 12. The name of an appearing document and information indicating the character number in the document) are stored in association with each other.

固有名属性データベース14は、電子文書中の各固有名の属性を示す固有名属性情報を予め記憶する。例えば、固有名属性データベース14は、固有名属性情報として、個人の住所や勤務先、役職等の属性情報を記憶する。また、固有名属性データベース14は、電子文書中の固有名(固有名詞)を匿名化するための具体的な匿名表現を、固有名に対応付けて予め記憶する。   The unique name attribute database 14 stores in advance unique name attribute information indicating attributes of unique names in the electronic document. For example, the proper name attribute database 14 stores, as proper name attribute information, attribute information such as an individual address, work place, and post. Also, the proper name attribute database 14 stores in advance a specific anonymous expression for anonymizing a proper name (proper noun) in the electronic document in association with the proper name.

また、固有名属性データベース14は、同じ固有名に対して、匿名化レベル毎にそれぞれ異なる匿名表現を記憶している。すなわち、固有名属性データベース14は、匿名化レベル毎の匿名表現を固有名に対応付けて予め記憶している。本実施の形態では、固有名属性データベース14は、固有名IDと、固有名の属性と、匿名化のレベル毎の匿名表現とを対応付けて記憶している。   Further, the proper name attribute database 14 stores different anonymous expressions for each anonymization level for the same proper name. That is, the proper name attribute database 14 stores in advance an anonymous expression for each anonymization level in association with a proper name. In the present embodiment, the proper name attribute database 14 stores a proper name ID, a proper name attribute, and an anonymous expression for each level of anonymization in association with each other.

実世間情報データベース15は、匿名化の度合を評価するための所定の評価情報を予め記憶する。本実施の形態では、実世間情報データベース15は、匿名化した表現が実社会(実世間)で実際にどのレベルの匿名表現に相当するかを評価するための評価情報(以下、実世間評価情報という)を記憶している。例えば、実世間情報データベース15は、実世間評価情報として、匿名化した表現を示す属性名と、実社会での実際の匿名化のレベルとを対応付けて記憶している。   The real world information database 15 stores in advance predetermined evaluation information for evaluating the degree of anonymization. In the present embodiment, the real world information database 15 includes evaluation information (hereinafter referred to as real world evaluation information) for evaluating what level of anonymous expression the anonymized expression actually corresponds to in the real world (real world). ) Is remembered. For example, the real world information database 15 stores, as real world evaluation information, an attribute name indicating an anonymized expression and an actual anonymization level in the real world in association with each other.

データ処理装置2は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。データ処理装置2は、図1に示すように、匿名化レベル調整手段21と、固有名匿名化手段22と、文書出力手段24とを含む。   Specifically, the data processing device 2 is realized by a CPU of an information processing device that operates according to a program. As shown in FIG. 1, the data processing device 2 includes an anonymization level adjustment unit 21, a proper name anonymization unit 22, and a document output unit 24.

匿名化レベル調整手段21は、アクセス対象の電子文書(以下、アクセス対象文書という)の文書ID集合を受け付ける機能を備える。例えば、匿名化レベル調整手段21は、ユーザの指示操作に従って、文書ID集合として、アクセス対象の電子文書の各ファイル名を入力する。そして、匿名化レベル調整手段21は、入力した文書ID集合を固有名匿名化手段22に渡す。なお、情報共有システムを用いる場合、匿名化レベル調整手段21は、例えば、文書ID集合をネットワークを介してユーザ端末から受信してもよい。   The anonymization level adjusting means 21 has a function of accepting a document ID set of an electronic document to be accessed (hereinafter referred to as an access target document). For example, the anonymization level adjusting unit 21 inputs each file name of the electronic document to be accessed as a document ID set in accordance with the user's instruction operation. Then, the anonymization level adjustment unit 21 passes the input document ID set to the proper name anonymization unit 22. In the case of using the information sharing system, the anonymization level adjusting unit 21 may receive a set of document IDs from the user terminal via a network, for example.

また、匿名化レベル調整手段21は、ユーザが電子文書を利用する利用環境の条件の入力を受け付ける機能を備える。例えば、匿名化レベル調整手段21は、ユーザの指示操作に従って、ユーザID(例えば、ログイン名やユーザアカウント)を入力すると、入力したユーザIDにもとづいてユーザのアクセス権限の有無を判定する。そして、匿名化レベル調整手段21は、判定結果にもとづいて、ユーザのアクセス権限の有無を利用環境の条件として入力する。また、例えば、匿名化レベル調整手段21は、ユーザの指示操作に従って、ユーザの利用場所(例えば、社内や社外)及び利用方法(例えば、閲覧やコピー)を利用環境の条件として入力する。   Further, the anonymization level adjusting means 21 has a function of accepting input of conditions for a usage environment in which the user uses an electronic document. For example, when the user ID (for example, login name or user account) is input in accordance with the user's instruction operation, the anonymization level adjusting unit 21 determines whether the user has access authority based on the input user ID. And the anonymization level adjustment means 21 inputs the presence or absence of a user's access authority as conditions of use environment based on the determination result. Further, for example, the anonymization level adjusting means 21 inputs the user's usage location (for example, in-house or outside) and the usage method (for example, browsing or copying) as the conditions of the usage environment in accordance with the user's instruction operation.

なお、情報共有システムを用いる場合、匿名化レベル調整手段21は、利用環境の条件として、ユーザIDや利用場所、利用方法の情報を、ネットワークを介してユーザ端末から受信してもよい。   When the information sharing system is used, the anonymization level adjusting unit 21 may receive information on the user ID, the usage place, and the usage method from the user terminal via the network as conditions for the usage environment.

また、匿名化レベル調整手段21は、利用環境情報にもとづいて、匿名化レベルを決定する機能を備える。本実施の形態では、匿名化レベル調整手段21は、利用環境データベース11が記憶する利用環境情報のうち、入力した利用環境の条件に合致する情報があるか否かを判断する。そして、匿名化レベル調整手段21は、利用環境の条件に合致する利用環境情報に対応する匿名化レベルを利用環境データベース11から抽出し、アクセス対象文書に用いる匿名化レベルとして決定する。   The anonymization level adjusting means 21 has a function of determining the anonymization level based on the usage environment information. In the present embodiment, the anonymization level adjusting unit 21 determines whether there is information that matches the input usage environment condition among the usage environment information stored in the usage environment database 11. And the anonymization level adjustment means 21 extracts the anonymization level corresponding to the usage environment information that matches the usage environment conditions from the usage environment database 11 and determines it as the anonymization level used for the access target document.

固有名匿名化手段22は、匿名化レベル調整手段21からの文書ID集合にもとづいて、文書データベース12から各アクセス対象文書を抽出する機能を備える。また、固有名匿名化手段22は、抽出したアクセス対象文書の固有名部分に固有名IDと属性値とを付加し、匿名化レベルに応じた匿名表現を決定する機能を備える。   The proper name anonymization means 22 has a function of extracting each access target document from the document database 12 based on the document ID set from the anonymization level adjustment means 21. The proper name anonymization means 22 has a function of adding a proper name ID and an attribute value to the proper name portion of the extracted access target document and determining an anonymous expression according to the anonymization level.

本実施の形態では、固有名匿名化手段22は、抽出したアクセス対象文書に対応する固有名IDを、固有名出現位置データベース13から抽出する。また、固有名匿名化手段22は、抽出した固有名IDに対応する固有名属性情報(固有名の個人の住所や勤務先、役職等)を、固有名属性データベース14から抽出する。そして、固有名匿名化手段22は、抽出した固有名ID及び固有名属性情報をアクセス対象文書に対応付けることによって、アクセス対象文書の固有名部分に固有名IDと属性値とを付加する。   In the present embodiment, the proper name anonymization means 22 extracts the proper name ID corresponding to the extracted access target document from the proper name appearance position database 13. Also, the proper name anonymization means 22 extracts proper name attribute information (such as an individual's address, work place, title, etc.) corresponding to the extracted proper name ID from the proper name attribute database 14. Then, the unique name anonymization means 22 adds the unique name ID and the attribute value to the unique name portion of the access target document by associating the extracted unique name ID and unique name attribute information with the access target document.

また、固有名匿名化手段22は、抽出した固有名ID及び固有名属性情報と、匿名化レベル調整手段21が決定した匿名化レベルとにもとづいて、アクセス対象文書の固有名部分に用いる匿名表現を決定する。この場合、固有名匿名化手段22は、固有名ID及び固有名属性情報に対応する各匿名表現のうち、匿名化レベル調整手段21が決定した匿名化レベルに対応する匿名表現を固有名属性データベース14から抽出する。そして、固有名匿名化手段22は、抽出した固有名表現をアクセス対象文書の固有名部分に用いる匿名表現として決定する。   Further, the proper name anonymization means 22 uses the anonymous name used for the proper name portion of the access target document based on the extracted proper name ID and proper name attribute information and the anonymization level determined by the anonymization level adjustment means 21. To decide. In this case, the proper name anonymization means 22 uses an anonymous expression corresponding to the anonymization level determined by the anonymization level adjusting means 21 among the respective anonymous expressions corresponding to the proper name ID and proper name attribute information. 14 to extract. And the proper name anonymization means 22 determines the extracted proper name expression as an anonymous expression used for the proper name part of the access target document.

また、固有名匿名化手段22は、実世間情報データベース15が記憶する実世間評価情報にもとづいて、決定した匿名表現が実社会で実際にどのレベルの匿名表現に相当するかを評価する機能を備える。また、固有名匿名化手段22は、評価結果にもとづいて、決定した匿名表現の匿名化レベルが実社会の実際の匿名化のレベルに合致するか否かを判定する機能を備える。例えば、固有名匿名化手段22は、実社会の実際の匿名化のレベルに合致しないと判定すると、実社会の匿名化のレベルに合致しない旨をアラームとして表示させる。また、例えば、固有名匿名化手段22は、実社会の実際の匿名化のレベルに合致しないと判定すると、固有名属性データベース14が記憶する各匿名化レベルの匿名表現を更新する。   Further, the proper name anonymization means 22 has a function of evaluating, based on the real world evaluation information stored in the real world information database 15, what level of anonymous expression actually corresponds to the determined anonymous expression in the real world. . Moreover, the proper name anonymization means 22 has a function of determining whether or not the anonymization level of the determined anonymous expression matches the actual anonymization level of the real world based on the evaluation result. For example, if the proper name anonymization means 22 determines that it does not match the actual anonymization level of the real world, it displays an alarm indicating that it does not match the real anonymization level of the real world. Further, for example, if the proper name anonymization means 22 determines that it does not match the actual anonymization level of the real world, it updates the anonymous expression of each anonymization level stored in the proper name attribute database 14.

文書出力手段24は、各アクセス対象文書を匿名表現に置き換えた文書集合を出力する機能を備える。本実施の形態では、文書出力手段24は、固有名匿名化手段22が抽出した各アクセス対象文書中の固有名表現を、固有名匿名化手段22が決定した匿名表現に変換する。そして、文書出力手段24は、固有名表現を匿名表現に変換した各アクセス対象文書を出力する。例えば、文書出力手段24は、変換した各アクセス対象文書をディスプレイ装置等の表示装置に表示させたり、フレキシブルディスク等の記録媒体にコピーする。また、例えば、情報共有システムを用いる場合、文書出力手段24は、変換した各アクセス対象文書をネットワークを介してユーザ端末に送信する。   The document output means 24 has a function of outputting a document set in which each access target document is replaced with an anonymous expression. In the present embodiment, the document output means 24 converts the proper name expression in each access target document extracted by the proper name anonymization means 22 into the anonymous expression determined by the proper name anonymization means 22. Then, the document output unit 24 outputs each access target document obtained by converting the proper name expression into the anonymous expression. For example, the document output unit 24 displays each converted access target document on a display device such as a display device or copies it to a recording medium such as a flexible disk. For example, when using an information sharing system, the document output unit 24 transmits each converted access target document to the user terminal via the network.

なお、本実施の形態において、文書管理装置の記憶部は、電子文書を匿名化するための各種プログラムを記憶している。例えば、文書管理装置の記憶部は、コンピュータに、電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定する処理と、決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定する処理と、処理対象の電子文書中の固有名詞を、決定した匿名表現に置き換える処理とを実行させるための文書匿名化プログラムを記憶している。   In the present embodiment, the storage unit of the document management apparatus stores various programs for anonymizing the electronic document. For example, the storage unit of the document management apparatus determines the anonymization level indicating the degree of anonymization of the electronic document based on the usage environment information indicating the usage environment in which the electronic document is used. In order to execute processing for determining an anonymous expression for anonymizing a proper noun in the processing target electronic document and processing for replacing the proper noun in the processing target electronic document with the determined anonymous expression according to the conversion level The document anonymization program is memorized.

次に、動作について説明する。本実施の形態において、文書管理装置は、顧客からの電子メールやアンケート結果、掲示板の書き込み情報等の電子文書を予め文書データベース12に蓄積している。また、本実施の形態では、文書管理装置が蓄積する各電子文書について、予め文書中の固有名表現が特定され、電子文書の各固有名表現に固有名IDが付与されている。そして、文書管理装置は、特定された固有名表現の位置や固有名IDを固有名出現位置データベース13に予め記憶している。また、本実施の形態では、特定された各固有名表現に対する匿名表現が匿名化レベル毎に予め作成され、文書管理装置は、作成された匿名表現を固有名属性データベース14に予め記憶している。   Next, the operation will be described. In the present embodiment, the document management apparatus stores electronic documents such as e-mails from customers, questionnaire results, and bulletin board writing information in the document database 12 in advance. In the present embodiment, for each electronic document stored in the document management apparatus, a unique name expression in the document is specified in advance, and a unique name ID is assigned to each unique name expression of the electronic document. Then, the document management apparatus stores the specified unique name expression position and unique name ID in the proper name appearance position database 13 in advance. In the present embodiment, an anonymous expression for each identified proper name expression is created in advance for each anonymization level, and the document management apparatus stores the created anonymous expression in the proper name attribute database 14 in advance. .

また、本実施の形態では、予め利用環境に対する匿名化レベルが決定され、文書管理装置は、決定された匿名化レベルを利用環境情報に対応付けて利用環境データベース11に予め記憶している。本実施の形態では、文書管理装置は、ユーザのアクセス権限の有無や、電子文書をどの場所でどのような方法で利用するかに従って決定された匿名化レベルを、予め利用環境データベース11に記憶している。   In this embodiment, the anonymization level for the usage environment is determined in advance, and the document management apparatus stores the determined anonymization level in advance in the usage environment database 11 in association with the usage environment information. In the present embodiment, the document management apparatus stores in advance in the usage environment database 11 the anonymization level determined in accordance with the presence / absence of the user's access authority and the location and method of use of the electronic document. ing.

また、本実施の形態では、予め各匿名表現が実社会で実際にどのレベルの匿名表現に相当するかを示す実世間評価情報が生成され、文書管理装置は、生成された実世間評価情報を実世間情報データベース15に予め蓄積している。例えば、各地域の人口や企業の従業員数等の統計情報にもとづいて実世間評価情報が予め生成され、文書管理装置は、作成された実世間評価情報を実世間情報データベース15に蓄積している。   Further, in the present embodiment, real world evaluation information indicating which level each anonymous expression actually corresponds to in the real world is generated, and the document management apparatus executes the generated real world evaluation information. It is stored in the public information database 15 in advance. For example, real-world evaluation information is generated in advance based on statistical information such as the population of each region and the number of employees of a company, and the document management apparatus stores the created real-world evaluation information in the real-world information database 15. .

図2は、文書管理装置が電子文書中の固有名表現を匿名表現に変換する文書匿名化処理の一例を示す流れ図である。まず、文書管理装置の匿名化レベル調整手段21は、アクセス対象文書の文書ID集合と利用環境の条件とを読み込む。例えば、匿名化レベル調整手段21は、ユーザの指示操作に従って、各アクセス対象文書の文書IDや利用環境の条件を入力する。また、情報共有システムを用いる場合、例えば、ユーザは、ユーザ端末を操作して、各文書ID及び利用環境の条件を入力指示する。この場合、匿名化レベル調整手段21は、文書ID集合及び利用環境の条件を、インターネットやLAN等のネットワークを介してユーザ端末から受信する。   FIG. 2 is a flowchart illustrating an example of a document anonymization process in which the document management apparatus converts a proper name expression in an electronic document into an anonymous expression. First, the anonymization level adjusting unit 21 of the document management apparatus reads the document ID set of the access target document and the conditions of the usage environment. For example, the anonymization level adjusting means 21 inputs the document ID of each access target document and the conditions of the usage environment according to the user's instruction operation. Further, when using the information sharing system, for example, the user operates the user terminal to input an instruction for each document ID and usage environment conditions. In this case, the anonymization level adjusting unit 21 receives the document ID set and the usage environment conditions from the user terminal via a network such as the Internet or a LAN.

匿名化レベル調整手段21は、例えば、文書IDとして、各アクセス対象文書のファイル名を入力する。また、匿名化レベル調整手段21は、ユーザの指示操作に従ってユーザIDを入力し、入力したユーザIDにもとづいてユーザのアクセス権限の有無を判定する。例えば、文書管理装置はユーザIDとユーザのアクセス権限とを対応付けたデータベースを備え、匿名化レベル調整手段21は、データベースが記憶するアクセス権限の情報にもとづいて、ユーザのアクセス権限の有無を判定する。そして、匿名化レベル調整手段21は、判定結果にもとづいて、アクセス権限の有無を利用環境の条件として入力する。また、匿名化レベル調整手段21は、ユーザの指示操作に従って、ユーザの利用場所(例えば、社内や社外)や利用方法(例えば、閲覧やコピー)を利用環境の条件として入力する。   For example, the anonymization level adjusting means 21 inputs the file name of each access target document as the document ID. Further, the anonymization level adjusting means 21 inputs a user ID according to the user's instruction operation, and determines whether or not the user has the access authority based on the input user ID. For example, the document management apparatus includes a database in which a user ID and a user access authority are associated with each other, and the anonymization level adjusting unit 21 determines whether the user has the access authority based on the access authority information stored in the database. To do. And the anonymization level adjustment means 21 inputs the presence or absence of access authority as conditions of a use environment based on the determination result. Further, the anonymization level adjusting means 21 inputs the user's usage location (for example, in-house or outside) and the usage method (for example, browsing or copying) as conditions for the usage environment in accordance with the user's instruction operation.

文書ID集合及び利用環境の条件を入力すると、匿名化レベル調整手段21は、利用環境データベース11を参照し、利用環境情報にもとづいて匿名化レベルを決定する(ステップS11)。本実施の形態では、匿名化レベル調整手段21は、利用環境データベース11が記憶する各利用環境情報(ユーザのアクセス権限や利用場所、利用方法)のうち、入力した利用環境の条件に合致する情報があるか否かを判断する。合致する利用環境情報があると判断すると、匿名化レベル調整手段21は、合致する利用環境情報に対応する匿名化レベルを利用環境データベース11から抽出する。そして、匿名化レベル調整手段21は、抽出した匿名化レベルを、アクセス対象文書を匿名化する際の匿名化レベルに決定する。   When the document ID set and the usage environment conditions are input, the anonymization level adjusting unit 21 refers to the usage environment database 11 and determines the anonymization level based on the usage environment information (step S11). In the present embodiment, the anonymization level adjusting means 21 is information that matches the input usage environment conditions among the usage environment information (user access authority, usage location, usage method) stored in the usage environment database 11. Judge whether there is. If it is determined that there is matching usage environment information, the anonymization level adjusting unit 21 extracts the anonymization level corresponding to the matching usage environment information from the usage environment database 11. And the anonymization level adjustment means 21 determines the extracted anonymization level to the anonymization level at the time of anonymizing an access object document.

匿名化レベル調整手段21は、入力した文書ID集合を固有名匿名化手段22に渡す。固有名匿名化手段22は、匿名化レベル調整手段21からの各文書IDにもとづいて、文書データベース12からアクセス対象の電子文書を全て抽出する。また、固有名匿名化手段22は、抽出したアクセス対象文書の固有名部分に固有名IDを付加する。本実施の形態では、固有名匿名化手段22は、アクセス対象文書の固有名表現の出現箇所に対応する固有名IDを、固有名出現位置データベース13から抽出する。そして、固有名匿名化手段22は、抽出した固有名IDをアクセス対象文書の固有名部分に対応付ける。   The anonymization level adjustment unit 21 passes the input document ID set to the proper name anonymization unit 22. The proper name anonymization means 22 extracts all electronic documents to be accessed from the document database 12 based on each document ID from the anonymization level adjustment means 21. The unique name anonymization means 22 adds a unique name ID to the unique name portion of the extracted access target document. In the present embodiment, the proper name anonymization means 22 extracts the proper name ID corresponding to the appearance location of the proper name expression of the access target document from the proper name appearance position database 13. Then, the unique name anonymization means 22 associates the extracted unique name ID with the unique name portion of the access target document.

また、固有名匿名化手段22は、アクセス対象文書の各固有名部分に対して、匿名化レベルに応じた匿名表現を決定する(ステップS12)。本実施の形態では、固有名匿名化手段22は、各固有名部分に付加した固有名ID及び匿名化レベル調整手段21が決定した匿名化レベルにもとづいて、各固有名部分の匿名表現を決定する。この場合、固有名匿名化手段22は、固有名IDに対応する各匿名表現のうち、匿名化レベル調整手段21が決定した匿名化レベルに対応する匿名表現を、固有名属性データベース14から抽出する。そして、固有名匿名化手段22は、抽出した表現をアクセス対象文書の固有名部分に用いる匿名表現として決定する。   Further, the proper name anonymization means 22 determines an anonymous expression corresponding to the anonymization level for each proper name portion of the access target document (step S12). In the present embodiment, the proper name anonymization means 22 determines an anonymous expression of each proper name part based on the specific name ID added to each proper name part and the anonymization level determined by the anonymization level adjustment means 21. To do. In this case, the proper name anonymization means 22 extracts from the proper name attribute database 14 an anonymous expression corresponding to the anonymization level determined by the anonymization level adjustment means 21 among the anonymous expressions corresponding to the proper name ID. . And the specific name anonymization means 22 determines the extracted expression as an anonymous expression used for the specific name portion of the access target document.

文書出力手段24は、固有名匿名化手段22が決定した匿名表現に従って、アクセス対象文書の固有名部分を匿名表現に置き換えた文書集合を出力する(ステップS13)。この場合、文書出力手段24は、アクセス対象文書の各固有名部分を、固有名匿名化手段22が決定した匿名表現に変換する。そして、文書出力手段24は、固有名部分を匿名表現に変換したアクセス対象文書を出力する。例えば、文書出力手段24は、変換したアクセス対象文書を表示装置に表示させたり記録媒体にコピーする。また、例えば、情報共有システムを用いる場合、文書出力手段24は、変換したアクセス対象文書をネットワークを介してユーザ端末に送信する。   The document output means 24 outputs a document set in which the proper name portion of the access target document is replaced with the anonymous expression in accordance with the anonymous expression determined by the proper name anonymization means 22 (step S13). In this case, the document output unit 24 converts each unique name portion of the access target document into an anonymous expression determined by the proper name anonymization unit 22. Then, the document output unit 24 outputs an access target document obtained by converting the unique name portion into an anonymous expression. For example, the document output unit 24 displays the converted access target document on a display device or copies it to a recording medium. For example, when using an information sharing system, the document output unit 24 transmits the converted access target document to the user terminal via the network.

なお、ステップS12において、固有名匿名化手段22は、匿名表現を決定すると、実世間情報データベース15が記憶する実世間評価情報にもとづいて、決定した匿名表現が実社会でどのレベルの匿名表現に相当するかを評価する。この場合、固有名匿名化手段22は、評価結果にもとづいて、決定した匿名表現の匿名化レベルが実社会の実際の匿名化のレベルに合致するか否かを判定する。そして、実社会の実際の匿名化のレベルに合致しないと判定すると、固有名匿名化手段22は、実社会の匿名化のレベルに合致しない旨をアラームとして表示させ、固有名属性データベース14が記憶する各匿名表現の更新を促す。また、固有名匿名化手段22は、実社会の実際の匿名化のレベルに合致しないと判定すると、固有名属性データベース14が記憶する各匿名化レベルの匿名表現を更新するようにしてもよい。   In step S12, when the proper name anonymization means 22 determines the anonymous expression, it corresponds to what level of anonymous expression the determined anonymous expression is based on the real world evaluation information stored in the real world information database 15 in the real world. Evaluate what to do. In this case, the proper name anonymization means 22 determines whether or not the determined anonymization level of the anonymous expression matches the actual anonymization level of the real world based on the evaluation result. If it is determined that the level does not match the actual anonymization level of the real world, the proper name anonymization means 22 displays an alarm indicating that it does not match the level of anonymization of the real world, and each of the proper name attribute database 14 stores Encourage anonymity updates. Moreover, when the proper name anonymization means 22 determines that the actual anonymization level in the real world does not match, the proper name anonymization means 22 may update the anonymous expression of each anonymization level stored in the proper name attribute database 14.

以上のように、本実施の形態によれば、文書管理装置は、ユーザの利用環境に合わせて、匿名化レベルを柔軟に調整した文書を出力する。従って、文書アクセス環境に従って、匿名化のレベルを動的に調整できるようにすることができる。また、情報漏洩のリスクが少なく、可読性の高い文書を出力できるようにすることができる。   As described above, according to the present embodiment, the document management apparatus outputs a document in which the anonymization level is flexibly adjusted according to the user's usage environment. Therefore, the anonymization level can be dynamically adjusted according to the document access environment. In addition, it is possible to output a highly readable document with little risk of information leakage.

実施の形態2.
次に、本発明の第2の実施の形態を図面を参照して説明する。図3は、文書匿名化装置を用いた文書管理装置の他の構成例を示すブロック図である。図3に示すように、文書管理装置は、記憶装置1とデータ処理装置3とを含む。図3に示すように、本実施の形態では、図1で示したデータ処理装置2の構成要素に加えて、データ処理装置3が表現区別手段23を含む点で、第1の実施の形態と異なる。なお、本実施の形態において、匿名化レベル調整手段21、固有名匿名化手段22及び文書出力手段24の機能は、第1の実施の形態におけるそれらの機能と同様である。また、本実施の形態において、記憶装置1が記憶する情報は、第1の実施の形態で示した記憶装置1が記憶する情報と同様である。
Embodiment 2. FIG.
Next, a second embodiment of the present invention will be described with reference to the drawings. FIG. 3 is a block diagram illustrating another configuration example of the document management apparatus using the document anonymization apparatus. As shown in FIG. 3, the document management apparatus includes a storage device 1 and a data processing device 3. As shown in FIG. 3, this embodiment differs from the first embodiment in that the data processing device 3 includes an expression distinguishing means 23 in addition to the components of the data processing device 2 shown in FIG. Different. In the present embodiment, the functions of the anonymization level adjustment means 21, the proper name anonymization means 22, and the document output means 24 are the same as those functions in the first embodiment. In the present embodiment, the information stored in the storage device 1 is the same as the information stored in the storage device 1 described in the first embodiment.

表現区別手段23は、固有名匿名化手段22が決定した複数の匿名表現の中に、固有名IDが異なるにもかかわらず、表現が同一である匿名表現があるか否かを判定する機能を備える。また、表現区別手段23は、固有名IDが異なるにもかかわらず匿名表現が同一であると判定すると、それらの匿名表現を区別可能な他の匿名表現に変更する機能を備える。   The expression distinguishing unit 23 has a function of determining whether or not there is an anonymous expression having the same expression among the plurality of anonymous expressions determined by the unique name anonymizing unit 22 even though the unique name IDs are different. Prepare. In addition, if the expression distinguishing unit 23 determines that the anonymous expressions are the same even though the unique name IDs are different, the expression distinguishing unit 23 has a function of changing the anonymous expressions to other anonymous expressions that can be distinguished.

また、表現区別手段23は、固有名匿名化手段22が決定した複数の匿名表現の中に、固有名IDが同一であるにもかかわらず、表現が異なる匿名表現があるか否かを判定する機能を備える。また、表現区別手段23は、固有名IDが同一であるにもかかわらず匿名表現が異なると判定すると、それらの匿名表現を同一の匿名表現に変更する機能を備える。   Further, the expression distinguishing unit 23 determines whether or not there are anonymous expressions having different expressions even though the unique name IDs are the same among the plurality of anonymous expressions determined by the unique name anonymizing unit 22. It has a function. Further, if the expression distinguishing means 23 determines that the anonymous expressions are different even though the unique name IDs are the same, the expression distinguishing means 23 has a function of changing those anonymous expressions to the same anonymous expressions.

次に、動作について説明する。図4は、文書管理装置が電子文書中の固有名表現を匿名表現に変換する文書匿名化処理の他の例を示す流れ図である。まず、文書管理装置の匿名化レベル調整手段21は、アクセス対象文書の文書ID集合と利用環境の条件とを読み込む。例えば、匿名化レベル調整手段21は、ユーザの指示操作に従って、各アクセス対象文書の文書IDや利用環境の条件を入力する。また、情報共有システムを用いる場合、例えば、ユーザは、ユーザ端末を操作して、各文書ID及び利用環境の条件の入力指示する。この場合、匿名化レベル調整手段21は、文書ID集合及び利用環境の条件をネットワークを介してユーザ端末から受信する。   Next, the operation will be described. FIG. 4 is a flowchart illustrating another example of a document anonymization process in which the document management apparatus converts a proper name expression in an electronic document into an anonymous expression. First, the anonymization level adjusting unit 21 of the document management apparatus reads the document ID set of the access target document and the conditions of the usage environment. For example, the anonymization level adjusting means 21 inputs the document ID of each access target document and the conditions of the usage environment according to the user's instruction operation. When using the information sharing system, for example, the user operates the user terminal to instruct input of each document ID and usage environment conditions. In this case, the anonymization level adjusting unit 21 receives the document ID set and the usage environment conditions from the user terminal via the network.

文書ID集合及び利用環境の条件を入力すると、匿名化レベル調整手段21は、利用環境データベース11を参照し、利用環境情報にもとづいて匿名化レベルを決定する(ステップS21)。本実施の形態では、匿名化レベル調整手段21は、利用環境データベース11が記憶する各利用環境情報(ユーザのアクセス権限や利用場所、利用方法)のうち、入力した利用環境の条件に合致する情報があるか否かを判断する。合致する利用環境情報があると判断すると、匿名化レベル調整手段21は、合致する利用環境情報に対応する匿名化レベルを利用環境データベース11から抽出する。そして、匿名化レベル調整手段21は、抽出した匿名化レベルを、アクセス対象文書を匿名化する際の匿名化レベルに決定する。   When the document ID set and the usage environment conditions are input, the anonymization level adjusting unit 21 refers to the usage environment database 11 and determines the anonymization level based on the usage environment information (step S21). In the present embodiment, the anonymization level adjusting means 21 is information that matches the input usage environment conditions among the usage environment information (user access authority, usage location, usage method) stored in the usage environment database 11. Judge whether there is. If it is determined that there is matching usage environment information, the anonymization level adjusting unit 21 extracts the anonymization level corresponding to the matching usage environment information from the usage environment database 11. And the anonymization level adjustment means 21 determines the extracted anonymization level to the anonymization level at the time of anonymizing an access object document.

匿名化レベル調整手段21は、入力した文書ID集合を固有名匿名化手段22に渡す。固有名匿名化手段22は、匿名化レベル調整手段21からの各文書IDにもとづいて、文書データベース12からアクセス対象の電子文書を全て抽出する。また、固有名匿名化手段22は、抽出したアクセス対象文書の固有名部分に固有名IDを付加する。本実施の形態では、固有名匿名化手段22は、アクセス対象文書の固有名表現の出現箇所に対応する固有名IDを、固有名出現位置データベース13から抽出する。そして、固有名匿名化手段22は、抽出した固有名IDを、アクセス対象文書の固有名部分に対応付ける。   The anonymization level adjustment unit 21 passes the input document ID set to the proper name anonymization unit 22. The proper name anonymization means 22 extracts all electronic documents to be accessed from the document database 12 based on each document ID from the anonymization level adjustment means 21. The unique name anonymization means 22 adds a unique name ID to the unique name portion of the extracted access target document. In the present embodiment, the proper name anonymization means 22 extracts the proper name ID corresponding to the appearance location of the proper name expression of the access target document from the proper name appearance position database 13. Then, the unique name anonymization means 22 associates the extracted unique name ID with the unique name portion of the access target document.

また、固有名匿名化手段22は、アクセス対象文書の各固有名部分に対して、匿名化レベルに応じた匿名表現を決定する(ステップS22)。本実施の形態では、固有名匿名化手段22は、各固有名部分に付加した固有名ID及び匿名化レベル調整手段21が決定した匿名化レベルにもとづいて、各固有名部分の匿名表現を決定する。この場合、固有名匿名化手段22は、固有名IDに対応する各匿名表現のうち、匿名化レベル調整手段21が決定した匿名化レベルに対応する匿名表現を、固有名属性データベース14から抽出する。そして、固有名匿名化手段22は、抽出した表現をアクセス対象文書の固有名部分に用いる匿名表現として決定する。   Moreover, the proper name anonymization means 22 determines the anonymous expression according to the anonymization level for each proper name portion of the access target document (step S22). In the present embodiment, the proper name anonymization means 22 determines an anonymous expression of each proper name part based on the specific name ID added to each proper name part and the anonymization level determined by the anonymization level adjustment means 21. To do. In this case, the proper name anonymization means 22 extracts from the proper name attribute database 14 an anonymous expression corresponding to the anonymization level determined by the anonymization level adjustment means 21 among the anonymous expressions corresponding to the proper name ID. . And the specific name anonymization means 22 determines the extracted expression as an anonymous expression used for the specific name portion of the access target document.

表現区別手段23は、固有名匿名化手段22が決定したアクセス対象の文書集合の固有名に対応する各匿名表現中に、固有名IDが同一であるにもかかわらず匿名表現が異なる表現が存在するか否かを判定する。固有名IDが同一であるにもかかわらず異なる匿名表現が存在すると判定すると、表現区別手段23は、それらの匿名表現を同一の匿名表現に変更する。   The expression distinguishing means 23 includes expressions having different anonymous expressions even though the unique name IDs are the same among the anonymous expressions corresponding to the unique names of the access target document set determined by the unique name anonymizing means 22. It is determined whether or not to do. If it is determined that different anonymous expressions exist even though the unique name IDs are the same, the expression distinguishing means 23 changes those anonymous expressions to the same anonymous expression.

また、表現区別手段23は、固有名匿名化手段22が決定したアクセス対象の文書集合の固有名に対応する各匿名表現中に、匿名表現が同一であるにもかかわらず固有名IDが異なる表現が存在するか否かを判定する。匿名表現が同一であるにもかかわらず固有名IDが異なる表現が存在すると判定すると、表現区別手段23は、それらの匿名表現をそれぞれ異なる匿名表現に変更する(ステップS23)。   In addition, the expression distinguishing means 23 includes expressions having different unique name IDs in the anonymous expressions corresponding to the unique names of the access target document set determined by the unique name anonymizing means 22 even though the anonymous expressions are the same. It is determined whether or not exists. If it is determined that there are expressions having different unique names ID even though the anonymous expressions are the same, the expression distinguishing means 23 changes these anonymous expressions to different anonymous expressions (step S23).

文書出力手段24は、固有名匿名化手段22が決定した匿名表現、又は表現区別手段23が変更した匿名表現に従って、アクセス対象文書の固有名詞部分を匿名表現に置き換えた文書集合を出力する(ステップS24)。この場合、文書出力手段24は、アクセス対象文書の各固有名部分を、固有名匿名化手段22が決定した匿名表現、又は表現区別手段23が変更した匿名表現に変換する。そして、文書出力手段24は、変換したアクセス対象文書を出力する。例えば、文書出力手段24は、変換したアクセス対象文書を表示装置に表示させたり記録媒体にコピーする。また、例えば、情報共有システムを用いる場合、文書出力手段24は、変換したアクセス対象文書をネットワークを介してユーザ端末に送信する。   The document output means 24 outputs a document set in which the proper noun part of the access target document is replaced with the anonymous expression according to the anonymous expression determined by the proper name anonymization means 22 or the anonymous expression changed by the expression distinguishing means 23 (step S24). In this case, the document output means 24 converts each unique name portion of the access target document into an anonymous expression determined by the proper name anonymization means 22 or an anonymous expression changed by the expression distinguishing means 23. Then, the document output unit 24 outputs the converted access target document. For example, the document output unit 24 displays the converted access target document on a display device or copies it to a recording medium. For example, when using an information sharing system, the document output unit 24 transmits the converted access target document to the user terminal via the network.

なお、ステップS22において、固有名匿名化手段22は、匿名表現を決定すると、実世間情報データベース15が記憶する実世間評価情報にもとづいて、決定した匿名表現が実社会でどのレベルの匿名表現に相当するかを評価する。この場合、固有名匿名化手段22は、評価結果にもとづいて、決定した匿名表現の匿名化レベルが実社会の実際の匿名化のレベルに合致するか否かを判定する。そして、実社会の実際の匿名化のレベルに合致しないと判定すると、固有名匿名化手段22は、実社会の匿名化のレベルに合致しない旨をアラームとして表示させ、固有名属性データベース14が記憶する各匿名表現の更新を促す。また、固有名匿名化手段22は、実社会の実際の匿名化のレベルに合致しないと判定すると、固有名属性データベース14が記憶する各匿名化レベルの匿名表現を更新するようにしてもよい。   In step S22, when the proper name anonymization means 22 determines the anonymous expression, the determined anonymous expression corresponds to what level of anonymous expression in the real world based on the real world evaluation information stored in the real world information database 15. Evaluate what to do. In this case, the proper name anonymization means 22 determines whether or not the determined anonymization level of the anonymous expression matches the actual anonymization level of the real world based on the evaluation result. If it is determined that the level does not match the actual anonymization level of the real world, the proper name anonymization means 22 displays an alarm indicating that it does not match the level of anonymization of the real world, and each of the proper name attribute database 14 stores Encourage anonymity updates. Moreover, when the proper name anonymization means 22 determines that the actual anonymization level in the real world does not match, the proper name anonymization means 22 may update the anonymous expression of each anonymization level stored in the proper name attribute database 14.

以上のように、本実施の形態によれば、文書管理装置は、複数の文書間で同一の固有名に対して同一の匿名表現を選択して匿名化し、異なる固有名に対して異なる匿名表現を選択して匿名化する。従って、参照対象の複数の文書間で、同一の対象を同じ匿名表現で表し、異なる対象を異なる匿名表現で表すことができる。また、匿名化によって複数の文書間の対応関係が損なわれないように、匿名化した電子文書を出力することができる。   As described above, according to the present embodiment, the document management apparatus selects and anonymizes the same anonymous expression for the same unique name among a plurality of documents, and different anonymous expressions for different unique names. Select to anonymize. Therefore, the same object can be represented by the same anonymous expression and different objects can be represented by different anonymous expressions among the plurality of documents to be referred to. In addition, an anonymized electronic document can be output so that the correspondence between a plurality of documents is not impaired by anonymization.

次に、本発明の第1の実施例を図面を参照して説明する。なお、本実施例で示す文書管理装置は、本発明の第1の実施の形態で示した文書管理装置に相当する。本実施例において、文書管理装置は、顧客からの電子メールやアンケート結果、掲示板の書き込み情報等の電子文書を予め文書データベース12に蓄積している。また、本実施例では、予め各電子文書中の固有名表現が特定され、電子文書の各固有名表現に固有名IDが付与されている。そして、文書管理装置は、特定された固有名表現の位置や固有名IDを固有名出現位置データベース13に記憶している。また、本実施例では、予め各固有名表現に対する匿名表現が匿名化レベル毎に作成され、文書管理装置は、作成された匿名表現を固有名属性データベース14に記憶している。   Next, a first embodiment of the present invention will be described with reference to the drawings. The document management apparatus shown in this embodiment corresponds to the document management apparatus shown in the first embodiment of the present invention. In this embodiment, the document management apparatus stores in advance in the document database 12 electronic documents such as e-mails from customers, questionnaire results, and bulletin board writing information. Further, in this embodiment, a unique name expression in each electronic document is specified in advance, and a unique name ID is assigned to each unique name expression of the electronic document. Then, the document management apparatus stores the specified unique name expression position and unique name ID in the proper name appearance position database 13. In this embodiment, an anonymous expression for each proper name expression is created in advance for each anonymization level, and the document management apparatus stores the created anonymous expression in the proper name attribute database 14.

また、本実施例では、文書管理装置は、予め利用環境に対する匿名化レベルが決定され、文書管理装置は、決定された匿名化レベルを利用環境情報に対応付けて予め利用環境データベース11に記憶している。また、本実施例では、予め各匿名表現が実社会で実際にどのレベルの匿名表現に相当するかを示す実世間評価情報が生成され、文書管理装置は、生成された実世間評価情報を実世間情報データベース15に蓄積している。   In this embodiment, the document management apparatus determines the anonymization level for the usage environment in advance, and the document management apparatus stores the determined anonymization level in advance in the usage environment database 11 in association with the usage environment information. ing. Further, in this embodiment, real world evaluation information indicating which level of anonymous expression each anonymous expression actually corresponds to in the real world is generated in advance, and the document management apparatus converts the generated real world evaluation information to the real world It is stored in the information database 15.

図5は、利用環境データベース11が記憶する情報の一例を示す説明図である。利用環境データベース11は、利用環境情報として、ユーザの固有名アクセス属性、電子文書の利用場所及び利用方法の情報を記憶する。本実施例では、図5に示すように、利用環境データベース11は、ユーザのアクセス権限「あり」又は「なし」の情報や、利用場所として「機密室」や「部門内」等の情報、利用方法として「閲覧」や「コピー」等の情報を記憶している。   FIG. 5 is an explanatory diagram illustrating an example of information stored in the usage environment database 11. The usage environment database 11 stores, as usage environment information, information on a user's unique name access attribute, usage location and usage method of an electronic document. In this embodiment, as shown in FIG. 5, the usage environment database 11 includes user access authority “present” or “none” information, information such as “confidential room” and “in-department” as usage locations, and usage. Information such as “browsing” and “copying” is stored as a method.

また、利用環境データベース11は、固有名アクセス属性、利用場所及び利用方法に対応付けて、匿名化レベルを記憶している。本実施例では、図5に示すように、ユーザの固有名アクセス属性、利用場所及び利用方法に対応付けて、匿名化レベルを「なし」、「小」、「中」又は「大」の各段階に分類して記憶している。なお、図5において、匿名化レベル「なし」とは、電子文書中の固有名表現の匿名化を行わないことを示している。また、匿名化レベルは本実施例で示したものに限らず、例えば、利用環境データベース11は、更に匿名化の度合を細分化した匿名化レベルを記憶してもよい。例えば、利用環境データベース11は、匿名化レベルとして「無限大」や「極小」等の情報を記憶してもよい。   In addition, the usage environment database 11 stores anonymization levels in association with specific name access attributes, usage locations, and usage methods. In this embodiment, as shown in FIG. 5, the anonymization level is set to “none”, “small”, “medium”, or “large” in association with the user's unique name access attribute, usage location, and usage method. It is classified and stored in stages. In FIG. 5, the anonymization level “none” indicates that the anonymization of the proper name expression in the electronic document is not performed. Further, the anonymization level is not limited to that shown in the present embodiment. For example, the usage environment database 11 may store an anonymization level obtained by further subdividing the degree of anonymization. For example, the usage environment database 11 may store information such as “infinity” or “minimum” as the anonymization level.

図5に示す例では、例えば、ユーザの固有名のアクセス属性が「あり」で、利用場所が「機密室」であり利用方法が「閲覧」の場合、対応する匿名化レベルが「なし」であることを示している。また、例えば、ユーザの固有名のアクセス属性が「あり」で、利用場所が「社外」であり利用方法が「閲覧」の場合、対応する匿名化レベルが「大」であることを示している。   In the example illustrated in FIG. 5, for example, when the access attribute of the user's unique name is “Yes”, the usage location is “Confidential Room”, and the usage method is “Browse”, the corresponding anonymization level is “None”. It shows that there is. For example, when the access attribute of the user's proper name is “Yes”, the usage location is “External” and the usage method is “Browse”, the corresponding anonymization level is “Large”. .

匿名化レベル調整手段21は、ユーザの操作に従って、ユーザがアクセスしたい文書の文書IDの集合とユーザの利用環境の属性とを入力する。本実施例では、匿名化レベル調整手段21は、利用環境の属性として、ユーザの固有名へのアクセス属性の有無や、利用場所が「機密室」、「会社内」又は「会社外」であるか等の区分、利用方法が閲覧するだけなのかコピーするのか等の区分を入力する。匿名化レベル調整手段21は、利用環境データベース11を参照することによって、ユーザの利用属性に対応する匿名化レベルを得ることができる。   The anonymization level adjusting means 21 inputs a set of document IDs of the documents that the user wants to access and attributes of the user's usage environment according to the user's operation. In this embodiment, the anonymization level adjusting means 21 has the presence / absence of an access attribute to the user's unique name as the usage environment attribute, and the usage location is “confidential room”, “inside the company” or “outside the company”. Such as whether the usage is just browsing or copying. The anonymization level adjusting means 21 can obtain the anonymization level corresponding to the usage attribute of the user by referring to the usage environment database 11.

図5に示す例では、例えば、ユーザの利用環境の条件としてアクセス権限「あり」、利用場所「機密室」及び利用方法「閲覧」を入力すると、匿名化レベル調整手段21は、利用環境に対応する匿名化レベル「なし」を利用環境データベース11から抽出する。また、例えば、ユーザの利用環境の条件としてアクセス権限「あり」、利用場所「社外」及び利用方法「閲覧」を入力すると、匿名化レベル調整手段21は、利用環境に対応する匿名化レベル「大」を利用環境データベース11から抽出する。   In the example shown in FIG. 5, for example, when an access authority “Yes”, a usage location “confidential room”, and a usage method “browse” are input as conditions of the usage environment of the user, the anonymization level adjusting unit 21 corresponds to the usage environment. The anonymization level “none” to be extracted is extracted from the usage environment database 11. Further, for example, when the access authority “Yes”, the usage location “external”, and the usage method “browsing” are input as the conditions of the usage environment of the user, the anonymization level adjusting unit 21 sets the anonymization level “high” corresponding to the usage environment. Is extracted from the usage environment database 11.

図6は、文書データベース12が記憶する情報の一例を示す説明図である。図6に示すように、文書データベース12は、文書IDと文書自体とを対応付けて記憶する。また、文書データベース12は、文書中に出現する固有名の位置を付加した状態で電子文書を記憶している。本実施例では、図6に示すように、便宜的に、文書データベース12が固有名の位置に下線を付加した状態で電子文書を記憶している場合を説明する。   FIG. 6 is an explanatory diagram showing an example of information stored in the document database 12. As shown in FIG. 6, the document database 12 stores a document ID and the document itself in association with each other. Further, the document database 12 stores the electronic document with the position of the unique name appearing in the document added. In this embodiment, as shown in FIG. 6, a case will be described where the document database 12 stores an electronic document with an underline added to the position of the unique name for convenience.

図7は、固有名出現位置データベース13が記憶する情報の一例を示す説明図である。図7に示すように、固有名出現位置データベース13は、固有名IDと、固有名の出現場所とを対応付けて記憶する。図7に示す例では、例えば、「田中001」という固有名IDに対応する固有名表現が、文書データベース12が蓄積する電子文書のうち、文書ID「文書1」の文書の102文字目に存在することを示している。   FIG. 7 is an explanatory diagram illustrating an example of information stored in the unique name appearance position database 13. As illustrated in FIG. 7, the unique name appearance position database 13 stores a unique name ID and a unique name appearance location in association with each other. In the example illustrated in FIG. 7, for example, the unique name expression corresponding to the unique name ID “Tanaka 001” exists in the 102nd character of the document with the document ID “document 1” among the electronic documents stored in the document database 12. It shows that

図8は、固有名属性データベース14が記憶する情報の一例を示す説明図である。図8に示すように、固有名属性データベース14は、固有名IDと、固有名の属性である住所及び勤務先と、各匿名表現とを対応付けて記憶する。図8に示す例では、例えば、固有名IDが「田中001」である固有名は、住所属性が「川崎市中原区下沼部」であることを示している。また、固有名IDが「田中001」である固有名は、匿名化レベル「最大(無限大)」の場合に「Aさん」という表現で匿名化され、匿名化レベル「大」の場合に「川崎市のAさん」という表現で匿名化されることを示している。更に、固有名IDが「田中001」である固有名は、匿名化レベル「中」の場合に「川崎市中原区のAさん」という表現で匿名化され、匿名化レベル「小」の場合に「川崎市中原区下沼部のAさん」という表現で匿名化されることを示している。   FIG. 8 is an explanatory diagram showing an example of information stored in the unique name attribute database 14. As illustrated in FIG. 8, the unique name attribute database 14 stores a unique name ID, an address and work place that are attributes of the unique name, and each anonymous expression in association with each other. In the example illustrated in FIG. 8, for example, the proper name having the proper name ID “Tanaka 001” indicates that the address attribute is “Shimonumabe, Nakahara-ku, Kawasaki City”. Also, the unique name with the unique name ID “Tanaka 001” is anonymized with the expression “Mr. A” when the anonymization level is “maximum (infinity)”, and when the anonymization level is “large”, It means that it is anonymized by the expression “Mr. A in Kawasaki City”. Furthermore, the unique name with the unique name ID “Tanaka 001” is anonymized with the expression “Mr. A in Nakahara-ku, Kawasaki City” when the anonymization level is “medium”, and when the anonymization level is “small” It shows that it is anonymized by the expression “Mr. A from Shimonumabe, Nakahara-ku, Kawasaki City”.

図9は、実世間情報データベース15が記憶する情報の一例を示す説明図である。実世間情報データベース15は、匿名化した表現が実世間で実際にどのレベルの匿名表現に相当するかを評価するための実世間評価情報を記憶している。本実施例では、図9に示すように、実世間情報データベース15は、実世間評価情報として、実世間での評価期間と、匿名表現の属性名と、匿名化レベルとを対応付けて記憶している。   FIG. 9 is an explanatory diagram showing an example of information stored in the real world information database 15. The real world information database 15 stores real world evaluation information for evaluating what level of anonymous expression the anonymized expression actually corresponds to in the real world. In this embodiment, as shown in FIG. 9, the real world information database 15 stores the real world evaluation period, the attribute name of the anonymous expression, and the anonymization level in association with each other as real world evaluation information. ing.

例えば、文書管理装置を用いたシステムは、予め実世間評価情報を求める実世間情報取得サーバを備える。例えば、実世間情報取得サーバは、各地域の人口や企業の従業員数等の統計情報にもとづいて、匿名化した表現に相当する人物の実世間における人数を予め求める。この場合、実世間情報取得サーバは、例えば、2003年の川崎市の人口「100万人」の情報にもとづいて、匿名表現「川崎市のAさん」に相当する人物は実世間において100万人存在しうる旨を求める。また、実世間情報取得サーバは、求めた人数にもとづいて匿名化した表現の実世間での匿名化レベルを求める。例えば、実世間情報取得サーバは、求めた人数が100万人以上である場合に匿名化レベル「大」と求め、人数が1万人以上である場合に匿名化レベル「中」と求め、人数が1000人以上である場合に匿名化レベル「小」と求め、人数が1000人未満である場合に匿名化レベル「極小」と求める。   For example, a system using a document management apparatus includes a real world information acquisition server that obtains real world evaluation information in advance. For example, the real world information acquisition server obtains in advance the number of people in the real world corresponding to the anonymized expression based on statistical information such as the population of each region and the number of employees of the company. In this case, the real-world information acquisition server, for example, has 1 million people who correspond to the anonymous expression “Mr. A in Kawasaki City” based on the information of population “1 million” in Kawasaki City in 2003. We ask that it can exist. Moreover, the real world information acquisition server calculates | requires the anonymization level in the real world of the expression anonymized based on the calculated | required number of persons. For example, the real-world information acquisition server requests an anonymization level “large” when the requested number is 1 million or more, and requests an anonymization level “medium” when the number is 10,000 or more. When the number of persons is 1000 or more, the anonymization level “small” is obtained, and when the number of persons is less than 1000, the anonymization level “minimal” is obtained.

例えば、図9に示す例では、2003年の川崎市の人口にもとづいて、「川崎市のAさん」という匿名表現に相当する人物が100万人存在しうると求められ、実世間での匿名化レベル「大」に相当することがわかる。また、例えば、2004年の○○社の従業員数や役職者数にもとづいて、「○○社&部長」という匿名表現に相当する人物が1000人存在しうると求められ、実世間での匿名化レベル「小」に相当することがわかる。   For example, in the example shown in FIG. 9, based on the population of Kawasaki City in 2003, it is required that there can be one million people corresponding to the anonymous expression “Mr. A in Kawasaki City”. It can be seen that this corresponds to the “Large” level. In addition, for example, based on the number of employees and managers of XX Company in 2004, it is required that there can be 1000 people who correspond to the anonymous expression “XX Company & General Manager”. It can be seen that this corresponds to the conversion level “small”.

固有名匿名化手段22は、匿名化レベル調整手段21から、アクセス対象の文書の文書IDの集合と、決定した匿名化レベルとを受け取る。また、固有名匿名化手段22は、文書IDの集合にもとづいて、文書データベース12から、アクセス対象の文書を取り出す。また、固有名匿名化手段22は、固有名出現位置データベース13から、アクセス対象の文書中の固有名部分の固有名IDを取り出す。そして、固有名匿名化手段22は、固有名IDと匿名化レベルとをキーとして固有名属性データベース14を検索し、各固有名に対応する匿名表現を決定する。   The proper name anonymization means 22 receives the set of document IDs of the documents to be accessed and the determined anonymization level from the anonymization level adjustment means 21. Further, the proper name anonymization means 22 takes out a document to be accessed from the document database 12 based on the set of document IDs. Further, the proper name anonymization means 22 takes out the proper name ID of the proper name portion in the document to be accessed from the proper name appearance position database 13. The proper name anonymization means 22 searches the proper name attribute database 14 using the proper name ID and the anonymization level as keys, and determines an anonymous expression corresponding to each proper name.

例えば、匿名化レベル調整手段21から受け取ったアクセス対象の文書の文書ID集合が{文書1}であり、決定した匿名化レベル「大」である場合を例に説明する。固有名匿名化手段22は、文書ID集合{文書1}にもとづいて、図6に示す文書データベース12から、文書ID「文書1」に対応する電子文書をアクセス対象文書として抽出する。また、固有名匿名化手段22は、図7に示す固有名出現位置データベース13から、アクセス対象文書である「文書1」の102文字目の固有名部分の固有名ID「田中001」を抽出する。そして、固有名匿名化手段22は、固有名ID「田中001」と匿名化レベル「大」とをキーとして図8に示す固有名属性データベース14を検索し、固有名に対応する匿名表現を決定する。   For example, the case where the document ID set of the access target document received from the anonymization level adjusting unit 21 is {document 1} and the determined anonymization level is “high” will be described as an example. The unique name anonymization means 22 extracts an electronic document corresponding to the document ID “document 1” as an access target document from the document database 12 shown in FIG. 6 based on the document ID set {document 1}. Further, the unique name anonymization means 22 extracts the unique name ID “Tanaka 001” of the 102nd character's unique name portion of the “document 1” that is the access target document from the unique name appearance position database 13 shown in FIG. . Then, the proper name anonymization means 22 searches the proper name attribute database 14 shown in FIG. 8 using the proper name ID “Tanaka 001” and the anonymization level “Large” as keys, and determines an anonymous expression corresponding to the proper name. To do.

本例では、固有名匿名化手段22は、図6に示す文書ID「文書1」の文書の固有名部分「川崎市中原区下沼部の田中さん」に対応する匿名表現として、図8に示す固有名属性データベース14から「川崎市のAさん」という表現を選択する。   In this example, the unique name anonymization means 22 uses the unique name shown in FIG. 8 as an anonymous expression corresponding to the unique name part “Mr. Tanaka of Shimonuma, Nakahara-ku, Kawasaki City” of the document with the document ID “Document 1” shown in FIG. The expression “Mr. A in Kawasaki City” is selected from the name attribute database 14.

また、固有名匿名化手段22は、図9に示す実世間情報データベース15にもとづいて、選択した匿名表現の匿名化レベルが、ある時期の実世間における匿名化レベルに対応しているか否かをチェックする。例えば、固有名匿名化手段22は、図9に示す実世間情報データベース15にもとづいて、選択した「川崎市のAさん」という匿名表現の2004年における実世間での匿名化レベルが「大」であると判定する。そして、固有名匿名化手段22は、決定した匿名表現の匿名化レベル「大」が実世間での匿名化レベルに対応しており、適切な表現であると判定する。   Further, the proper name anonymization means 22 determines whether the anonymization level of the selected anonymous expression corresponds to the anonymization level in the real world at a certain time based on the real world information database 15 shown in FIG. To check. For example, the proper name anonymization means 22 is based on the real-world information database 15 shown in FIG. 9 and the real-world anonymization level in 2004 of the selected anonymous expression “Mr. A in Kawasaki City” is “high”. It is determined that And the proper name anonymization means 22 determines that the anonymization level “large” of the determined anonymous expression corresponds to the anonymization level in the real world and is an appropriate expression.

なお、決定した匿名表現の匿名化レベルが実世間での匿名化レベルに合致しないと判定した場合、固有名匿名化手段22は、例えば、実世間の匿名化のレベルに合致しない旨をアラームとして表示させ、システム管理者に固有名属性データベース14の更新を促す。また、固有名匿名化手段22は、例えば、固有名属性データベース14が記憶する各匿名化レベルの匿名表現を更新する。   If it is determined that the anonymization level of the determined anonymous expression does not match the anonymization level in the real world, the proper name anonymization means 22 uses, for example, an alarm that the level does not match the level of anonymization in the real world The system administrator is prompted to update the unique name attribute database 14. Moreover, the proper name anonymization means 22 updates the anonymous expression of each anonymization level which the proper name attribute database 14 memorize | stores, for example.

文書出力手段24は、固有名匿名化手段22から、アクセス対象文書、固有名ID及び固有名IDに対応する匿名表現を受け取る。そして、文書出力手段24は、アクセス対象の文書中の固有名表現を匿名表現に変換して出力する。本実施例では、文書出力手段24は、文書ID「文書1」の文書中の固有名部分「川崎市中原区下沼部の田中さん」を匿名表現「川崎市のAさん」に変換して文書を出力する。   The document output unit 24 receives the anonymous expression corresponding to the access target document, the unique name ID, and the unique name ID from the proper name anonymization unit 22. Then, the document output means 24 converts the proper name expression in the document to be accessed into an anonymous expression and outputs it. In the present embodiment, the document output means 24 converts the unique name portion “Mr. Tanaka of Shimonuma, Nakahara-ku, Kawasaki City” into the anonymous expression “Mr. A of Kawasaki City” in the document with the document ID “Document 1”. Output.

次に、本発明の第2の実施例を図面を参照して説明する。なお、本実施例で示す文書管理装置は、本発明の第2の実施の形態で示した文書管理装置に相当する。また、本実施例において、匿名化レベル調整手段21、固有名匿名化手段22及び文書出力手段24の機能及び動作は、第1の実施例におけるそれらの機能及び動作と同様である。   Next, a second embodiment of the present invention will be described with reference to the drawings. The document management apparatus shown in this embodiment corresponds to the document management apparatus shown in the second embodiment of the present invention. In the present embodiment, the functions and operations of the anonymization level adjusting unit 21, the proper name anonymizing unit 22, and the document output unit 24 are the same as those in the first embodiment.

本実施例において、固有名匿名化手段22が匿名表現を決定すると、表現区別手段23は、決定した複数の匿名表現中に、固有名IDが異なるにもかかわらず匿名表現が同一である表現が存在するか否かを判定する。表現区別手段23は、固有名IDが異なるが同一の匿名表現が用いられていると判定すると、それら同一の匿名表現を区別可能な別の表現に変更する。   In the present embodiment, when the proper name anonymization means 22 determines the anonymous expression, the expression distinguishing means 23 includes an expression in which the anonymous expression is the same among the plurality of determined anonymous expressions although the specific name IDs are different. Determine if it exists. If it is determined that the same anonymous expression is used although the unique name ID is different, the expression distinguishing means 23 changes the same anonymous expression to another expression that can be distinguished.

例えば、匿名化レベル調整手段21が決定した2つの匿名表現が、固有名IDが異なるにもかかわらず同じ「Aさん」という表現を用いている場合、表現区別手段23は、片方の匿名表現「Aさん」を表現「Bさん」に修正(変更)する。また、例えば、表現区別手段23は、対応する固有名IDを暗号化して文書中に埋め込むことによって、それら2つの匿名表現を区別可能な表現に変更する。この場合、表現区別手段23は、例えば、それら2つの匿名表現を、それぞれ「Aさん(ID=xaiA0a )」及び「Aさん(ID=eEaIa0 )」という表現に修正する。   For example, when the two anonymous expressions determined by the anonymization level adjusting means 21 use the same expression “Mr. A” even though the unique name IDs are different, the expression distinguishing means 23 uses one anonymous expression “ “Mr. A” is modified (changed) to the expression “Mr. B”. In addition, for example, the expression distinguishing unit 23 changes the two anonymous expressions into distinguishable expressions by encrypting the corresponding unique name ID and embedding it in the document. In this case, for example, the expression distinguishing unit 23 corrects the two anonymous expressions to expressions “Mr. A (ID = xaiA0a)” and “Mr. A (ID = eEaIa0)”, respectively.

また、固有名匿名化手段22が匿名表現を決定すると、表現区別手段23は、決定した複数の匿名表現中に、固有名IDが同一であるにもかかわらず匿名表現が異なる表現が存在するか否かを判定する。表現区別手段23は、固有名IDが同一であるが異なる匿名表現が用いられていると判定すると、それら異なる匿名表現を同一性が分かる表現に変更する。   Further, when the proper name anonymization means 22 determines the anonymous expression, the expression distinguishing means 23 includes, in the determined plural anonymous expressions, whether there are expressions with different anonymous expressions even though the specific name ID is the same. Determine whether or not. If the expression distinguishing means 23 determines that different anonymous expressions having the same unique name ID but the same unique ID are used, these different anonymous expressions are changed to expressions that show the identity.

例えば、匿名化レベル調整手段21が決定した2つの匿名表現「川崎市のAさん」と「○○社のBさん」とが同一の固有名IDを持つ場合(同一人物に対して異なる匿名表現を決定してしまった場合)、表現区別手段23は、それらの匿名表現を「川崎市(○○社)のAさん」という表現に修正し統一する。   For example, when two anonymous expressions “Mr. A of Kawasaki City” and “Mr. B of XX Company” determined by the anonymization level adjusting means 21 have the same unique name ID (different anonymous expressions for the same person) The expression distinguishing means 23 corrects and unifies these anonymous expressions into the expression “Mr. A of Kawasaki City (XX company)”.

また、例えば、表現区別手段23は、固有名IDを埋め込むことによって、それら異なる匿名表現を同一性が分かる表現に変更する。この場合、表現区別手段23は、例えば、それら異なる匿名表現をそれぞれ「川崎市のAさん(ID=xaiA0a )」及び「○○社のAさん(ID=xaiA0a )」という表現に修正する。さらに、例えば、表現区別手段23は、文書と合わせて固有名属性情報を出力することによって、それら異なる匿名表現を同一性が分かる表現に変更する。この場合、表現区別手段23は、文書中ではそれらの匿名表現を「Aさん(ID=xaiA0a )」という表現に統一して出力する。そして、表現区別手段23は、例えば、「Aさん=(ID= xaiA0a,住所=川崎市,勤務先=○○社)」という情報を固有名属性情報として、アクセス対象の文書とは別個に出力する。   Also, for example, the expression distinguishing means 23 changes these different anonymous expressions to expressions that can be identified by embedding the unique name ID. In this case, for example, the expression distinguishing means 23 corrects these different anonymous expressions to expressions “Mr. A of Kawasaki City (ID = xaiA0a)” and “Mr. A of XX Company (ID = xaiA0a)”, respectively. Further, for example, the expression distinguishing unit 23 outputs the unique name attribute information together with the document, thereby changing the different anonymous expressions into expressions that can be identified by the identity. In this case, the expression distinguishing means 23 unifies the anonymous expression into the expression “Mr. A (ID = xaiA0a)” in the document and outputs it. Then, the expression distinguishing means 23 outputs, for example, information “Mr. A = (ID = xaiA0a, address = Kawasaki City, company = XX company)” as specific name attribute information separately from the document to be accessed. To do.

次に、本発明の第3の実施例を図面を参照して説明する。図10は、文書管理装置を用いた情報共有システムの構成の一例を示すブロック図である。本実施例では、顧客からの電子メールや電話を受け付けるコンタクトセンタにおいて、顧客からの電子メールやアンケートの結果等の電子文書を情報共有システムを用いて情報共有する場合を説明する。   Next, a third embodiment of the present invention will be described with reference to the drawings. FIG. 10 is a block diagram illustrating an example of a configuration of an information sharing system using a document management apparatus. In this embodiment, a case will be described in which an electronic document such as an e-mail from a customer or a questionnaire result is shared using an information sharing system in a contact center that accepts an e-mail or a phone call from the customer.

図10に示すように、情報共有システムは、文書管理装置20、顧客端末40、オペレータ端末50、文書登録サーバ60、実世間情報取得サーバ70及びユーザ端末80A,80B,80Cを含む。   As shown in FIG. 10, the information sharing system includes a document management device 20, a customer terminal 40, an operator terminal 50, a document registration server 60, a real world information acquisition server 70, and user terminals 80A, 80B, and 80C.

顧客端末40は、顧客が使用する端末であり、例えば、パーソナルコンピュータや携帯電話機、PDA等の情報処理端末である。また、顧客端末40は、例えば、電話機やファクシミリ端末等であってもよい。顧客端末40は、顧客の操作に従って、インターネットや電話網等の通信ネットワークを介して、各種電子文書をコンタクトセンタに送信する機能を備える。本実施例では、顧客端末40は、顧客の各種個人情報が含まれる電子文書をコンタクトセンタに送信する。例えば、顧客端末40は、商品やサービスの問い合わせメールやアンケート結果を含む文書をコンタクトセンタに送信する。なお、図10では、1つの顧客端末40を示しているが、情報共有システムは、複数の顧客端末40を含む。   The customer terminal 40 is a terminal used by a customer, for example, an information processing terminal such as a personal computer, a mobile phone, or a PDA. Further, the customer terminal 40 may be, for example, a telephone or a facsimile terminal. The customer terminal 40 has a function of transmitting various electronic documents to a contact center via a communication network such as the Internet or a telephone network in accordance with a customer operation. In the present embodiment, the customer terminal 40 transmits an electronic document including various customer personal information to the contact center. For example, the customer terminal 40 transmits a document including an inquiry mail for a product or service and a questionnaire result to the contact center. In FIG. 10, one customer terminal 40 is shown, but the information sharing system includes a plurality of customer terminals 40.

オペレータ端末50は、コンタクトセンタ窓口のオペレータが使用する端末であり、例えば、パーソナルコンピュータ等の情報処理端末である。また、オペレータ端末50は、例えば、電話機やファクシミリ端末等であってもよい。オペレータ端末50は、顧客端末40から、通信ネットワークを介して各種電子文書を受信する機能を備える。また、オペレータ端末50は、顧客端末40からの各種電子文書を文書登録サーバ60に出力する機能を備える。   The operator terminal 50 is a terminal used by an operator at a contact center window, and is, for example, an information processing terminal such as a personal computer. The operator terminal 50 may be, for example, a telephone or a facsimile terminal. The operator terminal 50 has a function of receiving various electronic documents from the customer terminal 40 via a communication network. The operator terminal 50 also has a function of outputting various electronic documents from the customer terminal 40 to the document registration server 60.

例えば、オペレータ端末50は、顧客端末40から受信した電子メール(商品の問い合わせやアンケート結果)を文書登録サーバ60に出力する。また、例えば、オペレータ端末50は、顧客とオペレータとの通話中に、オペレータの入力操作に従って入力したアンケートの結果等を含む電子文書を文書登録サーバ60に出力する。なお、図1では、1つのオペレータ端末50を示しているが、情報共有システムは、複数のオペレータ端末50を含む。   For example, the operator terminal 50 outputs an e-mail (product inquiry or questionnaire result) received from the customer terminal 40 to the document registration server 60. Further, for example, the operator terminal 50 outputs an electronic document including a questionnaire result and the like input according to an input operation of the operator to the document registration server 60 during a call between the customer and the operator. Although one operator terminal 50 is shown in FIG. 1, the information sharing system includes a plurality of operator terminals 50.

文書登録サーバ60は、具体的には、ワークステーションやパーソナルコンピュータ等の情報処理装置である。文書登録サーバ60は、オペレータ端末50から入力した各種電子文書を文書管理装置20の文書データベース12に蓄積させる機能を備える。また、文書登録サーバ60は、入力した電子文書中の固有名表現を特定する機能を備える。また、文書登録サーバ60は、特定した各固有名表現の位置や固有名IDを文書管理装置20の固有名出現位置データベース13に記憶させる機能を備える。また、文書登録サーバ60は、特定した各固有名表現に対する匿名表現を匿名化レベル毎に作成する機能を備える。また、文書登録サーバ60は、作成した匿名表現を固有名属性データベース14に記憶させる機能を備える。   Specifically, the document registration server 60 is an information processing apparatus such as a workstation or a personal computer. The document registration server 60 has a function of storing various electronic documents input from the operator terminal 50 in the document database 12 of the document management apparatus 20. Further, the document registration server 60 has a function of specifying a proper name expression in the input electronic document. In addition, the document registration server 60 has a function of storing the position and unique name ID of each identified unique name expression in the unique name appearance position database 13 of the document management apparatus 20. In addition, the document registration server 60 has a function of creating an anonymous expression for each identified proper name expression for each anonymization level. Further, the document registration server 60 has a function of storing the created anonymous expression in the proper name attribute database 14.

実世間情報取得サーバ70は、具体的には、ワークステーションやパーソナルコンピュータ等の情報処理装置である。実世間情報取得サーバ70は、各匿名表現が実社会で実際にどのレベルの匿名表現に相当するかを示す実世間評価情報を生成する機能を備える。また、実世間情報取得サーバ70は、生成した実世間評価情報を文書管理装置20の実世間情報データベース15に蓄積させる機能を備える。   The real world information acquisition server 70 is specifically an information processing apparatus such as a workstation or a personal computer. The real world information acquisition server 70 has a function of generating real world evaluation information indicating which level of anonymous expression each anonymous expression actually corresponds to in the real world. The real world information acquisition server 70 has a function of storing the generated real world evaluation information in the real world information database 15 of the document management apparatus 20.

文書管理装置20は、図10に示すように、文書管理サーバ2A、利用環境データベース11、文書データベース12、固有名出現位置データベース13、固有名属性データベース14及び実世間情報データベース15を含む。   The document management apparatus 20 includes a document management server 2A, a usage environment database 11, a document database 12, a proper name appearance position database 13, a proper name attribute database 14, and a real world information database 15 as shown in FIG.

文書管理サーバ2Aは、具体的には、ワークステーションやパーソナルコンピュータ等の情報処理装置である。なお、本実施例において、文書管理サーバ2Aの基本的な機能は、第1の実施の形態で示したデータ処理装置2、又は第2の実施の形態で示したデータ処理装置3の機能と同様である。   Specifically, the document management server 2A is an information processing apparatus such as a workstation or a personal computer. In this embodiment, the basic function of the document management server 2A is the same as the function of the data processing device 2 shown in the first embodiment or the data processing device 3 shown in the second embodiment. It is.

利用環境データベース11、文書データベース12、固有名出現位置データベース13、固有名属性データベース14及び実世間情報データベース15は、具体的には、磁気ディスク装置等のデータベース装置である。なお、本実施例において、利用環境データベース11、文書データベース12、固有名出現位置データベース13、固有名属性データベース14及び実世間情報データベース15が記憶する情報の内容は、第1の実施の形態又は第2の実施の形態で示したそれらのデータベースが記憶する情報の内容と同様である。   Specifically, the usage environment database 11, the document database 12, the proper name appearance position database 13, the proper name attribute database 14, and the real world information database 15 are database devices such as magnetic disk devices. In this embodiment, the contents of the information stored in the usage environment database 11, the document database 12, the proper name appearance position database 13, the proper name attribute database 14, and the real world information database 15 are the same as those in the first embodiment or the first embodiment. The contents of the information stored in those databases shown in the second embodiment are the same.

ユーザ端末80A,80B,80Cは、電子文書を利用するユーザが使用する端末であり、例えば、パーソナルコンピュータ等の情報処理端末である。本実施例において、ユーザ端末80A,80B,80Cは、例えば、コンタクトセンタ内の部門に属するユーザ(例えば、オペレータ)によって使用される。また、ユーザ端末80A,80B,80Cは、例えば、コンタクトセンタ以外の社内の関連部門(例えば、営業部門)のユーザによって使用される。   The user terminals 80A, 80B, and 80C are terminals used by users who use electronic documents, and are information processing terminals such as personal computers, for example. In the present embodiment, the user terminals 80A, 80B, 80C are used by, for example, a user (for example, an operator) belonging to a department in the contact center. The user terminals 80A, 80B, and 80C are used by users in related departments (for example, sales departments) other than the contact center, for example.

ユーザ端末80A,80B,80Cは、ユーザの操作に従って、電子文書の利用要求を、LAN等の社内ネットワークを介して文書管理装置20に送信する機能を備える。また、ユーザ端末80A,80B,80Cは、文書管理装置20から、社内ネットワークを介して電子文書を受信する機能を備える。また、ユーザ端末80A,80B,80Cは、受信した電子文書をディスプレイ装置等の表示装置に表示する機能を備える。   The user terminals 80A, 80B, and 80C have a function of transmitting a request for using an electronic document to the document management apparatus 20 via an in-house network such as a LAN in accordance with a user operation. Further, the user terminals 80A, 80B, and 80C have a function of receiving an electronic document from the document management apparatus 20 via the in-house network. The user terminals 80A, 80B, and 80C have a function of displaying the received electronic document on a display device such as a display device.

なお、ユーザ端末80A,80B,80Cは、企業等の社内の端末に限らず、例えば、顧客が使用する社外の端末であってもよい。この場合、ユーザ端末80A,80B,80Cは、電子文書の利用要求を、インターネット等の通信ネットワークを介して文書管理装置20に送信する。また、ユーザ端末80A,80B,80Cは、文書管理装置20から、インターネット等の通信ネットワークを介して電子文書を受信し、受信した電子文書を表示装置に表示する。また、図10では、3つのユーザ端末80A,80B,80Cを示しているが、情報共有システムは、4以上のユーザ端末を含んでいてもよい。   The user terminals 80A, 80B, and 80C are not limited to internal terminals such as companies, but may be external terminals used by customers, for example. In this case, the user terminals 80A, 80B, and 80C transmit an electronic document use request to the document management apparatus 20 via a communication network such as the Internet. In addition, the user terminals 80A, 80B, and 80C receive the electronic document from the document management device 20 via a communication network such as the Internet, and display the received electronic document on the display device. 10 shows three user terminals 80A, 80B, and 80C, the information sharing system may include four or more user terminals.

次に、本実施例の動作を説明する。本実施例では、情報共有システムを利用したコンタクトセンタでのサービスイメージを、図10を用いて説明する。顧客端末40は、顧客の操作に従って、コンタクトセンタの窓口のオペレータ端末50に、製品に関する問い合わせの電子メールや、アンケートの結果等の個人情報を含む文書を送信する。文書登録サーバ60は、顧客端末40からの電子文書を予め文書データベース12に登録する。また、文書登録サーバ60は、文書中の個人情報(名前や住所)の範囲を抽出して、特定した固有名表現の情報を予めデータベース13,14に登録する。   Next, the operation of this embodiment will be described. In this embodiment, a service image at a contact center using an information sharing system will be described with reference to FIG. The customer terminal 40 transmits a document including personal information such as an e-mail about a product inquiry and a questionnaire result to the operator terminal 50 at the contact center in accordance with the operation of the customer. The document registration server 60 registers the electronic document from the customer terminal 40 in the document database 12 in advance. Further, the document registration server 60 extracts the range of personal information (name and address) in the document and registers the specified unique name expression information in the databases 13 and 14 in advance.

文書管理サーバ2Aは、電子文書を要求されると、ユーザ端末80A,80B,80Cから受信した利用環境の条件、及び利用環境データベース11が記憶する利用環境情報にもとづいて、アクセス対象の電子文書を匿名化する際の匿名化レベルを決定する。また、文書管理サーバ2Aは、ユーザ端末80A,80B,80Cから受信した文書ID集合にもとづいて、文書データベース12からアクセス対象の電子文書を全て抽出する。また、文書管理サーバ2Aは、決定した匿名化レベルと、固有名出現位置データベース13及び固有名属性データベース14が記憶する情報にもとづいて、アクセス対象文書を匿名化する際の匿名表現を決定する。   When the electronic document is requested, the document management server 2A selects the electronic document to be accessed based on the usage environment conditions received from the user terminals 80A, 80B, and 80C and the usage environment information stored in the usage environment database 11. Determine the anonymization level when anonymizing. Further, the document management server 2A extracts all electronic documents to be accessed from the document database 12 based on the document ID set received from the user terminals 80A, 80B, 80C. Further, the document management server 2A determines an anonymity expression when the access target document is anonymized based on the determined anonymization level and information stored in the proper name appearance position database 13 and the proper name attribute database 14.

また、文書管理サーバ2Aは、実世間情報データベース15が記憶する実世間評価情報にもとづいて、決定した匿名表現の匿名化レベルが実世間でのレベルに適合するか否かを評価する。また、文書管理サーバ2Aは、抽出したアクセス対象の電子文書中の固有名表現を、決定した匿名表現に置き換える。そして、文書管理サーバ2Aは、匿名表現に置き換えた電子文書を、社内ネットワークを介してユーザ端末80A,80B,80Cに送信する。   Further, the document management server 2A evaluates whether or not the determined anonymization level of the anonymous expression matches the level in the real world based on the real world evaluation information stored in the real world information database 15. Further, the document management server 2A replaces the unique name expression in the extracted electronic document to be accessed with the determined anonymous expression. Then, the document management server 2A transmits the electronic document replaced with the anonymous expression to the user terminals 80A, 80B, and 80C via the in-house network.

本実施例では、登録した情報を参照する際に、例えば、(1)コンタクトセンタ内の部門に属するユーザAがコンタクトセンタの窓口からアクセスする場合には、名前や住所がそのまま表示される文書にアクセスできるようにする。すなわち、文書管理装置20は、匿名化を行わずに、オリジナルの電子文書をそのままユーザ端末80Aに出力する。また、例えば、(2)コンタクトセンタの関連部門に属するユーザBがアクセスする際には、文書中の個人名を「川崎市のAさん」のように匿名化した文書しかアクセスできないように制御する。すなわち、文書管理装置20は、電子文書中の固有名表現を匿名表現「川崎市のAさん」で置き換えて、電子文書をユーザ端末80Bに出力する。そのようにすることによって、ユーザBがコンタクトセンタで蓄積する文書の内容を理解できるが、利用文書に個人情報が含まれないようにすることができ、ユーザBが故意に又は誤って個人情報を漏洩するのを防ぐことができる。   In this embodiment, when referring to the registered information, for example, (1) when a user A belonging to a department in the contact center accesses from a contact center window, the name or address is displayed as it is in a document displayed as it is. Make it accessible. That is, the document management apparatus 20 outputs the original electronic document as it is to the user terminal 80A without performing anonymization. Further, for example, (2) when the user B belonging to the related department of the contact center accesses, it is controlled so that only the anonymized document such as “Mr. A in Kawasaki City” can be accessed. . That is, the document management apparatus 20 replaces the proper name expression in the electronic document with the anonymous expression “Mr. A in Kawasaki City” and outputs the electronic document to the user terminal 80B. By doing so, the user B can understand the contents of the documents accumulated in the contact center, but the use document can be prevented from including personal information, and the user B intentionally or mistakenly stores the personal information. Leakage can be prevented.

本発明は、コンピュータ上に蓄積される顧客からのメールやアンケート結果、掲示板等の情報の電子化テキスト(電子文書)を閲覧又はコピーするための文書管理装置の用途に適用できる。また、本発明は、電子文書を共有化する情報共有システムの用途に適用できる。また、本発明は、文書管理装置をコンピュータを用いて実現するためのプログラムの用途に適用できる。   The present invention can be applied to the use of a document management apparatus for viewing or copying electronic texts (electronic documents) of information such as e-mails from customers, questionnaire results, bulletin boards, and the like stored on a computer. The present invention can also be applied to the use of an information sharing system for sharing an electronic document. Further, the present invention can be applied to the use of a program for realizing the document management apparatus using a computer.

本発明による文書管理装置の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the document management apparatus by this invention. 文書中の固有名を匿名化して文書を出力する文書匿名化処理の一例を示す流れ図である。It is a flowchart which shows an example of the document anonymization process which anonymizes the specific name in a document and outputs a document. 文書管理装置の他の構成例を示すブロック図である。It is a block diagram which shows the other structural example of a document management apparatus. 文書中の固有名を匿名化して文書を出力する文書匿名化処理の他の例を示す流れ図である。It is a flowchart which shows the other example of the document anonymization process which anonymizes the specific name in a document and outputs a document. 利用環境データベースが記憶する情報の例を示す説明図である。It is explanatory drawing which shows the example of the information which a utilization environment database memorize | stores. 文書データベースが記憶する情報の例を示す説明図である。It is explanatory drawing which shows the example of the information which a document database memorize | stores. 固有名出現位置データベースが記憶する情報の例を示す説明図である。It is explanatory drawing which shows the example of the information which a proper name appearance position database memorize | stores. 固有名属性データベースが記憶する情報の例を示す説明図である。It is explanatory drawing which shows the example of the information which a proper name attribute database memorize | stores. 実世間情報データベースが記憶する情報の例を示す説明図である。It is explanatory drawing which shows the example of the information which a real world information database memorize | stores. 文書管理装置を用いた情報共有システムの構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the information sharing system using a document management apparatus.

符号の説明Explanation of symbols

1 記憶装置
2 データ処理装置
11 利用環境データベース
12 文書データベース
13 固有名出現位置データベース
14 固有名属性データベース
15 実世間情報データベース
21 匿名化レベル調整手段
22 固有名匿名化手段
24 文書出力手段
DESCRIPTION OF SYMBOLS 1 Storage device 2 Data processing apparatus 11 Usage environment database 12 Document database 13 Unique name appearance position database 14 Unique name attribute database 15 Real world information database 21 Anonymization level adjustment means 22 Specific name anonymization means 24 Document output means

Claims (22)

電子文書を匿名化する文書匿名化装置であって、
電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定する匿名化レベル決定手段と、
前記匿名化レベル決定手段が決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定する匿名表現決定手段と、
処理対象の電子文書中の固有名詞を、前記匿名表現決定手段が決定した匿名表現に置き換える文書変換手段とを
備えたことを特徴とする文書匿名化装置。
A document anonymization device for anonymizing an electronic document,
Anonymization level determination means for determining an anonymization level indicating the degree of anonymization of the electronic document based on the usage environment information indicating the usage environment for using the electronic document;
According to the anonymization level determined by the anonymization level determination means, anonymity expression determination means for determining an anonymous expression for anonymizing a proper noun in the electronic document to be processed;
A document anonymization apparatus comprising: a document conversion unit that replaces a proper noun in an electronic document to be processed with an anonymous expression determined by the anonymous expression determination unit.
予め利用環境情報と匿名化レベルとを対応付けて記憶する匿名化レベル記憶手段と、
ユーザが電子文書を利用する利用環境の条件を入力する利用条件入力手段とを備え、
匿名化レベル決定手段は、
前記匿名化レベル記憶手段が記憶する利用環境情報のうち、前記利用条件入力手段が入力した利用環境の条件に合致する利用環境情報があるか否かを判断し、
前記利用環境の条件に合致する利用環境情報があると判断すると、前記利用環境の条件に合致する利用環境情報に対応する匿名化レベルを前記匿名化レベル記憶手段から抽出する
請求項1記載の文書匿名化装置。
Anonymization level storage means for storing the usage environment information and the anonymization level in association with each other;
Use condition input means for inputting conditions of a use environment in which a user uses an electronic document,
Anonymization level determination means
Of the usage environment information stored by the anonymization level storage means, determine whether there is usage environment information that matches the usage environment conditions input by the usage condition input means,
The document according to claim 1, wherein when it is determined that there is usage environment information that matches the usage environment condition, an anonymization level corresponding to the usage environment information that matches the usage environment condition is extracted from the anonymization level storage unit. Anonymization device.
匿名化レベル記憶手段は、電子文書へのアクセス権限の有無、電子文書の利用場所又は電子文書の利用方法の情報を、利用環境情報として匿名化レベルに対応付けて記憶し、
利用条件入力手段は、利用環境の条件として、ユーザのアクセス権限の有無、ユーザが電子文書を利用する場所、又はユーザが電子文書を利用する方法を入力し、
匿名化レベル決定手段は、前記匿名化レベル記憶手段が記憶するアクセス権限の有無、利用場所又は利用方法の情報と、前記利用条件入力手段が入力したアクセス権限の有無、利用する場所又は利用する方法とが合致するか否かを判断する
請求項2記載の文書匿名化装置。
The anonymization level storage means stores the presence / absence of access authority to the electronic document, the usage location of the electronic document or the usage method of the electronic document in association with the anonymization level as usage environment information,
The use condition input means inputs the presence / absence of the user's access authority, the location where the user uses the electronic document, or the method where the user uses the electronic document as the conditions of the usage environment,
Anonymization level determination means includes information on presence / absence of access authority, usage location or usage method stored in the anonymization level storage means, presence / absence of access authority input by the usage condition input means, usage location, or usage method The document anonymization device according to claim 2, wherein the document anonymization device is determined.
予め匿名表現を固有名詞に対応付けて記憶する匿名表現記憶手段を備え、
匿名表現決定手段は、処理対象の電子文書に含まれる固有名詞を特定し、前記特定した固有名詞に対応する匿名表現を前記匿名表現記憶手段から抽出する
請求項1から請求項3のうちのいずれか1項に記載の文書匿名化装置。
Anonymous expression storage means for storing the anonymous expression in association with the proper noun in advance is provided,
The anonymous expression determination means identifies a proper noun included in the electronic document to be processed, and extracts an anonymous expression corresponding to the specified proper noun from the anonymous expression storage means. The document anonymization apparatus of Claim 1.
匿名表現記憶手段は、匿名化レベル毎の匿名表現を固有名詞に対応付けて予め記憶し、
匿名表現決定手段は、匿名レベル決定手段が決定した匿名化レベルに対応する匿名表現を前記匿名表現記憶手段から抽出する
請求項4記載の文書匿名化装置。
Anonymous expression storage means stores in advance an anonymous expression for each anonymization level in association with a proper noun,
The document anonymization device according to claim 4, wherein the anonymous expression determination unit extracts an anonymous expression corresponding to the anonymization level determined by the anonymous level determination unit from the anonymous expression storage unit.
匿名表現決定手段が処理対象の電子文書中の固有名詞に対する匿名表現を決定すると、匿名化の度合を評価するための所定の評価情報にもとづいて、前記決定した匿名表現の匿名化レベルが実社会における匿名化の度合に合致しているか否かを評価する匿名表現評価手段を備えた請求項1から請求項5のうちのいずれか1項に記載の文書匿名化装置。   When the anonymous expression determination means determines the anonymous expression for the proper noun in the electronic document to be processed, the anonymization level of the determined anonymous expression is determined in the real world based on predetermined evaluation information for evaluating the degree of anonymization. The document anonymization device according to any one of claims 1 to 5, further comprising an anonymous expression evaluation unit that evaluates whether or not the degree of anonymization is met. 匿名表現決定手段が決定した匿名表現を所定の条件に従って変更する匿名表現変更手段を備え、
前記匿名表現変更手段は、
匿名表現決定手段が決定した複数の匿名表現のうち、異なる表現であって同じ固有名詞を示す匿名表現が存在するか否かを判断し、
異なる表現であって同じ固有名詞を示す匿名表現が存在すると判断すると、前記異なる表現であって同じ固有名詞を示す各匿名表現を同じ表現に変更し、
匿名表現決定手段が決定した複数の匿名表現のうち、同じ表現であって異なる固有名詞を示す匿名表現が存在するか否かを判断し、
同じ表現であって異なる固有名詞を示す匿名表現が存在すると判断すると、前記同じ表現であって異なる固有名詞を示す各匿名表現を異なる表現に変更し、
文書変換手段は、処理対象の電子文書中の固有名詞を、前記匿名表現変更手段が変更した匿名表現に置き換える
請求項1から請求項6のうちのいずれか1項に記載の文書匿名化装置。
Anonymous expression changing means for changing the anonymous expression determined by the anonymous expression determining means according to a predetermined condition,
The anonymous expression changing means is:
Among the plurality of anonymous expressions determined by the anonymous expression determining means, it is determined whether there is an anonymous expression that is a different expression and indicates the same proper noun,
If it is determined that there is an anonymous expression that is a different expression and indicates the same proper noun, each anonymous expression that is the different expression and indicates the same proper noun is changed to the same expression,
Among the plurality of anonymous expressions determined by the anonymous expression determination means, it is determined whether there is an anonymous expression indicating the same proper and different proper nouns,
If it is determined that there is an anonymous expression indicating the same proper and different proper noun, each anonymous expression indicating the same proper and different proper noun is changed to a different expression,
The document anonymization device according to any one of claims 1 to 6, wherein the document conversion unit replaces the proper noun in the electronic document to be processed with the anonymous expression changed by the anonymous expression changing unit.
電子文書を蓄積し管理する文書管理装置であって、
電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定する匿名化レベル決定手段と、
前記匿名化レベル決定手段が決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定する匿名表現決定手段と、
処理対象の電子文書中の固有名詞を、前記匿名表現決定手段が決定した匿名表現に置き換える文書変換手段とを
備えたことを特徴とする文書管理装置。
A document management device for storing and managing electronic documents,
Anonymization level determination means for determining an anonymization level indicating the degree of anonymization of the electronic document based on the usage environment information indicating the usage environment for using the electronic document;
According to the anonymization level determined by the anonymization level determination means, anonymity expression determination means for determining an anonymous expression for anonymizing a proper noun in the electronic document to be processed;
A document management apparatus comprising: a document conversion unit that replaces a proper noun in an electronic document to be processed with an anonymous expression determined by the anonymous expression determination unit.
電子文書を複数蓄積する文書蓄積手段と、
処理対象の電子文書を前記文書蓄積手段から抽出する文書抽出手段とを備え、
文書変換手段は、前記文書抽出手段が抽出した電子文書中の固有名詞を匿名表現に置き換えて電子文書を出力する
請求項8記載の文書管理装置。
Document storage means for storing a plurality of electronic documents;
A document extraction unit that extracts an electronic document to be processed from the document storage unit;
The document management apparatus according to claim 8, wherein the document conversion unit outputs the electronic document by replacing the proper noun in the electronic document extracted by the document extraction unit with an anonymous expression.
匿名表現決定手段が処理対象の電子文書中の固有名詞に対する匿名表現を決定すると、匿名化の度合を評価するための所定の評価情報にもとづいて、前記決定した匿名表現の匿名化レベルが実社会における匿名化の度合に合致しているか否かを評価する匿名表現評価手段を備えた請求項8又は請求項9記載の文書管理装置。   When the anonymous expression determination means determines the anonymous expression for the proper noun in the electronic document to be processed, the anonymization level of the determined anonymous expression is determined in the real world based on predetermined evaluation information for evaluating the degree of anonymization. The document management apparatus according to claim 8 or 9, further comprising an anonymous expression evaluation unit that evaluates whether or not the degree of anonymization is met. 匿名表現決定手段が決定した匿名表現を所定の条件に従って変更する匿名表現変更手段を備え、
前記匿名表現変更手段は、
匿名表現決定手段が決定した複数の匿名表現のうち、異なる表現であって同じ固有名詞を示す匿名表現が存在するか否かを判断し、
異なる表現であって同じ固有名詞を示す匿名表現が存在すると判断すると、前記異なる表現であって同じ固有名詞を示す各匿名表現を同じ表現に変更し、
匿名表現決定手段が決定した複数の匿名表現のうち、同じ表現であって異なる固有名詞を示す匿名表現が存在するか否かを判断し、
同じ表現であって異なる固有名詞を示す匿名表現が存在すると判断すると、前記同じ表現であって異なる固有名詞を示す各匿名表現を異なる表現に変更し、
文書変換手段は、処理対象の電子文書中の固有名詞を、前記匿名表現変更手段が変更した匿名表現に置き換える
請求項8から請求項10のうちのいずれか1項に記載の文書管理装置。
Anonymous expression changing means for changing the anonymous expression determined by the anonymous expression determining means according to a predetermined condition,
The anonymous expression changing means is:
Among the plurality of anonymous expressions determined by the anonymous expression determining means, it is determined whether there is an anonymous expression that is a different expression and indicates the same proper noun,
If it is determined that there is an anonymous expression that is a different expression and indicates the same proper noun, each anonymous expression that is the different expression and indicates the same proper noun is changed to the same expression,
Among the plurality of anonymous expressions determined by the anonymous expression determination means, it is determined whether there is an anonymous expression indicating the same proper and different proper nouns,
If it is determined that there is an anonymous expression indicating the same proper and different proper noun, each anonymous expression indicating the same proper and different proper noun is changed to a different expression,
The document management apparatus according to any one of claims 8 to 10, wherein the document conversion unit replaces the proper noun in the electronic document to be processed with the anonymous expression changed by the anonymous expression changing unit.
電子文書を共有するための情報共有システムであって、
ユーザ端末と、
電子文書を蓄積し管理する文書管理装置とを備え、
前記ユーザ端末は、処理対象の電子文書の抽出要求を、ネットワークを介して前記文書管理装置に送信し、
前記文書管理装置は、
電子文書を複数蓄積する文書蓄積手段と、
前記ユーザ端末から要求された電子文書を前記文書蓄積手段から抽出する文書抽出手段と、
電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定する匿名化レベル決定手段と、
前記匿名化レベル決定手段が決定した匿名化レベルに従って、電子文書中の固有名詞を匿名化するための匿名表現を決定する匿名表現決定手段と、
前記文書抽出手段が抽出した電子文書中の固有名詞を、前記匿名表現決定手段が決定した匿名表現に置き換える文書変換手段と、
前記文書変換手段が固有名詞を匿名表現に置き換えた電子文書を、ネットワークを介して前記ユーザ端末に送信する文書送信手段とを含む
ことを特徴とする情報共有システム。
An information sharing system for sharing electronic documents,
A user terminal,
A document management device for storing and managing electronic documents,
The user terminal sends an extraction request for an electronic document to be processed to the document management apparatus via a network,
The document management apparatus includes:
Document storage means for storing a plurality of electronic documents;
Document extraction means for extracting the electronic document requested from the user terminal from the document storage means;
Anonymization level determination means for determining an anonymization level indicating the degree of anonymization of the electronic document based on the usage environment information indicating the usage environment for using the electronic document;
According to the anonymization level determined by the anonymization level determination means, anonymity expression determination means for determining an anonymous expression for anonymizing proper nouns in the electronic document;
Document conversion means for replacing the proper noun in the electronic document extracted by the document extraction means with the anonymous expression determined by the anonymous expression determination means,
An information sharing system comprising: a document transmission unit that transmits an electronic document in which the document conversion unit replaces a proper noun with an anonymous expression to the user terminal via a network.
電子文書を匿名化する文書匿名化方法であって、
電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定するステップと、
前記決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定するステップと、
処理対象の電子文書中の固有名詞を、前記決定した匿名表現に置き換えるステップとを含む
ことを特徴とする文書匿名化方法。
A document anonymization method for anonymizing an electronic document,
Determining an anonymization level indicating a degree of anonymizing the electronic document based on usage environment information indicating a usage environment for using the electronic document;
According to the determined anonymization level, determining an anonymous expression for anonymizing the proper noun in the electronic document to be processed;
Replacing the proper noun in the electronic document to be processed with the determined anonymous expression.
電子文書を蓄積し管理する文書管理方法であって、
電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定するステップと、
前記決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定するステップと、
処理対象の電子文書中の固有名詞を、前記決定した匿名表現に置き換えて電子文書を出力するステップとを含む
ことを特徴とする文書管理方法。
A document management method for storing and managing electronic documents,
Determining an anonymization level indicating a degree of anonymizing the electronic document based on usage environment information indicating a usage environment for using the electronic document;
According to the determined anonymization level, determining an anonymous expression for anonymizing the proper noun in the electronic document to be processed;
Replacing the proper noun in the electronic document to be processed with the determined anonymous expression and outputting the electronic document.
処理対象の電子文書中の固有名詞に対する匿名表現を決定すると、匿名化の度合を評価するための所定の評価情報にもとづいて、前記決定した匿名表現の匿名化レベルが実社会における匿名化の度合に合致しているか否かを評価するステップを含む請求項14記載の文書管理方法。   When the anonymous expression for the proper noun in the electronic document to be processed is determined, the anonymization level of the determined anonymous expression is determined based on the predetermined evaluation information for evaluating the degree of anonymization. The document management method according to claim 14, further comprising a step of evaluating whether or not they match. 決定した複数の匿名表現のうち、異なる表現であって同じ固有名詞を示す匿名表現が存在するか否かを判断するステップと、
異なる表現であって同じ固有名詞を示す匿名表現が存在すると判断すると、前記異なる表現であって同じ固有名詞を示す各匿名表現を同じ表現に変更するステップと、
処理対象の電子文書中の固有名詞を、前記変更した匿名表現に置き換えるステップとを含む
請求項14又は請求項15記載の文書管理方法。
A step of determining whether or not there is an anonymous expression indicating the same proper noun among different determined anonymous expressions;
If it is determined that there is an anonymous expression indicating the same proper noun in different expressions, the step of changing each anonymous expression indicating the same proper noun in the same expression to the same expression,
The document management method according to claim 14, further comprising: replacing a proper noun in the electronic document to be processed with the changed anonymous expression.
決定した複数の匿名表現のうち、同じ表現であって異なる固有名詞を示す匿名表現が存在するか否かを判断するステップと、
同じ表現であって異なる固有名詞を示す匿名表現が存在すると判断すると、前記同じ表現であって異なる固有名詞を示す各匿名表現を異なる表現に変更するステップと、
処理対象の電子文書中の固有名詞を、前記変更した匿名表現に置き換えるステップとを含む
請求項14から請求項16のうちのいずれか1項に記載の文書管理方法。
A step of determining whether or not there is an anonymous expression indicating a different proper noun among the plurality of determined anonymous expressions;
If it is determined that there is an anonymous expression indicating the same proper and different proper noun, the step of changing each anonymous expression indicating the same proper and different proper noun to a different expression,
The document management method according to any one of claims 14 to 16, further comprising: replacing a proper noun in the electronic document to be processed with the changed anonymous expression.
電子文書を共有するための情報共有方法であって、
電子文書を蓄積し管理する文書管理装置が、電子文書を予め複数蓄積するステップと、
ユーザ端末が、処理対象の電子文書の抽出要求を、ネットワークを介して前記文書管理装置に送信するステップと、
前記文書管理装置が、前記ユーザ端末から要求された電子文書を抽出するステップと、
前記文書管理装置が、電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定するステップと、
前記文書管理装置が、前記決定した匿名化レベルに従って、電子文書中の固有名詞を匿名化するための匿名表現を決定するステップと、
前記文書管理装置が、前記抽出した電子文書中の固有名詞を、前記決定した匿名表現に置き換えるステップと、
前記文書管理装置が、前記固有名詞を匿名表現に置き換えた電子文書を、ネットワークを介して前記ユーザ端末に送信するステップとを含む
ことを特徴とする情報共有方法。
An information sharing method for sharing an electronic document,
A document management device for storing and managing electronic documents, storing a plurality of electronic documents in advance;
A step in which a user terminal sends an extraction request for an electronic document to be processed to the document management apparatus via a network;
The document management device extracting an electronic document requested from the user terminal;
The document management device determines an anonymization level indicating a degree of anonymizing the electronic document based on usage environment information indicating a usage environment in which the electronic document is used;
The document management device determines an anonymity expression for anonymizing proper nouns in the electronic document according to the determined anonymization level;
The document management device replacing a proper noun in the extracted electronic document with the determined anonymous expression;
The document management apparatus includes a step of transmitting an electronic document in which the proper noun is replaced with an anonymous expression to the user terminal via a network.
電子文書を匿名化するための文書匿名化プログラムであって、
コンピュータに、
電子文書を利用する利用環境を示す利用環境情報にもとづいて、電子文書を匿名化する度合を示す匿名化レベルを決定する処理と、
前記決定した匿名化レベルに従って、処理対象の電子文書中の固有名詞を匿名化するための匿名表現を決定する処理と、
処理対象の電子文書中の固有名詞を、前記決定した匿名表現に置き換える処理とを
実行させる文書匿名化プログラム。
A document anonymization program for anonymizing an electronic document,
On the computer,
A process of determining an anonymization level indicating a degree of anonymizing an electronic document based on usage environment information indicating a usage environment for using the electronic document;
According to the determined anonymization level, a process for determining an anonymous expression for anonymizing a proper noun in the electronic document to be processed;
A document anonymization program that executes processing for replacing a proper noun in a processing target electronic document with the determined anonymous expression.
コンピュータに、
処理対象の電子文書中の固有名詞に対する匿名表現を決定すると、匿名化の度合を評価するための所定の評価情報にもとづいて、前記決定した匿名表現の匿名化レベルが実社会における匿名化の度合に合致しているか否かを評価する処理を実行させる
請求項19記載の文書匿名化プログラム。
On the computer,
When the anonymous expression for the proper noun in the electronic document to be processed is determined, the anonymization level of the determined anonymous expression is determined based on the predetermined evaluation information for evaluating the degree of anonymization. The document anonymization program according to claim 19, wherein a process for evaluating whether or not they match is executed.
コンピュータに、
決定した複数の匿名表現のうち、異なる表現であって同じ固有名詞を示す匿名表現が存在するか否かを判断する処理と、
異なる表現であって同じ固有名詞を示す匿名表現が存在すると判断すると、前記異なる表現であって同じ固有名詞を示す各匿名表現を同じ表現に変更する処理と、
処理対象の電子文書中の固有名詞を、前記変更した匿名表現に置き換える処理とを実行させる
請求項19又は請求項20記載の文書匿名化プログラム。
On the computer,
Among the plurality of determined anonymous expressions, a process of determining whether there is an anonymous expression that is a different expression and indicates the same proper noun,
When it is determined that there is an anonymous expression indicating the same proper noun with different expressions, a process of changing each anonymous expression indicating the same proper noun to the same expression with the same proper noun,
21. The document anonymization program according to claim 19 or 20, wherein a process for replacing a proper noun in an electronic document to be processed with the changed anonymous expression is executed.
コンピュータに、
決定した複数の匿名表現のうち、同じ表現であって異なる固有名詞を示す匿名表現が存在するか否かを判断する処理と、
同じ表現であって異なる固有名詞を示す匿名表現が存在すると判断すると、前記同じ表現であって異なる固有名詞を示す各匿名表現を異なる表現に変更する処理と、
処理対象の電子文書中の固有名詞を、前記変更した匿名表現に置き換える処理とを実行させる
請求項19から請求項21のうちのいずれか1項に記載の文書匿名化プログラム。
On the computer,
Among the plurality of determined anonymous expressions, a process for determining whether there is an anonymous expression indicating the same proper and different proper nouns; and
If it is determined that there is an anonymous expression indicating the same proper and different proper noun, the process of changing each anonymous expression indicating the same proper and different proper noun to a different expression,
The document anonymization program according to any one of claims 19 to 21, wherein a process of replacing a proper noun in an electronic document to be processed with the changed anonymous expression is executed.
JP2004380066A 2004-12-28 2004-12-28 Document anonymization device, document management device, document anonymization method, and document anonymization program Expired - Fee Related JP4622514B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004380066A JP4622514B2 (en) 2004-12-28 2004-12-28 Document anonymization device, document management device, document anonymization method, and document anonymization program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004380066A JP4622514B2 (en) 2004-12-28 2004-12-28 Document anonymization device, document management device, document anonymization method, and document anonymization program

Publications (2)

Publication Number Publication Date
JP2006185311A true JP2006185311A (en) 2006-07-13
JP4622514B2 JP4622514B2 (en) 2011-02-02

Family

ID=36738367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004380066A Expired - Fee Related JP4622514B2 (en) 2004-12-28 2004-12-28 Document anonymization device, document management device, document anonymization method, and document anonymization program

Country Status (1)

Country Link
JP (1) JP4622514B2 (en)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128995A (en) * 2008-11-28 2010-06-10 Nec Corp Information management apparatus, data processing method of the same, information management system, and computer program
JPWO2008126149A1 (en) * 2007-03-30 2010-07-15 富士通株式会社 Document anonymization device
JP2011170108A (en) * 2010-02-18 2011-09-01 Nikon Corp Information processing apparatus
JP2012208703A (en) * 2011-03-29 2012-10-25 Fujitsu Ltd Nursing care record browsing program, nursing care record browsing device and nursing care record browsing method
WO2014073617A1 (en) * 2012-11-07 2014-05-15 学校法人沖縄科学技術大学院大学学園 Data communications system, data analysis device, data communications method, and program
JP2014512056A (en) * 2011-04-11 2014-05-19 インタートラスト テクノロジーズ コーポレイション Systems and methods for information security
US9013399B2 (en) 2010-02-18 2015-04-21 Nikon Corporation Information processing device, portable device and information processing system
JP2015130022A (en) * 2014-01-07 2015-07-16 Kddi株式会社 Anonymization parameter selection device, method and program
US9466054B1 (en) 2003-06-05 2016-10-11 Intertrust Technologies Corporation Interoperable systems and methods for peer-to-peer service orchestration
JP2017503278A (en) * 2014-01-02 2017-01-26 アルカテル−ルーセント Role-based anonymization
US9626667B2 (en) 2005-10-18 2017-04-18 Intertrust Technologies Corporation Digital rights management engine systems and methods
JP2017091515A (en) * 2015-11-03 2017-05-25 パロ アルト リサーチ センター インコーポレイテッド Computer-implemented system and method for automatically identifying attributes for anonymization
JP2017215869A (en) * 2016-06-01 2017-12-07 Necソリューションイノベータ株式会社 Anonymization processor, anonymization processing method, and program
JP2018147205A (en) * 2017-03-06 2018-09-20 富士ゼロックス株式会社 Information processing device and information processing program
JP2020021505A (en) * 2019-10-09 2020-02-06 株式会社ニコン Information processing device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002269081A (en) * 2001-01-05 2002-09-20 Fujitsu Ltd Device and method for setting document anonymity, computer-readable recording medium with recorded anonymity setting program and the program
JP2002312362A (en) * 2001-04-18 2002-10-25 Nippon Telegr & Teleph Corp <Ntt> Document disclosure method, document browsing system, and program and recording medium therefor
JP2003016064A (en) * 2001-06-29 2003-01-17 Toshiba Corp Apparatus, method and program for creating for map of real word/encrypted word in electronic document, apparatus for encryption of the document and apparatus for decryption the document

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002269081A (en) * 2001-01-05 2002-09-20 Fujitsu Ltd Device and method for setting document anonymity, computer-readable recording medium with recorded anonymity setting program and the program
JP2002312362A (en) * 2001-04-18 2002-10-25 Nippon Telegr & Teleph Corp <Ntt> Document disclosure method, document browsing system, and program and recording medium therefor
JP2003016064A (en) * 2001-06-29 2003-01-17 Toshiba Corp Apparatus, method and program for creating for map of real word/encrypted word in electronic document, apparatus for encryption of the document and apparatus for decryption the document

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9466054B1 (en) 2003-06-05 2016-10-11 Intertrust Technologies Corporation Interoperable systems and methods for peer-to-peer service orchestration
US9626667B2 (en) 2005-10-18 2017-04-18 Intertrust Technologies Corporation Digital rights management engine systems and methods
JPWO2008126149A1 (en) * 2007-03-30 2010-07-15 富士通株式会社 Document anonymization device
JP2010128995A (en) * 2008-11-28 2010-06-10 Nec Corp Information management apparatus, data processing method of the same, information management system, and computer program
JP2011170108A (en) * 2010-02-18 2011-09-01 Nikon Corp Information processing apparatus
US9013399B2 (en) 2010-02-18 2015-04-21 Nikon Corporation Information processing device, portable device and information processing system
US9626151B2 (en) 2010-02-18 2017-04-18 Nikon Corporation Information processing device, portable device and information processing system
JP2012208703A (en) * 2011-03-29 2012-10-25 Fujitsu Ltd Nursing care record browsing program, nursing care record browsing device and nursing care record browsing method
US9589110B2 (en) 2011-04-11 2017-03-07 Intertrust Technologies Corporation Information security systems and methods
US10009384B2 (en) 2011-04-11 2018-06-26 Intertrust Technologies Corporation Information security systems and methods
JP2014512056A (en) * 2011-04-11 2014-05-19 インタートラスト テクノロジーズ コーポレイション Systems and methods for information security
US9684764B2 (en) 2012-11-07 2017-06-20 Okinawa Institute of Science and Technology Graduate University Data communication system, data analysis apparatus, data communication method, and program product
JP2014095931A (en) * 2012-11-07 2014-05-22 Okinawa Institute Of Science And Technology Graduate Univ Data communication system, data analysis device, data communication method and program
WO2014073617A1 (en) * 2012-11-07 2014-05-15 学校法人沖縄科学技術大学院大学学園 Data communications system, data analysis device, data communications method, and program
JP2017503278A (en) * 2014-01-02 2017-01-26 アルカテル−ルーセント Role-based anonymization
JP2015130022A (en) * 2014-01-07 2015-07-16 Kddi株式会社 Anonymization parameter selection device, method and program
JP2017091515A (en) * 2015-11-03 2017-05-25 パロ アルト リサーチ センター インコーポレイテッド Computer-implemented system and method for automatically identifying attributes for anonymization
JP2017215869A (en) * 2016-06-01 2017-12-07 Necソリューションイノベータ株式会社 Anonymization processor, anonymization processing method, and program
JP2018147205A (en) * 2017-03-06 2018-09-20 富士ゼロックス株式会社 Information processing device and information processing program
JP2020021505A (en) * 2019-10-09 2020-02-06 株式会社ニコン Information processing device

Also Published As

Publication number Publication date
JP4622514B2 (en) 2011-02-02

Similar Documents

Publication Publication Date Title
EP3788533B1 (en) Protecting personally identifiable information (pii) using tagging and persistence of pii
JP4622514B2 (en) Document anonymization device, document management device, document anonymization method, and document anonymization program
US8819009B2 (en) Automatic social graph calculation
US8271424B2 (en) Privacy and confidentiality preserving reporting of URLs
US11256825B2 (en) Systems and methods for securing data in electronic communications
US20120005720A1 (en) Categorization Of Privacy Data And Data Flow Detection With Rules Engine To Detect Privacy Breaches
US20030005312A1 (en) Apparatus and method for creating a map of a real name word to an anonymous word for an electronic document
GB2497397A (en) Data anonymisation by replacement of sensitive information in a log
JPWO2009017135A1 (en) Information providing support device and information providing support method
JP2008004018A (en) System and method for managing personal information-confidential information
JP2022533748A (en) Sensitive data management
RU2633113C2 (en) Information processing device, information processing system and information processing method
US6711570B1 (en) System and method for matching terms contained in an electronic document with a set of user profiles
JP4705962B2 (en) Data security control system
JP2014013474A (en) Log audit system
US20100070508A1 (en) Information correlation system, user information correlating method, and program
JP4008679B2 (en) Information management apparatus and information management system
WO2004107120A2 (en) Methods and apparatuses for sequestering content
JP2005284353A (en) Personal information use system, method for controlling the same system, map file generating device and access control policy file generating device
JP5341695B2 (en) Information processing system, information processing method, and program
US20210192025A1 (en) Service support system and service support method
JP2007034677A (en) Directory information providing method, directory information providing device, directory information providing system and program
US8380733B2 (en) Methods and apparatuses for dynamically displaying search suggestions
JP2002182964A (en) Security system, security method and program
JP6797618B2 (en) Search device, search method, program and search system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101018

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131112

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees