JP2006309406A - Information concealing device, concealing system, concealing method and concealing program - Google Patents

Information concealing device, concealing system, concealing method and concealing program Download PDF

Info

Publication number
JP2006309406A
JP2006309406A JP2005129634A JP2005129634A JP2006309406A JP 2006309406 A JP2006309406 A JP 2006309406A JP 2005129634 A JP2005129634 A JP 2005129634A JP 2005129634 A JP2005129634 A JP 2005129634A JP 2006309406 A JP2006309406 A JP 2006309406A
Authority
JP
Japan
Prior art keywords
information
inspection
concealment
word
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005129634A
Other languages
Japanese (ja)
Inventor
Kazutaka Hayashi
千登 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005129634A priority Critical patent/JP2006309406A/en
Publication of JP2006309406A publication Critical patent/JP2006309406A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information concealing device which estimates information to be concealed by referring to information separately acquired and performs concealing processes based on the estimation. <P>SOLUTION: The information concealing device 10 for concealing text information including secret information, such as a character string has a first kind concealing required word indication part 12 which indicates first kind of information (name of a person, name of a company, etc.) as concealing required information, and a determination processing part 26 which determines efficiency of the concealment by the concealing required word indicated in the first kind concealing required indication part 12. The determination processing part 26 inspects external information by an inspection formula using inspection words extracted from the text information, and determines the efficiency of the concealment from the inspection result. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、業務活動等を記録した日報に代表される秘密情報を包含したテキスト情報を秘匿化するための技術に関する。   The present invention relates to a technique for concealing text information including confidential information represented by a daily report that records business activities and the like.

業務活動において収集される情報の共有や現場での活動の管理・支援のために、従来から活動記録を残すことが行われている。例えば営業活動においては、営業担当員が業務上得た情報を交えて日々の活動を日報などの形で記録することが行われている。情報技術の進展により活動記録は企業活動上有用な情報を抽出する源泉としても注目され始め、例えばテキストマイニング等の技術を利用して業務活動上の判断に有用な情報を活動記録から導き出すことや、業務分析に供し、営業活動の改善等に役立てたりすることが試みられている。それらの活動記録の活用には、必ずしも活動記録を保持している組織が独自に行うだけでなく、他者または第三者の専門的な分析サービス等を利用することも行われる。   In order to share information collected in business activities and to manage and support activities in the field, it has traditionally been possible to keep activity records. For example, in sales activities, daily activities are recorded in the form of daily reports, etc., using information obtained from the sales staff in the course of business. With the advancement of information technology, activity records have begun to attract attention as a source for extracting useful information for corporate activities. For example, using information such as text mining to derive useful information from activity records It has been tried to be used for business analysis and to improve sales activities. In order to utilize these activity records, not only the organization that holds the activity records is independently carried out, but also a specialized analysis service of another person or a third party is used.

しかし、業務上収集される情報には秘匿すべき情報が少なからず含まれており、事故やウィルス被害などの事態を含め、秘匿すべき情報が流出・漏洩する可能性を極力避けることが必要とされている。このためには、他者への情報の開示には慎重を期すことが必要とされ、外部に情報を開示する際にはあらかじめ一部の情報を隠してから開示することが行われてきた。   However, there is a lot of information that should be kept confidential in the information collected for business purposes, and it is necessary to avoid the possibility of leakage or leakage of information that should be kept confidential, including accidents and virus damage. Has been. For this purpose, it is necessary to be careful in disclosing information to others, and when disclosing information to the outside, some information has been concealed in advance.

たとえば特許文献1では、インターネット上でのサービスの履歴から得られる情報をマーケティングリサーチのために他者からの活用を可能とするにあたり、利用者の識別情報の匿名化を行っている。この種の技術では、他者に情報を提供する前に秘匿すべき情報を別の記号・文字列に変えるという方法で秘匿化することが行われてきた。   For example, in Patent Document 1, the user's identification information is anonymized when information obtained from the service history on the Internet can be used by others for marketing research. In this type of technology, the information to be concealed before being provided to others has been concealed by a method of changing to another symbol / character string.

特許文献2は、信頼のある個人情報をもとに個人情報を秘匿してアクセス管理を行うことを可能にした個人情報の信頼度および開示度による認証またはアクセス管理システムを開示している。これにより、匿名の投稿が可能になり、信頼できるハンドル名の使用が可能となり、例えば、女性だけのアクセス許可や、年令制限を有するアクセス許可が可能となる。   Patent Document 2 discloses an authentication or access management system based on the reliability and disclosure level of personal information, which makes it possible to conceal personal information and perform access management based on reliable personal information. As a result, anonymous posting is possible, and a reliable handle name can be used. For example, access permission only for women and access permission with age restrictions are possible.

特許文献3は、ユーザ情報のリークを防止しつつ、ウエブ(Web)サイトを評価できる評価システムを開示している。これには、アクセスログの中の利用者を特定できる部分を別の文字列に変換して分析側に提供したり、ウエブ分析で必要となる部分については情報の関連が保たれるよう、すなわち同一ユーザのアクセスであることが分析上分かる必要がある部分については、同一の識別子に変換することが記載されている。   Patent Document 3 discloses an evaluation system that can evaluate a web site while preventing leakage of user information. This can be done by converting the part that can identify the user in the access log to another character string and providing it to the analysis side, or so that the information related to the part necessary for web analysis can be maintained. It is described that a part that needs to be understood in the analysis to be accessed by the same user is converted to the same identifier.

また特許文献4は、格付け評価機関などが用いるデータ評価システムの構築技術に関する。格付けを外部機関により行う際には、一般に公開しない負債内容などを使うことも多く、また、評価のノウハウも営業秘密であり、これらをお互いに公開せずに評価を実現する技術を開示している。   Patent Document 4 relates to a technique for constructing a data evaluation system used by a rating evaluation organization or the like. When rating is performed by an external organization, the contents of debts that are not disclosed to the public are often used, and the know-how of evaluation is also a trade secret. Disclosure of technology that realizes evaluation without sharing these with each other Yes.

特開2004−234381号Japanese Patent Application Laid-Open No. 2004-234381 特開2002−132730号JP 2002-132730 A 特開2002−123452号Japanese Patent Laid-Open No. 2002-123452 特開2001−052051号JP 2001-052051 A

しかしながら、従来の情報の秘匿化処理には次のような課題がある。インターネット上のサービス履歴等に比べて、多様な情報が記録される営業日報などでは、上記の従来技術を用いたとしても、個人情報等を秘匿することは十分とはいえなかった。活動記録の中には様々な情報が記載されるため、他の情報を照会することにより秘匿化したはずの情報が明らかになってしまう場合があった。例えば、図8に示した架空の営業日報中において、「わかよ部長」という人を表す文字列に対して秘匿化処理を行い、図10のようなテキスト情報に変換したとしても、例えば、ウエブ上に図15(a)のような記事が載っていた場合には、図10の「AAA」が「わかよ」であることが簡単に判明してしまう。他にも例えば、会議の参加者名簿と企業名から個人が特定可能となる場合もあるし、大学の卒業名簿と年齢、所属企業名等の組み合わせで個人名が特定可能となってしまう場合もある。特に、名簿情報等の流出がよく知られており、その種類の情報を紹介しても個人等が特定されないよう十分な秘匿化を行う必要がある。   However, the conventional information concealment process has the following problems. In business daily reports and the like in which a variety of information is recorded as compared to service histories on the Internet, it is not sufficient to conceal personal information and the like even if the above-described conventional technology is used. Since various information is described in the activity record, there is a case where information that should be concealed may be revealed by referring to other information. For example, in the fictitious business daily report shown in FIG. 8, even if the concealment process is performed on the character string representing the person “Wakayo Manager” and converted into the text information as shown in FIG. If an article as shown in FIG. 15A is on the top, it is easily determined that “AAA” in FIG. 10 is “Wakayo”. In addition, for example, individuals may be identified from the conference participant list and company name, or individual names may be identified by combining university graduation list, age, company name, etc. is there. In particular, outflow of directory information is well known, and it is necessary to sufficiently conceal individuals so that individuals are not identified even if information of that type is introduced.

本発明は、上記の点に鑑みてなされたもので、別途入手可能な他の情報の参照によって秘匿すべき情報が推定される可能性を検査すること、そして検査に基づいた秘匿化処理により、分析・診断などのサービスのために他者に開示する営業日報などのテキスト記述を含む業務関連情報の秘匿化を安全なものとする情報秘匿化装置、情報秘匿化システム、情報秘匿化方法、および情報秘匿化プログラムの提供を目的としている。   The present invention has been made in view of the above points, and by examining the possibility that information to be concealed is estimated by referring to other information that is separately available, and by concealment processing based on the inspection, An information concealment device, an information concealment system, an information concealment method, and a method for concealing business-related information including text descriptions such as business daily reports to be disclosed to others for services such as analysis and diagnosis, and The purpose is to provide an information concealment program.

本発明に係る、文字列等の秘密情報を含む情報を秘匿化する情報秘匿化装置は、第1の種類の情報を秘匿化すべき情報として指示する指示手段と、第1の種類の情報に基づき、秘匿化の対象である情報から要秘匿化語を選定する第1の選定手段と、第1の選定手段により選定された要秘匿化語により、秘匿化の対象である情報の秘匿化が十分であるか否かを判定する判定手段とを有する。これにより、秘匿化の対象である情報が容易に特定されることを防止することができる。   An information concealment device for concealing information including secret information such as a character string according to the present invention is based on instruction means for instructing first type information as information to be concealed, and the first type information. The first selection means for selecting the confidential word from the information to be concealed and the concealment word selected by the first selection means sufficiently conceal the information to be concealed. Determination means for determining whether or not. As a result, it is possible to prevent information that is an object of concealment from being easily specified.

好ましくは、判定手段は、秘匿化の対象であるテキスト情報から少なくとも1つの検査語を抽出する検査語抽出手段と、抽出された検査語に基づき検査式を構成する検査式構成手段と、構成された検査式を用い外部情報の検査を行う検査実行手段とを有し、判定手段は、検査実行手段の検査結果に基づき秘匿化が十分か否かを判定する。外部情報を参照し、秘匿化される情報の解読に繋がりそうな用語が存在するか否かを検査することで、より正確な判定を行うことができる。   Preferably, the determination unit includes: a test word extraction unit that extracts at least one test word from the text information to be concealed; and a test formula configuration unit that configures a test formula based on the extracted test word. And an inspection execution means for inspecting external information using the inspection formula, and the determination means determines whether concealment is sufficient based on the inspection result of the inspection execution means. A more accurate determination can be made by referring to external information and examining whether there is a term that is likely to lead to deciphering of the information to be concealed.

好ましくは情報秘匿化装置はさらに、判定手段により秘匿化が十分でないと判定されたとき、秘匿化の対象であるテキスト情報から第2の種類の要秘匿化語を選定する第2の選定手段を有し、前記判定手段は、第2の選定手段により選定された要秘匿化語により、秘匿化の対象である情報の秘匿化が十分であるか否かを判定する。これにより、秘匿化の対象である情報が容易に特定されることを防止することができる。   Preferably, the information concealment device further includes a second selection unit that selects the second type of concealment word from the text information to be concealed when the determination unit determines that the concealment is not sufficient. And the determining means determines whether or not the information to be concealed is sufficiently concealed by the anonymized word selected by the second selecting means. As a result, it is possible to prevent information that is an object of concealment from being easily specified.

例えば、検査語抽出手段は、秘匿化の対象であるテキスト情報に含まれる特徴語を出現頻度に応じて抽出する。出現頻度は、出現する回数のみならず、出現する特徴語の出現の偏り頻度を含むものであっても良い。検査語抽出手段は、予め決められたルールに従い、秘匿化の対象であるテキスト情報に含まれる要注意語を抽出する。また、検査式構成手段は、抽出された複数の検査語から検査式候補を設定し、設定された検査式候補について前記検査実行手段により予備検査を実行させ、その予備検査結果に基づき検査式を選定するようにしてもよい。検査式構成手段は、外部に対する問い合わせ結果に基づき検査式候補を設定するようにしてもよい。さらに検査実行手段は、検査式候補についてデータベースに蓄積された情報を対象に検査を実行する。データベースは、外部データベースまたは内部データベースを問わない。検査実行手段は、検査式候補について情報公開サービスに含まれる情報を対象に検査を実行してもよい。情報公開サービスは、ウエブ上で公開される情報を含む。   For example, the test word extraction unit extracts a feature word included in text information that is a concealment target according to the appearance frequency. The appearance frequency may include not only the number of appearances but also the bias frequency of appearance of the feature words that appear. The inspection word extraction means extracts a caution word included in the text information to be concealed according to a predetermined rule. Further, the inspection formula constructing means sets a test formula candidate from the plurality of extracted test words, causes the test execution means to perform a preliminary test on the set test formula candidate, and determines the test formula based on the preliminary test result. You may make it select. The inspection formula constructing means may set a test formula candidate based on the external inquiry result. Further, the inspection execution means executes an inspection on the information accumulated in the database for the inspection formula candidates. The database may be an external database or an internal database. The inspection execution means may execute an inspection on information included in the information disclosure service for the inspection formula candidate. The information disclosure service includes information published on the web.

さらに情報秘匿化装置は、前記判定手段により秘匿化が十分であると判定されたとき、第1の選定手段および/または第2の選定手段により選定された要秘匿化語を秘匿化する秘匿化手段を有する。   Furthermore, the information concealment device conceales the concealment word that is selected by the first selection unit and / or the second selection unit when the determination unit determines that the concealment is sufficient. Have means.

さらに好ましくは、情報秘匿化装置は、検査式による検査を禁止すべきか否かを判定する禁止判定手段を有し、禁止と判定された場合には、検査実行手段は、外部から収集済みの情報について当該検査式による検査を実行する。これにより、検査式が外部に漏洩し、秘匿化すべき情報が特定されることを防止することができる。   More preferably, the information concealment apparatus includes a prohibition determination unit that determines whether or not the inspection based on the inspection formula should be prohibited. If the information concealment device determines that the inspection is prohibited, the information is collected from the outside. The inspection according to the inspection formula is executed. Thereby, it can prevent that a check type | formula leaks outside and the information which should be concealed is specified.

上記した情報秘匿化装置は、検査実行手段により検査される情報を蓄積した情報蓄積媒体とを含む情報秘匿化システムであってもよい。この場合、情報蓄積媒体は、検査実行手段により通信手段を介してアクセス可能である。   The information concealment device described above may be an information concealment system including an information storage medium that stores information to be inspected by the inspection execution unit. In this case, the information storage medium can be accessed by the examination execution means via the communication means.

本発明に係る、文字列等の秘密情報を含むテキスト情報を秘匿化する情報秘匿化方法は、第1の種類の情報に基づき、秘匿化の対象であるテキスト情報から要秘匿化語を選定する第1の選定ステップと、第1の選定ステップで選定された要秘匿化語により、秘匿化の対象であるテキスト情報の秘匿化が十分であるか否かを判定する判定ステップとを有する。情報秘匿化方法はさらに、秘匿化が十分であると判定されたとき、要秘匿化語を秘匿化する秘匿化ステップを有する。   An information concealment method for concealing text information including secret information such as a character string according to the present invention selects a concealment word from text information to be concealed based on the first type of information. A first selection step and a determination step of determining whether or not the text information that is the target of concealment is sufficient by the concealment word selected in the first selection step. The information concealment method further includes a concealment step of concealing a concealment-required word when it is determined that the concealment is sufficient.

本発明に係る、文字列等の秘密情報を含むテキスト情報を秘匿化する情報秘匿化プログラムは、第1の種類の情報に基づき、秘匿化の対象であるテキスト情報から要秘匿化語を選定する第1の選定ステップと、第1の選定ステップで選定された要秘匿化語により、秘匿化の対象である情報の秘匿化が十分であるか否かを判定する判定ステップと、判定ステップにより秘匿化が十分でないと判定されたとき、秘匿化の対象である情報から第2の種類の要秘匿化語を選定する第2の選定ステップと、選定された要秘匿化語を秘匿化するステップとを有する。   An information concealment program for concealing text information including secret information such as a character string according to the present invention selects a concealment word from text information to be concealed based on the first type of information. The first selection step, the determination step for determining whether or not the information to be concealed is sufficient by the concealment word selected in the first selection step, and concealment by the determination step A second selection step of selecting a second type of confidential word from information to be concealed, and a step of concealing the selected confidential word when it is determined that the conversion is not sufficient Have

本発明に係る情報秘匿化装置によれば、秘匿化すべき情報を秘匿化する前に、秘匿化が十分であるか否かを判定するようにしたので、秘匿化した情報が容易に解読することを未然に防止することができる。さらに、秘匿化が十分でないとき、外部の情報を参照し、秘匿化の解読に繋がるような情報を要秘匿化語として選定することにより、より厳重で安全な情報の秘匿化を行うことができる。   According to the information concealment device according to the present invention, it is determined whether the concealment is sufficient before concealing the information to be concealed, so that the concealed information can be easily decoded. Can be prevented in advance. Furthermore, when concealment is not sufficient, more strict and safe information can be concealed by referring to external information and selecting information that can lead to deciphering as a concealment word. .

以下、本発明を実施するための最良の形態を図面を参照して説明する。   The best mode for carrying out the present invention will be described below with reference to the drawings.

図1は、本発明の第1の実施例に係る情報秘匿化装置の構成を示すブロック図である。本実施例に係る情報秘匿化装置10は、一例として業務活動を記録した業務日報に含まれる情報の秘匿化を行うものであり、次のように構成されている。第一種要秘匿化語指示部12は、図示しない入力手段から入力された秘匿化すべき情報の指定を保持し、これを要秘匿化語管理部14に通知する。要秘匿化語管理部14は、具体的に秘匿化処理を行う文字列や記号を管理し、秘匿化の対象となる文字列や記号を秘匿化処理部16に通知する。秘匿化処理16は、要秘匿化管理部14および後述する判定処理部26の判定結果に基づき秘匿化が必要とされた文字列や記号等を予め定められた変換ルールに従い秘匿化処理を行う。   FIG. 1 is a block diagram showing the configuration of the information concealment device according to the first embodiment of the present invention. The information concealment device 10 according to the present embodiment conceals information included in a daily business report that records business activities as an example, and is configured as follows. The first type concealment required word instruction unit 12 holds designation of information to be concealed input from an input unit (not shown) and notifies the concealed word management unit 14 of this. The anonymized word management unit 14 manages a character string and a symbol to be specifically concealed, and notifies the anonymity processing unit 16 of a character string and a symbol to be concealed. The concealment processing 16 performs concealment processing according to a predetermined conversion rule for character strings, symbols, and the like that need to be concealed based on determination results of the concealment management unit 14 and a determination processing unit 26 described later.

業務データ保持部18は、日報等の業務活動等に関するデータを保持する。検査語選出部20は、要秘匿化語管理部14からの情報を参照して、業務データ保持部18の業務データを参照して検査を行う特徴語すなわち検査語を選出する。検査式構成管理部22は、検査語選出部で選定された検査語を受け取り検査実行部24と通信を行い検査式を構成する。検査実行部24は、業務データ保持部18とは異なる外部の情報を参照して秘匿化の検査を実行する。判定処理部26は、検査式構成管理部22で管理される検査式について、予め定められた基準にしたがって秘匿化の程度について判定を行う。秘匿化処理部16は、判定処理の結果を受けて起動し要秘匿化語管理部14を参照して業務データ保持部18に保持されたデータの秘匿化処理を行い、秘匿済データを出力部28から出力する。第二種要秘匿化語選定処理部30では、判定処理部26により秘匿化処理が不十分であると判定された検査式から新たに秘匿化を追加する第二の種類の要秘匿化指示を選定し、これを要秘匿化語管理部14に通知する。   The business data holding unit 18 holds data related to business activities such as daily reports. The inspection word selection unit 20 refers to the information from the confidential word management unit 14 and selects a characteristic word to be inspected, that is, an inspection word, with reference to the business data in the business data holding unit 18. The test formula configuration management unit 22 receives the test word selected by the test word selection unit and communicates with the test execution unit 24 to configure the test formula. The inspection execution unit 24 executes the concealment inspection with reference to external information different from the business data holding unit 18. The determination processing unit 26 determines the degree of concealment of the inspection formula managed by the inspection formula configuration management unit 22 according to a predetermined criterion. The concealment processing unit 16 is activated in response to the result of the determination processing, performs concealment processing of the data held in the business data holding unit 18 with reference to the anonymized word management unit 14, and outputs the concealed data. 28. The second type concealment word selection processing unit 30 issues a second type concealment instruction for newly adding concealment from the inspection formula determined by the determination processing unit 26 that the concealment processing is insufficient. This is selected, and this is notified to the anonymized word management unit 14.

次に、本実施例の情報秘匿化装置の処理の流れを説明する。説明にあたり、架空の営業担当者「うゐの けふこ」さんが架空の顧客企業「(株)セスン」を訪問した際の架空の日報データ(図8および図9)を例に用いる。なお、実施例中の例で用いた固有名詞は、全て伊呂波歌の部分文字列を切り出した架空のものである。   Next, the flow of processing of the information concealment device according to this embodiment will be described. For the explanation, fictitious daily sales data (FIGS. 8 and 9) when a fictitious sales representative “Ue no Kefuko” visits a fictitious customer company “Cesson Co., Ltd.” is used as an example. In addition, all the proper nouns used in the examples in the examples are fictitious cut out partial character strings of the Iroha song.

図2は、情報秘匿化処理の概略を示したものである。先ず、第一種要秘匿化語指示部12が要秘匿化語管理部14に対し、第一種の秘匿化すべき文字列や記号の情報を通知する(ステップS101)。第一種要秘匿化語指示部12には、例えば、「人名」と「顧客企業名」を秘匿化すべき情報として保存しており、要秘匿化語管理部14に対し、第一種の要秘匿化語の指示として日報データ中の「人名」と「顧客企業名」が通知される。   FIG. 2 shows an outline of the information concealment process. First, the first type concealed word instruction unit 12 notifies the concealed word management unit 14 of information on the character string and the symbol to be concealed of the first type (step S101). For example, the “person name” and the “customer company name” are stored as information to be concealed in the first type confidential word instruction unit 12, and the first type essential information is stored in the confidential word management unit 14. “Personal name” and “customer company name” in the daily report data are notified as instructions for the concealment word.

要秘匿化語管理部14は、第一種の要秘匿化語の指示を受けると、業務データ保持部18を参照して秘匿化すべき具体的な文字列や記号を抽出し、秘匿化語の設定を行い(ステップS102)これを秘匿化語として内部の記録手段に格納する。この処理は、テキスト情報から公知の固有表現抽出技術を用いて実現することもできるし、業務データ保持部18に保持される顧客企業名や訪問先の人の氏名などの日報データの属性値から抽出することもできる。このステップで、図8および図9において人名「わかよ」が選定され、日報の属性データから訪問先の企業名「セスン」が秘匿化語として設定されて格納される。   When the confidential word management unit 14 receives an instruction for the first type of confidential word, the confidential word management unit 14 refers to the business data holding unit 18 to extract a specific character string or symbol to be concealed. Setting is performed (step S102), and this is stored in the internal recording means as a concealment word. This processing can be realized by using a well-known named expression extraction technique from text information, or from daily report data attribute values such as the name of a customer company held in the business data holding unit 18 and the name of a person to be visited. It can also be extracted. In this step, the personal name “Wakayo” is selected in FIG. 8 and FIG. 9, and the visited company name “Cessin” is set as a concealment word from the daily attribute data and stored.

次に、検査語選出部20により検査語の抽出が行われる。説明の簡単のため公知の特徴語抽出の技術により処理の概略を説明すると、各日報データ(図8と図9)のテキスト情報から単語を切り出して名詞やサ変動詞等の自立語と未知語を抽出し、抽出したそれぞれの表現について日報全体の中でその表現が現れる日報の数に応じた重み付けを行った数値を算出して順位付けを行い、その順位をもとに予め定められた基準にしたがって検査語として選択する表現(特徴語)を抽出する(ステップS103)。表現が現れる記事の数(ここでは日報の数)が少ないものほど特徴を表す表現として選択することができる。   Next, a test word is extracted by the test word selection unit 20. For the sake of simplicity, the outline of the processing will be described using a known feature word extraction technique. Words are cut out from the text information of each daily report data (FIGS. 8 and 9), and free words such as nouns and sub-variants and unknown words are extracted. For each extracted expression, a ranking is performed by calculating a numerical value that is weighted according to the number of daily reports in which the expression appears in the entire daily report. Therefore, an expression (feature word) to be selected as a test word is extracted (step S103). The smaller the number of articles in which an expression appears (here, the number of daily reports), the more the expression can be selected.

この処理で、図8では「わかよ」、「ゑひも市」、「剣道」、「優勝」、「チリヌ」、図9では、「わかよ」、「チリヌ」、「エコ・いろは」がそれぞれ選ばれたものとし、要秘匿化語管理部14を参照して秘匿化語である「わかよ」を除いた表現が検査語として抽出される。   In this process, “Wakayo”, “Kashiwahimo-shi”, “Kendo”, “Champion”, “Chillin” in FIG. 8, and “Wakayo”, “Chillin”, “Eco-Iroha” in FIG. 9, respectively. The expression excluding “Wakayo”, which is a concealment word, is extracted as a check word by referring to the concealment word management unit 14.

検査語選出部20により検査語が抽出されると、検査式構成管理部22は予め定められた方法で設定された単位ごとに検査式を構成する(ステップS104)。この検査式が構成される処理の流れを図3に示す。まず、抽出された検査語から検査式候補を初期設定する(ステップS201)。例えば、図8のデータに対しては4つの検査語が選択されているので、4つの検査語それぞれを選び、[ゑひも市]、[剣道]、[優勝]、[チリヌ]の4つを検査式候補とする。   When a test word is extracted by the test word selection unit 20, the test formula configuration management unit 22 configures a test formula for each unit set by a predetermined method (step S104). FIG. 3 shows the flow of processing for constructing this check expression. First, a test formula candidate is initialized from the extracted test words (step S201). For example, four test words are selected for the data shown in FIG. 8, so select each of the four test words, and select [Kashihimoichi], [Kendo], [Winner], and [Chillin]. It is considered as an inspection formula candidate.

次に、初期設定された検査式候補について、検査実行部24により予備検査が行われる(ステップS202)。検査制御部24aは、公開情報に対し、検査式候補を用いた予備検査を実行し、これを収集する。例えば、検査式候補を用いて、外部の情報を検索する等の問い合わせ処理を行う。ここでは説明の簡単のため、外部の情報としてウエブ上の情報をとりあげ、問い合わせ処理としてウエブ上の情報の検索エンジンへの問い合わせでの実現を例にとって説明を行う。   Next, a preliminary inspection is performed by the inspection execution unit 24 for the initially set inspection formula candidates (step S202). The inspection control unit 24a performs preliminary inspection using inspection formula candidates on the public information, and collects this. For example, an inquiry process such as searching for external information is performed using the inspection formula candidates. Here, for the sake of simplicity of explanation, information on the web will be taken as external information, and an explanation will be given by taking as an example the realization of the information on the web by an inquiry to a search engine.

検査式候補「ゑひも市」を例にとると、検査実行部24は、外部の検索エンジンに“ゑひも市”という検索式での問い合わせを行い、問い合わせに該当した情報の数(以降、ヒット数)の取得を行う。検査式構成管理部22は、このヒット数について予め定めた予備検査方法により検査を行い、検査式候補から検査式を選定する。(ステップS203)。この予備検査方法は、簡単には例えば検索のヒット数をある数値と比較し、その数値より小さい場合に検査式を選定することができる。ここでは、ヒット数が、1000よりも小さい場合に、検査式として選定するものとする。図4は、架空の予備検査結果を示したものである。上記選定の基準によれば、この段階で検査式として選択されるものはない。   Taking the test formula candidate “Kashihimo-shi” as an example, the test execution unit 24 makes an inquiry to an external search engine using the search formula “Kashihimo-shi”, and the number of information corresponding to the inquiry (hereinafter, hits) Number). The inspection formula configuration management unit 22 inspects the number of hits by a predetermined preliminary inspection method, and selects an inspection formula from the inspection formula candidates. (Step S203). In this preliminary inspection method, for example, the number of hits in a search is compared with a certain numerical value, and an inspection formula can be selected when the number is smaller than the numerical value. Here, when the number of hits is smaller than 1000, the inspection formula is selected. FIG. 4 shows the result of an imaginary preliminary inspection. According to the above selection criteria, no inspection formula is selected at this stage.

次に、検査式構成管理部22は、検査式候補の追加が可能であるかを判定し(ステップS204)、予め定めた方法により検査語を組み合わせて新たに検査式候補を用意する。例えば検査式として選定されなかった検査式候補に検査語を追加することにより以下のように新たな検査式候補を用意する。   Next, the test formula configuration management unit 22 determines whether a test formula candidate can be added (step S204), and prepares a new test formula candidate by combining test words using a predetermined method. For example, by adding a test word to a test formula candidate not selected as a test formula, a new test formula candidate is prepared as follows.

[ゑひも市 and 剣道]、[ゑひも市 and 優勝]、[ゑひも市 and チリヌ]、[剣道 and 優勝]、[剣道 and チリヌ]、および[優勝 and チリヌ]の検査語を組み合わせた検査式候補を設定する(ステップS201)。   Inspection formula that combines the test words of [Kashihimoichi and Kendo], [Sagahimoichi and Winner], [Kashihimoichi and Cirinu], [Kendo and Winner], [Kendo and Cirinu], and [Winner and Cirinu] Candidates are set (step S201).

そして、検査式構成管理部22は、同様に検査実行部24に予備検査を依頼し(ステップS202)、検査結果としてのヒット数をそれぞれ得る。図5は、この検査式候補による架空の検査結果を示している。この段階で、ヒット数が1,000以下である、以下の4つの検査式候補が選定されて、検査式として検査式構成管理部22に保存される。検査実行部24は、検査式構成管理部22から選択された検査式の通知を受けて、検索によりヒットしたデータの収集を行い、内部の記憶手段に蓄積する。[ゑひも市 and 剣道]、[ゑひも市 and 優勝]、[ゑひも市 and チリヌ]および[剣道 and チリヌ]の4つの検査式が選定される(ステップS203)   Then, the inspection formula configuration management unit 22 similarly requests a preliminary inspection from the inspection execution unit 24 (step S202), and obtains the number of hits as the inspection result. FIG. 5 shows a fictitious inspection result by this inspection formula candidate. At this stage, the following four test formula candidates having a hit count of 1,000 or less are selected and stored in the test formula configuration management unit 22 as test formulas. The inspection execution unit 24 receives notification of the inspection formula selected from the inspection formula configuration management unit 22, collects data hit by the search, and stores it in the internal storage means. Four inspection formulas are selected, [Shihimo-shi and Kendo], [Shihimo-shi and winner], [Shihimo-shi and Chirinu] and [Kendo and Chirinu] (step S203).

次に、検査式構成管理部22は、検索式候補の次の組み合わせを用意する。これには検索式として選択されなかった[剣道 and 優勝]と[優勝 and チリヌ]を元に検査語を組み合わせを作成する。この場合、[剣道 and 優勝 and チリヌ]を生成することができるが、すでに検索式として選択されている「剣道 and チリヌ」を含んでいるため検索式候補として追加することは行わない(ステップS204)。この段階で、追加の検索式候補が生成されないことから、図8の日報に対する検査式構成が終了する(ステップS205)。   Next, the inspection formula configuration management unit 22 prepares the next combination of search formula candidates. For this, a combination of test words is created based on [Kendo and Winner] and [Winner and Chillin] that were not selected as a search expression. In this case, [Kendo and Winner and Chillin] can be generated, but since “Kendo and Chillin” already selected as the search expression is included, it is not added as a search expression candidate (step S204). . At this stage, since no additional search formula candidates are generated, the check formula configuration for the daily report in FIG. 8 ends (step S205).

図9から抽出された検査語についても同様の処理が実行され検査式が選択される。すなわち、図9のデータでは、「チリヌ」と「エコ・いろは」の2つの検査語が選択されているので、これらの予備検査が実行される。但し、「チリヌ」については既に予備検査が実行されているので、これの予備検査は省略され、[エコ・いろは]について予備検査が実行される。図6は、[エコ・いろは]の予備検査の結果である。   The same processing is executed for the check word extracted from FIG. 9, and a check expression is selected. That is, in the data of FIG. 9, since two inspection words “Cilenu” and “Eco-Iroha” are selected, these preliminary inspections are executed. However, since the preliminary inspection has already been performed for “Chillin”, the preliminary inspection is omitted, and the preliminary inspection is performed for [Eco-Iroha]. FIG. 6 shows the result of the preliminary inspection of [Eco-Iroha].

検索結果は、1,000件以下であるので、[エコ・いろは]が検査式として選ばれる。[エコ・いろは]の検索結果について、検索実行部24において、ヒットした情報は収集され保存される。仮に、[エコ・いろは]が検査式に選ばれなかった場合には、[エコ・いろは and チリヌ]が次の検査式候補となることも前述の通りである。   Since the number of search results is 1,000 or less, “Eco-Iroha” is selected as the inspection formula. For the search result of “Eco-Iroha”, the search execution unit 24 collects and stores the hit information. As described above, if [Eco-Iroha] is not selected as the inspection formula, [Eco-Iroha and Chillin] will be the next test formula candidate.

再び図2に戻り、検査式構成管理部22は、要秘匿化語管理部14から秘匿した情報「わかよ」を取り出し、これを検査式に追加し(例えば、[ゑひも市 and剣道 and わかよ])、検査実行部24に対して収集した情報での検査処理を実行するように指示する(ステップS105)。検査処理は、ここでの例では検索処理を行い、そのヒット数を入手することで実現される。処理結果は、例えば図7のようになる。   Returning to FIG. 2 again, the inspection formula configuration management unit 22 takes out the concealed information “Wakayo” from the anonymized word management unit 14 and adds it to the inspection formula (for example, [Kashihimoichi and Kendo and Waka Yo]), and instructs the inspection execution unit 24 to execute the inspection process using the collected information (step S105). In this example, the inspection process is realized by performing a search process and obtaining the number of hits. The processing result is, for example, as shown in FIG.

判定処理部26は、検査処理の結果について秘匿化処理が十分であるか否かについて判定処理を行う(ステップS106)。判定処理部26は、例えば要秘匿化情報を加えた検査結果が、予め定めた数値の範囲内の場合には、秘匿化処理は十分でないと判定することができる。例えば、予め定めた範囲を0以上20未満とし、この範囲内にあるとき秘匿化は十分でないと判定する。要秘匿化情報が「わかよ」であるとき、要秘匿化情報を加えた[ゑひも市 and 剣道]と[ゑひも市 and 優勝]の検索結果は、それぞれ3件であるため、秘匿化が十分でないとして、この2つの検査式を選択する。この検査では、秘匿化を暴こうとしたものが、「わかよ」に関する情報ではないかと仮説をもっていた場合などに、その証拠が簡単に特定されてしまう危険性を調べる。   The determination processing unit 26 determines whether or not the concealment process is sufficient for the result of the inspection process (step S106). The determination processing unit 26 can determine that the concealment process is not sufficient when, for example, the inspection result to which the concealment information is required is within a predetermined numerical range. For example, the predetermined range is set to 0 or more and less than 20, and it is determined that the concealment is not sufficient when it is within this range. When the confidential information is “Wakayo”, there are three search results for [Kashihimo-shi and Kendo] and [Tatsumi-himo-shi and Winner] with the confidential information added. If not, select these two check expressions. This examination examines the risk that the evidence will be easily specified when the hypothesis is that the information that is trying to reveal the concealment might be information about "Wakayo".

また、図7の要秘匿化語を加えた検査結果の、検査式候補での予備検査結果に対する割合を判定基準に用いることもできる。例えば、割合が60%を越えている場合に秘匿化が十分でないとして選択するとした場合、検査式[エコ・いろは]について、要秘匿化情報「セスン」を加えたときの検索結果は80件であり、従って、割合が80/96?83%であることから、検査式[エコ・いろは]が秘匿化が十分でないとして選択される。この検査では、検査式候補に当てはまるものについて推測される危険性を調べる。   Further, the ratio of the inspection result to which the concealment word of FIG. 7 is added to the preliminary inspection result of the inspection formula candidate can be used as a criterion. For example, if the ratio exceeds 60% and it is selected that the concealment is not sufficient, the search result when the concealment information “Cesun” is added for the inspection formula [Eco-Iroha] is 80. Therefore, since the ratio is 80/96 to 83%, the inspection formula [Eco-Iroha] is selected as being insufficiently concealed. In this inspection, the risk that is estimated about what is applicable to the inspection formula candidate is examined.

図15(a)、12月23日のゑひも市の市民剣道大会で優勝者として「わかよ たれそ」の名前が挙がっている架空の記事の例であり、同様に図15(b)は、(株)セスンが掲げる「エコ・いろは」について記載されている架空の記事の例である。   Fig. 15 (a) is an example of a fictitious article in which the name of "Wakayo Taleso" is listed as the winner of the citizen Kendo tournament on December 23rd. Similarly, Fig. 15 (b) This is an example of a fictitious article that describes "Eco-Iroha", which is set up by Cesson.

上記したように判定処理部26は、この段階で[ゑひも市 and 剣道]と[ゑひも市 and 優勝]と[エコ・いろは]の検査式が、秘匿化が十分ではないと判定し、これらを選択し(ステップS107)、次に、これらの選択された検査式を第二種要秘匿化語選定部30へ供給する(ステップS108)。第二種要秘匿化語選定部30は、選択された検査式に含まれる検査語から新たに追加する要秘匿化語を選定する。新たに選定される要秘匿化語は、「ゑひも市」と「剣道」のいずれかの検査語と、「ゑひも市」と「優勝」のいずれかの検査語、そして「エコ・いろは」であり、これらの秘匿化を行うように要秘匿化語管理部14に指示すればよい。このとき、上記した特徴語を抽出するために計算した数値を参照して特徴的な語を選んでも良いし、複数の絞り込みキーに影響を与える語を優先的に選んでもよい(ここでの例では、「ゑひも市」)。本例では、「ゑひも市」と「エコ・いろは」の2つの言葉を要秘匿化語に加えてから検査語の選出、検査式の構成、検査、判定などの処理を繰り返すことにより(ステップS102〜S107)、秘匿化を安全なものにすることができる。   As described above, the determination processing unit 26 determines that the inspection formulas of [Shihimoichi and Kendo], [Sasahimoichi and Winner] and [Eco-Iroha] are not sufficiently concealed, (Step S107), and then supplies these selected check expressions to the second type concealment word selection unit 30 (Step S108). The second type anonymized word selection unit 30 selects an anonymized word to be newly added from the inspection words included in the selected inspection formula. The new secret words to be selected are either “Kashihimo-shi” or “Kendo” test word, “Kashihimo-shi” or “winner” test word, and “Eco-Iroha”. Therefore, the anonymized word management unit 14 may be instructed to conceal these. At this time, a characteristic word may be selected by referring to the numerical value calculated to extract the characteristic word described above, or a word that affects a plurality of narrowing keys may be selected preferentially (example here) Let ’s talk about “Shimo-shi”). In this example, by adding the two words “Tsubakihimo-shi” and “Eco-Iroha” to the anonymized words, it repeats the process of selecting the test word, constructing the test formula, testing, and judging (step) S102 to S107), concealment can be made safe.

2度目以降の検査語の選定では、特徴語を選定する際の基準を変化させるなどして1度目の検査語の選定時に選ばれなかった語を検査語として追加するようにすれば、2度目以降の検査語の選定でも新たに検査語が加わりやすくなる。検査式構成時には新たに選ばれた検査語と既に選ばれている検査語も組み合わせて検査式候補が構成される。ここでは、特に検査語の選定基準を変えなかったものとし、新たな検査語が選定されないので新たな検査式候補なども構成されず、繰り返しの検査処理が終了する。   In the selection of the inspection word for the second time and later, if the word that was not selected at the time of the first inspection word selection is added as the inspection word by changing the criteria for selecting the feature word, the second time It becomes easy to add a new test word even when selecting a test word thereafter. At the time of constructing the test formula, a test formula candidate is constructed by combining a newly selected test word and an already selected test word. Here, it is assumed that the test word selection criteria have not been changed, and no new test word is selected, so that a new test formula candidate or the like is not formed, and the repeated test process is completed.

繰り返しの検査処理が終了すると、判定処理部26は、秘匿化処理部16に秘匿化処理の実行を指示する(ステップS109)。秘匿化処理部16は、要秘匿化語管理部14からの要秘匿化語に従い、図8の日報では、「わかよ」と「ゑひも市」を、図9の日報では「エコ・いろは」の文字列の秘匿化処理を行う(ステップS110)。出力部28は、秘匿化処理をされた情報を出力する。この出力は、外部の公開情報についての検証を行った結果の秘匿化されたデータとなる。   When the repeated inspection process is completed, the determination processing unit 26 instructs the concealment processing unit 16 to execute the concealment process (step S109). The anonymization processing unit 16 follows the anonymized word from the anonymized word management unit 14 in the daily report of FIG. 8 and displays “Wakayo” and “Kashihimo-shi”, and in the daily report of FIG. The character string is concealed (step S110). The output unit 28 outputs the information subjected to the concealment process. This output is concealed data as a result of verification of external public information.

図12、図13は、それぞれ図8、図9の秘匿化を行った処理結果を示したものであり、図10、図11はそれぞれ図8、図9に対して第一種要秘匿化指示として指示された文字列だけを秘匿化した場合の結果を示した図である。図14は、図12、13が生成された際の文字列記号の変換処理のログであり、秘匿化処理部16で生成されて要秘匿化語管理部14に送信されて保存される。変換処理のログは、秘匿化処理を施したデータについての分析結果などを受け取った際に、もとの情報を参照する際などに用いられる。ここでは説明の簡単の為に1種類の文字列記号が1種類の文字列記号に変換される例を示しているが、これは秘匿化処理に対する制限を示しているものではなく、秘匿化処理には1対他、他対他、他対1の組み合わせで秘匿化語と変換後の語が対応するような処理を用いてもよい。   FIG. 12 and FIG. 13 show the processing results of the concealment shown in FIG. 8 and FIG. 9, respectively. FIG. 10 and FIG. 11 show the first type concealment instruction for FIG. It is the figure which showed the result at the time of concealing only the character string instruct | indicated as. FIG. 14 is a log of character string symbol conversion processing when FIGS. 12 and 13 are generated. The log is generated by the anonymization processing unit 16 and transmitted to the anonymized word management unit 14 for storage. The log of the conversion process is used when referring to the original information when receiving the analysis result of the data subjected to the concealment process. Here, for the sake of simplicity of explanation, an example in which one type of character string symbol is converted into one type of character string symbol is shown, but this does not indicate a limitation on the concealment process, and the concealment process A process in which a concealed word and a converted word correspond to each other in a combination of one-to-other, other-to-other, and other-to-one may be used.

なお、前述の処理構成において、検査式構成処理の際に、係り受け解析なども用いて時や場所などを限定する修飾語句を加えることもできる。時や場所などを限定する修飾語句を加える例としては、図8における「12月」が挙げられる。さらに、「12月」を時を限定する修飾語句として用いることから「12月」のほかに、年を推定する計算を行って(日報のテキスト以外の情報から得る等の方法もある)「2004年12月」の文字列を加えることも容易にできる。これにより、予備検査がより該当しやすいものに絞られ、検査実行部において外部から収集する情報を削減することができる。   In the above-described processing configuration, a modifier that limits the time and place can also be added by using dependency analysis or the like at the time of the test formula configuration processing. An example of adding a modifier that limits time, place, etc. is “December” in FIG. Furthermore, since “December” is used as a modifier to limit the time, in addition to “December”, calculation for estimating the year is performed (there is a method of obtaining from information other than the text of the daily report) “2004” It is also easy to add the character string “December Year”. As a result, the preliminary inspection can be narrowed down to more easily applicable, and the information collected from the outside in the inspection execution unit can be reduced.

また、過去の問い合わせ履歴や特徴語の計算の結果などから、外部への問い合わせ結果の予測を行う処理を検査式構成処理に先立って行うこともできる。例えば、図8に示した日報データの例では、「剣道」「優勝」の表現については過去の問い合わせ結果から、単に[剣道]や[優勝] の予備検査式を構成しても検査する値よりも十分に大きな結果しか返ってこないという予測がなされて、これらについての外部に対する予備検査処理を省くことができる。   In addition, a process for predicting a query result to the outside based on a past query history, a result of feature word calculation, or the like can be performed prior to an inspection formula construction process. For example, in the example of daily report data shown in FIG. 8, the expression of “kendo” or “winner” is based on past inquiry results, and even if a preliminary check formula of [kendo] or [winner] is simply configured, However, it is predicted that only a sufficiently large result will be returned, and it is possible to omit a preliminary inspection process for the outside.

また、前述の処理例では要秘匿化語を予備検査時には用いない構成を示したが、検査語の選定時から要秘匿化語を他の検査語に加えて検査を行う処理とすることもできる。例においては、要秘匿化語管理部14を参照して「わかよ」と「セスン」を最初の検査語に加えておくことになる。予備検査時に要秘匿化語を用いる構成では予備検査処理だけでなく検査処理にも外部への問い合わせを用いた検査だけとして公開情報の収集を行わないという処理構成とすることもできる。   Further, in the above-described processing example, the configuration in which the confidential word is not used at the time of the preliminary inspection is shown. However, it is also possible to perform the processing in which the confidential word is added to other inspection words from the time of selecting the inspection word. . In the example, referring to the anonymized word management unit 14, “Wakayo” and “Cessin” are added to the first test word. In the configuration using the concealment word at the time of the preliminary inspection, it is possible to adopt a processing configuration in which collection of public information is not performed only for the inspection using the inquiry to the outside as well as the preliminary inspection processing.

一方、要秘匿化情報を外部への問い合わせに用いる処理構成の場合には、外部への問い合わせに用いることを避ける組み合わせを判定する外部問い合わせ禁止判定処理を、外部への問い合わせの前に実行することが望ましい。この外部問い合わせ禁止判定処理は、予め定めた判定ルールを用意しておくこと等で容易に実現することができる。例えば、「セスン」の内部情報を秘密の情報とは知らずに「うゐの けふこ」さんが耳に入れてしまい、そのまま日報に登録してしまったような場合の対策となる処理である。例えば「わかよ部長は来月にはカヨタの副社長になられるそうだ。」「セスンはカヨタとの合併の検討を進めているようだ」と日報中に記載されていたような際にも、「わかよ AND カヨタ AND 副社長」、「セスン AND カヨタ AND 合併」などの問い合わせを万が一にも公式の発表の前に外部に行ったりしないようにすることが望ましい。このために、例えば{社名}AND{合併等の変更を表す言葉}や{人名}AND{特定の役職名}などのパターンでの問い合わせを外部へ行うことを禁止するように設定することができる。これらの問い合わせを禁止したパターンに当てはまった検査式については、条件を緩めた予備検査式を用意し、予備検査においてヒットした情報を外部から収集したのち、収集した情報について外部への問い合わせを禁止された検査式で検査することもできる。   On the other hand, in the case of a processing configuration that uses confidential information for external inquiries, external query prohibition determination processing that determines combinations that should not be used for external inquiries should be executed before external inquiries. Is desirable. This external inquiry prohibition determination process can be easily realized by preparing a predetermined determination rule. For example, this is a process to deal with the case where Mr. Ue no Kefuko has not heard the inside information of “Cesun” as confidential information and has just registered it in the daily report. For example, “Wakayo's director seems to be the vice president of Kayota next month.” “Cesson seems to be considering the merger with Kayota.” It is desirable that inquiries such as “Wakayo AND Kayota AND Vice President” and “Cessen AND Kayota AND Merger” should not be made outside before the official announcement. For this purpose, for example, it is possible to set to prohibit the inquiry in the pattern such as {company name} AND {words indicating change of merger}, {person name} AND {specific title}, etc. . For inspection formulas that apply to patterns that prohibit these inquiries, prepare preliminary inspection formulas with relaxed conditions, collect information that was hit in the preliminary inspection from the outside, and then prohibit external inquiries about the collected information. It is also possible to inspect with a different inspection formula.

また、本実施例においては説明の簡単のため、検査式の構成を日報の一つ一つを単位として検査語の組み合わせを行う例を示したが、この単位は同じ案件や同じ訪問先ごと等の単位で構成してもよい。この変形により、複数の関連する日報データを組み合わせることによって秘匿したい情報が特定されてしまうことを防ぐことができる。また、予備検査を外部に問い合わせる順を本実施例では説明の簡単のために日報単位で行う例を示したが、大量の予備検査を集めたあとで順序をランダムにして問い合わせるようにすることで、予備検査の問い合わせから日報ごとの内容を特定されることを防ぐことができる。   In addition, in this embodiment, for the sake of simplicity of explanation, an example is shown in which the composition of the inspection formula is a combination of inspection words in units of daily reports, but this unit is the same for each case or the same visited place, etc. You may comprise by the unit of. By this modification, it is possible to prevent information to be concealed from being specified by combining a plurality of related daily report data. In addition, in this embodiment, for the sake of simplicity, the example in which the preliminary inspection is inquired to the outside is shown on a daily report basis. However, after collecting a large number of preliminary inspections, the order can be inquired at random. It is possible to prevent the contents of each daily report from being specified from the inquiry of the preliminary inspection.

次に本発明の第2の実施例について説明する。図16は第2の実施例の構成を示すブロック図である。図中、第1の実施例と同様のものについて同一参照番号を付してある。第2の実施例に係る情報秘匿化システム10aにおいて、検査語選定部40は、秘匿すべき語を特定してしまう可能性の高い要注意語を、図示しない入力手段により入力されたルールに従って抽出する要注意語抽出部42を備えている。さらに、情報秘匿化システム10aは、外部の名簿情報を検索する外部検査実行管理部100を備えている。外部検査実行管理部100は、検査制御部24aに応答して、複数の外部の名簿情報検査実行部110による検査を実行させる。図中の破線Pは、情報秘匿化システム10aの内部と外部の境界を示している。   Next, a second embodiment of the present invention will be described. FIG. 16 is a block diagram showing the configuration of the second embodiment. In the figure, the same reference numerals are assigned to the same components as in the first embodiment. In the information concealment system 10a according to the second embodiment, the test word selection unit 40 extracts words requiring attention that are likely to specify a word to be concealed according to a rule input by an input unit (not shown). The caution required word extraction part 42 is provided. Furthermore, the information concealment system 10a includes an external examination execution management unit 100 that searches for external name list information. The external inspection execution management unit 100 causes the plurality of external name list information inspection execution units 110 to execute inspections in response to the inspection control unit 24a. A broken line P in the figure indicates the boundary between the inside and the outside of the information concealment system 10a.

図17は、要注意語抽出部における抽出ルールの一例を示す図である。図17(a)は、テキストデータ中の製品の納品・導入の記載から導入先の企業名が絞り込まれる場合に対応する要注意語抽出ルールの例である。製品Xを導入する場合において、抽出パターンは、「製品X」(何か1文字)、「導入」あるいは「納品」、「検収」、「受注」等の文字列がつながる場合のパターンを規定している。そして、この抽出パターンに当てはまる場合には、企業名が特定される恐れがあるので、製品Xの製品導入企業リストを検査すべきことが指定されている。この検査の判定基準は、該当するリスト(この場合、製品チリヌの製品導入企業リストが存在すること、そして、そのリスト中の要素数(企業数)であることが指定されており、これらは検査式構成管理部22、判定処理部26で参照されて使用される。   FIG. 17 is a diagram illustrating an example of an extraction rule in the word requiring attention extraction unit. FIG. 17A is an example of a caution word extraction rule corresponding to the case where the introduction company name is narrowed down from the description of product delivery / introduction in the text data. In the case of introducing product X, the extraction pattern specifies the pattern in which character strings such as “product X” (something one character), “introduction” or “delivery”, “acceptance”, “order receipt” are connected. ing. When this extraction pattern is applicable, there is a possibility that the company name may be specified. Therefore, it is specified that the product introduction company list of the product X should be inspected. The criteria for this inspection are specified in the corresponding list (in this case, there is a list of companies that have introduced the products of the product Chillin, and the number of elements (number of companies) in the list. The formula configuration management unit 22 and the determination processing unit 26 are referred to and used.

図17(b)は、過去の所属に関する要注意語の抽出ルールの例である。検査対象が2種類の名簿情報となっており、Y大学の名簿選定とその名簿中のリストの要素数という判定基準とY大学のX部のリストの選定が判定項目して記載されている。これは、大学の卒業名簿のように大量のデータが含まれるものと相対的に少ない数の要素が含まれるものでの判定基準の指定を変える例を示している。そして、図17(b)のルールで特定される被特定項目は人であることが記載されている。   FIG. 17B is an example of a rule for extracting a word requiring attention regarding past affiliation. The examination target is two types of name list information, and the determination criteria of the selection of the name list of Y University and the number of elements in the list in the name list and the selection of the list of the X part of Y University are described as determination items. This shows an example of changing the designation of the judgment criteria in a case where a large amount of data is included and a case where a relatively small number of elements are included like a university graduation list. And it is described that the specified item specified by the rule of FIG. 17B is a person.

図17(c)は、記事情報から人が特定される場合を防ぐための抽出ルールの例である。顧客との会話の中での顧客の特記事項として記録される種類の情報のうち、特に何らかの賞を受賞した等の情報は他の情報源から氏名つきで公表されていることがある。図17(c)では、YのXの記事情報を検査対象とし、記事が選定されることを判定項目として指定してある。   FIG. 17C is an example of an extraction rule for preventing a person from being identified from article information. Among the types of information recorded as customer special notes in a conversation with a customer, information such as awards that have been awarded in particular may be disclosed by other information sources with their names. In FIG. 17C, the article information of X of Y is set as the inspection target, and the selection of the article is designated as the determination item.

要注意語の抽出ルールには、それぞれ検査対象や検査の基準についての指示を加えることができる。例えば図17(b)のルールは、名簿情報を検査することが指定されており、検査は複数段階でなされる。「Y大学」の文字列パターンの「Y」が特定されているか(抽出されるか)、特定されていれば検査制御部24aにより外部検査実行管理部100を介して外部の名簿情報等の検査が実行される。外部の名簿情報検査実行部110は、例えば「Y」大学の名簿を管理するところに配置され、検査式候補を用いて問い合わせを行う。名簿情報検査実行部110は、問い合わせに対して名簿情報内の具体的な情報を回答するのではなく、問い合わせに合致した件数のみを回答するなど集計した値を回答すればよい。さらには、指定した件数よりも多いか少ないかの判定のみという形での回答とし、問い合わせ時に指定する件数は、予め定めた数値よりも小さくできない(例えば5より小さい値は指定できない)ようにすることで名簿情報に関する具体的な情報をより隠したまま、問い合わせによる検査を実行することができる。   Instructions regarding the inspection target and the inspection standard can be added to each of the attention word extraction rules. For example, the rule of FIG. 17B specifies that the name list information is to be inspected, and the inspection is performed in a plurality of stages. Whether “Y” in the character string pattern of “Y University” is specified (extracted), or if specified, the inspection control unit 24a checks the external name list information etc. via the external inspection execution management unit 100 Is executed. The external name list information inspection execution unit 110 is arranged to manage the name list of “Y” university, for example, and makes an inquiry using the inspection formula candidates. The list information inspection execution unit 110 does not return specific information in the list information in response to the inquiry, but may return a total value such as only the number of cases that match the inquiry. Furthermore, it is assumed that the answer is in the form of only determination whether the number is greater or less than the designated number, and the number designated at the time of inquiry cannot be smaller than a predetermined numerical value (for example, a value smaller than 5 cannot be designated). In this way, it is possible to carry out an inspection by inquiring while further hiding specific information relating to the list information.

図18の架空の日報を用いて例を説明する。ここでは、図17(b)のルールが適用され、「Y大学のX部での先輩」というパターンについて「Y」は「うゐの」、「X」は「剣道」となる。「うゐの」と「剣道」の要注意語は、検査語に加えられ図2のときと同様の処理がなされるが、検査対象が図17(b)のルールにより指定されて加えられており、名簿情報に対する検査も行われる。ここでは名簿情報を対象とした検査の処理のみを説明する。   An example will be described using the fictitious daily report in FIG. Here, the rule of FIG. 17B is applied, and “Y” is “Uno” and “X” is “Kendo” for the pattern “Senior at the X Department of Y University”. The words requiring attention of “Uno” and “Kendo” are added to the test word and processed in the same manner as in FIG. 2, but the test target is specified by the rule of FIG. 17B and added. In addition, inspection of the directory information is also performed. Here, only the inspection process for the directory information will be described.

検査式構成管理部22は、ルールでの指示に従い「Y大学」すなわち「うゐの大学」の名簿情報に対して問い合わせ可能か検査実行部24に問い合わせる。検査実行部24は、外部検査実行管理部100が把握する外部の名簿情報検査実行部110に「うゐの大学」の名簿情報を扱うものがあるか否かを調べる。ここで「うゐの大学」の名簿情報を扱うものが無い場合、その結果が検査式構成管理部22に通知され、検査式構成管理部22はその旨を記録し、後の処理を判定処理部26に任せる。判定処理部26は、名簿情報が無いものについて望ましくは秘匿化が不十分であると判定することになり、「うゐの」の文字列記号は、第二種要秘匿化語指示部12に加えられていく。   The inspection formula configuration management unit 22 inquires of the inspection execution unit 24 whether it is possible to inquire about the name list information of “University Y”, that is, “University of Udon”, according to the instruction in the rule. The examination execution unit 24 checks whether or not there is an external name list information examination execution unit 110 grasped by the external examination execution management unit 100 that handles name information of “University of Uda”. Here, when there is no information handling the name list information of “University of Uda”, the result is notified to the inspection formula configuration management unit 22, and the inspection formula configuration management unit 22 records that fact, and the subsequent processing is determined. Leave it to the part 26. The determination processing unit 26 determines that the information without the list information is preferably insufficiently concealed, and the character string symbol “Uno” is sent to the second type concealment required word instruction unit 12. It will be added.

外部検査実行管理部100が把握する名簿情報検査実行部110の中に、「うゐの大学」の名簿情報を扱うものがあった場合には、問い合わせ可能な情報の種類を外部検査実行管理部100から受け取り、検査制御部24aを通じて検査式構成管理部22に伝えられる。ここでは、「卒業年度」、「学部」、「(現在の)所属」が返されるものとする。   If there is a list information inspection execution unit 110 grasped by the external inspection execution management unit 100 that handles the name information of “University of Uda”, the type of information that can be inquired is set as the external inspection execution management unit. 100 and is transmitted to the inspection type configuration management unit 22 through the inspection control unit 24a. Here, “Graduation Year”, “Faculty”, and “(Current) Affiliation” are returned.

検査式構成管理部22は、検査語と要秘匿化語の中から「卒業年度」「学部」「(現在の)所属」に当てはまる種類の情報を選ぶ。外部検査実行管理部100から返される情報の種類と検査語に付与される情報の種類の間には予め対応関係を調べて保存しておくことができる。このため、ここではその保存した対応関係により、「(現在の)所属」との対応関係がとれるものとして「セスン」が選ばれる。検査式構成管理部22は、検査式候補として[所属:セスン]を選び、検査実行部24に「うゐの大学」の名簿情報を扱う外部名簿情報検査実行部110に問い合わせることを指示する。検査実行部24では、検査制御部24a、外部検査実行管理部100を通じて該当する名簿情報検査実行部110で「所属」が「セスン」である該当者が判定処理部26を参照して得た数値よりも小さいか否かを調べる。例えば、判定処理部26を参照して得た数値が5であったとすると、「うゐの大学」の名簿情報を扱う名簿情報検査実行部110から「小」の回答を得たときには、「うゐの大学」の卒業生で「セスン」に所属する人が5名よりも少ないということを意味する。この場合、秘匿されているはずの「セスン」が、もしも特定された場合には「うゐの大学」の名簿情報を参照することにより「わかよ」氏が絞り込まれる可能性が高まることを意味する。ここでの例は、要秘匿化語である「セスン」を検査式に用いた例を示したが、判定処理部26により予め定められた方針に従い、秘匿されているはずの情報「セスン」を検査式に使った際の結果の扱いは予め決められる。   The inspection formula configuration management unit 22 selects the type of information corresponding to “graduation year”, “faculty”, and “(current) affiliation” from the inspection word and the confidential word. A correspondence relationship between the type of information returned from the external inspection execution management unit 100 and the type of information given to the test word can be checked and stored in advance. For this reason, here, “Csen” is selected as a correspondence relationship with “(current) affiliation” based on the stored correspondence relationship. The examination formula configuration management unit 22 selects [Affiliation: Csen] as the examination formula candidate, and instructs the examination execution unit 24 to make an inquiry to the external name list information examination execution unit 110 that handles name list information of “University of Uda”. In the inspection execution unit 24, numerical values obtained by referring to the determination processing unit 26 by a corresponding person whose “affiliation” is “Cessin” in the corresponding list information inspection execution unit 110 through the inspection control unit 24 a and the external inspection execution management unit 100. Check if it is smaller than. For example, if the numerical value obtained by referring to the determination processing unit 26 is 5, when a “small” answer is obtained from the list information inspection execution unit 110 that handles the list information of “Ugano University”, “U” This means that there are fewer than five graduates of “University of Samurai” who belong to “Cessun”. In this case, it means that the possibility that “Wakayo” will be narrowed by referring to the directory information of “University of Udon” if “Cesson”, which should be concealed, is identified. To do. In this example, the confidential word “Cessin” is used as an inspection formula. However, according to a policy predetermined by the determination processing unit 26, the information “Cesson” that should be concealed is displayed. The handling of the results when used in the inspection formula is predetermined.

より安全に秘匿化するためには、秘匿化する情報のどれか特定されても他の秘匿化された情報が特定されないようにすることが望ましいとした場合には、「セスン」を検査式に使った際の結果を反映して「うゐの」は、第二種秘匿化語とされて秘匿化されることになる。一方で、もし外部の名簿情報検査実行部110から「大」の回答を得た場合には、判定処理部26は、秘匿化は十分であると判定することになり、「うゐの」の文字列は秘匿化の候補には加えられない。   In order to conceal more safely, if it is desirable not to identify any other concealed information even if any of the information to be concealed is specified, “Cesson” should be Reflecting the results of use, “Unono” is classified as a second type concealment word. On the other hand, if the response “large” is obtained from the external name list information inspection execution unit 110, the determination processing unit 26 determines that the concealment is sufficient, The string is not added as a concealment candidate.

同様に、外部の名簿情報検査実行部110に「うゐの大学剣道部」の名簿情報を扱うものがあれば、同様の処理を行い「うゐの」を秘匿化の候補に加えるか否かの処理が行われることになる。母集団の少ない「うゐの大学剣道部」では相対的に「小」の回答が得られる可能性が高くなる。「うゐの大学」の名簿情報からの結果と「うゐの大学剣道部」の名簿情報からの結果が異なっていた場合には予め定めた方法で処理を決めればよいが、秘匿化情報に加えるほうを優先することでより安全な秘匿化とすることができる。また、「うゐの大学剣道部」の名簿情報を扱う名簿情報検査実行部が無かった場合には、たとえば「うゐの大学」に対する差分である「剣道部」の部分を秘匿化すると定めておくことができる。   Similarly, if there is an external list information inspection execution unit 110 that handles the list information of “Uo no University Kendo Club”, whether or not to add “Uo no” as a candidate for concealment by performing the same processing. Will be performed. There is a high possibility that “small” answers will be obtained relatively in “Uno University Kendo Club” with a small population. If the results from the “Uo University” roster information and the “Uo University Kendo Club” roster information are different, the processing may be decided in a predetermined method. By giving priority to the addition, it is possible to make it more secure and concealed. In addition, if there is no roster information inspection execution section that handles the roster information of “Uo no University Kendo Club”, for example, it is determined that the “Kendo Club” part that is the difference with “Uo University” is to be concealed. I can leave.

名簿情報検査実行部110への問い合わせに要秘匿化語からも選択を行ったが、要秘匿化語の種類について外部への問い合わせに用いる種類と用いない種類を分けて用いることもできる。この分類規則は予め定めて保存しておけばよく、例えば 部門名、人名、電話番号、住所は外部への問い合わせに用いない、会社名は外部への問い合わせに用いるなどの規則を記述して保存しておくことができる。これにより、不用意な問い合わせを外部に行わないように制御することが容易に実現できる。   In the inquiry to the list information inspection execution unit 110, selection is also made from the confidential word, but the type of confidential word can be used separately from the type used for external inquiry and the type not used. This classification rule should be saved in advance. For example, the department name, person name, telephone number, and address should not be used for external inquiries, and the company name should be used for external inquiries. Can be kept. As a result, it is possible to easily realize control so as not to make an inadvertent inquiry outside.

次に、本発明の第3の実施例について説明する。第3の実施例に係る情報秘匿化システム10bは、図19に示すように名簿情報検査実行部110を組織内部に配置させている。前述のように名簿情報の内部情報を提示せずに情報が絞り込めることの調査のみを行うため、単に名簿情報を保持している人の協力を得て、それぞれの名簿情報の保持者の管理のもとに名簿情報検査実行部120を配置することもできる。ある程度の規模の組織になると様々な種類の名簿情報を持つ人が存在するので、その人たちの協力を前提として名簿情報の正当な所有者のもとに名簿情報検査実行部120を配置する構成とすれば、内部への問い合わせにより、図16のときのように、外部への問い合わせを行った場合と同等の効果を得ることができるうえ、外部に提示する情報を減らすことができる。   Next, a third embodiment of the present invention will be described. In the information concealment system 10b according to the third embodiment, a name list information inspection execution unit 110 is arranged inside the organization as shown in FIG. As mentioned above, only the investigation of whether the information can be narrowed down without presenting the internal information of the name list information is performed, so the management of each name information holder is managed with the cooperation of the person holding the name list information. The name list information inspection execution unit 120 can also be arranged under this. Since there are people with various types of name information in an organization of a certain size, the name information inspection execution unit 120 is arranged under the right owner of name information on the premise of their cooperation. As a result, it is possible to obtain the same effect as the case of making an inquiry to the outside as shown in FIG. 16 by the inquiry to the inside, and to reduce the information presented to the outside.

内部の協力者は正当に所有する名簿情報について、個々の情報を開示することなく業務情報の秘匿化に協力することができる。さらに、名簿情報検査実行部120に予め明示的に制限を加えることでより安全に協力を行うことができ、例えば氏名や住所電話番号など個人を特定する情報への問い合わせには答えない、回答は問い合わせ内容が問い合わせ時に指定された数値に対して小さいか否かしか回答しない、さらには指定された数値は予め一定の数値以下にはできないようにした実装を配置することで、ご操作などによる名簿情報の流出を防ぐことができる。   Internal collaborators can cooperate in concealing business information without disclosing individual information on legally owned directory information. Furthermore, it is possible to cooperate more safely by explicitly restricting the name list information inspection execution unit 120 in advance. For example, it does not answer inquiries to information that identifies individuals such as name and address telephone number. It is only a reply whether or not the inquiry content is smaller than the numerical value specified at the time of inquiry, and furthermore, a list that is specified by the operation etc. is arranged so that the specified numerical value can not be less than a predetermined numerical value in advance. Information leakage can be prevented.

上記した実施例においては、文字列の抽出などにパターンマッチや単純な特徴語抽出を用いる説明を行ったが、自然言語処理の係り受け解析の結果や意味解析の結果を利用した処理を排除するものではない。また、検査式の構成時には一つの日報の中での検査語の組み合わせを例にとって説明を行ったが、複数の日報に表れる語を組み合わせて検査式を構成することを排除するものでもない。例えば、係り受け解析や意味解析を用いて検査語と要秘匿語の間の関係を捉えたり、図17(c)のようにパターンを用いて表現の構造を捉えると、公知の質問応答システムを検査処理に用いた構成にすることも容易となる。   In the above-described embodiments, the explanation was made using pattern matching and simple feature word extraction for character string extraction, but the processing using the results of dependency analysis and semantic analysis of natural language processing is excluded. It is not a thing. In addition, although the explanation is made by taking the combination of the inspection words in one daily report as an example when constructing the inspection formula, it does not exclude that the inspection formula is configured by combining words appearing in a plurality of daily reports. For example, if the relationship between a test word and a secret word is captured using dependency analysis or semantic analysis, or if the structure of an expression is captured using a pattern as shown in FIG. It is also easy to adopt a configuration used for the inspection process.

図17(c)を例にとると、検査語抽出の段階で抽出パターンを用いて検査語の抽出処理が行われ、図8のデータから“「ゑひも市」の「剣道大会」での「優勝」”という文字列が抽出パターンと一致して選択される。この検査語(表現)から検査式候補は、質問応答用システム用に、例えば“「ゑひも市」の「剣道大会」での「優勝」「者」は?”と構成される。この検査式候補を用いた予備検査は、公知の質問応答システムを用いて行われ、予備検査の結果としては順位付けられた名詞(人を表すと質問応答システムが判断した名詞)のリストが得られる。検査処理ではリスト中に要秘匿化語「わかよ」が含まれるか?何位に挙げられているかという情報を検査し、判定処理では検査の結果に対して予め定められた基準にしたがって判定を行い、たとえば上位10位以内に要秘匿化語が現れた場合には、秘匿化が十分でないと判定するといった処理を行うように構成することもできる。   Taking FIG. 17C as an example, test word extraction processing is performed using the extraction pattern at the test word extraction stage, and the data of FIG. The character string “win” ”is selected in accordance with the extraction pattern. From this test word (expression), the test formula candidate is used for the question answering system, for example,“ Kendo Tournament ” Who is the “winner” or “person”? The preliminary examination using this examination formula candidate is performed using a well-known question answering system, and as a result of the preliminary examination, the ranked noun (the question answering system determines that it represents a person). A list of nouns) in the check process, does the list contain the secret word “Wakayo”? Check the information on how many are listed, and in the determination process, make a determination according to a predetermined criterion for the result of the inspection, for example, when a confidential word appears within the top 10 ranks, It can also be configured to perform processing such as determining that concealment is not sufficient.

また、上記した実施例においては営業日報を例にとって説明したが、他の業務を記録したデータを対象にしてもよく、さらにはアンケートやインタビューの記録など一時期にまとめて収集される情報についても少ない改変のみで実施例を容易に適用することができる。   In the above embodiment, the daily business report has been described as an example. However, data that records other work may be targeted, and there is also little information collected at one time such as questionnaires and interview records. The embodiments can be easily applied by modification alone.

さらに検査実行部や検査制御部を信頼できる外部の公的機関に配置する構成もあり得る、その場合には、より多くの名簿情報等について検査を行うことができるようになることが期待でき、より安全な秘匿化処理を実現できるようになる。   In addition, there can be a configuration where the inspection execution unit and the inspection control unit are arranged in an external public organization that can be trusted, in that case, it can be expected to be able to inspect more directory information, etc. A safer concealment process can be realized.

以上説明したように、秘匿化語を特定する可能性があることが経験的に分かっている表現を抽出することにより、より確実な検査を行うことができる。また、名簿情報に対する検査を実現することで、例えば上の例では「うゐの」大学の卒業生で「セスン」に所属する人は非常に少なく5名以下であるといった状況があった場合には、「うゐの大学」の卒業者名簿が流出していた場合には、「わかよ」氏が特定されてしまう危険性が高くなる場合もあったが、上記実施例では一般には開示されない名簿情報に対しても検査を行う枠組みを用意した。このことにより、仮に「うゐの大学」の名簿情報が流出していたような場合に備えた、秘匿化の検証・再秘匿化を行うことができ、より安全な秘匿化情報を作成することができる。   As described above, a more reliable examination can be performed by extracting an expression that is empirically known to have the possibility of specifying a concealment word. In addition, by implementing the inspection of the directory information, for example, in the above example, there are very few graduates of “Uno” university who belong to “Cessin” and there are 5 or less people. In the case where the graduate list of “Uo no University” was leaked, there was a risk that Mr. “Wakayo” would be identified, but the list which is not generally disclosed in the above embodiment A framework for inspecting information was also prepared. As a result, it is possible to verify and re-conceal the concealment in case the directory information of “University of Udon” has leaked, and to create safer concealment information Can do.

以上、本発明の好ましい実施の形態について詳述したが、本発明に係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。   The preferred embodiments of the present invention have been described in detail above. However, the present invention is not limited to the specific embodiments according to the present invention, and various modifications can be made within the scope of the gist of the present invention described in the claims. Deformation / change is possible.

本発明に係る情報秘匿化装置は、電子化された情報に含まれる情報を秘匿化するための装置、システム、ネットワークシステム、プログラム等において利用される。   The information concealment apparatus according to the present invention is used in an apparatus, system, network system, program, etc. for concealing information contained in digitized information.

本発明の第1の実施例に係る情報秘匿化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the information concealment apparatus which concerns on 1st Example of this invention. 情報秘匿化装置の動作フローを示す図である。It is a figure which shows the operation | movement flow of an information concealment apparatus. 図2の検査式構成の動作フローを示す図である。It is a figure which shows the operation | movement flow of the test | inspection type | formula structure of FIG. 架空の予備検査結果を示す図である。It is a figure which shows a fictitious preliminary test result. 検査式候補による架空の検査結果を示す図である。It is a figure which shows the fictitious test result by a test formula candidate. [エコ・いろは]の予備検査の結果である。It is the result of preliminary inspection of [Eco-Iroha]. 検査処理結果を示す図である。It is a figure which shows a test process result. 日報データの例を示す図である。It is a figure which shows the example of daily report data. 日報データの例を示す図である。It is a figure which shows the example of daily report data. 図8の日報データを第一種要秘匿化語により秘匿化した例を示す図である。It is a figure which shows the example which concealed the daily report data of FIG. 8 by the 1st type concealment required word. 図9の日報データを第一種要秘匿化語により秘匿化した例を示す図である。It is a figure which shows the example which concealed the daily report data of FIG. 9 by the 1st type concealment required word. 図8の日報データを第二種要秘匿化語により秘匿化した例を示す図である。It is a figure which shows the example which concealed the daily report data of FIG. 8 by the 2nd type concealment required word. 図9の日報データを第二種要秘匿化語により秘匿化した例を示す図である。It is a figure which shows the example which concealed the daily report data of FIG. 9 by the 2nd type concealment required word. 図12および図3の秘匿化処理における文字列記号の変換処理のログを示す図である。It is a figure which shows the log of the conversion process of the character string symbol in the concealment process of FIG. 12 and FIG. 架空の記事の例を示す図である。It is a figure which shows the example of a fictitious article. 本発明の第2の実施例に係る情報秘匿化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the information concealment apparatus which concerns on 2nd Example of this invention. 要注意語を抽出するときのルールの一例を示す図である。It is a figure which shows an example of the rule when extracting a caution word. 日報データの例を示す図である。It is a figure which shows the example of daily report data. 本発明の第3の実施例に係る情報秘匿化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the information concealment apparatus which concerns on 3rd Example of this invention.

符号の説明Explanation of symbols

10:情報秘匿化装置 10a、10b:情報秘匿化システム
12:第一種要秘匿化語指示部 14:要秘匿化語管理部
16:秘匿化処理部 18:業務データ保持部
20:検査語選出部 22:検査式構成管理部
24:検査実行部 26:判定処理部
28:出力部 30:第二種要秘匿化語選定部
100:外部検査実行管理部 110:名簿情報検査実行部
120:名簿情報検査実行部
10: Information concealment device 10a, 10b: Information concealment system 12: First type concealed word instruction unit 14: Concealed word management unit 16: Concealment processing unit 18: Business data holding unit 20: Check word selection Unit 22: Inspection type configuration management unit 24: Inspection execution unit 26: Judgment processing unit 28: Output unit 30: Type 2 anonymized word selection unit 100: External inspection execution management unit 110: Name list information inspection execution unit 120: Name list Information inspection execution department

Claims (35)

文字列等の秘密情報を含む情報を秘匿化する情報秘匿化装置であって、
第1の種類の情報を秘匿化すべき情報として指示する指示手段と、
第1の種類の情報に基づき、秘匿化の対象である情報から要秘匿化語を選定する第1の選定手段と、
第1の選定手段により選定された要秘匿化語により、秘匿化の対象である情報の秘匿化が十分であるか否かを判定する判定手段と、
を有する情報秘匿化装置。
An information concealment device for concealing information including secret information such as character strings,
Instruction means for instructing the first type of information as information to be concealed;
First selecting means for selecting a confidential word from information to be concealed based on the first type of information;
A determination means for determining whether or not the information to be concealed is sufficiently concealed by the concealment word selected by the first selecting means;
An information concealment device.
判定手段は、秘匿化の対象である情報から少なくとも1つの検査語を抽出する検査語抽出手段と、抽出された検査語に基づき検査式を構成する検査式構成手段と、構成された検査式を用い外部情報の検査を行う検査実行手段とを有し、判定手段は、検査実行手段の検査結果に基づき秘匿化が十分か否かを判定する、請求項2に記載の情報秘匿化装置。 The determining means includes a test word extracting means for extracting at least one test word from the information to be concealed, a test formula forming means for configuring a test formula based on the extracted test word, and a test formula configured The information concealment device according to claim 2, further comprising: an inspection execution unit that performs an inspection of external information to be used, and the determination unit determines whether the concealment is sufficient based on the inspection result of the inspection execution unit. 情報秘匿化装置はさらに、判定手段により秘匿化が十分でないと判定されたとき、秘匿化の対象である情報から第2の種類の要秘匿化語を選定する第2の選定手段を有し、
前記判定手段は、第2の選定手段により選定された要秘匿化語により、秘匿化の対象である情報の秘匿化が十分であるか否かを判定する、請求項1または2に記載の情報秘匿化装置。
The information concealment device further includes a second selection unit that selects a second type of concealment word from the information to be concealed when the determination unit determines that the concealment is not sufficient.
3. The information according to claim 1, wherein the determination unit determines whether or not the information to be concealed is sufficiently concealed based on the concealment word selected by the second selection unit. Concealment device.
第2の選定手段は、検査実行手段の検査結果に基づき第2の種類の要秘匿化語を選定する、請求項3に記載の情報秘匿化装置。 The information concealment device according to claim 3, wherein the second selection unit selects the second type of concealment word based on the inspection result of the inspection execution unit. 検査語抽出手段は、秘匿化の対象であるテキスト情報に含まれる特徴語を出現頻度に応じて抽出する、請求項2に記載の情報秘匿化装置。 The information concealment device according to claim 2, wherein the test word extraction unit extracts a feature word included in the text information to be concealed according to the appearance frequency. 出現頻度は、テキスト情報に含まれる特徴語の出現の偏り頻度を含む、請求項5に記載の情報秘匿化装置。 The information concealment device according to claim 5, wherein the appearance frequency includes a bias frequency of appearance of feature words included in the text information. 検査語抽出手段は、予め決められたルールに従い、秘匿化の対象であるテキスト情報に含まれる要注意語を抽出する、請求項2に記載の情報秘匿化装置。 The information concealment device according to claim 2, wherein the test word extraction unit extracts a caution word included in the text information to be concealed according to a predetermined rule. 検査式構成手段は、抽出された複数の検査語から検査式候補を設定し、設定された検査式候補について前記検査実行手段により予備検査を実行させ、その予備検査結果に基づき検査式を選定する、請求項2に記載の情報秘匿化装置。 The inspection formula construction means sets inspection formula candidates from the extracted plurality of test words, causes the inspection execution means to perform preliminary inspection on the set inspection formula candidates, and selects an inspection formula based on the preliminary inspection results The information concealment device according to claim 2. 検査式構成手段は、抽出された複数の検査語を用いて絞り込み検索となる検査式候補を設定する、請求項8に記載の情報秘匿化装置。 The information concealment device according to claim 8, wherein the check expression constructing means sets a check expression candidate to be a narrow search using a plurality of extracted check words. 検査式構成手段は、予備検査を実行したときのヒット数が一定の範囲に含まれる検査式候補を選定する、請求項8に記載の情報秘匿化装置。 9. The information concealment device according to claim 8, wherein the inspection formula construction means selects a test formula candidate whose hit count when the preliminary inspection is executed is included in a certain range. 検査式構成手段は、外部に対する問い合わせ結果に基づき検査式候補を設定する、請求項8に記載の情報秘匿化装置。 The information concealment device according to claim 8, wherein the inspection formula constructing unit sets a test formula candidate based on an inquiry result to the outside. 検査実行手段は、検査式候補についてデータベースに蓄積された情報を対象に検査を実行する、請求項1ないし11いずれか1つに記載の情報秘匿化装置。 The information concealment device according to any one of claims 1 to 11, wherein the inspection execution unit performs an inspection on information accumulated in a database for an inspection formula candidate. データベースは、外部データベースまたは内部データベースを含む、請求項12に記載の情報秘匿化装置。 The information concealment device according to claim 12, wherein the database includes an external database or an internal database. 検査実行手段は、検査式候補について情報公開サービスに含まれる情報を対象に検査を実行する、請求項1ないし11いずれか1つに記載の情報秘匿化装置。 The information concealment device according to any one of claims 1 to 11, wherein the inspection execution unit performs an inspection on information included in the information disclosure service for the inspection formula candidate. 情報公開サービスは、ウエブ上で公開される情報を含む、請求項14に記載の情報秘匿化装置。 The information concealment device according to claim 14, wherein the information disclosure service includes information disclosed on the web. 検査実行手段は、検査式候補について外部で公開された名簿情報を対象に検査を実行する、請求項1ないし11いずれか1つに記載の情報秘匿化装置。 The information concealment device according to any one of claims 1 to 11, wherein the inspection execution unit performs inspection on the name list information disclosed externally for the inspection formula candidate. 検査実行手段は、検査式候補について内部の名簿情報を対象に検査を実行する、請求項1ないし11いずれか1つに記載の情報秘匿化装置。 The information concealment device according to claim 1, wherein the inspection execution unit performs an inspection on the internal name list information for the inspection formula candidate. 前記判定手段により秘匿化が十分であると判定されたとき、第1の選定手段および/または第2の選定手段により選定された要秘匿化語を秘匿化する秘匿化手段を有する、請求項1ないし17いずれか1つに記載の情報秘匿化装置。 2. A concealment unit that conceals a concealment word selected by the first selection unit and / or the second selection unit when the determination unit determines that concealment is sufficient. Or the information concealment device according to any one of 17 to 17; 情報秘匿化装置はさらに、要秘匿化情報を外部に問い合わせる問い合わせ手段を含む、請求項1に記載の情報秘匿化装置。 The information concealment apparatus according to claim 1, further comprising inquiry means for inquiring the concealment information to the outside. 情報秘匿化装置はさらに、検査式による検査を禁止すべきか否かを判定する禁止判定手段を有し、禁止と判定された場合には、検査実行手段は、外部から収集済みの情報について当該検査式による検査を実行する、請求項1ないし19いずれか1つに記載の情報秘匿化装置。 The information concealment device further includes a prohibition determination unit that determines whether or not the inspection based on the inspection formula should be prohibited. The information concealment device according to claim 1, wherein the information concealment device executes inspection based on a formula. 請求項1ないし20いずれか1つに記載の情報秘匿化装置と、
検査実行手段により検査される情報を蓄積した情報蓄積媒体と、を含む情報秘匿化システム。
The information concealment device according to any one of claims 1 to 20,
An information concealment system comprising: an information storage medium that stores information to be inspected by the inspection execution means.
情報蓄積媒体は、検査実行手段により通信手段を介してアクセス可能である、請求項21に記載の情報秘匿化システム。 The information concealment system according to claim 21, wherein the information storage medium is accessible by the examination execution means via the communication means. 文字列等の秘密情報を含むテキスト情報を秘匿化する情報秘匿化方法であって、
第1の種類の情報に基づき、秘匿化の対象である情報から要秘匿化語を選定する第1の選定ステップと、
第1の選定ステップにより選定された要秘匿化語により、秘匿化の対象である情報の秘匿化が十分であるか否かを判定する判定ステップと、
を有する情報秘匿化方法。
An information concealment method for concealing text information including secret information such as character strings,
A first selection step of selecting a concealment word from information to be concealed based on the first type of information;
A determination step of determining whether or not the information to be concealed is sufficiently concealed by the anonymized word selected in the first selection step;
An information concealment method comprising:
情報秘匿化方法はさらに、秘匿化の対象である情報から少なくとも1つの検査語を抽出する検査語抽出ステップと、抽出された検査語に基づき検査式を構成する検査式構成ステップと、構成された検査式を用い外部の公開情報の検査を行う検査実行ステップとを有し、検査実行ステップの検査結果に基づき秘匿化が十分か否かを判定する、請求項17に記載の情報秘匿化方法。 The information concealment method further includes a test word extraction step for extracting at least one test word from information to be concealed, and a test formula configuration step for configuring a test formula based on the extracted test word. The information concealment method according to claim 17, further comprising: an inspection execution step for inspecting external public information using an inspection formula, and determining whether concealment is sufficient based on an inspection result of the inspection execution step. 情報秘匿化方法はさらに、判定ステップにより秘匿化が十分でないと判定されたとき、秘匿化の対象である情報から第2の種類の要秘匿化語を選定する第2の選定ステップと、
第2の選定ステップにより選定された要秘匿化語により、秘匿化の対象である情報の秘匿化が十分であるか否かを判定する判定ステップと、
を有する情報秘匿化方法。
The information concealment method further includes a second selection step of selecting a second type of concealment word from the information to be concealed when the determination step determines that the concealment is not sufficient,
A determination step of determining whether or not the information to be concealed is sufficiently concealed by the anonymized word selected in the second selection step;
An information concealment method comprising:
検査語抽出ステップは、秘匿化の対象であるテキスト情報に含まれる特徴語を出現頻度に応じて抽出する、請求項23に記載の情報秘匿化方法。 24. The information concealment method according to claim 23, wherein the inspection word extraction step extracts a feature word included in the text information to be concealed according to the appearance frequency. 検査語抽出ステップは、予め定められたルールに基づきテキスト情報から要注意語を抽出する、請求項23に記載の情報秘匿化方法。 24. The information concealment method according to claim 23, wherein the inspection word extraction step extracts words requiring attention from the text information based on a predetermined rule. 検査式構成ステップは、抽出された複数の検査語から検査式候補を設定し、設定された検査式候補について前記検査実行手段により予備検査を実行させ、その予備検査結果に基づき検査式を選定する、請求項23に記載の情報秘匿化方法。 In the inspection formula construction step, a test formula candidate is set from a plurality of extracted test words, a preliminary test is executed by the test execution means for the set test formula candidate, and a test formula is selected based on the preliminary test result The information concealment method according to claim 23. 検査式構成ステップは、抽出された複数の検査語を用いて絞り込み検索となる検査式候補を設定する、請求項23に記載の情報秘匿化方法。 24. The information concealment method according to claim 23, wherein the inspection formula construction step sets inspection formula candidates to be a narrow search using a plurality of extracted test words. 検査式構成ステップは、予備検査を実行したときのヒット数が一定の範囲に含まれる検査式候補を選定する、請求項23に記載の情報秘匿化方法。 24. The information concealment method according to claim 23, wherein the test formula configuration step selects test formula candidates in which the hit count when the preliminary test is executed is included in a certain range. 検査実行ステップは、検査式候補についてウエブ上で公開された情報を対象に検査を実行する、請求項23に記載の情報秘匿化方法。 24. The information concealment method according to claim 23, wherein the inspection execution step performs an inspection on information published on the web for inspection formula candidates. 検査実行ステップは、検査式候補について外部で公開された名簿情報を対象に検査を実行する、請求項23に記載の情報秘匿化方法。 24. The information concealment method according to claim 23, wherein the inspection execution step performs inspection on name list information that is publicly disclosed for the inspection formula candidate. 検査実行ステップは、検査式候補について内部の名簿情報を対象に検査を実行する、請求項23に記載の情報秘匿化方法。 The information concealment method according to claim 23, wherein the inspection execution step executes an inspection on the internal name list information for the inspection formula candidate. 情報秘匿化方法はさらに、秘匿化が十分であると判定されたとき、第1および/または第2の選定ステップで選定された要秘匿化語を秘匿化する秘匿化ステップを有する請求23ないし33いずれか1つに記載の情報秘匿化方法。 The information concealment method further comprises a concealment step of concealing the concealment-required word selected in the first and / or second selection step when it is determined that the concealment is sufficient. The information concealment method as described in any one. 文字列等の秘密情報を含むテキスト情報を秘匿化する情報秘匿化プログラムであって、
第1の種類の情報に基づき、秘匿化の対象である情報から要秘匿化語を選定する第1の選定ステップと、
第1の選定ステップで選定された要秘匿化語により、秘匿化の対象である情報の秘匿化が十分であるか否かを判定する判定ステップと、
判定ステップにより秘匿化が十分でないと判定されたとき、秘匿化の対象である情報から第2の種類の要秘匿化語を選定する第2の選定ステップと、
選定された要秘匿化語を秘匿化するステップと、
を有する情報秘匿化プログラム。
An information concealment program for concealing text information including secret information such as character strings,
A first selection step of selecting a concealment word from information to be concealed based on the first type of information;
A determination step for determining whether or not the information to be concealed is sufficiently concealed by the concealment word selected in the first selection step;
A second selection step of selecting a second type of concealment word from information to be concealed when it is determined that the concealment is not sufficient by the determination step;
Concealing the selected confidential word, and
An information concealment program.
JP2005129634A 2005-04-27 2005-04-27 Information concealing device, concealing system, concealing method and concealing program Pending JP2006309406A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005129634A JP2006309406A (en) 2005-04-27 2005-04-27 Information concealing device, concealing system, concealing method and concealing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005129634A JP2006309406A (en) 2005-04-27 2005-04-27 Information concealing device, concealing system, concealing method and concealing program

Publications (1)

Publication Number Publication Date
JP2006309406A true JP2006309406A (en) 2006-11-09

Family

ID=37476236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005129634A Pending JP2006309406A (en) 2005-04-27 2005-04-27 Information concealing device, concealing system, concealing method and concealing program

Country Status (1)

Country Link
JP (1) JP2006309406A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010182053A (en) * 2009-02-05 2010-08-19 Giken Shoji International Co Ltd Concealed totaling system
JP2013080525A (en) * 2013-02-07 2013-05-02 Giken Shoji International Co Ltd Processing program in secret tabulation system
JP2014035579A (en) * 2012-08-07 2014-02-24 Yahoo Japan Corp Portable terminal, information processing method and computer program
JP2020166556A (en) * 2019-03-29 2020-10-08 株式会社エヌ・ティ・ティ・データ Anonymous processing target specification method, anonymous processing target specification system and program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002269081A (en) * 2001-01-05 2002-09-20 Fujitsu Ltd Device and method for setting document anonymity, computer-readable recording medium with recorded anonymity setting program and the program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002269081A (en) * 2001-01-05 2002-09-20 Fujitsu Ltd Device and method for setting document anonymity, computer-readable recording medium with recorded anonymity setting program and the program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010182053A (en) * 2009-02-05 2010-08-19 Giken Shoji International Co Ltd Concealed totaling system
JP2014035579A (en) * 2012-08-07 2014-02-24 Yahoo Japan Corp Portable terminal, information processing method and computer program
JP2013080525A (en) * 2013-02-07 2013-05-02 Giken Shoji International Co Ltd Processing program in secret tabulation system
JP2020166556A (en) * 2019-03-29 2020-10-08 株式会社エヌ・ティ・ティ・データ Anonymous processing target specification method, anonymous processing target specification system and program

Similar Documents

Publication Publication Date Title
Zaeem et al. The effect of the GDPR on privacy policies: Recent progress and future promise
Pollach What's wrong with online privacy policies?
Edenborg Anti-gender politics as discourse coalitions: Russia’s domestic and international promotion of “traditional values”
Dinev et al. Internet privacy concerns and their antecedents-measurement validity and a regression model
Harpham et al. Measuring social capital within health surveys: key issues
Harper The measurement of social capital in the United Kingdom
Lu et al. Technology acceptance model for wireless Internet
Heatherly et al. Preventing private information inference attacks on social networks
Lasprogata et al. Regulation of electronic employee monitoring: Identifying fundamental principles of employee privacy through a comparative study of data privacy legislation in the European Union, United States and Canada
Fuchs Societal and ideological impacts of deep packet inspection internet surveillance
US8819009B2 (en) Automatic social graph calculation
Lavorgna Internet-mediated drug trafficking: towards a better understanding of new criminal dynamics
Smith et al. Comparing the RELTRAD and born‐again/evangelical self‐identification approaches to measuring American Protestantism
Suen et al. The experiences of sexual and gender minorities in employment: Evidence from a large-scale survey of lesbian, gay, bisexual, transgender and intersex people in China
Leukfeldt et al. Cybercrime on the menu? Examining cafeteria-style offending among financially motivated cybercriminals
Beştepe et al. Acceptance of IoT-based and sustainability-oriented smart city services: A mixed methods study
Lee et al. A comparative study of quality awards: Evolving criteria and research
Kaminski Standing after Snowden: Lessons on privacy harm from national security surveillance litigation
Nguyen et al. The structure of cybercrime networks: transnational computer fraud in Vietnam
Risius et al. Towards an understanding of conspiracy echo chambers on Facebook
JP2016153998A (en) Service evaluation device and method
JP2006309406A (en) Information concealing device, concealing system, concealing method and concealing program
Murray Delphi methodologies: A review and critique
Seabrook et al. Administrative law judges in fair housing enforcement: Attitudes, case facts, and political control
Reinhardt et al. Varieties of antigenderism: the politicization of gender issues across three European populist radical right parties

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100927

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101102