JP2001142893A - 情報公開装置および文章公開方法 - Google Patents

情報公開装置および文章公開方法

Info

Publication number
JP2001142893A
JP2001142893A JP32211499A JP32211499A JP2001142893A JP 2001142893 A JP2001142893 A JP 2001142893A JP 32211499 A JP32211499 A JP 32211499A JP 32211499 A JP32211499 A JP 32211499A JP 2001142893 A JP2001142893 A JP 2001142893A
Authority
JP
Japan
Prior art keywords
document
masking
changed
word
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP32211499A
Other languages
English (en)
Inventor
Junichi Matsuda
純一 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP32211499A priority Critical patent/JP2001142893A/ja
Publication of JP2001142893A publication Critical patent/JP2001142893A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文書中の特定情報をマスキングする際に、あ
らかじめ登録されていない文字列に対しては、マスキン
グする手段は与えられていない。 【解決手段】 マスキング対象文書をを一文ずつ読み込
み(203)、形態素解析を行う(204)。次に、形
態素解析結果に対して、マスキング規則81を順番に読
み込み(205)、マッチングしているかどうかを調べ
る(206)。マスキング規則にマッチした場合に、マ
スキング候補部分を表示する(207)。次に、マスキ
ング部分をユーザに修正させる(212)。これにより、
マスキング部分を指定した文書を新たに作成する。最後
にマスキングした文書を新たに作成する(213)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書の特定部分を
マスキングした形で公開する装置に関する。
【0002】
【従来の技術】近年、情報公開が進んでおり、役所の文
書や企業内文書が公開される機会が増えているが、同時
に、公開に際して、個人情報や機密情報を保護すること
が必要になりつつある。つまり、特定の部分をマスキン
グ(黒く塗りつぶす)したうえで公開することが必要で
ある。従来、特開平11−143871に示すように、
情報公開要求もとのプロファイル情報と規則を用いて、
マスキング部分を自動的に決定する方式がある。
【0003】
【発明が解決しようとする課題】しかしながら、上記方
式は、あらかじめ指定された会社名や数字などの文字列
をマスキングするものであり、新たな会社名や珍しい人
名などのようにあらかじめ登録されていない文字列に対
しては、マスキングする手段は与えられていない。ま
た、マスキングしたあとの文書はマスキング部分に書い
てあった内容が消失してしまうという問題点があった。
【0004】上記問題点に鑑み、本発明の第1の目的
は、あらかじめ指定されていない会社名や人名などに対
してもマスキング部分として推定することを可能とする
ことにある。
【0005】本発明の第2の目的は、マスキング前の文
書とマスキング後の文書を対で管理することにより、マ
スキングに要する管理を効率よく行うことにある。
【0006】
【課題を解決するための手段】上記課題を解決するため
に、本発明では、公開対象文書を形態素解析し、形態素
の前後の文字から人名、会社名などのマスキング対象文
字列を推定する。また、もとの文書と、マスキング候補
の表示を変えた文書と、マスキング後の文書の3つの文
書をひとまとまりで管理することにより、マスキング業
務の効率化を図る。
【0007】
【発明の実施の形態】以下、本発明の実施の形態を図面
を用いて説明する。
【0008】図1は、本発明の全体構成を示す図であ
る。公開請求者からの求めに応じて公開元が情報公開を
行う。情報公開は、文書表示装置11、マスキング処理
装置12で行う。また、データベースとして、文書デー
タベース13、マスキング規則14、辞書データベース
15を有する。
【0009】図2は,本発明の実施例を示すフローチャ
ートである。図3は、辞書データベースのレコード構成
を示す図である。レコードは、見出し31,品詞32,
活用形33,終止形34からなる。図4は、マスキング
対象文書の表示画面を示す図である。
【0010】図5は、形態素解析結果のレコードを示す
図であり、単語51、品詞52からなる。図6は、マス
キング規則のレコードを示す図である。図7は、マスキ
ング候補部分を変化させて表示した図である。
【0011】図8は、マスキング修正ウインドウの表示
画面を示す図であり、「マスキングする」81、「マス
キングしない」82、「すべてマスキング」83、「キ
ャンセル」84の4つのボタンからなる図9は、マスキ
ング済み文書の表示画面を示す図である。
【0012】次に,本発明の処理の流れを図2に沿って
説明する。まず、文書のマスキング部分を決定する処理
について説明する。最初に、公開対象文書を画面に表示
する(201)。例えば、この文書名ををaa.mk1とす
る。まず、この文書をコピーして(202)、例えば、
拡張子を変えた文書aa.mk2を生成する。表示した文書4
1を一文ずつ読み込み(203)、形態素解析を行う
(204)。形態素解析は、辞書データの見出し31,
品詞32,活用形33,終止形34などを参照しなが
ら、文を単語51に分割し、品詞52などを決定する処
理である。
【0013】次に、形態素解析結果に対して、マスキン
グ規則81を順番に読み込み(205)、マッチングし
ているかどうかを調べる(206)。マスキング規則6
1は、たとえば、形態素の並びから成る。鍵かっこ[]
で囲まれた部分がマスキング対象単語である。マスキン
グ規則にマッチした場合に、[]で囲まれた部分をマス
キング候補部分として下線表示など変化させて表示する
(207)。下線表示ではなく、白黒反転表示や色を変
えて表示してもよい。なお、マスキング規則では,品詞
が姓名である場合のように単純な規則だけではなく,後
に「さん」「殿」のような特別な接尾語がある場合に,
直前の語をマスキングすることも可能である。これによ
り,姓名が辞書に登録されていない珍しい名前でも姓名
を推測し、マスキング候補とすることができる。
【0014】以上の処理をマスキング規則が終わるまで
繰り返す(208)。さらに、すべての文に対して処理
を繰り返す(209)。この結果、マスキング候補に下
線が引かれた画面71が生成される。
【0015】次に、マスキング部分をユーザに修正させ
るための画面インタフェースについて説明する。まず、
文書aa.mk2をコピーして、aa.mk3を作成し、表示する
(210)。次に、マスキング修正ウインドウを新規表
示する(211)。マスキング修正ウインドウには、
「マスキングする」81、「マスキングしない」82、
「すべてマスキング」83、「キャンセル」84の4つ
のボタンがある。次にマスキング修正処理を行う(21
2)。「マスキングする」ボタンが選択されると、該単
語を下線表示のままとする。「マスキングしない」ボタ
ンが選択されると、下線表示を解除し、元の表示に戻
す。「すべてマスキング」ボタンが選択されると、下線
表示の部分はすべてそのままとしてマスキング文書作成
処理に移る。「キャンセル」ボタンが選択されると、こ
れ以降の下線表示をすべて解除し、マスキング文書作成
処理に移る。
【0016】次に、マスキング文書作成処理について説
明する。文書中の下線表示部分すべての文字を、例えば
「#」等の記号に置き換え、該部分の背景色を文字の色
と同一にする(213)。これにより、マスキング済み
文書91が生成され、文書を印刷したときにマスキング
部分がすべて塗りつぶされることになる。
【0017】以上により、原文書、マスキング部分が指
定された文書、マスキング済みの文書の3文書を一括管
理することができる。さらに、本発明では、文章を形態
素解析して必要な部分を抽出するため、漏れのないマス
キングが容易に実現できる。
【0018】
【発明の効果】以上述べたように、本発明によれば、マ
スキング文書を効率よく作成・管理することができる。
【図面の簡単な説明】
【図1】本発明に係る情報公開方式を実現するための機
能ブロック構成図である。
【図2】本発明の実施例を示すフローチャートである。
【図3】辞書データベースのレコード構成を示す図であ
る。
【図4】マスキング対象文書の表示画面を示す図であ
る。
【図5】形態素解析結果のレコードを示す図である。
【図6】マスキング規則のレコードを示す図である。
【図7】マスキング候補部分を変化させて表示した図で
ある。
【図8】マスキング修正ウインドウの表示画面を示す図
である。
【図9】マスキング済み文書の表示画面を示す図であ
る。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】文書データベース中から文書を取り出す手
    段と、該文書中の特定の部分を抽出する手段と、抽出し
    た部分を変化させて表示させる手段と、変化させた表示
    をもとに戻す手段と、表示を変化させた文書を保存する
    手段と、表示を変化させた部分の文字を別の文字に置き
    換えた文書を保存する手段と、を有することを特徴とす
    る情報公開装置。
  2. 【請求項2】文書中の特定の部分を抽出する際に、文書
    を形態素解析し、形態素の並びに応じて抽出部分を決定
    することを特徴とする特許請求の範囲第1項記載の情報
    公開装置。
  3. 【請求項3】変化させた表示をもとに戻す際に、表示を
    変化させた部分をもとに戻すかどうかを使用者に選択さ
    せる手段を設けたことを特徴とする特許請求の範囲第1
    項記載の情報公開装置。
  4. 【請求項4】公開対象文書と表示を変化させた文書と表
    示を変化させた部分の文字を別の文字に置き換えた文書
    とを関連づけて保存することを特徴とする特許請求の範
    囲第1項記載の情報公開装置。
  5. 【請求項5】文書ファイルを読み込むステップと、上記
    文書を形態素解析するステップと、辞書に格納された特
    定語句を抽出するとともに、隣接する単語から特定語句
    と推定される語句を抽出するステップと、抽出した特定
    単語と単語を反転表示させるステップと、ユーザが指定
    した特定単語と単語をマスキングするステップと、上記
    マスキングされた単語を含む文章を出力するステップと
    を有することを有することを特徴とする文章公開方法。
JP32211499A 1999-11-12 1999-11-12 情報公開装置および文章公開方法 Pending JP2001142893A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32211499A JP2001142893A (ja) 1999-11-12 1999-11-12 情報公開装置および文章公開方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32211499A JP2001142893A (ja) 1999-11-12 1999-11-12 情報公開装置および文章公開方法

Publications (1)

Publication Number Publication Date
JP2001142893A true JP2001142893A (ja) 2001-05-25

Family

ID=18140084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32211499A Pending JP2001142893A (ja) 1999-11-12 1999-11-12 情報公開装置および文章公開方法

Country Status (1)

Country Link
JP (1) JP2001142893A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007305094A (ja) * 2006-05-12 2007-11-22 Kojiro Kinoshita 情報提供方法、情報提供システム及びコンピュータプログラム
US7765193B2 (en) 2004-03-15 2010-07-27 Ricoh Company, Ltd. Control of document disclosure according to affiliation or document type
JP2011133803A (ja) * 2009-12-25 2011-07-07 Oki Electric Industry Co Ltd 入力補助装置、入力補助プログラム、音声合成装置及び音声合成プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143871A (ja) * 1997-11-12 1999-05-28 Fuji Xerox Co Ltd 文書開示装置及び文書開示プログラムを格納した媒体
JPH11238064A (ja) * 1998-02-20 1999-08-31 Toshiba Corp データベース作成方法および情報記憶検索装置および記録媒体
JPH11272695A (ja) * 1998-03-20 1999-10-08 Oki Electric Ind Co Ltd 情報抽出装置及びその方法並びに情報記憶媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143871A (ja) * 1997-11-12 1999-05-28 Fuji Xerox Co Ltd 文書開示装置及び文書開示プログラムを格納した媒体
JPH11238064A (ja) * 1998-02-20 1999-08-31 Toshiba Corp データベース作成方法および情報記憶検索装置および記録媒体
JPH11272695A (ja) * 1998-03-20 1999-10-08 Oki Electric Ind Co Ltd 情報抽出装置及びその方法並びに情報記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7765193B2 (en) 2004-03-15 2010-07-27 Ricoh Company, Ltd. Control of document disclosure according to affiliation or document type
JP2007305094A (ja) * 2006-05-12 2007-11-22 Kojiro Kinoshita 情報提供方法、情報提供システム及びコンピュータプログラム
JP2011133803A (ja) * 2009-12-25 2011-07-07 Oki Electric Industry Co Ltd 入力補助装置、入力補助プログラム、音声合成装置及び音声合成プログラム

Similar Documents

Publication Publication Date Title
KR100999488B1 (ko) 문서 표절 탐색 방법 및 장치
US20030083862A1 (en) Method for extracting name entities and jargon terms using a suffix tree data structure
JP2008148322A (ja) 文字符号化処理方法及びシステム
JP3372532B2 (ja) 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
JP2001142893A (ja) 情報公開装置および文章公開方法
JPH11328166A (ja) 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0877196A (ja) 文書情報抽出装置
JP2536633B2 (ja) 複合語抽出装置
JP3725470B2 (ja) 統計的言語モデルを作成するためのコーパス処理装置及び方法並びにプログラム
JP2536221B2 (ja) 複合語抽出装置
JP2007018158A (ja) 文字処理装置、文字処理方法及び記録媒体
JP2621999B2 (ja) 文書処理装置
JP4023371B2 (ja) 固有名認識装置および方法
JP3016040B2 (ja) 自然言語処理システム
JP3379643B2 (ja) 形態素解析方法および形態素解析プログラムを記録した記録媒体
JPH0750486B2 (ja) キ−ワ−ド抽出装置
JP4279926B2 (ja) 未知語読み導出装置および未知語読み導出方法並びに記録媒体
JPS595335A (ja) 日本語入力装置
JPH0668070A (ja) 複合語辞書登録装置
JP2000029882A (ja) 要約文作成装置
JP2838850B2 (ja) 仮名漢字変換装置
JPH08320873A (ja) キーワード自動抽出方法および装置
JPH05233689A (ja) 文書自動要約方法
Cojocaru et al. On technology of free access to the characteristic cultural heritage in the form of old printed texts
JPH05290030A (ja) 文書処理装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050621