JP2014186427A - ドキュメント作成支援装置,ドキュメント作成支援プログラム及びドキュメント作成支援方法 - Google Patents

ドキュメント作成支援装置,ドキュメント作成支援プログラム及びドキュメント作成支援方法 Download PDF

Info

Publication number
JP2014186427A
JP2014186427A JP2013059500A JP2013059500A JP2014186427A JP 2014186427 A JP2014186427 A JP 2014186427A JP 2013059500 A JP2013059500 A JP 2013059500A JP 2013059500 A JP2013059500 A JP 2013059500A JP 2014186427 A JP2014186427 A JP 2014186427A
Authority
JP
Japan
Prior art keywords
word
character string
input character
secret
document file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013059500A
Other languages
English (en)
Inventor
Daisuke Yamaoka
大亮 山岡
Yoshitaka Mukoyama
芳孝 向山
Nobuyuki Ikemura
長之 池村
Ha Dung Ngo
ハー ヨン ゴ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013059500A priority Critical patent/JP2014186427A/ja
Publication of JP2014186427A publication Critical patent/JP2014186427A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】マスキングドキュメントの作成や管理を容易に行う。
【解決手段】入力される文字列についてドキュメント作成支援処理を行うドキュメント作成支援装置であって,入力された1つまたは複数の文字を有する入力文字列の仮名漢字変換が確定したときに,確定した入力文字列に含まれる単語が秘密ワードデータベース内のいずれかの秘密ワードの少なくとも一部と一致するか否かをチェックするチェック手段と,入力文字列に含まれる1つの単語または複数の連続する単語列が前記秘密ワードと一致した場合,当該秘密ワードと一致した一致入力文字列と前記一致した秘密ワードに対応する置換ワードとを関連付けて中間ドキュメントファイルに保存し,一致しない場合,前記入力文字列を中間ドキュメントファイルに保存する中間ドキュメントファイル生成手段とを有する。
【選択図】図1

Description

本発明は,ドキュメント作成支援装置,ドキュメント作成支援プログラム及びドキュメント作成支援方法に関する。
ドキュメント作成支援プログラムは,ワードプロセッサやエディタなど,主にテキストデータが含まれているドキュメントファイルの作成を支援する。企業や官公庁内で作成されるドキュメントには,多くの個人情報や秘密情報(以下まとめて秘密情報)が含まれている。したがって,そのような秘密情報が含まれているドキュメントファイルは,外部者に開示することはできないし,セキュリティ性が低い個人の端末内にコピーすることも好ましくない。
そこで,ドキュメント内の秘密情報をマスキングしたり,秘密情報を別の単語に変換する書類管理システムが提案されている。たとえば,以下の特許文献などである。
特開2001−325258号公報 特開2006−331329号公報 特表2009−516247号公報
作成済みのドキュメントファイルを外部者に開示したりする時に,ドキュメントファイル内のテキストデータを検索して,秘密情報をアスタリスクなどのマスキング文字や他の単語に変換してマスキングドキュメントを生成する方法では,作成済みドキュメントファイルのテキストデータを検索して秘密情報を検出する必要があり,処理工数がかかるという問題がある。
さらに,作成済みドキュメントファイルをその後修正や加筆するなどして更新した場合は,再度更新後のドキュメントファイルについて再度マスキングドキュメントを生成する処理が必要になり,ドキュメント管理が煩雑になるという問題がある。
そこで,1つの側面では,本発明の目的は,マスキングドキュメントの作成や管理を容易に行うドキュメント作成支援装置,ドキュメント作成支援プログラム及びドキュメント作成支援方法を提供することにある。
実施の形態の第1の側面は,入力される文字列についてドキュメント作成支援処理を行うドキュメント作成支援装置であって,
入力された1つまたは複数の文字を有する入力文字列の仮名漢字変換が確定したときに,前記確定した入力文字列に含まれる単語が秘密ワードデータベース内のいずれかの秘密ワードの少なくとも一部と一致するか否かをチェックするチェック手段と,
前記入力文字列に含まれる1つの単語または複数の連続する単語列が前記秘密ワードと一致した場合,当該秘密ワードと一致した一致入力文字列と前記一致した秘密ワードに対応する置換ワードとを関連付けて中間ドキュメントファイルに保存し,一致しない場合,前記入力文字列を中間ドキュメントファイルに保存する中間ドキュメントファイル生成手段と
を有する。
上記第1の側面によれば,マスキングドキュメントの作成工数が少なく,マスキングドキュメントの管理が容易になる。
本実施の形態におけるドキュメント作成支援装置を有するドキュメント作成サーバとクライアント装置の構成図である。 本実施の形態におけるドキュメント作成支援装置の構成図である。 秘密ワードデータベースの一例を示す図である。 入力文字列とそれに対して作成された中間ドキュメントファイルの例を示す図である。 入力文字列の入力に対応して生成される中間ドキュメントファイルの変遷を示す図である。 ドキュメント作成支援処理のフローチャート図である。 図6の各処理について説明する図である。 文字列入力処理S13のフローチャート図である。 文字列解析及びマスキング処理S14のフローチャート図である。 マスキング処理S142のフローチャート図である。 通常ワード処理のフローチャート図である。 秘密ワード処理のフローチャート図である。 ファイル保存処理のフローチャート図である。 オリジナルドキュメントファイル保存処理のフローチャート図である。 マスキングドキュメントファイル保存処理のフローチャート図である。 複写処理のフローチャート図である。 図5のように入力された場合の入力文字バッファと検索対象文字列と検索文字バッファと候補秘密ワードと候補優先度フラグの状態を示す図である。
図1は,本実施の形態におけるドキュメント作成支援装置を有するドキュメント作成サーバとクライアント装置の構成図である。クライアント装置10は,ドキュメントを作成する作成者により文字入力が行われドキュメントデータを表示する端末12と,必要に応じてドキュメントファイルを保存するローカルディスク14とを有する。
クライアント装置10は,インターネットやイントラネットなどのネットワークNETを介してドキュメント作成サーバ20と通信可能に接続される。そして,ドキュメント作成者は,クライアント装置10をドキュメント作成サーバ20にネットワークNETを介して接続し,ドキュメント作成サーバ20内のドキュメント作成支援装置を使用してドキュメントを作成する。
ドキュメント作成サーバ20は,クライアント装置10から入力される文字列についてドキュメント作成支援処理を行うドキュメント作成支援装置21と,作成されるドキュメント内の秘密にすべき秘密ワードとその秘密ワードに置き換えられる置換ワードとを有する秘密ワードデータベース22とを有する。さらに,ドキュメント作成サーバ20は,メモリ23と,ディスクユニット26とを有し,メモリ23内には,ドキュメント作成支援処理中に入力文字を一時的に格納する入力文字バッファ24と,入力文字列に含まれる単語が秘密ワードと一致した場合にその一致した単語を一時的に格納する検索文字バッファ25とを有する。これらのバッファの利用については後述する。
そして,ドキュメント作成サーバ20は,作成中のドキュメントに対応して生成される中間ドキュメントファイル27と,オリジナルドキュメントファイル28と,マスキングドキュメントファイル29とを記憶するディスクユニット26とを有する。ディスクユニット26は,メモリディスク以外の揮発性または不揮発性の記憶媒体でもよい。
図2は,本実施の形態におけるドキュメント作成支援装置の構成図である。ドキュメント作成支援装置21は,ドキュメント作成支援プログラムであり,そのドキュメント作成支援プログラムがドキュメント作成サーバ20内の図示しないプロセッサにより実行されて,ドキュメント作成支援処理を行う。
ドキュメント作成支援装置21は,文字列入力処理部211と,文字列解析処理部212と,マスキング処理部123と,ファイル保存処理部214と,複写処理部215とを有する。
文字列入力処理部211は,クライアント装置10の端末12で入力された文字列について仮名漢字変換などの入力処理を行う。すなわち,一般的な仮名漢字変換処理プログラムである。文字列解析処理部212は,仮名漢字変換で確定した入力文字列を単語に分解するなどの文字列解析処理を行うプログラムである。
マスキング処理部213は,入力文字列が秘密ワードデータベース22内のいずれかの秘密ワードと一致するか否かをチェックし,秘密ワードと一致した一致入力文字列とその秘密ワードに対応する置換ワードとを有する中間ドキュメントを生成する処理を行うプログラムである。中間ドキュメントについては後述する。
ファイル保存処理部214は,ドキュメント作成完了後にドキュメント作成者による作成中のドキュメントを保存するドキュメント保存要求に応答して,少なくとも中間ドキュメントのファイルを記憶媒体内に保存する。ファイル保存処理部214は,中間ドキュメントファイルに加えて,中間ドキュメントから入力文字列をそのまま有するオリジナルドキュメントファイルと,秘密ワードと一致した一致入力文字列に代えて秘密ワードに対応する置換ワードを有するマスキングドキュメントファイル29とを生成し,記憶媒体内に保存してもよい。
複写処理部215は,ドキュメントファイルの複写要求に応答して,複写先の記憶媒体のセキュリティが基準値以上ならオリジナルドキュメントファイルを複写し,基準値未満ならマスキングドキュメントファイルを複写し,複写先の記憶媒体への格納を許可する。
上記のドキュメント作成支援装置21の各処理部については後で詳述する。
図3は,秘密ワードデータベースの一例を示す図である。秘密ワードデータベース22には,作成するドキュメント内の文字列のうち秘密にすべき文字列を秘密ワードとして登録される。また,秘密ワードデータベース22には,マスキングドキュメントにおいて,それらの秘密ワードに代えて保存される置換ワードも登録される。そして,秘密ワードについて,好ましくは各秘密ワードの単語数も登録されても良い。さらに,秘密ワードデータベース22内には,各秘密ワード毎に候補優先度フラグが一時的に生成される。この候補優先度フラグは,入力文字列が秘密ワードと一致するか否かをチェックする処理で利用される。この秘密ワードデータベース22は,ドキュメントを作成する前に予め作成されている。
図4は,入力文字列とそれに対して作成された中間ドキュメントファイルの例を示す図である。本実施の形態によるドキュメント作成支援処理を説明する前に,入力文字列と中間ドキュメントファイルの例を説明する。
図4の例では,入力文字列として,
「2000年神奈川県川崎市川崎区B町1丁目1番地(電話044−999−9999)に山田太郎さんと鈴木花子さんが住んでいました。」
が入力された場合に生成される中間ドキュメントファイルの例が示されている。
ドキュメント作成支援装置21のマスキング処理部213は,入力文字列について,図3の秘密ワードデータベース22に登録されている秘密ワードを検索して,以下の下線部が秘密ワードと一致することを検出することができる。
2000年神奈川県川崎市川崎区B町1丁目1番地(電話044−999−9999)に山田太郎さんと鈴木花子さんが住んでいました。」
そこで,マスキング処理部213は,下線部の秘密ワードと一致した一致入力文字列について,その秘密ワードに対応する置換ワードと関連付けて中間ドキュメントファイルを作成する。図4に示された中間ドキュメントファイルは,XMLフォーマットのドキュメントである。XMLフォーマットのドキュメントは,ドキュメント内の単語が複数種類のタグでタグ付けされる。
図4にタグの定義が示されているとおり,<word>タグは,秘密ワードとは一致しない入力文字列であって,マスキングドキュメントにおいて置換ワードに変換されない文字列である。<secret>タグは,秘密ワードと一致した一致入力文字列であり,マスキングドキュメントにおいて置換ワードに変換される対象の文字列である。そして,<replace>タグは,<secret>タグ内で使用され,秘密ワードと一致した一致入力文字列から変換される置換ワードの文字列を表す。
図4に示された中間ドキュメントファイルの例では,上記の下線部の文字列は,全て<secret>タグの中にあり,さらに,その<secret>タグ内の<replace>タグ内にその文字列に対応する変換ワードがある。
そして,マスキング処理部213は,この中間ドキュメントファイルから,秘密ワードをマスキングする必要がない場合は,中間ドキュメントファイル内の<secret>タグ内の秘密ワードと一致した一致入力文字列をそのまま有するオリジナルドキュメントファイルを生成する。逆に,マスキングする必要がある場合は,中間ドキュメントファイル内の<secret>タグ内の秘密ワードと一致した一致入力文字列の代わりに,<replace>タグ内の置換ワードに変換したマスキングドキュメントファイルを生成する。
図5は,入力文字列の入力に対応して生成される中間ドキュメントファイルの変遷を示す図である。図5の入力文字列の例は,図4と同じである。また,図5の文字入力例によれば,最初に「2000年」が入力され仮名漢字変換が確定している。この仮名漢字変換処理は,文字列入力処理部211により行われる。そして,確定したとき,入力文字バッファ内には,確定した入力文字列「2000年」が格納されている。この入力文字バッファ内の確定した入力文字列「2000年」について,マスキング処理部213が,秘密ワードデータベースを検索して,「2000年」が秘密ワードと一致するマスキング対象文字列(一致入力文字列)であることを検出する。それにより,マスキング処理部213は,中間ドキュメントファイル内において,<secret>タグに入力した文字列「2000年」を,<replace>タグに置換ワードの「YYYY年」を格納する。
次に,「神奈川県」が入力され仮名漢字変換が確定して,入力文字バッファ内に格納されている。そして,マスキング処理部213は,入力文字列「神奈川県」が秘密ワードと一致しないことを検出し,中間ドキュメントファイル内において,<word>タグに「神奈川県」を格納する。
次に,「川崎市川崎区B町1丁目1番地」が入力され仮名漢字変換が確定して,入力文字バッファ内に格納されている。そして,文字列解析処理部212が,入力文字バッファ内の「川崎市川崎区B町1丁目1番地」を,「川崎市」「川崎区」「B町」「1丁目」「1番地」の5つの単語に分解する。そして,マスキング処理部213が,この5つの単語について順次,秘密ワードデータベースを検索し,入力文字列「川崎市川崎区B町1丁目1番地」が,秘密ワードと一致することを検出する。この検出アルゴリズムについては後で詳述する。
そして,マスキング処理部213が,中間ドキュメントファイル内において,<secret>タグ内に「川崎市川崎区B町1丁目1番地」を,<replace>タグ内に「AA市BB区CCCCCCCC」を格納する。
次の入力文字は,「(」であり,秘密ワードと一致せず,中間ドキュメントファイル内において,<word>タグ内に「(」が格納されている。
このようにして生成された中間ドキュメントファイル27は,ドキュメント作成者からの作成中のドキュメントの保存要求に応答して,ファイル保存処理部214により,記憶媒体26内に保存される。そのとき,ファイル保存処理部214は,中間ドキュメントファイル27に加えて,オリジナルドキュメントファイル28とマスキングドキュメントファイル29とを記憶してもよい。
一旦作成したドキュメントに対して,加筆,変更,削除をして変更する場合は,上記の中間ドキュメントファイル27に対して行われる。加筆された文字列は,上記と同様にして,秘密ワードと一致しない入力文字列は<word>タグ内に格納されて追加され,秘密ワードと一致する一致入力文字列は<secret>タグ内に格納され且つその<secret>タグ内の<replace>タグ内にその一致した秘密ワードに対応する置換ワードが格納されて追加される。修正された文字列は,修正後の文字列は上記と同様であり,修正前の文字列は中間ドキュメントファイルから削除される。また,削除された文字列も中間ドキュメントファイルから削除される。
以上が,本実施の形態におけるドキュメント作成支援装置による処理の概略である。次に,ドキュメント作成支援装置による処理を詳細に説明する。
[ドキュメント作成支援装置による処理の詳細説明]
以下,ドキュメント作成支援装置のプログラムの詳細な処理について説明する。
図6は,ドキュメント作成支援処理のフローチャート図である。クライアント装置10の端末12によりドキュメント作成開始要求があると,サーバ20のドキュメント作成支援装置21が起動し,図6の処理を開始する。まず,既存ファイルの編集の場合は(S10のYes),ドキュメント作成支援装置21は,編集対象の中間ドキュメントファイルをディスクユニット26から読み出す(S11)。また,新規ファイルの作成の場合は(S10のNo),ドキュメント作成支援装置21は,新規の中間ドキュメントファイルを作成する(S12)。
そして,その後は,クライアント装置10の端末12から入力される文字列に対して,文字列入力処理部211が文字列入力処理S13を実行し,文字列解析処理部212とマスキング処理部213が文字列解析及びマスキング処理S14を実行し,端末12から作成中または編集中のドキュメントファイルのファイル保存要求が出されるまで(S15のNo),処理S13,S14が繰り返される。そして,ファイル保存要求が出されると(S15のYes),ファイル保存処理部214が,ファイル保存処理S16を実行する。
図7は,図6の各処理について説明する図である。文字列入力処理S13では,入力文字列に対して仮名漢字変換などを行い,入力文字列が確定され,確定した入力文字列は入力文字バッファ24内に格納される。文字列解析処理S14では,入力文字バッファ24内に格納されている確定した入力文字列を構文解析して単語に分割する。図7には,前述の「川崎市川崎区B町1丁目1番地」が,「川崎市」「川崎区」「B町」「1丁目」「1番地」の5個の単語に分解されている。
マスキング処理S14では,上記の分割された単語について,順番に秘密ワードデータベースを検索し,秘密ワードと一致する入力文字列(一致入力文字列)が検出される。この秘密ワードと一致する一致入力文字列の検出処理において,検索文字バッファ25が利用される。検索文字バッファについては後述する。検出処理の結果,入力文字列は,秘密ワードと一致しない文字列と,一致する文字列とに分類され,前述した中間ドキュメントファイル27に一致入力文字列と置換ワードとが関連付けて保存される。
そして,最後にファイル保存処理S16では,少なくとも中間ドキュメントファイル27が記憶媒体内に保存される。また,それに加えて,中間ドキュメントファイル27に加えて,オリジナルドキュメントファイル28とマスキングドキュメントファイル29とが生成され記憶媒体内に保存されても良い。
以下,図6,7の処理について,図5のように入力された例に基づいて詳述する。
図17は,図5のように入力された場合の入力文字バッファと検索対象文字列と検索文字バッファと候補秘密ワードと候補優先度フラグの状態を示す図である。
図8は,文字列入力処理S13のフローチャート図である。まず,端末12にて文字列が入力され(S131),変換キーが操作され(S132),確定キーが操作される(S133)。これにより入力文字列が確定する。ただし,確定キーが操作された後に入力文字列が修正されることが頻繁に行われるので,次の文字列の入力が開始される直前(S134)で,入力文字列が確定したとみなすようにしてもよい。
図5,図17の例では,「2000年」「神奈川県」「川崎市川崎区B町1丁目1番地」「(」がそれぞれ確定した入力文字列として入力文字バッファ24に格納され,次の文字列解析及びマスキング処理S14の対象になる。
図9は,文字列解析及びマスキング処理S14のフローチャート図である。文字列解析及びマスキング処理S14では,入力文字バッファ24に格納されている確定した入力文字列は,単語に分解される(S140)。この分解処理には入力文字列の構文を解析する必要がある。しかし,本実施の形態では,文字列の入力中にドキュメント作成者が確定した入力文字列を,解析すればよいので,ドキュメント内の文字列を単語に分解する処理は複雑な処理ではなく短時間で完了する。したがって,一旦作成終了したドキュメントを構文解析して単語に分解し,その単語が秘密ワードに一致するかの処理をしてマスキングドキュメントを生成するよりも処理が簡易である。
図17の例では,確定した入力文字列「2000年」「神奈川県」「(」の場合は,それぞれ1つの単語であり分解はされない。一方,入力文字列「川崎市川崎区B町1丁目1番地」の場合は,「川崎市」「川崎区」「B町」「1丁目」「1番地」に分解される。
次に,文字列解析及びマスキング処理S14では,分解されなかった単語または分解された先頭の単語が,秘密ワードの検索対象である検索対象文字列として設定される(S141)。そして,この検索対象文字列に対してマスキング処理が行われる(S142)。このマスキング処理S142は,分解された複数の単語全てについて順番に行われる(S143,A144)。分解されなかった単語はマスキング処理S142が一回だけ行われる。
図17の例では,「2000年」「神奈川県」「川崎市」「川崎区」「B町」「1丁目」「1番地」「(」が検索対象文字列となり,順番にそれぞれについてマスキング処理S142が行われる。
図10は,マスキング処理S142のフローチャート図である。マスキング処理S142では,検索対象文字列が処理対象となる。そして,既に検索文字バッファ25内に単語が存在する場合(既に検索対象文字列がいずれかの秘密ワードの先頭の単語と一致している場合)には,秘密ワード処理S142-3の対象になり,存在しない場合(未だ検索対象文字列がいずれかの秘密ワードの先頭の単語と一致していない場合)には,通常ワード処理S142-2の対象になる。通常ワード処理S142-2では,後述するとおり,検索対象文字列がいずれかの秘密ワードの先頭単語と一致するか否かのチェックが行われる。一方,秘密ワード処理S142-3では,検索対象文字列がそのとき候補にあがっている秘密ワードの後続の単語と連続して一致するか否かのチェックが行われる。
したがって,図17の例では,検索対象文字列となる「2000年」「神奈川県」「川崎市」は,通常ワード処理の対象となり,「川崎区」「B町」「1丁目」「1番地」は,秘密ワード処理対象となる。
図11は,通常ワード処理のフローチャート図である。通常ワード処理は,未だ検索対象文字列がいずれの秘密ワードの先頭の単語とも一致していない場合に行われるので,全ての秘密ワードを対象にして,検索対象文字列(単語)をキーとして前方一致検索が行われる(S20)。そこで,完全一致する秘密ワードが抽出されると(S21のYes),その検索対象文字列(単語)が<secret>タグの要素として中間ドキュメントファイルに書き出され,その一致した秘密ワードに対応する置換ワードが<replace>タグの要素として中間ドキュメントファイルに書き出される(S22)。
検索対象文字列(単語)が秘密ワードと完全一致していない場合(S21のNo)であって,前方一致した候補秘密ワードが1件以上存在する場合は(S24のYes),抽出された秘密ワードの候補優先度フラグが+1加算され(S25),検索文字バッファ内に検索対象文字列が格納される(S26)。
また,検索対象文字列(単語)が秘密ワードと完全一致もせず(S21のNo),前方一致した候補秘密ワードもない場合は(S24のNo),その検索対象文字列は,置換ワードへの変換対象外文字列として,<word>タグを付けて中間ドキュメントファイルに書き出される(S27)。そして,検索文字バッファがクリアされ候補優先度フラグもクリアされる(S28)。このクリア処理は,後述する秘密ワード処理で前方一致した候補秘密ワードが0件の場合のために行われる。
図17の例では,処理番号ST1の入力文字列が「2000年」の場合に,検索対象文字列が「2000年」となり,秘密ワードと完全一致するので,処理S22が行われる。一方,処理番号ST2の入力文字列が「神奈川県」の場合に,検索対象文字列が「神奈川県」となり,秘密ワードとの前方一致は0件であるので,処理S27が行われる。そして,処理番号ST3の入力文字列が「川崎市川崎区B町1丁目1番地」の場合に,検索対象文字列が「川崎市」となり,4件の秘密ワードと前方一致するので,処理S25,S26が行われ,検索文字バッファに検索対象文字列「川崎市」が格納される。
図12は,秘密ワード処理のフローチャート図である。図11の通常ワード処理で検索対象文字列(単語)がいずれかの秘密ワードの先頭と前方一致した場合に,その検索対象文字列が検索文字バッファに格納されて,図10の処理S142-1でYesと判定されて,図12の秘密ワード処理が実行される。図17の例でいうと,処理番号ST3で検索対象文字列「川崎市」が4つの秘密ワードと前方一致し,図11の処理S26で検索文字バッファに格納されると,それ以降の処理番号ST4-ST7でこの秘密ワード処理が実行される。
図12の秘密ワード処理では,まず,候補優先度フラグの高い秘密ワードを対象に,検索文字バッファ内の文字列に検索対象文字列を加えた文字列をキーとして前方一致検索が行われる(S30)。図17の例では,処理番号ST3で検索文字バッファには「川崎市」が格納され,4つの候補の秘密ワードに候補優先度フラグ「1」が付与されている。そこで,処理番号ST4では,検索文字バッファの「川崎市」に検索対象文字列「川崎区」を加えた「川崎市川崎区」をキーとして4つの候補の秘密ワードを対象にして前方一致検索が行われる。
そして,検索後に,検索キーが秘密ワードと完全一致しているか否かが判定される(S31)。図17の処理番号ST4では「川崎市川崎区」は完全一致していないので(S31のNo),処理S34以下が行われる。処理S34にて検索結果が1件以上存在する場合は(S34のYes),抽出した秘密ワードの候補優先度フラグに+1を加算し(S35),検索文字バッファに検索対象文字列を追加する(S36)。
図17の例では,処理番号ST4で,検索対象文字列「川崎区」について処理が行われ,「川崎市川崎区」をキーにした前方一致検索の結果,2つの候補の秘密ワードが抽出される。ただし,この時点では完全一致ではない(S31のNo)ので,それらの候補優先度フラグが「2」にされ,検索文字バッファは「川崎市川崎区」と変更される。
もし処理番号ST4で検索対象文字列(単語)が「宮前区」や「水道局」などの場合は,前方一致検索結果が0件となり(S34のNo),その検索対象文字列「宮前区」「水道局」について,改めて通常ワード処理が行われる(S142-2)。この通常ワード処理で検索対象文字列「宮前区」「水道局」がいずれかの秘密ワードと前方一致または完全一致するかがチェックされる。
次に,図17の例では,処理番号ST5で検索対象文字列「B町」が処理され,処理S30で1つの候補の秘密ワードが抽出され(S34),その候補優先度フラグが「3」にされ(S35),検索文字バッファは「川崎市川崎区B町」と変更される(S36)。
同様に,処理番号ST6で検索対象文字列「1丁目」が処理され,1つの候補の秘密ワードが抽出され(S30,S34),その候補優先度フラグが「4」にされ(S35),検索文字バッファは「川崎市川崎区B町」と変更される(S36)。
そして,処理番号ST7で検索対象文字列「1番地」が処理され,1つの候補の秘密ワードが抽出され(S30),その抽出された秘密ワード「川崎市川崎区B町1丁目1番地」と,検索キーの「川崎市川崎区B町1丁目」+「1番地」とが完全一致となる(S31のYes)。そこで,検索文字バッファ内の文字列に検索対象文字列を加えた文字列「川崎市川崎区B町1丁目」+「1番地」が,<secret>タグの要素として中間ドキュメントファイルに書き出され,その完全一致した秘密ワードの置換ワード「AA市BB区CCCCCCCC」が<replace>タグの要素として中間ドキュメントファイルに書き出される(S33)。そして,検索文字バッファがクリアされ候補優先度フラグもクリアされる(S33)。
図17の例では,次の処理番号ST7では,「(」が入力され,検索文字バッファがクリアされているので,通常ワード処理が行われ,秘密ワードと前方一致されず,<word>タグの要素として中間ドキュメントファイルに書き出される。もし,この通常ワード処理で検索対象文字列(単語)が秘密ワードと完全一致した場合は,すなわち,1つの単語で秘密ワードと完全一致した場合は,図11の処理S22でその検索対象文字列の単語が中間ドキュメントファイルに<secret>タグの要素として書き出され,それに対応する置換ワードが<replace>タグの要素として書き出される。
以上のような通常ワード処理と秘密ワード処理により,入力時において仮名漢字変換で確定した入力文字列という短い文字列を分割した単語(検索対象文字列)を秘密ワードデータベース内の秘密ワードと一致するか否かのチェックと,1つの単語または複数の単語列が秘密ワードと一致する場合に,<secret>タグの要素及び<replace>タグの要素として,一致した文字列と置換ワードとを中間ドキュメントファイルに書き出すことが行われる。上記の通常ワード処理と秘密ワード処理は一例であり,それ以外の方法でも同様の処理を行うことができる。
図13は,ファイル保存処理のフローチャート図である。ドキュメント作成が終了すると,作成者の端末12からファイル保存要求が出され,ファイル保存処理が行われる。ファイル保存処理では,まず,作成中の中間ドキュメントファイルが保存される(S161)。そして,オリジナルドキュメントファイル保存処理(S162)と,マスキングドキュメントファイル保存処理(S163)とが行われる。
なお,図13において,中間ドキュメントファイルのみが保存されるようにしてもよい。
図14は,オリジナルドキュメントファイル保存処理のフローチャート図である。この保存処理では,中間ドキュメントファイル内の<word>タグの要素(文字列)と<secret>タグの要素とを抽出してオリジナルドキュメントファイルを作成する。まず,中間ドキュメントファイルから最初の<word>タグの要素または<secret>タグの要素を取り出し(S40),取り出した要素をオリジナルドキュメントファイルに書き出す(S41)。そして,次の<word>タグまたは<secret>タグがなくなるまで(S42のNo),中間ドキュメントファイルからその要素を取り出し(S43),オリジナルドキュメントファイルに書き出す(S41)処理を繰り返し,最後にオリジナルドキュメントファイルを保存する(S44)。
図15は,マスキングドキュメントファイル保存処理のフローチャート図である。この保存処理では,中間ドキュメントファイル内の<word>タグの要素と<replace>タグの要素とを抽出してマスキングドキュメントファイルを作成する。まず,中間ドキュメントファイルから最初の<word>タグの要素または<secret>タグの要素を取り出し(S50),取り出した要素が<word>タグの場合は(S51のYes),取り出した要素(文字列)をマスキングドキュメントファイルに書き出す(S52)。一方,取り出した要素が<secret>タグの場合は(S51のNo),その<secret>タグに対応する<replace>タグの要素(文字列)をマスキングドキュメントファイルに書き出す(S53)。そして,次の<word>タグまたは<secret>タグがなくなるまで(S54のNo),中間ドキュメントファイルからその要素を取り出し(S55),<word>タグの要素または<replace>タグの要素をマスキングドキュメントファイルに書き出す(S52,S53)処理を繰り返し,最後にマスキングドキュメントファイルを保存する(S56)。
上記のように,中間ドキュメントファイルには秘密ワードと一致した一致入力文字列とその秘密ワードの置換ワードとが<secret>タグと<replace>タグとにより関連づけられているので,オリジナルドキュメントファイルでは<secret>タグの要素が,マスキングドキュメントファイルでは<replace>タグの要素が,それぞれ書き出されることができる。
図16は,複写処理のフローチャート図である。端末12から作成済みのドキュメントファイルの複写依頼があると(S60のYes),複写先の記憶媒体のセキュリティレベルが基準値より高いか否かチェックされる(S61)。複写先のセキュリティレベルが高い場合は(S61のYes),オリジナルドキュメントファイルが保存される。一方,複写先のセキュリティレベルが高くない場合は(S61のNo),マスキングドキュメントファイルが保存される。図1の例では,サーバ装置20内のディスクユニット26はセキュリティレベルが高いが,クライアント装置10内のローカルディスク14はセキュリティレベルが低いので,ローカルディスク14への複写要求に対してはマスキングドキュメントファイルが複写される。
なお,図13のファイル保存処理で中間ドキュメントファイルのみが保存されている場合は,図16の処理S63では,中間ドキュメントファイルから図14のオリジナルドキュメントファイル作成処理が行われ,そのファイルが保存される。同様に,図16の処理S62では,中間ドキュメントファイルから図15のマスキングドキュメントファイル作成処理が行われ,そのファイルが保存される。
図16の複写処理によれば,複写先のセキュリティレベルが低い場合には,秘密ワードをマスキングしたマスキングドキュメントファイルが複写されるので,秘密ワードが開示される危険性を低減することができる。
以上説明したとおり,本実施の形態のドキュメント作成支援装置によれば,ドキュメント作成と並列して秘密ワードについての処理が行われるので,入力文字列が確定する度にそれに含まれる単語(検索対象文字列)をキーとして秘密ワードを前方一致検索することができ,検索対象文字列の抽出のための構文解析処理は容易になる。また,秘密ワードと一致した一致入力文字列とその秘密ワードに対応する置換ワードとを関連付けて中間ドキュメントファイルに保存しているので,ドキュメント作成後の修正や変更時にはその中間ドキュメントファイルに対して行えば,オリジナルドキュメントファイルとマスキングドキュメントファイルを作成できるので,ドキュメント管理が容易になる。
以上の実施の形態をまとめると,次の付記のとおりである。
(付記1)
入力される文字列についてドキュメント作成支援処理を行うドキュメント作成支援装置であって,
入力された1つまたは複数の文字を有する入力文字列の仮名漢字変換が確定したときに,前記確定した入力文字列に含まれる単語が秘密ワードデータベース内のいずれかの秘密ワードの少なくとも一部と一致するか否かをチェックするチェック手段と,
前記入力文字列に含まれる1つの単語または複数の連続する単語列が前記秘密ワードと一致した場合,当該秘密ワードと一致した一致入力文字列と前記一致した秘密ワードに対応する置換ワードとを関連付けて中間ドキュメントファイルに保存し,一致しない場合,前記入力文字列を中間ドキュメントファイルに保存する中間ドキュメントファイル生成手段と
を有するドキュメント作成支援装置。
(付記2)
付記1において,
前記作成中のドキュメントファイルの保存要求に応答して,前記中間ドキュメントファイルを所定の記憶媒体に保存する保存処理手段とを有するドキュメント作成支援装置。
(付記3)
付記2において,
ドキュメントファイルの複写要求に応答して,複写先の記憶媒体のセキュリティレベルが基準値以上の場合は,前記中間ドキュメントファイルから前記一致入力文字列については当該入力文字列をそのまま有するオリジナルドキュメントファイルを作成し複写し,前記複写先の記憶媒体のセキュリティレベルが前記基準値未満の場合は,前記中間ドキュメントファイルから前記一致入力文字列については前記置換ワードに変換したマスキングドキュメントファイルを作成し複写する複写処理手段とを有するドキュメント作成支援装置。
(付記4)
付記2において,
前記保存処理手段は,前記作成中のドキュメントファイルの保存要求に応答して,前記中間ドキュメントファイルに加えて,前記一致入力文字列については当該入力文字列をそのまま有するオリジナルドキュメントファイルと,前記一致入力文字列については前記置換ワードに変換したマスキングドキュメントファイルとを前記所定の記憶媒体に保存するドキュメント作成支援装置。
(付記5)
付記4において,
ドキュメントファイルの複写要求に応答して,複写先の記憶媒体のセキュリティレベルが基準値以上の場合は,前記オリジナルドキュメントファイルを複写し,前記複写先の記憶媒体のセキュリティレベルが前記基準値未満の場合は,前記マスキングドキュメントファイルを複写する複写処理手段とを有するドキュメント作成支援装置。
(付記6)
付記1において,
前記チェック手段は,前記確定した入力文字列に含まれる第1の単語が前記秘密ワードと前方一致するか否かをチェックする前方一致チェックを行い,前記確定した入力文字列に含まれる前記第1の単語の後続の第2の単語が前記第1の単語と連続して前記前方一致した秘密ワードと前方一致するか否かをチェックする連続一致チェックを,前記第1,第2の単語の単語列が前記秘密ワードと全て一致するまで繰り返すドキュメント作成支援装置。
(付記7)
付記1において,
前記中間ドキュメントファイル生成手段は,前記中間ドキュメントファイル内の前記一致入力文字列の場所に,秘密ワードとタグ付けされた前記一致入力文字列に対応する秘密ワードと,置換ワードとタグ付けされた前記置換ワードとを保存するドキュメント作成支援装置。
(付記8)
入力される文字列についてドキュメント作成支援処理をコンピュータに実行させるドキュメント支援プログラムであって,
前記ドキュメント作成支援処理は,
入力された1つまたは複数の文字を有する入力文字列の仮名漢字変換が確定したときに,前記確定した入力文字列に含まれる単語が秘密ワードデータベース内のいずれかの秘密ワードの少なくとも一部と一致するか否かをチェックするチェック工程と,
前記入力文字列に含まれる1つの単語または複数の連続する単語列が前記秘密ワードと一致した場合,当該秘密ワードと一致した一致入力文字列と前記一致した秘密ワードに対応する置換ワードとを関連付けて中間ドキュメントファイルに保存し,一致しない場合,前記入力文字列を中間ドキュメントファイルに保存する工程と
を有するドキュメント支援プログラム。
(付記9)
入力される文字列についてドキュメント作成支援処理を行うドキュメント支援処理方法であって,
入力された1つまたは複数の文字を有する入力文字列の仮名漢字変換が確定したときに,前記確定した入力文字列に含まれる単語が秘密ワードデータベース内のいずれかの秘密ワードの少なくとも一部と一致するか否かをチェックするチェック工程と,
前記入力文字列に含まれる1つの単語または複数の連続する単語列が前記秘密ワードと一致した場合,当該秘密ワードと一致した一致入力文字列と前記一致した秘密ワードに対応する置換ワードとを関連付けて中間ドキュメントファイルに保存し,一致しない場合,前記入力文字列を中間ドキュメントファイルに保存する工程と
を有するドキュメント支援処理方法。
10:クライアント装置
20:ドキュメント作成サーバ
21:ドキュメント作成支援装置
22:秘密ワードデータベース

Claims (8)

  1. 入力される文字列についてドキュメント作成支援処理を行うドキュメント作成支援装置であって,
    入力された1つまたは複数の文字を有する入力文字列の仮名漢字変換が確定したときに,前記確定した入力文字列に含まれる単語が秘密ワードデータベース内のいずれかの秘密ワードの少なくとも一部と一致するか否かをチェックするチェック手段と,
    前記入力文字列に含まれる1つの単語または複数の連続する単語列が前記秘密ワードと一致した場合,当該秘密ワードと一致した一致入力文字列と前記一致した秘密ワードに対応する置換ワードとを関連付けて中間ドキュメントファイルに保存し,一致しない場合,前記入力文字列を中間ドキュメントファイルに保存する中間ドキュメントファイル生成手段と
    を有するドキュメント作成支援装置。
  2. 請求項1において,
    前記作成中のドキュメントファイルの保存要求に応答して,前記中間ドキュメントファイルを所定の記憶媒体に保存する保存処理手段とを有するドキュメント作成支援装置。
  3. 請求項2において,
    ドキュメントファイルの複写要求に応答して,複写先の記憶媒体のセキュリティレベルが基準値以上の場合は,前記中間ドキュメントファイルから前記一致入力文字列については当該入力文字列をそのまま有するオリジナルドキュメントファイルを作成し複写し,前記複写先の記憶媒体のセキュリティレベルが前記基準値未満の場合は,前記中間ドキュメントファイルから前記一致入力文字列については前記置換ワードに変換したマスキングドキュメントファイルを作成し複写する複写処理手段とを有するドキュメント作成支援装置。
  4. 請求項2において,
    前記保存処理手段は,前記作成中のドキュメントファイルの保存要求に応答して,前記中間ドキュメントファイルに加えて,前記一致入力文字列については当該入力文字列をそのまま有するオリジナルドキュメントファイルと,前記一致入力文字列については前記置換ワードに変換したマスキングドキュメントファイルとを前記所定の記憶媒体に保存するドキュメント作成支援装置。
  5. 請求項4において,
    ドキュメントファイルの複写要求に応答して,複写先の記憶媒体のセキュリティレベルが基準値以上の場合は,前記オリジナルドキュメントファイルを複写し,前記複写先の記憶媒体のセキュリティレベルが前記基準値未満の場合は,前記マスキングドキュメントファイルを複写する複写処理手段とを有するドキュメント作成支援装置。
  6. 請求項1において,
    前記チェック手段は,前記確定した入力文字列に含まれる第1の単語が前記秘密ワードと前方一致するか否かをチェックする前方一致チェックを行い,前記確定した入力文字列に含まれる前記第1の単語の後続の第2の単語が前記第1の単語と連続して前記前方一致した秘密ワードと前方一致するか否かをチェックする連続一致チェックを,前記第1,第2の単語の単語列が前記秘密ワードと全て一致するまで繰り返すドキュメント作成支援装置。
  7. 入力される文字列についてドキュメント作成支援処理をコンピュータに実行させるドキュメント支援プログラムであって,
    前記ドキュメント作成支援処理は,
    入力された1つまたは複数の文字を有する入力文字列の仮名漢字変換が確定したときに,前記確定した入力文字列に含まれる単語が秘密ワードデータベース内のいずれかの秘密ワードの少なくとも一部と一致するか否かをチェックするチェック工程と,
    前記入力文字列に含まれる1つの単語または複数の連続する単語列が前記秘密ワードと一致した場合,当該秘密ワードと一致した一致入力文字列と前記一致した秘密ワードに対応する置換ワードとを関連付けて中間ドキュメントファイルに保存し,一致しない場合,前記入力文字列を中間ドキュメントファイルに保存する工程と
    を有するドキュメント支援プログラム。
  8. 入力される文字列についてドキュメント作成支援処理を行うドキュメント支援処理方法であって,
    入力された1つまたは複数の文字を有する入力文字列の仮名漢字変換が確定したときに,前記確定した入力文字列に含まれる単語が秘密ワードデータベース内のいずれかの秘密ワードの少なくとも一部と一致するか否かをチェックするチェック工程と,
    前記入力文字列に含まれる1つの単語または複数の連続する単語列が前記秘密ワードと一致した場合,当該秘密ワードと一致した一致入力文字列と前記一致した秘密ワードに対応する置換ワードとを関連付けて中間ドキュメントファイルに保存し,一致しない場合,前記入力文字列を中間ドキュメントファイルに保存する工程と
    を有するドキュメント支援処理方法。
JP2013059500A 2013-03-22 2013-03-22 ドキュメント作成支援装置,ドキュメント作成支援プログラム及びドキュメント作成支援方法 Pending JP2014186427A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013059500A JP2014186427A (ja) 2013-03-22 2013-03-22 ドキュメント作成支援装置,ドキュメント作成支援プログラム及びドキュメント作成支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013059500A JP2014186427A (ja) 2013-03-22 2013-03-22 ドキュメント作成支援装置,ドキュメント作成支援プログラム及びドキュメント作成支援方法

Publications (1)

Publication Number Publication Date
JP2014186427A true JP2014186427A (ja) 2014-10-02

Family

ID=51833972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013059500A Pending JP2014186427A (ja) 2013-03-22 2013-03-22 ドキュメント作成支援装置,ドキュメント作成支援プログラム及びドキュメント作成支援方法

Country Status (1)

Country Link
JP (1) JP2014186427A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022500800A (ja) * 2019-04-19 2022-01-04 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 ブロックチェーンに基づく情報処理方法、装置及びコンピュータプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116555A (ja) * 2007-11-06 2009-05-28 Hitachi Systems & Services Ltd 文書管理方法、文書管理装置、プログラムおよび記録媒体
JP2009211365A (ja) * 2008-03-04 2009-09-17 Nec Corp 仮名漢字変換装置、仮名漢字変換方法及びプログラム
JP2010086503A (ja) * 2008-09-30 2010-04-15 Yahoo Japan Corp 情報流出防止装置、方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116555A (ja) * 2007-11-06 2009-05-28 Hitachi Systems & Services Ltd 文書管理方法、文書管理装置、プログラムおよび記録媒体
JP2009211365A (ja) * 2008-03-04 2009-09-17 Nec Corp 仮名漢字変換装置、仮名漢字変換方法及びプログラム
JP2010086503A (ja) * 2008-09-30 2010-04-15 Yahoo Japan Corp 情報流出防止装置、方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022500800A (ja) * 2019-04-19 2022-01-04 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 ブロックチェーンに基づく情報処理方法、装置及びコンピュータプログラム
US11442912B2 (en) 2019-04-19 2022-09-13 Tencent Technology (Shenzhen) Company Limited Blockchain-based information processing method and apparatus and computer-readable storage medium
JP7154676B2 (ja) 2019-04-19 2022-10-18 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 ブロックチェーンに基づく情報処理方法、装置及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
Yalniz et al. A fast alignment scheme for automatic ocr evaluation of books
US20050053258A1 (en) System and method for watermarking a document
US7894630B2 (en) Tamper-resistant text stream watermarking
JP2006268638A (ja) 文書差分検出装置
JPWO2009104268A1 (ja) パッチ候補選択装置、パッチ候補選択プログラムおよびパッチ候補選択方法
JP2011008394A (ja) 文書情報生成装置、文書登録システム、及びプログラム
CN101611406A (zh) 文档存档系统
JP2008139971A (ja) 文書処理装置及び文書処理プログラム
US11651607B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
CN107203574A (zh) 数据管理和数据分析的聚合
US8976003B2 (en) Large-scale document authentication and identification system
CN113032548A (zh) 信息处理装置、存储介质及信息处理方法
CN113609846B (zh) 一种语句中实体关系的抽取方法及装置
US20150193459A1 (en) Data file searching method
JP6805720B2 (ja) データ検索プログラム、データ検索装置およびデータ検索方法
JP2014186427A (ja) ドキュメント作成支援装置,ドキュメント作成支援プログラム及びドキュメント作成支援方法
JP5800262B2 (ja) 正確なフォントのアクティブ化
WO2017072872A1 (ja) 業務プログラム生成支援システムおよび業務プログラム生成支援方法
US10275127B2 (en) Client apparatus, information processing system, information processing method, and non-transitory computer readable medium
US11769009B2 (en) Using domain specific vocabularies to spellcheck input strings
JP2006099249A (ja) 障害管理装置および障害管理方法
Hládek et al. Text mining and processing for corpora creation in Slovak language
JP2009252148A (ja) データベース自動修復装置及びその方法並びにデータベース自動修復プログラム
JP3882729B2 (ja) 情報開示プログラム
JP6044422B2 (ja) 略称生成方法および略称生成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160826

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161021

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170328