JP2013242782A - 文字列変換方法及びプログラム - Google Patents
文字列変換方法及びプログラム Download PDFInfo
- Publication number
- JP2013242782A JP2013242782A JP2012116668A JP2012116668A JP2013242782A JP 2013242782 A JP2013242782 A JP 2013242782A JP 2012116668 A JP2012116668 A JP 2012116668A JP 2012116668 A JP2012116668 A JP 2012116668A JP 2013242782 A JP2013242782 A JP 2013242782A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- personal information
- candidate
- mask
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
【解決手段】個人情報検出部40によって、個人情報辞書30に含まれる各構成要素項目の文字列を、電子文書から文字列変換の候補文字列として検出し、マスク対象判定部50によって、電子文書のドキュメントツリーを生成し、検出された文字列変換の候補文字列に対して、ドキュメントツリーにおける候補文字列に対応するノードと同一レベルのノードまたは子ノードの範囲に、組み合わせ対象の構成要素項目に対応する前記文字列変換の候補文字列が含まれる場合、検出された文字列変換の候補文字列と、組み合わせ対象の構成要素項目に対応する文字列変換の候補文字列との組み合わせを、文字列変換の対象として判定する。マスク置換部60によって、文字列変換の対象と判定された候補文字列の組み合わせをマスク文字列に置き換える。
【選択図】図1
Description
図1に示された本発明の第1の実施の形態に係る文字列変換装置1は、マスク処理対象の電子文書(HTMLデータ)をDOM(Document Object Model)で扱い、電子文書の文書構造を元に、ブロックレベル要素のHTMLタグであるか否かを判断した上で、各ノードの末端側のブロックレベル要素を探し、当該ブロックレベル要素の配下から候補文字列の組み合わせを選定する。
<システム構成>
図1に示すように、本発明の実施の形態に係る文字列変換装置1は、少なくとも入力データ読込部20、個人情報辞書30、個人情報検出部40、マスク対象判定部50、及びマスク置換部60を備える。文字列変換装置1の各機能部20〜60はサーバ(コンピュータ)のハードウェアリソースによって実現される。すなわち、文字列変換装置1は少なくとも演算装置(CPU)、記憶装置(メモリ、ハードディスク装置等)、通信インタフェース等のコンピュータに係るハードウェアリソースを備える。そして、これらのハードウェアリソースがソフトウェアリソース(OS、アプリケーション等)と協働することにより各機能部20〜60が実装される。なお、マスク対象判定部50が、ツリー生成手段及びマスク対象判定手段の一例である。
第1の実施の形態の文字列変換装置1に、入力データとしての電子文書(HTMLデータ)が入力されると、文字列変換装置1において、図5に示す、マスク置換処理ルーチンが実行される。
<システム構成>
次に、第2の実施の形態について説明する。なお、第1の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。
本発明は文字列変換装置1を構成する上記の機能部20〜60の一部若しくは全てとしてコンピュータを機能させるプログラムで構成しこれを当該コンピュータに実行させることで実現できる。または、文字列変換装置1が実行する上記のステップS1〜S5の一部若しくは全てをコンピュータに実行させるプログラムで構成しこれを当該コンピュータに実行させることで実現できる。そして、前記プログラムをそのコンピュータが読み取り可能な記録媒体、例えば、FD(Floppy(登録商標)Disk)や、MO(Magneto‐Opticaldisk)、ROM(ReadOnlyMemory)、メモリカード、CD(CompactDisk)‐ROM、DVD(DigitalVersatileDisk)‐ROM、CD‐R、CD‐RW、HDD、SSD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。さらに、上記のプログラムをインターネットや電子メールなど、ネットワークを介して提供することも可能である。
2 ユーザPC
3 重点マスク情報蓄積サーバ
4 インターネット
5 閲覧履歴収集サーバ
6 マスク情報解析サーバ
10 入力データ
20 入力データ読込部
30 個人情報辞書
40 個人情報検出部
50 マスク対象判定部
60 マスク置換部
200 ネットワークシステム
Claims (2)
- 個人情報検出手段によって、保護対象の個人情報文字列データを少なくとも1つ以上の構成要素項目に分けて格納した個人情報辞書に含まれる各構成要素項目の文字列を、電子文書から文字列変換の候補文字列として検出し、
ツリー生成手段によって、前記電子文書のドキュメントツリーを生成し、
マスク対象判定手段によって、前記検出された文字列変換の候補文字列に対して、前記ドキュメントツリーにおける前記候補文字列に対応するノードと同一レベルのノードまたは子ノードの範囲に、組み合わせ対象の構成要素項目に対応する前記文字列変換の候補文字列が含まれる場合、検出された文字列変換の候補文字列と、前記組み合わせ対象の構成要素項目に対応する前記文字列変換の候補文字列との組み合わせを、文字列変換の対象として判定し、
マスク置換手段によって、前記文字列変換の対象と判定された候補文字列の組み合わせを他の文字列に置き換える
文字列変換方法。 - コンピュータを、
保護対象の個人情報文字列データを少なくとも1つ以上の構成要素項目に分けて格納した個人情報辞書に含まれる各構成要素項目の文字列を、電子文書から文字列変換の候補文字列として検出する個人情報検出手段、
前記電子文書のドキュメントツリーを生成するツリー生成手段、
前記検出された文字列変換の候補文字列に対して、前記ドキュメントツリーにおける前記候補文字列に対応するノードと同一レベルのノードまたは子ノードの範囲に、組み合わせ対象の構成要素項目に対応する前記文字列変換の候補文字列が含まれる場合、検出された文字列変換の候補文字列と、前記組み合わせ対象の構成要素項目に対応する前記文字列変換の候補文字列との組み合わせを、文字列変換の対象として判定するマスク対象判定手段、及び
前記文字列変換の対象と判定された候補文字列の組み合わせを他の文字列に置き換えるマスク置換手段
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012116668A JP5676522B2 (ja) | 2012-05-22 | 2012-05-22 | 文字列変換方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012116668A JP5676522B2 (ja) | 2012-05-22 | 2012-05-22 | 文字列変換方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013242782A true JP2013242782A (ja) | 2013-12-05 |
JP5676522B2 JP5676522B2 (ja) | 2015-02-25 |
Family
ID=49843595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012116668A Expired - Fee Related JP5676522B2 (ja) | 2012-05-22 | 2012-05-22 | 文字列変換方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5676522B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014186425A (ja) * | 2013-03-22 | 2014-10-02 | Mitsubishi Denki Information Technology Corp | 文章マスク装置及び文章マスクプログラム |
JP2016218738A (ja) * | 2015-05-20 | 2016-12-22 | 株式会社野村総合研究所 | データマスキング装置、データマスキング方法およびコンピュータプログラム |
JP2017068677A (ja) * | 2015-09-30 | 2017-04-06 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP2018036845A (ja) * | 2016-08-31 | 2018-03-08 | シャープ株式会社 | 情報処理装置 |
WO2018179222A1 (ja) * | 2017-03-30 | 2018-10-04 | 株式会社オプティム | コンピュータシステム、画面共有方法及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002149638A (ja) * | 2000-11-07 | 2002-05-24 | Oki Electric Ind Co Ltd | 電子文書編集装置及び電子メール装置 |
JP2013114287A (ja) * | 2011-11-25 | 2013-06-10 | Nippon Telegr & Teleph Corp <Ntt> | 文字列変換装置、文字列変換方法及び文字列変換プログラム |
-
2012
- 2012-05-22 JP JP2012116668A patent/JP5676522B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002149638A (ja) * | 2000-11-07 | 2002-05-24 | Oki Electric Ind Co Ltd | 電子文書編集装置及び電子メール装置 |
JP2013114287A (ja) * | 2011-11-25 | 2013-06-10 | Nippon Telegr & Teleph Corp <Ntt> | 文字列変換装置、文字列変換方法及び文字列変換プログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014186425A (ja) * | 2013-03-22 | 2014-10-02 | Mitsubishi Denki Information Technology Corp | 文章マスク装置及び文章マスクプログラム |
JP2016218738A (ja) * | 2015-05-20 | 2016-12-22 | 株式会社野村総合研究所 | データマスキング装置、データマスキング方法およびコンピュータプログラム |
JP2017068677A (ja) * | 2015-09-30 | 2017-04-06 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP2018036845A (ja) * | 2016-08-31 | 2018-03-08 | シャープ株式会社 | 情報処理装置 |
WO2018179222A1 (ja) * | 2017-03-30 | 2018-10-04 | 株式会社オプティム | コンピュータシステム、画面共有方法及びプログラム |
US10789914B2 (en) | 2017-03-30 | 2020-09-29 | Optim Corporation | Computer system, screen sharing method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP5676522B2 (ja) | 2015-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5138046B2 (ja) | 検索システム、検索方法およびプログラム | |
Laclavík et al. | Email analysis and information extraction for enterprise benefit | |
JP5126541B2 (ja) | 情報分類装置、情報分類方法、及び情報分類プログラム | |
US20060271859A1 (en) | Method and system for visualizing Weblog social network communities | |
JP5676522B2 (ja) | 文字列変換方法及びプログラム | |
WO2015047920A1 (en) | Title and body extraction from web page | |
JP5358549B2 (ja) | 保護対象情報マスキング装置、保護対象情報マスキング方法および保護対象情報マスキングプログラム | |
US20090083266A1 (en) | Techniques for tokenizing urls | |
JP4636473B2 (ja) | リンク情報抽出装置、リンク情報抽出方法およびプログラム | |
JP4430598B2 (ja) | 情報共有システムおよび情報共有方法 | |
JP5731361B2 (ja) | 文字列変換方法及び文字列変換プログラム | |
JP5103051B2 (ja) | 情報処理システム及び情報処理方法 | |
JP2012123681A (ja) | 検索装置、検索システム、検索方法、検索プログラム、及び検索プログラムを記憶するコンピュータ読取可能な記録媒体 | |
JP2020098596A (ja) | ウェブページから情報を抽出する方法、装置及び記憶媒体 | |
JP2003173280A (ja) | データベース生成装置、データベース生成方法及びデータベース生成プログラム | |
CN110719344B (zh) | 域名获取方法、装置、电子设备及存储介质 | |
Alim et al. | Online social network profile data extraction for vulnerability analysis | |
JPWO2018056299A1 (ja) | 情報収集システム、情報収集方法、及び、プログラム | |
JP2006243832A (ja) | ワークフロー検索システム | |
JP5379627B2 (ja) | 検索制御装置、検索制御方法、及びプログラム | |
US20180046656A1 (en) | Constructing filterable hierarchy based on multidimensional key | |
JP5331084B2 (ja) | 特定情報抽出装置および特定情報抽出プログラム | |
JP2015103101A (ja) | テキスト要約装置、方法、及びプログラム | |
JP2015225446A (ja) | 個人情報処理装置、受託サービス提供装置、個人情報処理方法、および個人情報処理プログラム | |
CN110750739B (zh) | 一种页面类型确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140624 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5676522 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |