JP2009271573A - 情報処理システム、情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理システム、情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP2009271573A JP2009271573A JP2008118677A JP2008118677A JP2009271573A JP 2009271573 A JP2009271573 A JP 2009271573A JP 2008118677 A JP2008118677 A JP 2008118677A JP 2008118677 A JP2008118677 A JP 2008118677A JP 2009271573 A JP2009271573 A JP 2009271573A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- unit
- document data
- document
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Storage Device Security (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】本発明の情報処理システム100は、文書データを格納する文書格納部50と、文書データのテキストに含まれる意味単位に対し、属性を付与する解析部52と、文書データの意味単位と、該意味単位に付与された属性とを対応づけて格納する属性インデックス格納部(66,68)と、属性に関連付けられた意味単位を含む情報に対する、アクセス主体のアクセス権限を定義付ける権限定義データを格納する権限定義格納部76、権限定義データを参照し、文書データ内の意味単位を含む情報につき、該意味単位に関連付けられた属性に応じて、アクセス主体によるアクセスの可否を判定するアクセス制御部72と、文書データへのアクセス照会の入力に応答して、アクセス制御部の判定に従った照会結果を出力する入出力部74とを含む。
【選択図】図3
Description
をマスクする技術を開示している。
サーバ104は、文書データ格納部50を含んで構成される。文書データ格納部50は、記憶装置30上にデータベースまたはファイルシステムとして構成され、文書格納部としてコンピュータ装置34上に実現される。文書データ格納部50は、オペレータなどにより生成された非定型なテキスト情報を含む文書データを、順次蓄積してゆく。各文書データには、インデックス内で各文書データを一意に識別する文書識別値が割当てられる。この文書データ格納部50に蓄積される文書データが、本文書閲覧システム100において、クライアント102からの文書閲覧の照会に応答して提供される情報となる。
Language)などのマルチスタイルテキストの文書データについては、書式などの修飾属性の除去処理などを施し、テキスト情報に変換する。また自然言語解析部52は、DOC形式、PDF(Portable
Document Format)形式などバイナリ形式のデータについても、適切な文書フィルタを使用してテキスト情報に変換する。自然言語解析部52が取扱可能なデータ形式は、特に限定されるものではなく、データ形式に応じた文書フィルタ・モジュールを備えることにより、種々の形式のデータからテキスト情報を抽出可能に構成することができる。
本実施形態の属性付与部58は、さらに、意味単位インデックスに登録された意味属性が付与された語、句などの意味単位につき、統計解析法を適用する。属性付与部58は、統計解析法により、文書データ格納部50に格納された文書データ群中の相対的または絶対的な出現頻度などの統計値を算出し、統計解析結果を示す属性をさらに付与することができる。なお、統計解析を適用する文書データの範囲は、蓄積された全文書データとすることができ、その他、文書データのタイムスタンプなどにより、任意の時間範囲でフィルタリングされた文書データ群とすることができる。
以下、再び図3を参照し、文書データの意味単位を含む情報に対する閲覧権限の定義付けについて説明する。サーバ104は、さらに、ユーザ情報データベース(以下、ユーザ情報DBとして参照する。)76と、ユーザ情報登録部78とを含んで構成される。ユーザ情報DB76は、記憶装置30上に、リレーショナル・データベースなどにより構成され、権限定義格納部としてコンピュータ装置34上に実現される。ユーザ情報登録部78は、CPU12の実行空間を提供するシステム・メモリ16などにプログラムを展開することにより、コンピュータ装置34上に実現される。
個人に対する苦情を言及している文章中、個人情報であって、Nが2以上の<苦情対象回数N>属性が付された個人情報に対する閲覧権限が与えられる。また、図7(B)に示す例では、個人に対する賞賛を言及している文章中の賞賛対象となる個人の個人名については、いかなる職位およびいかなる部門のユーザ属性が付されるユーザに対して、閲覧権限が与えられている。
以下、再び図3を参照し、文書データの閲覧制御について説明する。サーバ104は、さらに、文書・属性取得部70、文書閲覧制御部72、照会入出力部74およびファイル・アクセス機構部80を含んで構成される。上記文書・属性取得部70、文書閲覧制御部72、および照会入出力部74は、それぞれ、CPU12の実行空間を提供するシステム・メモリ16などにプログラムを展開することにより、取得部、アクセス制御部、および入出力部として、コンピュータ装置34上に実現される。
以下、図10を参照して、文書データの登録更新方法について説明する。図10は、サーバが実行する文書データの登録更新方法の実施形態を示すフローチャートである。図10に示す処理は、サーバ104の起動などに応答して、ステップS100から開始し、ステップS101では、サーバ104は、文書データ登録更新の開始条件を満たすか否かを判定する。上記開始条件としては、予め設定したスケジュールの予定日時が到来したこと、未登録の文書データが所与の閾値を上まわったこと、システム管理者から外部指令があったことなどを条件とすることができるが、特に限定されるものではない。
以下、図11を参照して、文書データの閲覧照会処理方法について説明する。図11は、サーバが実行する文書データの閲覧照会処理方法の実施形態を示すフローチャートである。図11に示す処理は、ステップS200から開始し、ステップS201で、クライアント102からの文書閲覧の照会を受信する。文書閲覧の照会は、照会入出力部74に入力され、文書閲覧制御部72に閲覧データの作成が依頼される。ステップS202では、文書閲覧制御部72は、照会に含まれるユーザ識別値をユーザ情報DB76に与えて、閲覧の主体となるユーザに関連付けられたユーザ属性、および閲覧権限を定義付ける条件式を読み出す。
Claims (17)
- 情報に対するアクセスを制御する情報処理システムであって、前記システムは、
文書データを格納する文書格納部と、
前記文書データのテキストに含まれる意味単位に対し、属性を付与する解析部と、
前記文書データの前記意味単位と、該意味単位に付与された前記属性とを対応づけて格納する属性インデックス格納部と、
前記属性に関連付けられた前記意味単位を含む情報に対する、アクセス主体のアクセス権限を定義付ける権限定義データを格納する権限定義格納部と、
前記権限定義データを参照し、文書データ内の意味単位を含む情報につき、該意味単位に関連付けられた前記属性に応じて、前記アクセス主体によるアクセスの可否を判定するアクセス制御部と、
文書データへのアクセス照会の入力に応答して、前記アクセス制御部の判定に従った照会結果を出力する入出力部と
を含む、情報処理システム。 - 前記解析部は、さらに、統計解析処理により、前記属性インデックス格納部に格納された意味単位に対し、前記統計解析処理により算出された統計値を示す属性を付与する、請求項1に記載の情報処理システム。
- 前記属性インデックス格納部は、前記文書データと、該文書データに対して付された属性とをさらに対応付けて格納し、前記アクセス制御部は、前記権限定義データを参照し、前記文書データに付与された前記属性に応じて、さらに前記文書データ自体に対するアクセスの可否を判定する、請求項1に記載の情報処理システム。
- 前記解析部は、前記文書格納部から文書データを読み出して、テキストを取得し、辞書を用いた自然言語解析処理により、該テキストから意味単位を抽出して、各該意味単位に属性を付与する、請求項1に記載の情報処理システム。
- 前記入出力部は、前記アクセス制御部が閲覧不可と判定した前記意味単位を含む情報を前記文書データから削除または前記文書データにマスクしたデータを、前記照会結果として出力する、請求項1に記載の情報処理システム。
- 各々の前記意味単位は、語、句、節、文、および複数文からなる群から選択された粒度を有する、請求項1に記載の情報処理システム。
- 情報に対するアクセスを制御する情報処理装置であって、前記装置は、
文書データと、該文書データのテキストに含まれる意味単位に対し付与された属性とを取得する取得部と、
前記属性に関連付けられた前記意味単位を含む情報に対する、アクセス主体のアクセス権限を定義付ける権限定義データを格納する権限定義格納部と、
前記権限定義データを参照し、文書データ内の意味単位を含む情報につき、該意味単位に関連付けられた前記属性に応じて、前記アクセス主体によるアクセスの可否を判定するアクセス制御部と、
文書データへのアクセス照会の入力に応答して、前記アクセス制御部の判定に従った照会結果を出力する入出力部と
を含む、情報処理装置。 - 前記取得部は、前記文書データに対して付された属性をさらに取得し、前記アクセス制御部は、前記権限定義データを参照し、前記文書データに付与された前記属性に応じて、さらに前記文書データ自体に対するアクセスの可否を判定する、請求項7に記載の情報処理装置。
- 前記アクセス制御部は、該意味単位に関連付けられた統計値を示す属性に応じて、前記アクセス主体によるアクセスの可否を判定する、請求項7に記載の情報処理装置。
- 前記入出力部は、前記アクセス制御部が閲覧不可と判定した前記意味単位を含む情報を前記文書データから削除または前記文書データにマスクしたデータを、前記照会結果として出力する、請求項7に記載の情報処理装置。
- 各々の前記意味単位は、語、句、節、文、および複数文からなる群から選択された粒度を有する、請求項7に記載の情報処理装置。
- 情報に対するアクセスを制御する情報処理方法であって、前記方法は、
コンピュータ装置が、文書データへのアクセス照会の入力を受けるステップと、
前記コンピュータ装置が、文書データと、該文書データのテキストに含まれる意味単位に対し付与された属性とを取得するステップと、
前記コンピュータ装置が、前記属性に関連付けられた前記意味単位を含む情報に対する、アクセス主体のアクセス権限を定義付ける権限定義データを読み出すステップと、
前記コンピュータ装置が、前記権限定義データを参照し、文書データ内の意味単位を含む情報につき、該意味単位に関連付けられた前記属性に応じて、前記アクセス主体によるアクセスの可否を判定するステップと、
前記コンピュータ装置が、前記判定に従った照会結果を出力するステップと
を含む、情報処理方法。 - コンピュータ装置が、文書データを読み出すステップと、
コンピュータ装置が、前記文書データのテキストに含まれる意味単位に対し、属性を付与するステップと、
コンピュータ装置が、前記文書データの前記意味単位と、該意味単位に付与された前記属性とを対応づけて格納するステップと、
をさらに含む、請求項12に記載の情報処理方法。 - さらに、格納された前記意味単位に対し、統計解析処理により算出された統計値を示す属性を付与するステップを含む、請求項12に記載の情報処理方法。
- 請求項1〜6のいずれか1項に記載の各機能部をコンピュータに実現するためのコンピュータ実行可能なプログラム。
- 請求項7〜11のいずれか1項に記載の各機能部をコンピュータに実現するためのコンピュータ実行可能なプログラム。
- 情報に対するアクセスを制御する情報処理システムであって、前記システムは、
文書データを格納する文書格納部と、
前記文書データのテキストに含まれる意味単位に対し、属性を付与する解析部と、
前記文書データの前記意味単位と、該意味単位に付与された前記属性とを対応づけて格納する属性インデックス格納部と、
前記属性に関連付けられた前記意味単位を含む情報に対する、アクセス主体のアクセス権限を定義付ける権限定義データを格納する権限定義格納部と、
前記権限定義データを参照し、文書データ内の意味単位を含む情報につき、該意味単位に関連付けられた前記属性に応じて、前記アクセス主体によるアクセスの可否を判定するアクセス制御部と、
文書データへのアクセス照会の入力に応答して、前記アクセス制御部の判定に従った照会結果を出力する入出力部と
を含み、
前記解析部は、前記文書格納部から文書データを読み出して、テキストを取得し、辞書を用いた自然言語解析処理により、該テキストから意味単位を抽出して、各該意味単位に属性を付与し、さらに、統計解析処理により、前記属性インデックス格納部に格納された意味単位に対し、前記統計解析処理により算出された統計値を示す属性を付与し、
前記属性インデックス格納部は、前記文書データと、該文書データに対して付された属性とをさらに対応付けて格納し、
前記アクセス制御部は、前記権限定義データを参照し、前記文書データに付与された前記属性に応じて、さらに前記文書データ自体に対するアクセスの可否を判定する、
前記入出力部は、前記アクセス制御部が閲覧不可と判定した前記意味単位を含む情報を前記文書データから削除または前記文書データにマスクしたデータを、前記照会結果として出力し、
各々の前記意味単位は、語、句、節、文、および複数文からなる群から選択された粒度を有する、情報処理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008118677A JP5153443B2 (ja) | 2008-04-30 | 2008-04-30 | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008118677A JP5153443B2 (ja) | 2008-04-30 | 2008-04-30 | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009271573A true JP2009271573A (ja) | 2009-11-19 |
JP5153443B2 JP5153443B2 (ja) | 2013-02-27 |
Family
ID=41438100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008118677A Expired - Fee Related JP5153443B2 (ja) | 2008-04-30 | 2008-04-30 | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5153443B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012155510A (ja) * | 2011-01-26 | 2012-08-16 | Hitachi Ltd | センサ情報処理分析システム及び解析サーバ |
JP2012248049A (ja) * | 2011-05-30 | 2012-12-13 | Nippon Telegr & Teleph Corp <Ntt> | 文書情報分析装置、文書情報分析方法、文書情報分析プログラム |
JP2015125646A (ja) * | 2013-12-26 | 2015-07-06 | ニフティ株式会社 | 匿名化システム |
WO2015141002A1 (ja) * | 2014-03-20 | 2015-09-24 | 株式会社日立製作所 | データ管理方法 |
JP2017091421A (ja) * | 2015-11-16 | 2017-05-25 | 富士通テン株式会社 | ドライブレコーダ、表示システム、ドライブレコーダの記録方法およびプログラム |
JP2019153119A (ja) * | 2018-03-05 | 2019-09-12 | コニカミノルタ株式会社 | 文章抽出装置、プログラム |
CN110532279A (zh) * | 2019-07-12 | 2019-12-03 | 平安普惠企业管理有限公司 | 大数据平台权限控制方法、装置、计算机设备及存储介质 |
JP2020149713A (ja) * | 2020-05-25 | 2020-09-17 | 株式会社デンソーテン | 記憶装置および走行映像アクセス方法 |
JP2022073949A (ja) * | 2020-10-30 | 2022-05-17 | ソプラ株式会社 | セキュリティidの会話文検索システム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10334097A (ja) * | 1997-05-28 | 1998-12-18 | Oki Electric Ind Co Ltd | 属性辞書装置と自然言語処理装置及び方法並びにその記録媒体 |
JP2003228507A (ja) * | 2002-02-05 | 2003-08-15 | Just Syst Corp | ファイル管理装置および方法 |
JP2005018220A (ja) * | 2003-06-24 | 2005-01-20 | Fujitsu Ltd | 開示プログラム |
-
2008
- 2008-04-30 JP JP2008118677A patent/JP5153443B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10334097A (ja) * | 1997-05-28 | 1998-12-18 | Oki Electric Ind Co Ltd | 属性辞書装置と自然言語処理装置及び方法並びにその記録媒体 |
JP2003228507A (ja) * | 2002-02-05 | 2003-08-15 | Just Syst Corp | ファイル管理装置および方法 |
JP2005018220A (ja) * | 2003-06-24 | 2005-01-20 | Fujitsu Ltd | 開示プログラム |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102693214B (zh) * | 2011-01-26 | 2016-04-27 | 株式会社日立制作所 | 传感器信息处理分析系统以及分析服务器 |
CN102693214A (zh) * | 2011-01-26 | 2012-09-26 | 株式会社日立制作所 | 传感器信息处理分析系统以及分析服务器 |
JP2012155510A (ja) * | 2011-01-26 | 2012-08-16 | Hitachi Ltd | センサ情報処理分析システム及び解析サーバ |
JP2012248049A (ja) * | 2011-05-30 | 2012-12-13 | Nippon Telegr & Teleph Corp <Ntt> | 文書情報分析装置、文書情報分析方法、文書情報分析プログラム |
JP2015125646A (ja) * | 2013-12-26 | 2015-07-06 | ニフティ株式会社 | 匿名化システム |
US9563748B2 (en) | 2014-03-20 | 2017-02-07 | Hitachi, Ltd. | Data management method |
WO2015141002A1 (ja) * | 2014-03-20 | 2015-09-24 | 株式会社日立製作所 | データ管理方法 |
JP2017091421A (ja) * | 2015-11-16 | 2017-05-25 | 富士通テン株式会社 | ドライブレコーダ、表示システム、ドライブレコーダの記録方法およびプログラム |
JP2019153119A (ja) * | 2018-03-05 | 2019-09-12 | コニカミノルタ株式会社 | 文章抽出装置、プログラム |
CN110532279A (zh) * | 2019-07-12 | 2019-12-03 | 平安普惠企业管理有限公司 | 大数据平台权限控制方法、装置、计算机设备及存储介质 |
JP2020149713A (ja) * | 2020-05-25 | 2020-09-17 | 株式会社デンソーテン | 記憶装置および走行映像アクセス方法 |
JP2022073949A (ja) * | 2020-10-30 | 2022-05-17 | ソプラ株式会社 | セキュリティidの会話文検索システム |
JP7132576B2 (ja) | 2020-10-30 | 2022-09-07 | ソプラ株式会社 | セキュリティidの会話文検索システム |
Also Published As
Publication number | Publication date |
---|---|
JP5153443B2 (ja) | 2013-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5153443B2 (ja) | 情報処理システム、情報処理装置、情報処理方法およびプログラム | |
US8285540B2 (en) | Character string anonymizing apparatus, character string anonymizing method, and character string anonymizing program | |
US6957384B2 (en) | Document management system | |
US9542425B2 (en) | Document management system having automatic notifications | |
CN102483765B (zh) | 文件搜索系统和程序 | |
US20090112841A1 (en) | Document searching using contextual information leverage and insights | |
US8407218B2 (en) | Role based search | |
MXPA04003000A (es) | Busqueda por comoputadora con asociaciones. | |
US9418087B2 (en) | Migrating information data into an application | |
US7503075B2 (en) | Access trimmed user interface | |
JP2007233474A (ja) | 案件情報作成支援システム及びプログラム | |
US6711570B1 (en) | System and method for matching terms contained in an electronic document with a set of user profiles | |
US20160085389A1 (en) | Knowledge automation system thumbnail image generation | |
US20120046937A1 (en) | Semantic classification of variable data campaign information | |
US20220123935A1 (en) | Masking sensitive information in a document | |
Murphy | Digital document metadata in organizations: Roles, analytical approaches, and future research directions | |
US20160086499A1 (en) | Knowledge brokering and knowledge campaigns | |
US9268841B2 (en) | Searching data based on entities related to the data | |
US8655876B2 (en) | Methods and systems for classifying data based on entities related to the data | |
US20160085850A1 (en) | Knowledge brokering and knowledge campaigns | |
US20060136438A1 (en) | Process server array for processing documents and document components and a method related thereto | |
US8195458B2 (en) | Open class noun classification | |
JP2003228507A (ja) | ファイル管理装置および方法 | |
JPWO2005006191A1 (ja) | 複数種類の情報を登録する装置および方法 | |
US20240119170A1 (en) | Machine learning (ml) model pipeline with obfuscation to protect sensitive data therein |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121204 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |