JP7287510B2 - 文書処理のための方法及び装置 - Google Patents

文書処理のための方法及び装置 Download PDF

Info

Publication number
JP7287510B2
JP7287510B2 JP2022001738A JP2022001738A JP7287510B2 JP 7287510 B2 JP7287510 B2 JP 7287510B2 JP 2022001738 A JP2022001738 A JP 2022001738A JP 2022001738 A JP2022001738 A JP 2022001738A JP 7287510 B2 JP7287510 B2 JP 7287510B2
Authority
JP
Japan
Prior art keywords
computing device
electronic document
metadata
user
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022001738A
Other languages
English (en)
Other versions
JP2022107588A (ja
Inventor
クリスチャン ラヴェル
紘士 小林
紘史 山口
グル プラサナ
ロイク ベイロ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2022107588A publication Critical patent/JP2022107588A/ja
Application granted granted Critical
Publication of JP7287510B2 publication Critical patent/JP7287510B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/02Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、文書の処理に、具体的には、文書内の機密情報の扱いに関係がある。
産業及び商業の多くの分野で、紙よりもむしろ電子形式で文書を処理及び通信する傾向が続いている。データプライバシ及びセキュリティに関する懸案事項も高まっている。従って、秘密又は機密情報を含む文書を扱うための改善された方法に対する需要が存在する。
データベース及びデータファイルで機密データを検出しマスクするいくつかのサービスが知られている。例えば、米国特許第9998525号を参照されたい。
しかし、いくつかのサービス及び製品は、ユーザフレンドリではなく、自動化されておらず、かつ、文書ワークフローに組み込まれていない等の様々な欠点がある。
従って、機密情報を含む文書を処理するためのより効率的かつよりユーザフレンドリな方法が必要とされる。
本発明に従って、データリダクション(data redaction)アプリケーションのためのコンピュータデバイスが提供され、デバイスは、
データ処理プラットフォームと通信するよう構成されるインターフェースと、
前記データ処理プラットフォームから受け取られたリダクション情報を含む初期メタデータと、電子文書とを記憶するよう構成されるメモリユニットと、
前記メタデータ及び前記電子文書から、前記電子文書に適用されるべきリダクションを示すプレビュー画像を生成するよう構成されるプレビュー生成部と、
前記プレビュー画像をディスプレイへ送るよう構成されるディスプレイコントローラと、
変更されたメタデータをユーザアクションに応答して生成し、前記プレビュー生成部に、変更されたプレビュー画像を生成させるよう構成されたメタデータ変更部と
を有する
本発明に従って、コンピュータにより実施される、データリダクションの方法が提供され、方法は、
コンピュータデバイスで電子文書を受け取るステップと、
前記コンピュータデバイスでデータ処理プラットフォームから前記電子文書のためのリダクション情報を含む初期メタデータを受け取るステップと、
前記コンピュータデバイスで前記リダクション情報に従って前記リダクションが適用されるプレビュー画像を表示するステップと、
前記コンピュータデバイスでユーザ入力に応答して前記リダクション情報を変更して、変更されたメタデータを生成するステップと、
前記変更されたメタデータに応答して前記プレビュー画像を更新するステップと
を有する。
本発明に従って、画像データ上でデータをリダクションするよう構成されたシステムが提供される。システムは、
ディスプレイと、
上記のコンピュータデバイスと、
データ処理プラットフォームと
を有し、
前記データ処理プラットフォームは、
電子文書内のテキストデータの位置を決定し、前記テキストデータ及び該テキストデータの位置データを有する項目メタデータを生成する画像符号化ユニットと、
前記項目メタデータに基づき、前記電子文書でデータをリダクションするためのリダクション情報を含む初期メタデータを生成するデータ検出ユニットと、
前記初期メタデータを前記コンピュータデバイスへ送り、変更されたリダクション情報を含む変更されたメタデータを前記コンピュータデバイスから受け取るよう、前記コンピュータデバイスと通信するネットワーク通信インターフェースと、
前記電子文書及び前記変更されたリダクション情報から、データリダクションされた画像ファイルを生成するデータリダクション済み画像ファイル生成ユニットと、
前記データリダクションされた画像ファイルを、前もって決定されたフォーマットに変換する文書ファイル変換部と
を有する。
本発明の実施形態は、従って、電子文書内の機密情報を確実にかつ効率的にリダクションすることができ、ユーザが、所望の結果を達成するよう効果的かつ効率的にリダクション処理を制御することを可能にする。
以下では、例示的な実施形態及び添付の図面を参照して、本発明が更に説明される。
本発明が実装され得るシステムを示す。 本発明の実施形態におけるトップレベルのメニュー画面を示す。 本発明の実施形態で、リダクションされるべき項目を選択するメニュー画面を示す。 本発明の実施形態で、リダクションの方法を選択するメニュー画像を示す。 本発明の実施形態で、リダクションの前及び後の文書を示す。 本発明の実施形態のシステムを示す。 本発明の実施形態に従うシステムを示す。 単一のコンピュータデバイスを使用する本発明の第1の方法における通信フローを示す。 本発明の第1の方法を示すフローチャートである。 本発明の第2の方法における通信フローを示す。 本発明の第2の方法を示すフローチャートである。 本発明の第3の方法におけるデータフローを示す。 本発明の第3の方法を示すフローチャートである。 本発明の第3の方法を示すフローチャートであり、図13Aからの続きである。 本発明の実施形態におけるプレビュー画面を示す。 本発明の実施形態におけるプレビュー画面を示す。 本発明の実施形態におけるプレビュー画面を示す。 本発明の実施形態におけるプレビュー画面を示す。
様々な図で、同じ部分は、同じ参照符号によって表されている。
図1は、本発明の実施形態が実行され得る環境100の一実施形態を示す。環境は、コンピュータデバイス102(如何なるタイプのコンピュータデバイスも使用可能である(例えば、多機能周辺機器(MFP)、パーソナルコンピュータ、ラップトップ、スマートフォン、タブレットコンピュータ、など))、データ処理プラットフォーム104(例えば、遠隔位置でデータ処理を実行するために使用される遠隔サーバ)、及び通信あて先109(例えば、電子メールサーバ又は遠隔ファイルストレージサービス)を有する。任意に、1つ以上の補助サーバ105も用いられてもよい。データ処理プラットフォーム104は、単一のサーバ又は複数のサーバを有してよく、異なるサーバは異なる機能又は同じ機能を実行する。データ処理プラットフォーム104は、いくつかの処理ステップを実行し及び/又は関連する情報を取得するよう、補助サーバ105と通信してもよい。
本発明の例示的な方法の概要が、これより、与えられる。ユーザは、電子文書103の形で文書データを生成するようデバイス102を用いてオリジナルの文書101をスキャンしてよい。電子文書103は、例えば、インターネット、他のワイドエリアネットワーク(WAN)又はローカルエリアネットワーク(LAN)を介して、データ処理プラットフォーム104へ送られる。データ処理プラットフォーム104は、電子文書103において機密データ又はリダクションされるべき他のデータを検出するよう、以下でより詳細に記載されるプロセスを実行する。
データ処理プラットフォーム104は、電子文書103に対して実行されるべき提案されているリダクションを記述する初期メタデータを返す。初期メタデータは、マスキングメタデータとも呼ばれることがあり、任意の適切なファイルフォーマット(例えば、JSON)で供給され得、メタデータを含むファイルは、ここでは、マスキングデータファイルと呼ばれる。マスキングデータファイル106は、(オリジナルの又は変更されたフォーマットで)電子文書のコピーを含んでもよく、あるいは、提案されているリダクションを定義するために必要な最小限のデータしか含まなくてもよい。データ処理プラットフォーム104は、デバイス102から前に送信されたよりも低い解像度での電子文書のバージョンをデバイス102へ返送することができる。
マスキングデータファイル106を受け取ると、デバイス102は、電子文書103に適用されるよう提案されているリダクションをユーザに表示する。ユーザは、リダクションを確認又は編集することができる。そのプロセスが完了すると、デバイス102は、変更されたメタデータを含む確認データファイル107をデータ処理プラットフォーム104へ送る。変更されたメタデータは、初期メタデータに対して編集されたリダクションを表す。ユーザがリダクションを変更しない場合には、変更されたメタデータは初期メタデータと同じであることに留意されたい。マスキングデータファイル106と同様に、確認データファイル107は、(オリジナルの又は変更されたフォーマットで)電子文書のコピーを含んでもよく、あるいは、提案されているリダクションを定義するために必要な最小限のデータしか含まなくてもよい。電子文書及びメタデータは、ファイルの交換以外の他の技術を用いて、コンピュータデバイスとデータ処理プラットフォームとの間で通信され得ることが留意されるべきである。
データ処理プラットフォーム104で確認データファイル107を受け取ると、データリダクション済み画像ファイル生成ユニット104dは、リダクションされたデータが不可逆的にマスキング/不明りょう化されているリダクションされた文書を生成するようリダクションプロセスを実行し、文書コンバータ104eは、必要に応じて、データリダクションされた画像ファイルを所望の出力フォーマット(任意の適切なフォーマットが使用されてよく、例えば、ポータブルドキュメントフォーマットである)へ変換する。以下で更に論じられているように、リダクションプロセスは、選択された情報をセキュアにマスキング又は不明りょう化して出力文書108を生成する如何なるプロセスであることもできる。出力ユニット104fは、出力文書108を通信あて先109へ送る。通信あて先109は、例えば、電子メールボックス、クラウドストレージサーバ、文書管理システム、などであってよい。通信あて先109は、コンピュータデバイス102であることができる。
大筋では、データ処理プラットフォーム104によって実行される、機密データを検出するプロセスは、3つのステップを有する。第1に、画像符号化ユニット104aは、電子文書103で単語を検出する。画像符号化ユニット104aは、単語検出部とも呼ばれ得る。電子文書103が、テキストデータを含むフォーマットにある場合には、画像符号化ユニット104aは、単に、単語及び単語グループを抽出し得る。この文脈中、「単語」(word)は、句読点の有無によらず、任意の言語における連続した文字、数字又は符号の任意の列であると見なされる。電子文書103が平面画像ファイルであるか、あるいは、画像を含む場合には、画像符号化ユニット104aは、文字又は符号検出及び認識プロセスを最初に実行してもよい。
第2に、データ検出ユニット104bは、単語及び/又は単語グループが機密情報である可能性があるか、あるいは、さもなければ、リダクションされるべきであるかどうかを確かめるために、それらの単語及び/又は単語グループを検査する。「機密データ」又は「機密情報」という用語は、ここでは、それが任意の特定の文脈中で機密であるか否かによらず、潜在的にリダクションされるべきである如何なるデータも指すために使用されている。機密情報を識別するいくつかの種々の方法が可能であり、方法のいずれかの適切な方法又は組み合わせが使用されてよい。データ検出ユニット104bは、例えば、APIコールにより、機密データを識別するために外部サービスを利用してもよい。データ検出ユニット104bは、機密データ検出部と呼ばれてもよく、特定のタイプの機密情報、例えば、人物特定情報又は医療情報を夫々検出する複数の別個のモジュールを備えてもよい。検出された機密情報は、望ましくは、そのタイプ又はカテゴリに応じてラベル又はタグを付される。
機密情報を識別する方法の例は、機密情報のディクショナリに対して単語又は単語のグループをチェックすることである。機密情報のディクショナリは、氏名及び医療用語を含んでもよい。そのような方法で、単語のグループをチェックすることが重要である。これは、「bond」という単語自体は機密と見なされないが、「Eric Bond」は氏名と認識され得るからである。他の方法は、文書の文脈を考える。例えば、文書の一部がフォーム又は表として認識される場合に、「Name:」などのラベルに続く情報は、機密であると決定され得る。他の方法は、パターンマッチングを行うことである。例えば、簡単なアプローチで、各4つの数字から成る4つのグループで配置された16桁の数字は、クレジットカード番号であると決定され得る。より複雑な試験は、偽陽性を回避して、数字が別なふうにフォーマット化されている場合を検出するために適用され得る。データ検出ユニット104bは、適切に訓練された機械学習アルゴリズムインスタンスを用いてもよい。
第3に、画像分類部104cは、電子文書内の任意の画像を検査して、それらが機密であるかどうかを確かめる。このステップは任意である。機密画像の例には、署名及び人々の写真、特に顔が含まれ得る。画像分類部104cは、1つ以上の訓練された機械学習アルゴリズムインスタンスを有してもよい。画像分類部104cは、OpenCVライブラリ又は任意の他の適切なコンピュータビジョンライブラリを使用してもよい。
機密情報を検出する方法は、テキスト項目(単語又は単語グループ)が機密情報であるスコア又は確率を生成してもよい。その場合に、夫々潜在的に項目をリダクションすべきかどうかを決定するために、閾値が適用され得る。閾値は、予め決定された又はユーザにより選択可能なパラメータであってよい。機密情報を検出する複数の方法が使用される場合に、スコア又は確率は、総スコアを生成するよう結合されてもよく、あるいは、最高スコアが使用されてもよい。
本発明の実施形態で、上記のプロセスは、ユーザデバイス102でユーザによって制御される。ユーザは、ユーザインターフェースを備えた任意の適切なコンピューティングデバイス、例えば、多機能周辺プリンタ、パーソナルコンピュータ、ラップトップ、タブレット、スマートフォン、パーソナルデジタルアシスタント、などであってもよい。ユーザデバイスが画像捕捉機能、例えば、文書スキャナ(例えば、フィードスルー(feed-through)又はフラットベッド(flatbed))又はカメラを含む場合に、電子文書103は、物理的なオリジナルの画像を捕捉するために画像捕捉機能を用いて生成され得る。代替的に、又は追加的に、電子文書103は、他のソースから取得されても、あるいは、ワードプロセッシング又は他のソフトウェアをユーザデバイスで用いるユーザによって生成されてもよい。
本発明の実施形態のシステム600が図6に示されている。システム600は、少なくとも、コンピュータデバイス620及びデータ処理プラットフォーム630を有する。画像捕捉デバイス610は任意である。コンピュータデバイス620は、任意に画像捕捉デバイス610を含んでおり、ユーザデバイス102の例であり、例えば、多機能周辺機器、パーソナルコンピュータ、ラップトップ、スマートフォン、タブレットコンピュータ、などであってよい。コンピュータデバイス620はディスプレイ621を備える。あらゆるタイプのディスプレイがディスプレイ621として使用されてもよく、例えば、外付けディスプレイ又は内蔵ディスプレイがある。ディスプレイ621は、タッチ検知式ディスプレイ又は非タッチ検知式ディスプレイのどちらであってもよい。キーボード、キーパネル、タッチパッド、マウス又はトラックボールなどの入力デバイスが設けられてもよい。コンピュータデバイス620はまた、データリダクションアプリケーション622、メモリユニット626、及び通信インターフェース627も含む。データリダクションアプリケーション622は、少なくとも、ディスプレイコントローラ623、プレビュー生成部624、メタデータ変更ユニット625を含む。メモリユニット626は、文書データ記憶ユニット626a及びメタデータ記憶ユニット626bを含む。通信インターフェース627は、任意の適切なネットワークインターフェース、例えば、Ethernet(登録商標)インターフェース、Wi-Fiインターフェース又はセルラーインターフェースであることができる。
データリダクションアプリケーション622は:通信インターフェース627を介してデータ処理プラットフォーム630と通信すること、リダクションされた文書のプレビューをディスプレイ621により表示すること、確認情報をユーザに表示すること、確認及びリダクション設定を変更するユーザ命令を受け取って、それに従って動作すること、並びに文書データ及びメタデータを記憶すること、を含む機能を実行する。これらの機能は、本発明の方法に関連して以下で更に記載される。
データ処理プラットフォーム630は、項目メタデータ生成部631aを含む画像符号化ユニット631を含む。初期メタデータ生成部632a及び初期メタデータ書き込みユニット632bを含むデータ検出ユニット632もある。データ処理プラットフォーム630は、データリダクション済み画像ファイル生成ユニット633、文書ファイルコンバータ634、及びネットワーク通信インターフェース635を更に含む。メモリ636も設けられる。メモリ636は、画像データ記憶ユニット636a及びメタデータ記憶ユニット636bを含んでもよい。
図7は、本発明の他の実施形態に従うシステム700を示す。図6の実施形態のシステム600の対応する部分と同じであるこの実施形態のシステム700の部分は、同じ参照符号により表されており、それらの更なる記載は、簡潔さのために省略される。
システム700は、画像捕捉デバイス610、コンピュータデバイス620、及びデータ処理プラットフォーム630を含み、更には、リダクションされるべきである機密データの特定の項目を含むデータベース701を有する。データベース701は、リダクションされるべき機密情報を識別する目的で特に保持されているデータベースであってもよい。望ましくは、データベース701は、他の目的のために保持されているが、リダクションされるべき機密情報を含むデータベースである。例えば、データベース701は、従業員ディクショナリ、支払人ディクショナリ、ネットワークディクショナリ(例えば、LDAP(Lightweight Directory Access Protocol)に従う)、電子アドレス帳又は顧客管理システム(時々、クライアント又は顧客関係管理システムと呼ばれる)であってよい。そのようなディクショナリは、組織の構成員、クライアント若しくは顧客、及び/又は特定のネットワークのユーザに関する名前及び他の機密情報を含んでもよい。データベース701は、データ処理プラットフォーム630やコンピュータデバイス620の部分として、又は別のどこかで、例えば、補助サーバ105で保持されてもよい。データベース701は、別のどこかで保持されているデータベースのコピー又はレプリカであってもよい。
データ処理プラットフォーム630は、データベース701のコンテンツに対してテキスト項目(例えば、単語、単語のグループ、又は名称)をチェックして、そのテキスト項目がマスキングされるべきであるかどうかを決定してよい。望ましくは、処理の効率のために、文書内のあらゆるテキスト項目がデータベース701に対してチェックされるわけではない。例えば、ディクショナリで現れない単語を含むテキスト項目のみがチェックされる。所定のパターンに一致した項目がチェックされてもよい。
図8及び図9は、データ処理プラットフォーム630がコンピュータデバイス620と通信する本発明に従う第1の方法を更に詳細に示す。図9に示されるように、第1のステップで、コンピュータデバイス620は、データリダクションプロセスの初期設定をチェックするために表示し(S901)、ユーザから、それらの設定の任意の必要な変更を受け取る。プレビュー画面とのユーザインタラクションは、以下で更に記載される。次に、リダクションされるべき文書データを含む電子文書が、望ましくはTLS(Transport Layer Security)などの安全な通信方法により、データ処理プラットフォーム630へ送られる(S902)。上述されたように、リダクションされるべき電子文書は、画像捕捉機能によりコンピュータデバイスで取得されても、又はそこで生成されても、又は別などこかから取得されてもよい。
リダクションされるべき電子文書103は、データ処理プラットフォーム630で受け取られ(S903)、暗号化伝送プロトコルが使用された場合には復号される。受け取られた文書は、文書内のテキスト及び文書のテキストコンテンツを示す文書マップを識別するよう処理され(S904)、各テキスト要素の位置が生成される。文書マップは、位置データの例であり、ポジション座標データを使用してテスト要素の位置を識別し得る。画像、例えば、ピクチャ及び署名も、このステップで識別されて、位置を記録される。文書マップは、項目メタデータとして記憶される(S905)。データ検出プロセス(S906)が、潜在的なリダクションのためにデータ項目を識別するよう、電子文書及び対応する項目メタデータに対して実行される。リダクション情報は、コンピュータデバイス620へ送信されるべき初期メタデータとして生成及びセーブされる(S907)。
望ましくは、初期メタデータは、リダクションされるべき特定の項目とともに、文書画像内でのそれらの対応する位置と、望ましくは、それらが属する情報カテゴリとを示す。初期メタデータは、リダクションされるべき特定の項目に代えて、又はそれに加えて、何がリダクションされるべきであるかを定義する規則又は設定を指定してもよく、リダクション設定情報と呼ばれてもよい。電子文書及び初期メタデータは、コンピュータデバイス620へ送られる(S908)。初期メタデータは、電子文書とともにコンピュータデバイス620へ送られてもよく、それにより、メタデータとコンピュータデバイスとの間のリンクは正確に維持され得る。これは、潜在的なリダクションが厳密にプレビューされなくなるというリスクを減らすのに役立つ。他の実施形態では、電子文書103のコピーをコンピュータデバイス620が保有していることに応じて、初期データしかコンピュータデバイス620へ返送されなくてもよい。これは、バンド幅利用量を低減する。
コンピュータデバイス620の通信インターフェース627は、初期メタデータと、任意に、電子文書とを、データ処理プラットフォーム630から受け取る(S909)。データリダクションアプリケーション622は、初期メタデータと、リダクションされるべき電子文書とを、夫々、メタデータ記憶ユニット626b及び文書記憶ユニット626aに格納する(S910)。プレビュー生成部624は、ディスプレイ621でユーザに表示される(S911)第1プレビュー画像を生成する。コンピュータデバイスは、電子文書でリダクションされるべき項目の任意の必要な変更を示すユーザからの入力を受け取る。
メタデータ変更ユニット625は、ユーザ入力によって示される、リダクションされるべき項目の変更を表す変更されたメタデータを生成し、プレビュー生成部624に、変更されたプレビュー画像を生成させ、第1通信インターフェースに、変更されたリダクション情報をデータ処理プラットフォーム630へ送らせる。このステップは、表示されたリダクションのプレビュー画像にユーザが満足するまで、必要な回数だけ繰り返されてもよい。リダクション情報の変更が完了するとの確認を受け取ると、データリダクションアプリケーション622は、変更されたメタデータをメモリユニット626に格納する(S913)。次いで、データリダクションアプリケーション622は、ユーザによる確認のために、任意の他の関連設定、例えば、出力文書のフォーマット、出力文書のあて先、及び適用されるべき任意の文書ワークフローを表示する(S914)。関連設定の確認及び変更に続いて、データリダクションアプリケーション622は、更新されたメタデータと電子文書との対をデータ処理プラットフォーム630へ送る(S915)ように通信インターフェース627に指示する。
データ処理プラットフォーム630のネットワーク通信インターフェース635は、変更されたメタデータ及び電子文書を受け取る(S916)。データリダクション済み画像ファイル生成ユニット633は、電子文書を、リダクションが不可逆的に適用されているリダクションされた文書に変える(S917)。リダクションは、選択された方法で、文書データ内の選択された場所に適用される。望ましくは、出力文書は、如何なるテキスト情報又はメタデータも削除されているピクセルの単一レイヤに低減されるように“平板化”(flatten)されてもよい。
任意に、文書ファイルコンバータ634は、リダクションされた文書を別の所望のフォーマットに変換する(S918)。文書フォーマットの変換は、リダクションプロセスでデータリダクション済み画像ファイル生成ユニット633によっても実行され得る。最後に、ネットワーク通信インターフェース635は、リダクションされた文書を、指定された通信あて先640へ送る(S919)。文書を送ることは、如何なる適切な方法でも実行可能であり、例えば、文書を電子メールアドレスへ送るSMTP又は文書を遠隔の記憶場所にアップロードするFTPがある。文書が他のクラウドサービスへ送られるべき場合には、そのサービスのアプリケーションプログラミングインターフェース(API)が使用され得る。リダクションプロセスで生成されたメタデータも、そのようなクラウドサービスへ送られ、例えば、タグを適用するために又は分類のために使用されてもよい。
本発明の方法は、単一のセッションで実行可能であることが理解されるだろう。すなわち、ユーザは、最初のチェックステップ(S901)を行って、リダクションされるべき電子文書をデータ処理プラットフォーム630へ送り、それから、提案されているリダクションを受け取るのを待ち、リダクションのプレビュー画像を変更又は確認し、変更されたメタデータをデータ処理プラットフォーム630へ返送する。代替的に、最初にオリジナルの文書をデータ処理プラットフォーム630へ送り、その後に、提案されているリダクションを変更又は確認するステップは、別々の時点及び/又は別々のデバイスで実行されてもよい。ユーザは、1つのセッションで複数のオリジナルの文書を送り、その後に、異なるセッションでリダクションを変更又は確認してもよい。
ステップが異なるデバイスでユーザによって実行される他の方法は、図10及び図11に示される。図11で、同じステップが、図9で見られるように実行され、それらは、同じ参照符号で表記される。図11の方法は、最初のステップ(S901)、(S902)がユーザによって第1コンピュータデバイス620aで行われ、後の変更/確認ステップ(S909)~(S915)が第2コンピュータデバイス620bで実行される点で、図9の方法と相違する。図11の方法は、第1コンピュータデバイスの第1ユーザが、リダクションされるべき文書を生成又は選択することができ、一方、第2コンピュータデバイスの第2ユーザが、適用されるべきリダクションを変更又は確認することができるので、多くの人々が関与するバルクプロセス又はワークフローに特に適応される。多くの類似した文書が処理されるべきであるバルクプロセスでは、1つの文書について変更される設定が、有効に、次の文書の処理のためのデフォルトになり得る。
本発明の実施形態は、他のプロセスを組み込むこと及び/又はより広い文書処理ワークフローに組み込まれることが可能である。例えば、本発明は、提案されているリダクションの承認のステップを含む方法で具現され得る。そのような方法は、図12及び図13に示されている。図13では、図9のステップと同じであるステップは、同じ参照符号により表され、ここでは更に記載されない。
図13の方法は、図9及び図11の方法と同じステップを通って、電子文書及び更新されたメタデータがデータ処理プラットフォームへ送られる(S913)ポイントへ進む。電子文書及び更新されたメタデータを受け取ると、データ処理プラットフォームは、電子文書及び更新されたメタデータを第3コンピュータデバイス620cへ送る(S1301)。第3コンピュータデバイス620cは、電子文書及び更新されたメタデータを受け取り(S1302)、チェックのためにプレビュー画像を表示する(S1303)。第3コンピュータデバイス620cは、第3コンピュータデバイス620cのユーザから、プレビュー画像がオーケーであるとの確認、又はオーケーではないという指示を受け取る(S1304)。第3コンピュータデバイス620cを操作するユーザは、望ましくは、第1コンピュータデバイス620aを操作するユーザとは異なる個人である。2人のユーザは、ネットワーク内で異なる特権を有してもよい。プレビュー画像がオーケーであると確認されている場合には、第3コンピュータデバイス620cは、その出力文書がそのあて先へ送信されるよう要求をデータ処理プラットフォーム630へ送る(S1305)。データ処理プラットフォーム630は、第3コンピュータデバイス620cからコマンドを受け取り(S1306)、図9の方法で見られる生成、変換及び送信ステップ(S917)~(S919)を続ける。
図13の方法の他の変形例では、第3コンピュータデバイス620cのユーザは、後述されるように、プレビュー画面を用いてリダクションを変更する。変更されたリダクション情報は、次いで、第3コンピュータデバイス620cによって生成され、リダクション文書の生成等のためにデータ処理プラットフォーム630へ送られる。
プレビュー画像がオーケーではないと示される場合には、第3コンピュータデバイス620cは、拒否の通知を第1コンピュータデバイス620aへ送る(S1307)。拒否の通知は、なぜリダクションがオーケーではないのかの指示を含んでもよい。拒否の通知を受け取ると(S1308)、第1コンピュータデバイス620aは、プレビューを生成し(S911)、リダクション変更/確認設定への変更を受け取る(S912)ステップとともに、その後のステップ(S913)~(S915)を繰り返し、これによって、文書及び更に更新されたメタデータがデータ処理プラットフォーム630へ送られる。当然、リダクション情報の承認及び変更は、適切な変更が適用されることを確かにするよう複数回繰り返されてもよい。
図2は、プロセスの誘因を指示するためにユーザによって使用され得るメニュー画面200を示す。メニュー画面は、ユーザのログイン名の指示201を含んでもよい。様々なデフォルトのアクション及び設定が、ユーザのアカウントと関連付けられて、ユーザがログインすることによって自身を識別する場合にロードされる。
画面200は、記憶先202(例えば、ファイルシステム内のフォルダ)及びファイル名203などの記憶設定を指定することをユーザに可能にするオプションも含む。ファイル名は、「.pdf」などの標準の拡張子によって表されるファイルタイプを含んでもよい。
検出対象メニューオプション204は、処理されるべき文書内のどのようなタイプの機密情報が検出及びリダクションされるべきであるかを指定することをユーザに可能にする。情報検出及びリダクション設定は、後述されるように、サブメニューによりセットされてもよい。ユーザは、複数のタイプの機密情報を選択することを可能にされてもよい。
出力文書設定項目は、出力ファイルタイプ205及び出力符号化言語206を指定するオプションを含む。出力ファイルタイプは、任意の適切なファイルタイプであってよい。
あて先オプションは、あて先アカウントID207(例えば、ユーザの電子メールアドレスを使用する)及びあて先識別208を含んでもよい。あて先識別208は、URI又は既知のURIを有するサービスの予め定義されたエイリアスを有してもよい。任意に、ワークフロープロセス209が実行されるべきであるかどうかの選択を可能にするメニュー項目と、そうである場合には、続くべき特定のプロセスを選択するメニュー項目210とが提供されてもよい。
図3は、リダクション対象サブメニュー300を示す。それによって、ユーザは、自動的に検出及びリダクションされるべきである情報の特定のタイプを選択し得る。リダクション対象サブメニュー300には、メインメニュー200で検出対象メニュー項目を選択することによって達し得る。
リダクション対象サブメニュー300は、選択要素301から304、例えば、チェックボックスを含んでもよく、これらによって、ユーザは、検出及びリダクションされるべき情報の予め定義されたカテゴリを選択することができる。予め定義されたカテゴリは、本発明が置かれるべき特定のアプリケーションに依存してもよいが、特に重要なタイプの情報は、個人に関係がある個人情報、特に、識別情報及び機密個人情報である。他の可能なタイプの情報には、組織情報、金融情報及び/又は医療情報が含まれ得る。
情報のカテゴリは、所定の機密レベルに応じて階層的に編成されてもよい。例えば、最も機密性が高いレベルから、最も機密性が低いレベルまでの階層は、個人識別情報、機密個人情報、医療情報、組織情報であってよい。ユーザは、階層上のレベルを指定することによって、どのような情報がリダクションされるべきであるかを制御してもよく、それにより、そのレベル内又はそのレベルより上の全ての情報はリダクションされる。
リダクション対象サブメニュー300は、予め定義された画像認識タスクの選択が電子文書103で実行されることを可能にする追加の選択要素305、306を更に含んでもよい。実行されるべき画像認識タスクは、とりわけ顔認識及び署名認識を含んでもよい。更に、カスタムエントリ307は、電子文書103のテキストに対して実行されるべきカスタム検索を定義することをユーザに可能にするよう提供されてもよい。カスタム検索は、文字若しくはワイルドカード、又はより複雑な場合には、正規表現を用いて、定義されてもよい。
リダクション対象サブメニュー300は、行った変更をキャンセルすることをユーザが選択することができるキャンセル要素308、及びユーザが変更を確認し、メインメニュー画面に返す確認要素309も含む。
図4は、リダクションタイプサブメニュー400を示す。それによって、ユーザは、電子文書103内の機密データに適用されるべきリダクションのタイプを選択し得る。リダクションタイプサブメニュー400は、例えば、ラジオボタンの形で、選択要素401から405の組を有してもよい。ラジオボタンは、ただ1つのみが一度に選択可能であって、新しいオプションの選択が前の選択を自動的にキャンセルするように相互排他的であるオプションの組である。実行される可能性があるマスキングプロセスは、適用されるべき異なる色のマスク(例えば、黒、白、又は赤)、ぼかし又は“ピクセル化”プロセス、あるいは、他のプロセスのオプションを含むことができる。更に以下で記載される他のプロセスは、ダミーデータ又は偽名データによる機密データの置換を含んでもよい。異なるタイプのリダクションの組み合わせが適用されてもよい。例えば、機密データはダミーデータによって置換され、次いで、ピクセル化又は不明りょう化されてもよい。これは、元の情報が(例えば、リダクションの長さに基づき)回復又は推測不能であることを確かにしながら、同時にオリジナルの文書の見た目を保つ。従来のリダクションプロセスで使用されるベタ色の大きいブロックは、見た目が宜しくない。
例となる入力文書101及び対応する出力文書108は、図5に示される。オリジナルの文書101は、例えば、組織の従業員のプロフィールであってよい。プロフィールは、氏名、この例では「Eve Moneypenny」、及び住所などの個人識別情報501を含むことがある。また、画像502、例えば、プロフィールの対象である個人の顔写真も存在することがある。プロフィールは、誕生日などの機密個人情報503を更に含むことがある。他の機密個人情報には、性別、民族性、又は宗教が含まれてもよい。個人の部門所属及び/又は監督者などの組織情報504が更に含まれることがある。
リダクションされた出力文書108では、文書内の選択された情報がリダクションされている。この例では、異なるリダクション方法が、オリジナルの文書101の異なる要素に適用されているが、リダクションされる全ての要素に同じリダクション方法を適用することも可能である。この例では、個人情報501の部分、特に、氏名「Eve Moneypenny」は、偽名情報506、特に、ダミー名「Jane Doe」により置換されている。個人識別情報501の他の部分は、黒色の塗りつぶしブロック507によって置換されている。いくつかの場合に、疑似情報による元の情報の置換は、リダクションされている文書の性質及び文脈を理解することをより容易にし得る。
図5に示されるように、画像502は、シルエット505で置換されている。また、元の画像をストック画像又は合成的に生成された画像で置換することも可能であるが、置換画像がオリジナルでないことが明りょうに示されない場合には紛らわしいことがある。如何なるそのような紛らわしさも、置換画像を不明りょう化又はピクセル化することによって低減され得る。更に別のリダクションオプションは、機密個人情報503に関して表されており、誕生日が、アスタリスクの列508で置換されている。当然、他の特性が代わりに使用されてもよい。いくつかの場合に、置換テキスト又はシンボルは、例えば、日付又は電話番号がリダクションされていることをより明らかにするために、リダクションされた情報のフォーマット又は長さに一致することが望ましい。他の場合に、置換テキスト又はシンボルは、置換された情報と一致しないことが望ましい。これは、例えば、金額の大きさ又は名前の長さを示すことによって、情報を暴露する可能性があるからである。
電子文書に適用されるべきリダクションをプレビューし、変更し、確認することをユーザに可能にするためのインターフェースは、以下で記載される。これらの画面は、本発明の如何なる実施形態でも使用され得る。図14は、電子文書103に適用されるべきリダクションを示すプレビュー画面1400を表す。ページ画像1401は、電子文書1401のページ、例えば、最初のページを示す。リダクションマスク1403から1405は、機密情報の各々の項目を覆うものとして示されている。対応する項目ボタン1406から1408は、ページ画像1401の隣に表示されている。ナビゲーションボタン1402は、ページ画像1401のズームレベルを変更し、文書が多ページ文書である場合には文書のページ間をナビゲートすることをユーザに可能にするよう設けられている。
ユーザが、例えば、関連するリダクションマスク1405又は対応する項目ボタン1406を選択することによって、リダクション項目を選択する場合に、リダクションされるべき情報は、図15に表されるように示される。ディスプレイデバイスがタッチスクリーンである場合には、項目の選択は、単に、それらを押すことによって行われ得る。代替的に、又は追加的に、マウス又は他の同様のデバイスが、項目を選択するよう画面の周りでポインタを動かすために使用されてもよく、あるいは、カーソル(矢印)キーが、ビュー内の選択可能な項目の周りでカーソル又は選択要素を循環させるよう設けられてもよい。選択されたリダクション項目の情報の表示は、例えば、リダクションマスクを部分的に透明に又は輪郭のみにすることによって、実行され得る。機密情報はまた、対応する項目ボタン1406においても表示され得る。ポップアップメニュー1501は、リダクション項目を編集するか又はそれを完全に削除することをユーザに可能にするよう、例えば、選択されたリダクション項目の隣に、現れる。
ユーザがリダクション項目を削除することを選択する場合には、リダクションマスクは、図16に表されるように取り除かれ、それにより、情報の対応する項目1601がこれより表示される。対応する項目ボタンは、マスク項目の削除を元に戻すことをユーザに可能にする取り消しボタン1601で置換され得る。ユーザが情報の項目をマスク解除する場合に、オプションは、電子文書でその項目の全てのインスタンスをマスク解除するよう提示されてもよい。
図17は、追加のリダクションを文書に加えることをユーザに可能にするオプションを示す。リダクション項目の追加は、プレビュー画像のリダクションされていない領域を選択することによって、例えば、ディスプレイがタッチ検知式スクリーンである場合にはディスプレイのその部分をタップすることによって、開始され得る。ユーザが画面をタップすると、初期マスク1700が表示される。初期マスク1700は、デフォルトのサイズであってもよく、あるいは、リダクションアプリケーションが、ユーザ画面をタッチしたポイントで1つ以上のテキスト項目(例えば、単語)を覆う初期マスクのサイズを自動的に決定してもよい。調整ボタン1701、1702は、提案されているマスク領域が高さ及び/又は幅を調整されることを可能にするよう設けられてもよい。代替的に、マスクされるべき領域は、初期マスク領域のエッジ又は角を選択又はドラッグすることによって調整され得る。キャンセルボタン1703は、リダクション項目の提案されている追加をキャンセルすることをユーザに可能にするよう設けられ得る。確認ボタン174は、リダクションが適用される必要があることを確認することをユーザに可能にするよう設けられている。ユーザがリダクションされるべき追加の項目を選択すると、文書内のその項目の全インスタンスをリダクションするオプションが提供されてもよい。
代替的に、又は追加的に、プレビュー画像と平行して表示される追加のメニュー項目が、リダクションのためにプレビュー画像で追加の項目を選択することをユーザに可能にするよう設けられてもよい。
[結論]
本発明の方法は、1つ以上のコンピュータを有するコンピュータシステムによって実行されてもよい。本発明を実装するために使用されるコンピュータは、汎用CPU、グラフィクスプロセッシングユニット(GPU)、テンソルプロセッシングユニット(TPU)、又は他の特殊化されたプロセッサを含む1つ以上のプロセッサを有してもよい。本発明を実装するために使用されるコンピュータは物理的又は仮想的であってもよい。本発明を実装するために使用されるコンピュータは、サーバ、クライアント、又はワークステーションであってもよい。本発明を実装するために使用される複数のコンピュータは、分布しており、ローカルエリアネットワーク(LAN)又はワイドエリアネットワーク(WAN)などのネットワークを介して相互接続されてもよい。方法の個々のステップは、コンピュータシステムによって実行されてもよいが、必ずしもコンピュータシステムでなくてもよい。発明の方法の結果は、ユーザに表示されても、あるいは、如何なる適切な記憶媒体でも記憶されてもよい。本発明は、発明の方法を実行するための命令を記憶している非一時的なコンピュータ可読記憶媒体に担持されてもよい。如何なる適切なプログラミング言語も、発明を実装するために使用されてもよい。本発明の入力及び出力されたファイルは、如何なる適切なオープン又は独自仕様のフォーマット(例えば、PDF(Portable Document Format)、ODF(Open document Forma for Office Applications)、ドキュメント(.doc)、オープンオフィスXML(.docx)、JPEG(Joint Photographic Experts Group)(.jpeg)JPEG2000、PNG(Portable Network Graphics)(.png)、TIFF(Tagged Image File Format)でも符号化されてもよい。本発明は、1つ以上のプロセッサと、発明の方法を実行するための命令を記憶しているメモリ又はストレージとを有するコンピュータシステムで具現されてもよい。本発明は、多機能周辺機器(例えば、印刷、スキャン、コピー、通信のうちの1つ以上を実行する機能を備えている)に又はそのようなデバイスのためのソフトウェアアップデート若しくはアドオンに組み込まれてもよい。
本発明について記載してきたが、上記の実施形態に対して変形が行われてもよく、実施形態は限定であるよう意図されないことが理解されるだろう。発明は、添付の特許請求の範囲及びそれらの均等で定義される。
100 環境
101 オリジナルの文書
102,620 コンピュータデバイス
013 電子文書
104,630 データ処理プラットフォーム
104a,631 画像符号化ユニット
104b,632 データ検出ユニット
104c 画像分類部
104d,633 データリダクション済み画像ファイル生成ユニット
104e 文書コンバータ
104f 出力ユニット
105 補助サーバ
106 マスキングデータファイル
107 確認データファイル
108 出力文書
109 通信あて先
600,700 システム
610 画像捕捉デバイス
621 ディスプレイ
622 データリダクションアプリケーション
623 ディスプレイコントローラ
624 プレビュー生成部
625 メタデータ変更ユニット
626 メモリユニット
626a 文書データ記憶ユニット
626b メタデータ記憶ユニット
627 通信インターフェース
631a 項目メタデータ生成部
632a 初期メタデータ生成部
632b 初期メタデータ書き込みユニット632b
634 文書ファイルコンバータ
635 ネットワーク通信インターフェース
636 メモリ
636a 画像データ記憶ユニット636a
636b メタデータ記憶ユニット636b
701 データベース
米国特許第9998525号

Claims (22)

  1. データリダクションアプリケーションのためのコンピュータデバイスであって、
    データ処理プラットフォームと通信するよう構成されるインターフェースと、
    前記データ処理プラットフォームから受け取られたリダクション情報を含む初期メタデータと、電子文書とを記憶するよう構成されるメモリユニットと、
    前記初期メタデータ及び前記電子文書から、前記電子文書に適用されるべきリダクションを示すプレビュー画像を生成するよう構成されるプレビュー生成部と、
    前記プレビュー画像をディスプレイへ送るよう構成されるディスプレイコントローラと、
    ユーザからの入力を受けるインターフェース要素を有し、前記入力に応答して前記初期メタデータを変更するよう構成されるメタデータ変更部であり、前記インターフェース要素により、追加でリダクションされるべき前記電子文書内の項目を選択することを前記ユーザに可能にし、前記項目が選択された場合に、前記電子文書内の当該項目及び当該項目と同じ内容の全ての項目をリダクションするオプションを前記ユーザに提示する前記メタデータ変更部と
    を有するコンピュータデバイス。
  2. 前記リダクション情報は、前記電子文書でリダクションされるべき項目の位置を識別する位置情報と、前記リダクションされるべき項目のカテゴリを示すカテゴリ情報とを含む、
    請求項1に記載のコンピュータデバイス。
  3. 前記メタデータ変更部は、前記インターフェース要素により、リダクションされるべき前記電子文書内の項目の位置を選択することを前記ユーザに可能にする、
    請求項2に記載のコンピュータデバイス。
  4. 前記メタデータ変更部は、前記インターフェース要素により、リダクションされるべき前記電子文書内の個々の項目を選択することを前記ユーザに可能にする、
    請求項1乃至3のうちいずれか一項に記載のコンピュータデバイス。
  5. 前記リダクション情報は、各々の項目が機密事項である確率を示す確率情報を含む、
    請求項1乃至4のうちいずれか一項に記載のコンピュータデバイス。
  6. 前記メタデータ変更部は、前記インターフェース要素により、リダクションされるべき前記電子文書内の項目の閾確率を選択することを前記ユーザに可能にする、
    請求項5に記載のコンピュータデバイス。
  7. 前記メタデータ変更部は、前記インターフェース要素により、機密文書の処理を承認するよう予めセットされたワークフローを選択することを前記ユーザに可能にする、
    請求項1乃至6のうちいずれか一項に記載のコンピュータデバイス。
  8. オリジナルの文書の画像を前記電子文書として捕捉する画像捕捉デバイスを更に有し前記画像捕捉デバイスは、当該コンピュータデバイスから分離しているか、又は当該コンピュータデバイスと一体化されている
    請求項1乃至7のうちいずれか一項に記載のコンピュータデバイス。
  9. 前記メタデータ変更部は、前記インターフェース要素により、当該コンピュータデバイスに前記電子文書を前記データ処理プラットフォームへ送るように指示することを前記ユーザに可能にする、
    請求項1乃至8のうちいずれか一項に記載のコンピュータデバイス。
  10. 前記プレビュー画像を表示するよう構成される前記ディスプレイを更に有する、
    請求項1乃至9のうちいずれか一項に記載のコンピュータデバイス。
  11. ンピュータデバイスで電子文書を受け取るステップと、
    前記コンピュータデバイスでデータ処理プラットフォームから前記電子文書のためのリダクション情報を含む初期メタデータを受け取るステップと、
    前記コンピュータデバイスで前記リダクション情報に従ってリダクションが適用されるプレビュー画像を表示するステップと、
    前記コンピュータデバイスでユーザからの入力を受け、前記入力に応答して前記初期メタデータを変更するステップであり、前記ユーザが追加でリダクションされるべき前記電子文書内の項目を選択した場合に、前記電子文書内の当該項目及び当該項目と同じ内容の全ての項目をリダクションするオプションを前記ユーザに提示するステップ
    を有する方法。
  12. 前記初期メタデータを変更するステップは、前記ユーザからの前記入力に応答して前記リダクション情報を変更して、変更されたメタデータを生成するステップを有する、
    請求項11に記載の方法。
  13. 前記電子文書を受け取るステップは、オリジナルの文書の画像を前記電子文書として捕捉するステップを有する、
    請求項12に記載の方法。
  14. 前記初期メタデータを受け取るステップより前に、前記データ処理プラットフォームへ前記電子文書を送るステップを更に有する、
    請求項13に記載の方法。
  15. 前記画像を捕捉するステップ及び前記変更されたメタデータを生成するステップは、同じユーザによって引き起こされる、
    請求項13又は14に記載の方法。
  16. 前記変更されたメタデータを前記データ処理プラットフォームへ送るステップ
    を更に有する、請求項12乃至15のうちいずれか一項に記載の方法。
  17. 前記データ処理プラットフォームから更なるコンピュータデバイスへ前記変更されたメタデータを送信し、前記更なるコンピュータデバイスで、前記変更されたメタデータを確認又は変更するユーザ入力を受け取るステップを更に有する、
    請求項16に記載の方法。
  18. 前記コンピュータデバイスで入力を供給するユーザ及び前記更なるコンピュータデバイスで入力を供給するユーザは、異なるユーザである、
    請求項17に記載の方法。
  19. 画像データ上でデータをリダクションするよう構成されたシステムであって、
    ディスプレイと、
    請求項1乃至10のうちいずれか一項に記載のコンピュータデバイスと、
    データ処理プラットフォームと
    を有し、
    前記コンピュータデバイスの前記メタデータ変更部は、前記ユーザからの前記入力に応答して前記リダクション情報を変更して、変更されたリダクション情報を含む変更されたメタデータを生成し、
    前記データ処理プラットフォームは、
    電子文書内のテキストデータの位置を決定し、前記テキストデータ及び該テキストデータの位置データを有する項目メタデータを生成する画像符号化ユニットと、
    前記項目メタデータに基づき、前記電子文書でデータをリダクションするためのリダクション情報を含む初期メタデータを生成するデータ検出ユニットと、
    前記初期メタデータを前記コンピュータデバイスへ送り、前記変更されたリダクション情報を含む前記変更されたメタデータを前記コンピュータデバイスから受け取るよう、前記コンピュータデバイスと通信するネットワーク通信インターフェースと、
    前記電子文書及び前記変更されたリダクション情報から、データリダクションされた画像ファイルを生成するデータリダクション済み画像ファイル生成ユニットと、
    前記データリダクションされた画像ファイルを、前もって決定されたフォーマットに変換する文書ファイル変換部と
    を有する、
    システム。
  20. 更なるコンピュータデバイスを更に有し、
    前記データ処理プラットフォームは、前記電子文書及び前記変更されたリダクション情報を前記更なるコンピュータデバイスへ送るよう更に構成され、
    前記更なるコンピュータデバイスは、前記電子文書及び前記変更されたリダクション情報に基づき、リダクションされた文書のプレビューを表示し、確認命令又は拒否命令をユーザから受け取り、前記確認命令又は前記拒否命令を前記データ処理プラットフォームへ送るよう構成され、
    前記データ処理プラットフォームは、前記確認命令に応答して、前記データリダクションされた画像ファイルを生成するよう構成される、
    請求項19に記載のシステム。
  21. データリダクションアプリケーションのための更なるコンピュータデバイスを更に有し、
    前記データ処理プラットフォームは、前記電子文書及び前記変更されたリダクション情報を前記更なるコンピュータデバイスへ送るよう更に構成され、
    前記更なるコンピュータデバイスは、前記電子文書に基づき、リダクションされた文書のプレビューを表示し、ユーザアクションに応答して前記リダクション情報を更に変更し、前記更なるコンピュータデバイスのユーザによる前記更に変更されたリダクション情報に応答して、変更されたプレビュー画像を表示し、前記更に変更されたリダクション情報を前記データ処理プラットフォームへ送るよう構成される、
    請求項19に記載のシステム。
  22. 前記更なるコンピュータデバイスは、前記コンピュータデバイスと同じ機能を備える、
    請求項21に記載のシステム。
JP2022001738A 2021-01-11 2022-01-07 文書処理のための方法及び装置 Active JP7287510B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP21150830.4 2021-01-11
EP21150830.4A EP4027674A1 (en) 2021-01-11 2021-01-11 Method and apparatus for document processing

Publications (2)

Publication Number Publication Date
JP2022107588A JP2022107588A (ja) 2022-07-22
JP7287510B2 true JP7287510B2 (ja) 2023-06-06

Family

ID=74130048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022001738A Active JP7287510B2 (ja) 2021-01-11 2022-01-07 文書処理のための方法及び装置

Country Status (3)

Country Link
US (1) US20220222362A1 (ja)
EP (1) EP4027674A1 (ja)
JP (1) JP7287510B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002269081A (ja) 2001-01-05 2002-09-20 Fujitsu Ltd 文書匿名化装置、方法、匿名化プログラムを記録したコンピュータ読取り可能な記録媒体及びプログラム
JP2005309997A (ja) 2004-04-23 2005-11-04 Nextage:Kk 機密情報管理システム及び機密情報管理方法
JP2007299093A (ja) 2006-04-28 2007-11-15 Hitachi Software Eng Co Ltd 文書管理システム
JP2018026037A (ja) 2016-08-12 2018-02-15 株式会社リコー 情報処理装置、情報処理システム、プログラムおよび情報処理方法
JP2019082884A (ja) 2017-10-31 2019-05-30 京セラドキュメントソリューションズ株式会社 文書管理システム及び文書管理方法
JP2020170969A (ja) 2019-04-04 2020-10-15 富士通株式会社 文書出力プログラム、文書出力方法及び文書出力システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8456654B2 (en) * 2004-10-14 2013-06-04 Onstream Systems Limited Process for electronic document redaction
US20090323087A1 (en) * 2008-06-30 2009-12-31 Konica Minolta Systems Laboratory, Inc. Systems and Methods for Document Redaction
JP6544205B2 (ja) * 2015-11-04 2019-07-17 株式会社リコー 情報処理装置、プログラム、情報処理システムおよび情報処理方法
US9998525B1 (en) 2016-07-18 2018-06-12 Google Llc Reducing transmissions of redundant third-party content over a network
US10410016B1 (en) * 2018-07-05 2019-09-10 Capital One Services, Llc Cloud-based system for protecting sensitive information in shared content
US11755754B2 (en) * 2018-10-19 2023-09-12 Oracle International Corporation Systems and methods for securing data based on discovered relationships
US10594899B1 (en) * 2019-02-15 2020-03-17 Kyocera Document Solutions Inc. Methods and system for generating a confidential document

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002269081A (ja) 2001-01-05 2002-09-20 Fujitsu Ltd 文書匿名化装置、方法、匿名化プログラムを記録したコンピュータ読取り可能な記録媒体及びプログラム
JP2005309997A (ja) 2004-04-23 2005-11-04 Nextage:Kk 機密情報管理システム及び機密情報管理方法
JP2007299093A (ja) 2006-04-28 2007-11-15 Hitachi Software Eng Co Ltd 文書管理システム
JP2018026037A (ja) 2016-08-12 2018-02-15 株式会社リコー 情報処理装置、情報処理システム、プログラムおよび情報処理方法
JP2019082884A (ja) 2017-10-31 2019-05-30 京セラドキュメントソリューションズ株式会社 文書管理システム及び文書管理方法
JP2020170969A (ja) 2019-04-04 2020-10-15 富士通株式会社 文書出力プログラム、文書出力方法及び文書出力システム

Also Published As

Publication number Publication date
EP4027674A1 (en) 2022-07-13
US20220222362A1 (en) 2022-07-14
JP2022107588A (ja) 2022-07-22

Similar Documents

Publication Publication Date Title
US10742844B2 (en) Hiding sensitive data
US11379820B2 (en) Expressive digital content using payment QR codes
US9064201B2 (en) Information processing apparatus that instructs printing using metadata without divulging content of the metadata and method thereof
US20070154111A1 (en) Image display system, image registration terminal device and image reading terminal device used in the image display system
US20040034801A1 (en) Method for creating and using computer passwords
US9137405B2 (en) System for creating certified document copies
AU2021267818B2 (en) Systems and methods for creating enhanced documents for perfect automated parsing
US11537727B2 (en) Systems and methods for creating enhanced documents for perfect automated parsing
KR20210111294A (ko) 전자 콘텐츠에서 실행 가능한 주석을 위한 확장 가능한 프레임워크
JP7287510B2 (ja) 文書処理のための方法及び装置
JP7379987B2 (ja) 情報処理装置及びプログラム
US20150193870A1 (en) Generating electronic documents (edocs) for transactions
US11625207B2 (en) Information processing apparatus and non-transitory computer readable medium for suppression or prevention of work from being illegally sent to external apparatus
JP2010134561A (ja) 業務文書処理装置
JP7275698B2 (ja) 情報処理装置及びプログラム
JP2003132056A (ja) 公開文書作成支援装置
US20230368555A1 (en) Information processing apparatus, information processing method, and storage medium
JP2018116520A (ja) 文書処理システム
JP4983489B2 (ja) 情報処理装置及び情報処理プログラム
AU2016102049A4 (en) A System and Method for Facilitating Document Signing
JP2024005744A (ja) 情報処理方法、情報処理装置及びプログラム
TW202228053A (zh) 契約產生系統
JP2003132184A (ja) 公開文書決済支援装置
JP2021064209A (ja) 情報処理装置及び情報処理プログラム
JP4574575B2 (ja) 透かし情報埋め込み装置、透かし情報埋め込み方法、印刷装置、印刷物、透かし情報埋め込みプログラム、および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230508

R151 Written notification of patent or utility model registration

Ref document number: 7287510

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151