JP2021149439A - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP2021149439A
JP2021149439A JP2020048019A JP2020048019A JP2021149439A JP 2021149439 A JP2021149439 A JP 2021149439A JP 2020048019 A JP2020048019 A JP 2020048019A JP 2020048019 A JP2020048019 A JP 2020048019A JP 2021149439 A JP2021149439 A JP 2021149439A
Authority
JP
Japan
Prior art keywords
attribute
document
attribute information
information
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020048019A
Other languages
English (en)
Inventor
直弥 高山
Naoya Takayama
直弥 高山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Priority to JP2020048019A priority Critical patent/JP2021149439A/ja
Priority to US16/986,244 priority patent/US20210295033A1/en
Priority to CN202010927720.8A priority patent/CN113495874A/zh
Publication of JP2021149439A publication Critical patent/JP2021149439A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

【課題】文書に付与された属性情報を用いて検索する場合に、その属性情報をユーザーが付与できるか否か又は文書管理ソフトウェアによって抽出されるか否かにかかわらず一律に属性情報を用いた検索を行う場合に比べて、検索漏れ或いは検索ノイズの発生を抑制することができる情報処理装置を提供する。【解決手段】情報処理装置100は、メモリ110と一又は複数のプロセッサ105を備える。メモリ110は、文書に付与された属性情報と、該属性情報はユーザーが付与できる第1の属性情報又は文書管理ソフトウェアによって抽出される第2の属性情報のいずれであるかを示す情報を対応させて記憶している。プロセッサ105は、第1の属性情報と第2属性情報を用いて文書の検索を行う。【選択図】図1

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、紙文書及び文書画像に対する文書検索手段として、文字認識技術を応用して所与のキーワードを含む文書群を検索する方法を提案することを課題とし、文字認識装置と検索装置を分離し、文字認識装置の出力形態として、文字行抽出及び文字切出及び文字識別の多重仮説を恒久的に保持するファイル(文字認識装置読取仮説ファイル)を採用し、この文字認識装置読取仮説ファイルを元にキーワードを検索する機能を構成することで、必要な文書の検索及び文書分類を行うシステムを提供することが開示されている。
特許文献2には、誤認識を含んだ文書であっても確実に検索することを目的とし、活字で印刷された文書のイメージデータからテキストデータに変換が困難なとき、標準パターン等を用いて複数の変換候補を作成し、第1候補を確定文書データ、第2候補以降を変換候補データとする変換候補作成手段と、この作成された確定文書データおよび変換候補データを格納するファイルと、入力されるキーワードの文字に前記ファイルに格納されている変換候補データの文字を入れ変えて類似キーワードを作成し、キーワードと類似キーワードとからなる検索式を作成するキーワード変換手段と、ここで作成された検索式に基づいて前記ファイルから確定文書データを検索する検索手段とを設けた全文検索装置について開示されている。
特許文献3には、文字認識手段と記憶手段と文字列の指定手段とを備える情報処理装置において、文書画像より前記文字認識手段が認識したテキスト情報から、前記指定手段で指定された文字列を検索する情報処理方法であって、前記情報処理装置が有する判別手段が、特定の文字を記憶した前記記憶手段を参照して、前記指定された文字列中に前記特定の文字が含まれているか判別する判別工程と、前記情報処理装置が有する生成手段が、前記判別工程で前記特定の文字が含まれていると判別された場合、前記指定された文字列中の連続した文字であって、前記特定の文字を文字列中に含まない部分文字列を全て生成する生成工程と、前記情報処理装置が有する検出手段が、前記テキスト情報から作成した、前記部分文字列と同じ文字数のインデックスに、前記部分文字列が全て含まれていることを検出する検出工程と、前記情報処理装置が有する判断手段が、前記検出工程で前記部分文字列が含まれていると検出された場合、前記指定された文字列中の前記特定の文字を所定文字数以内の他の文字列に代えた文字列パターンが前記テキスト情報に含まれているか判断する判断工程と、前記情報処理装置が有する表示手段が、前記判断工程で前記文字列パターンを含むと判断されたテキスト情報または対応する文書画像を検索結果として表示装置に表示する表示工程とを備えることが開示されている。
特開2004−171316号公報 特開平07−160730号公報 特許第3689455号公報
文書に付与された属性情報を用いて検索する場合に、その属性情報をユーザーが付与できるか否か、又は、文書管理ソフトウェアによって抽出されるか否かにかかわらず一律に属性情報を用いて検索が行われている。そのため、検索漏れ、又は、検索ノイズが発生する。そこで本発明では、文書に付与された属性情報を用いて検索する場合に、その属性情報をユーザーが付与できるか否か、又は、文書管理ソフトウェアによって抽出されるか否かにかかわらず一律に属性情報を用いた検索を行う場合に比べて、検索漏れ、又は、検索ノイズの発生を抑制することができる情報処理装置及び情報処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、メモリと一又は複数のプロセッサを備え、前記メモリは、文書に付与された属性情報と、該属性情報はユーザーが付与できる第1の属性情報又は文書管理ソフトウェアによって抽出される第2の属性情報のいずれであるかを示す情報を対応させて記憶しており、前記プロセッサは、前記第1の属性情報と前記第2属性情報を用いて文書の検索を行う、情報処理装置である。
請求項2の発明は、前記第2の属性情報は、複数の種類があり、前記プロセッサは、前記第2の属性情報の種類の優先順位を用いて検索を行う、請求項1に記載の情報処理装置である。
請求項3の発明は、前記文書は画像であり、前記第2の属性情報として、画像を解析した結果を含み、第2の属性情報の前記種類として、文字の形態、文字が記載されている位置、文字列の統計的情報、文字列の品詞、予め定められた文字列と予め定められた位置関係にある文字列のいずれか1つ以上を有し、前記プロセッサは、前記種類の優先順位を変更することを可能とし、検索にあたって第2の属性情報を用いる上位の順位を指定することを可能とする、請求項2に記載の情報処理装置である。
請求項4の発明は、前記プロセッサは、前記第1の属性情報に対しては、検索における完全一致と部分一致のいずれかを指定することを可能とし、前記第2の属性情報に対しては、部分一致による検索を行う、請求項1に記載の情報処理装置である。
請求項5の発明は、メモリと一又は複数のプロセッサを備えたコンピュータの前記メモリは、文書に付与された属性情報と、該属性情報はユーザーが付与できる第1の属性情報又は文書管理ソフトウェアによって抽出される第2の属性情報のいずれであるかを示す情報を対応させて記憶しており、前記プロセッサに、前記第1の属性情報と前記第2の属性情報を用いて文書の検索を行う、処理を実行させるための情報処理プログラムである。
請求項1の情報処理装置によれば、文書に付与された属性情報を用いて検索する場合に、その属性情報をユーザーが付与できるか否か、又は、文書管理ソフトウェアによって抽出されるか否かにかかわらず一律に属性情報を用いた検索を行う場合に比べて、検索漏れ、又は、検索ノイズの発生を抑制することができる。
請求項2の情報処理装置によれば、第2の属性情報の種類の優先順位を用いて検索を行うことができる。
請求項3の情報処理装置によれば、文書が画像である場合、画像を解析した結果を第2の属性情報内に含めて、検索にあたって第2の属性情報を用いる上位の順位を指定することを可能とすることができる。
請求項4の情報処理装置によれば、第1の属性情報に対しては、検索における完全一致と部分一致のいずれかを指定することを可能とし、第2の属性情報に対しては、部分一致による検索を行うことができる。
請求項5の情報処理プログラムによれば、文書に付与された属性情報を用いて検索する場合に、その属性情報をユーザーが付与できるか否か、又は、文書管理ソフトウェアによって抽出されるか否かにかかわらず一律に属性情報を用いた検索を行う場合に比べて、検索漏れ、又は、検索ノイズの発生を抑制することができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を利用したシステム構成例を示す説明図である。 本実施の形態の処理例を示す説明図である。 本実施の形態の具体的なモジュール構成を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 環境設定(属性A抽出規則)画面の表示例を示す説明図である。 環境設定(属性A抽出規則)画面の表示例を示す説明図である。 環境設定(属性B抽出規則)画面の表示例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示す説明図である。 属性B表示領域の表示例を示す説明図である。 属性検索画面の表示例を示す説明図である。 検索結果画面の表示例を示す説明図である。 キー・バリュー抽出テーブルのデータ構造例を示す説明図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(「ソフトウェア」の解釈として、コンピュータ・プログラムを含む)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(例えば、コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(例えば、データの授受、指示、データ間の参照関係、ログイン等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(「2以上の値」には、もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(「ネットワーク」には、一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(つまり、社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。
本実施の形態である情報処理装置100は、文書に付与された属性情報を用いた検索機能を有している。図1の例に示すように、情報処理装置100は、少なくともプロセッサ105、メモリ110を有しており、それらをつないでデータのやりとりをするためのバス198により構成されている。この他に、情報処理装置100は、出力装置185、受付装置190、通信装置195を有していてもよい。そして、バス198を介して、プロセッサ105、メモリ110、出力装置185、受付装置190、通信装置195の間でデータのやりとりが行われる。
なお、図1の例に示すブロック図は、本実施の形態を実現するコンピュータのハードウェア構成例をも示している。本実施の形態としてのプログラムが実行されるコンピュータのハードウェア構成は、図1に例示するようなコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ等である。具体例として、処理部としてプロセッサ105を用い、記憶装置としてメモリ110を用いている。
プロセッサ105は、1つであってもよいし、複数あってもよい。プロセッサ105として、例えば、CPU(Central Processing Unitの略)、マイクロプロセッサ等を含む。複数のプロセッサ105を用いる場合は、密結合マルチプロセッサ、疎結合マルチプロセッサのいずれの形態であってもよい。例えば、1つのプロセッサ105内に複数のプロセッサ・コアが搭載されていてもよい。さらに、複数のコンピュータを通信路で結んで仮想的に一台のコンピュータのように振る舞わせるシステムとしてもよい。具体例として、疎結合マルチプロセッサであって、クラスタシステム、コンピュータクラスタとして構成してもよい。プロセッサ105は、プログラムメモリ120内のプログラムを実行する。
メモリ110として、例えば、レジスタやキャッシュメモリ等のプロセッサ105内部の半導体メモリを含めてもよいし、RAM(Random Access Memoryの略)やROM(Read Only Memoryの略)等によって構成される主記憶装置であるメインメモリであってもよいし、永続性記憶装置としての機能を有するHDD(Hard Disk Driveの略)やSSD(Solid State Driveの略)の内部記憶装置、CD、DVD、Blu−ray(登録商標) Disc、USBメモリ、メモリーカード等の外部記憶装置又は補助記憶装置であってもよいし、また、通信回線を介して接続されたサーバー等の記憶装置を含めてもよい。
メモリ110は、主にプログラムを記憶するプログラムメモリ120と主にデータを記憶するデータメモリ115を有している。なお、プログラムメモリ120、データメモリ115には、図示しているモジュールのプログラムの他、本コンピュータを起動するためのOS等のプログラム、モジュールの実行において適宜変化するパラメータ等のデータが格納されていてもよい。
出力装置185は、例えば、表示装置187、印刷装置189等を有している。液晶ディスプレイ、有機ELディスプレイ、3次元ディスプレイ等の表示装置187は、プロセッサ105による処理結果、データメモリ115内のデータ等を、テキストやイメージ情報等として表示する。プリンタ、複合機等の印刷装置189は、プロセッサ105による処理結果、データメモリ115内のデータ等を印刷する。また、出力装置185として、スピーカー、機器を振動させるアクチュエータ等を含んでいてもよい。
受付装置190は、例えば、指示受付装置192、文書読取装置194等を有している。キーボード、マウス、マイク、カメラ(視線検知カメラ等を含む)等の指示受付装置192は、これらに対する利用者の操作(動作、音声、視線等を含む)に基づいたデータを受け付ける。
また、タッチスクリーンのように、表示装置187と指示受付装置192の両方の機能を備えているものがあってもよい。その場合、キーボードの機能の実現について、物理的なキーが存在しなくても、タッチスクリーン上にソフトウェアでキーボード(いわゆるソフトウェアキーボード、スクリーンキーボード等ともいわれる)を描画して、キーボードの機能を実現するようにしてもよい。
なお、ユーザーインタフェースとして、主に、表示装置187、指示受付装置192が用いられる。
スキャナ、カメラ等の文書読取装置194は、文書を読み取り又は撮影して、発生する画像データを受け付ける。
通信装置195は、通信回線を介して他の装置と接続するためのネットワークカード等の通信回線インタフェースである。
本実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のプログラムメモリ120にソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、本実施の形態が実現される。
なお、図1に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図1に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、プロセッサ105として、GPU(Graphics Processing Unitの略、GPGPU(General−Purpose computing on Graphics Processing Unitsの略)を含む)を用いてもよいし、一部のモジュールの実行を専用のハードウェア(例えば特定用途向け集積回路(具体例として、ASIC(Application Specific Integrated Circuitの略)等がある)や再構成可能な集積回路(具体例として、FPGA(Field−Programmable Gate Arrayの略)等がある)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図1に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等に組み込まれていてもよい。
プロセッサ105は、バス198を介してメモリ110、出力装置185、受付装置190、通信装置195と接続されている。プロセッサ105は、プログラムメモリ120内のプログラムである各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する。例えば、文書読取装置194が文書の画像を読み取ったこと、又は、指示受付装置192によってユーザーの操作を受け付けたことを契機として、プログラムメモリ120内のその契機に対応するモジュールによる処理を実行し、その処理結果をデータメモリ115に記憶させたり、表示装置187に出力したり、通信装置195を制御して他の装置に送信したりする。
メモリ110は、データメモリ115、プログラムメモリ120を有しており、バス198を介してプロセッサ105、出力装置185、受付装置190、通信装置195と接続されている。
データメモリ115は、文書記憶モジュール125、属性記憶モジュール130を記憶している。
文書記憶モジュール125は、文書を記憶している。ここで「文書(ファイルとも言われる)」とは、テキストデータ、数値データ、図形データ、画像データ、動画データ、音声データ等、又は、これらの組み合わせであり、記憶、編集及び検索等の対象となり、システム又は利用者間で個別の単位として交換できるものをいい、これらに類似するものを含む。具体的には、文書は、文書管理ソフトウェア(文書作成プログラム、いわゆるワープロソフト等を含む)によって作成された文書、画像読取装置(スキャナー等)で読み込まれた画像、Webページ等を含む。
属性記憶モジュール130は、文書に付与された属性情報を記憶している。この属性情報は、検索対象となり、文書を検索するために利用される。属性情報は、大別して2種類ある。1つ目は、ユーザーが付与できる第1の属性情報であり、2つ目は、文書管理ソフトウェアによって抽出される第2の属性情報である。つまり、属性記憶モジュール130は、文書に付与された属性情報と、その属性情報は第1の属性情報、又は、第2の属性情報のいずれであるかを示す情報を対応させて記憶している。「第1の属性情報、又は、第2の属性情報のいずれであるかを示す情報」として、例えば、第1の属性情報を示すフラグであってもよいし、第2の属性情報であることを示すフラグであってもよいし、第1の属性情報と第2の属性情報を区別できるように、それぞれを別個のテーブルに記憶させるようにしてもよい。さらに、第1の属性情報は、複数の種類があってもよい。後述するように、例えば、文書作成日時、文書作成者等がある。そして、第2の属性情報は、複数の種類があってもよい。後述するように、例えば、文字の形態、文字が記載されている位置等がある。
ここで「第1の属性情報」とは、文書作成者等のユーザーが付与できる属性情報である。一般的に、文書のプロパティといわれるものであり、ユーザーが入力できるものである。ユーザーによる入力は可能性で足りる。したがって、文書管理ソフトウェアが入力してもよい。文書管理ソフトウェアが入力した場合であっても、属性表示画面において、ユーザーが修正可能になっている。つまり、ユーザーが付与できるとは、ユーザーが属性の値を入力すること、又は、属性の値をユーザーが修正可能であればよい。後者の例として、例えば、文書作成日時、文書作成者等の属性が該当する。「文書作成日時」は文書保存日時に応じてパソコン等のユーザーが用いている端末等が付ける属性情報であり、「文書作成者」は文書管理ソフトウェアが付ける属性情報であるが、ユーザーが修正可能な情報である。なお、ユーザーは、文書の内容又は属性情報の編集可能な者であればよく、例えば、文書作成者のほか、文書修正者、校正者、文書作成者の上司等が含まれていてもよいし、これらのうち、限定した者であってもよい。
また、「第2の属性情報」とは、文書の内容に応じて定まる属性情報であり、文書管理ソフトウェアによって文書から抽出される属性情報である。例えば、文書が画像である場合に、文字認識を行って、文書内の文字画像を認識した結果であるテキストを第2の属性情報とすることができる。また、文書内の文字画像の画像解析、言語処理等を行った結果を第2の属性情報としてもよい。具体的には、後述する「文字の形態」、「文字が記載されている位置」、「文字列の統計的情報」、「文字列の品詞」、「予め定められた文字列と予め定められた位置関係にある文字列」がある。
具体的には、第2の属性情報を付与するとのユーザーの指示があった場合は、その属性情報の内容は、文書管理ソフトウェアが抽出、算出等した値であってもよい。具体例をもって示すと、文字の形態の一例である「文字の大きさ」を属性情報として付与した場合、文書管理ソフトウェアが、文書内の各文字の大きさを抽出し、閾値以上の大きさである文字列を抽出することによって、文書内の「文字の大きさが閾値以上である文字列(具体的な文字列)」を、自動的に「文字の大きさ」という属性情報の内容とするようにしてもよい。第2の属性情報は、文書管理ソフトウェアが抽出した属性であって、ユーザーが文書から抽出することはしない。もちろんのことながら、属性情報の内容を、ユーザーが変更可能であることを妨げるものではない。
なお、「第1の属性情報」はユーザーが介在する確実な情報であり、「第2の属性情報」は文書管理ソフトウェアによって自動的に付与されるため、特に文字認識の性能によって異なる可能性があることから「不確実な属性情報」でもあるといえる。以後、「第1の属性情報」を属性Aともいう。「第2の属性情報」を属性Bともいう。
プログラムメモリ120は、検索モジュール135、属性付与(A)モジュール140、属性付与(B)モジュール145を記憶している。
検索モジュール135は、第1の属性情報と第2属性情報を用いて文書の検索を行う。
また、検索モジュール135は、第2の属性情報の種類の優先順位を用いて検索を行うようにしてもよい。
そして、文書は画像であり、第2の属性情報として、画像を解析した結果を含んでいる場合であって、第2の属性情報の種類として、文字の形態、文字が記載されている位置、文字列の統計的情報、文字列の品詞、予め定められた文字列と予め定められた位置関係にある文字列のいずれか1つ以上を有していてもよい。
この場合、検索モジュール135は、種類の優先順位を変更することを可能とし、検索にあたって第2の属性情報を用いる上位の順位を指定することを可能としてもよい。
ここで「画像を解析」として、画像内の文字認識を行うこと、文字の位置、大きさ、書体等を抽出することが含まれる。
「文字の形態」として、文字の大きさ、文字の色、文字の書体(フォント)、手書き/印刷文字等がある。「文字が記載されている位置」として、文書のヘッダー又はフッター、右上、右下、左上、左下等がある。「文字列の統計的情報」として、文書中の文字列の出現回数、tf−idf等がある。なお、ここでの文字列は、形態素解析を行って単語として抽出できたものとしてもよい。「文字列の品詞」として、名詞、動詞、形容詞、副詞等がある。さらに、名詞を人物名、地名等に分けるようにしてもよい。「予め定められた文字列と予め定められた位置関係にある文字列」として、予め定められた文字列と予め定められた位置関係とを対応させて記憶しておき、文字認識結果に予め定められた文字列があった場合は、画像内のその文字列と予め定められた位置関係にある文字列の文字認識結果を抽出すればよい。例えば、予め定められた文字列として「作成者」があり、予め定められた位置関係として、「作成者と記載されている文字列の右に記載されている文字列」である場合に、文字認識結果に「作成者」がある場合は、その「作成者」と記載されている位置の右に記載されている文字列を作成者の名前として抽出することが該当する。
また、検索モジュール135は、第1の属性情報に対しては、検索における完全一致と部分一致のいずれかを指定することを可能とし、第2の属性情報に対しては、部分一致による検索を行うようにしてもよい。
属性付与(A)モジュール140は、文書に第1の属性情報を付与する。前述したように、例えば、ユーザーが付与してもよいし、パソコン内の文書管理ソフトウェアが、文書を保存した日時を、第1の属性情報である「文書作成日時」として付与してもよい。また、文書読取装置194が文書を読み取った日時を、「文書作成日時」として付与してもよい。そして、文書管理ソフトウェアが、操作者を、「文書作成者」として付与してもよい。また、文書読取装置194にログインした操作者を、「文書作成者」として付与してもよい。これらの属性は、文書管理ソフトウェアが自動的に付与する例として挙げたが、前述したように、ユーザーが付与することも可能であり、その属性の値をユーザーが修正することも可能である。ユーザーが修正する例は、図6の例を用いて後述する。
属性付与(B)モジュール145は、画像処理モジュール150、文字認識モジュール155を有している。属性付与(B)モジュール145は、文書に第2の属性情報を付与する。
画像処理モジュール150は、文書である画像を解析して、「文字の形態」、「文字が記載されている位置」を抽出し、第2の属性として、文書に付与する。
文字認識モジュール155は、文書である画像内の文字画像を文字認識し、文字認識結果であるテキストを第2の属性情報として、文書に付与する。さらに、文字認識モジュール155は、文字認識結果に対して、形態素解析等の言語処理を行ってもよい。そして、「文字列の統計的情報」、「文字列の品詞」、「予め定められた文字列と予め定められた位置関係にある文字列」を抽出し、第2の属性として、文書に付与する。これらの属性は、ユーザーが文書から抽出することはしない属性である。
図2(a)は、スタンドアロン型のシステムとして構築した例を示すものである。
情報処理装置100と画像処理装置200は接続されている。画像処理装置200は、文書をスキャンする機能、印刷する機能等を有している。例えば、複合機である。情報処理装置100は、印刷装置189、文書読取装置194の機能を、画像処理装置200を用いて実現することになる。なお、画像処理装置200内に情報処理装置100を内蔵させ、画像処理装置200だけで文書の検索を行うようにしてもよい。
図2(b)は、ネットワーク型のシステムとして構築した例を示すものである。
情報処理装置100、画像処理装置200、ユーザー端末210A、ユーザー端末210Bは、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、情報処理装置100による機能は、クラウドサービスとして実現してもよい。
図2(a)、図2(b)のいずれの形態であっても、例えば、ユーザーは、画像処理装置200のスキャナ機能を用いて紙の文書を読み取って、その文書の画像を情報処理装置100に記憶させる。その際に、文書に第1の属性情報、第2の属性情報を付与する。そして、ユーザーは、ユーザー端末210を用いて、情報処理装置100に記憶されている文書を検索する。例えば、ユーザー端末210のブラウザを用いて、情報処理装置100に接続し、情報処理装置100の機能によって、文書を検索する。
図3は、本実施の形態の処理例を示す説明図である。
情報処理装置300内のモジュール構成について、図1の例に示したモジュール構成と比較して説明する。
情報処理装置300は、属性検索ツール335、文書管理ソフト340、フォルダ325a、フォルダ325b等を有している。
画像処理装置200は、情報処理装置300の文書管理ソフト340と接続されている。画像処理装置200は、文書390を読み込んで、文書390の画像を文書として、情報処理装置300に渡す。
文書管理ソフト340は、文書(文書390の画像)を解析して、その解析結果に応じて、文書に属性を付与する。そして、その属性にしたがって、文書をフォルダ325a、フォルダ325bのいずれか又は両方に格納する。
属性検索ツール335は、ユーザーの検索指示にしたがって、属性を検索キーとして、フォルダ325a、フォルダ325bから文書の検索を行う。
フォルダ325は、情報処理装置100の文書記憶モジュール125に該当する。そして、属性記憶モジュール130としての機能を有している。
属性検索ツール335は、情報処理装置100の検索モジュール135に該当する。
文書管理ソフト340は、情報処理装置100の属性付与(A)モジュール140と属性付与(B)モジュール145に該当する。
図4は、本実施の形態の具体的なモジュール構成を示す説明図である。図3の例に示した文書管理ソフト340、属性検索ツール335の詳細なモジュール構成例を示すものである。
文書管理ソフト340は、文書取得モジュール405、文字認識実行モジュール410、文書管理モジュール/表示モジュール415、出力モジュール420、環境設定モジュール425を有している。属性検索ツール335は、検索条件設定モジュール430、検索モジュール/結果表示モジュール435を有している。
画像処理装置200は、文書管理ソフト340の文書取得モジュール405と接続されている。画像処理装置200は、読み取った文書を文書取得モジュール405に渡す。
文書取得モジュール405は、画像処理装置200、文字認識実行モジュール410、文書管理モジュール/表示モジュール415と接続されている。文書取得モジュール405は、画像処理装置200から文書を取得し、その文書を文字認識実行モジュール410、文書管理モジュール/表示モジュール415に渡す。
文字認識実行モジュール410は、文書取得モジュール405、文書管理モジュール/表示モジュール415と接続されている。文字認識実行モジュール410は、文書内を文字認識し、認識結果であるテキストを文書管理モジュール/表示モジュール415に渡す。また、その文字認識に際して、文書を解析して、文字の形態、文字が記載されている位置等を抽出する。さらに、言語処理を行って、文字列の統計的情報、文字列の品詞等を抽出する。また、予め定められた文字列と予め定められた位置関係にある文字列を抽出する。
文書管理モジュール/表示モジュール415は、文書取得モジュール405、文字認識実行モジュール410、出力モジュール420、環境設定モジュール425と接続されている。文書管理モジュール/表示モジュール415は、文字認識実行モジュール410によって抽出された情報を属性情報として、文書に対応付ける。そして、文書と属性情報を表示し、ユーザーが第2の属性情報を修正可能とする。
出力モジュール420は、文書管理モジュール/表示モジュール415、格納モジュール490と接続されている。出力モジュール420は、文書管理モジュール/表示モジュール415によって属性情報が付与された文書を格納モジュール490に記憶させる。
環境設定モジュール425は、文書管理モジュール/表示モジュール415、属性検索ツール335の検索条件設定モジュール430と接続されている。環境設定モジュール425は、属性情報の取得条件を環境設定としてユーザーの指示にしたがって設定する。詳細については、図6の例に示す環境設定(属性A抽出規則)画面600、図7の例に示す環境設定(属性B抽出規則)画面700を用いて後述する。
検索条件設定モジュール430は、文書管理ソフト340の環境設定モジュール425、検索モジュール/結果表示モジュール435と接続されている。検索条件設定モジュール430は、環境設定モジュール425から環境設定を受け取り、検索における条件として検索モジュール/結果表示モジュール435に渡す。
検索モジュール/結果表示モジュール435は、検索条件設定モジュール430、格納モジュール490と接続されている。検索モジュール/結果表示モジュール435は、検索条件設定モジュール430から受け取った環境設定、ユーザーによる検索指示にしたがって、格納モジュール490内から検索条件に適合する属性情報を有する文書を検索する。
格納モジュール490は、文書管理ソフト340の出力モジュール420、属性検索ツール335の検索モジュール/結果表示モジュール435と接続されている。格納モジュール490は、文書とその文書に付与された属性情報を記憶している。具体的には、図3の例に示したフォルダ325a、フォルダ325bが該当する。
図5は、本実施の形態による処理例を示すフローチャートである。文書と属性情報の登録、文書の検索を含む全体の処理例を示すものである。
ステップS502では、画像処理装置200によってスキャンされた文書を情報処理装置300が取得する。
ステップS504では、環境設定で属性情報、登録先を設定する。
ステップS502、ステップS504の処理は、事前準備である。
ステップS506では、文書が選択されると、文書管理ソフト340が起動する。
ステップS508では、文書から属性A、属性Bを抽出する。ステップS508の詳細な処理については、図8の例に示すフローチャートを用いて後述する。属性Bとして、文書が画像である場合は、文字認識の結果を利用し、テキスト文書(ワープロソフトによって作成された文書を含む)である場合は、その文書内の全文を利用する。
ステップS510では、属性A、属性Bを表示して、ユーザーによる確認、修正を受けて登録する。具体的には、文書をフォルダに格納する。
ステップS504〜ステップS510の処理は、文書管理ソフト340によって行われる。
ステップS512では、ユーザーの操作に応じて、検索条件を設定して検索を行う。そして、検索結果を表示する。
ステップS514では、検索結果に文書があったか否かを判断し、あった場合は処理を終了し(ステップS599)、それ以外の場合はステップS512へ戻る。
ステップS512、ステップS514の処理は、属性検索ツール335によって行われる。
図6は、環境設定(属性A抽出規則)画面600の表示例を示す説明図である。
環境設定(属性A抽出規則)画面600は、環境設定モジュール425によって、属性Aを付与する規則を定めるために表示され、ユーザーの操作にしたがって設定される。
図6(a)の例に示すように、環境設定(属性A抽出規則)画面600には、文書種類一覧表示領域605、プロパティボタン610等を表示する。
文書種類一覧表示領域605内の「文書種類」が選択された状態で、プロパティボタン610が、ユーザーによってクリックされたことを検知した場合は、その文書種類の編集画面を表示する。図6(a)の例では、文書種類一覧表示領域605内の「領収書」が選択された状態で、プロパティボタン610が、ユーザーによってクリックされたことを検知したので、図6(b)の例に示す領収書の編集画面650を表示する。
図6(b)の例に示す領収書の編集画面650では、属性名欄655,種類欄660、値欄665、追加ボタン670、一覧表示領域675等を表示する。一覧表示領域675では、属性名、その属性の種類、値、必須入力であるか否か、編集禁止であるか否かを指定できるようにしている。例えば、一覧表示領域675内にない名前の属性を属性名欄655で入力した場合(図6(b)の例では、「123」)には、追加ボタン670を有効にする。追加ボタン670が選択されると、属性名欄655,種類欄660、値欄665内の内容で、一覧表示領域675内に追加する。
また、図6(c)の例に示すように、一覧表示領域675で属性がユーザーによって選択されたことを検知すると、変更ボタン680を有効にする。変更ボタン680が選択されると、属性名欄655,種類欄660、値欄665内の内容で、属性を設定する。
図7は、環境設定(属性B抽出規則)画面700の表示例を示す説明図である。
環境設定(属性B抽出規則)画面700は、環境設定モジュール425によって、属性Bを抽出する規則を定めるために表示され、ユーザーの操作にしたがって設定される。
環境設定(属性B抽出規則)画面700には、大きい文字欄705、ヘッダー領域、フッター領域の抽出欄710、ワード出現回数欄715、キー・バリュー抽出欄720、抽出品詞欄725、フォント指定欄730、手書き文字/印刷文字の抽出欄735を表示する。
大きい文字欄705では、属性Bとして大きい文字を抽出する規則を定めている。例えば、文字を大きい文字として抽出する対象として「10ポイント以上」の他に、「文書内で上位2番目までの大きさの文字」等がある。「文字の形態」の一例を示すものである。この他に、文字の色等を設定できるようにしてもよい。
ヘッダー領域、フッター領域の抽出欄710では、属性Bとしてヘッダー又はフッターを抽出する規則を定めている。例えば、「ヘッダー、フッターの両方」の他に、「ヘッダーのみ」、「フッターのみ」、「不要」等がある。「文字が記載されている位置」の一例を示すものである。
ワード出現回数欄715では、属性Bとして単語の出現回数で単語を抽出する規則を定めている。例えば、文書内の出現回数が上位の5位まである「トップ5」の他に、「5回以上出現している」等がある。「文字列の統計的情報」の一例を示すものである。
キー・バリュー抽出欄720では、属性Bとして「予め定められた文字列と予め定められた位置関係にある文字列」を抽出する処理(以下、キー・バリュー処理ともいう)の規則を定めている。例えば、「規則1」等がある。図13は、キー・バリュー抽出テーブル1300のデータ構造例を示す説明図である。「予め定められた文字列とその文字列と予め定められた位置関係にある文字列」を抽出するための規則の一例を示すものである。キー・バリュー抽出テーブル1300は、キー欄1305、バリュー抽出規則欄1310を有している。キー欄1305は、「予め定められた文字列」であるキーを記憶している。バリュー抽出規則欄1310は、バリュー抽出規則を記憶している。
例えば、規則1として、キー・バリュー抽出テーブル1300の1行目は、キーである「請求番号」のバリュー抽出規則は『「請求番号」が記載された位置の右側にある英数字の10桁を「請求書番号」として抽出』であることを示している。画像処理装置200のオプション機能、又は、情報処理装置100は、このキー・バリュー抽出テーブル1300にしたがって、属性値を抽出する。具体的には、文書内の文字画像を文字認識し、その文字認識結果にキー欄1305内の文字例がある場合は、バリュー抽出規則欄1310内の規則にしたがって、属性値を抽出する。これによって、予め定められた文字列とその文字列と予め定められた位置関係にある文字列を抽出することができる。
抽出品詞欄725では、属性Bとして品詞を用いて単語を抽出する規則を定めている。例えば、「人物名(代名詞を含む)」の他に、「名詞」、「東京都の住所」等がある。これは、形態素解析等によって、文書内の単語(文字認識結果を含む)の品詞を決定した結果を用いればよい。
フォント指定欄730では、属性Bとしてフォントを用いて単語を抽出する規則を定めている。「指定なし」の他に、「明朝体」、「ゴシック体」、「OCR−B体」等がある。「文字の形態」の一例を示すものである。
手書き文字/印刷文字の抽出欄735では、属性Bとして手書き文字か印刷文字かで単語を抽出する規則を定めている。例えば、「手書き文字」の他に、「印刷文字」、「指定なし」等がある。「文字の形態」の一例を示すものである。なお、「指定なし」の場合は、手書き文字と印刷文字の両方である。
図8は、本実施の形態による処理例を示すフローチャートである。図5の例に示したフローチャート内のステップS508の詳細な処理例を示すものである。
ステップS802では、対象となっている文書から属性Aを抽出する。文書に既に付与されている属性であって、例えば、属性Aであることを示すフラグが付加されているものである。
ステップS804では、その文書に対して文字認識を行う。
ステップS806では、文字の形態等を解析する。前述したように、文字の大きさ、色、手書きであるか印刷文字であるか、文字が記載されている位置等を抽出する。
ステップS808では、形態素解析等の言語処理を行う。前述したように、文字列の統計的情報、文字列の品詞等を抽出する。
ステップS810では、属性Bを抽出する。図7の例で示した環境設定(属性B抽出規則)画面700によって定められた規則にしたがって、属性Bを抽出すればよい。また、キー・バリュー処理によって、属性Bとなる文字列を抽出する。そして、それらの属性Bには、属性Bであることを示すフラグを付加して、対象となっている文書に付与する。
図9は、本実施の形態による処理例を示す説明図である。
画面900には、文書表示領域910、文書種類表示領域915、属性A表示領域920、属性B表示領域930、登録先表示領域940、登録ボタン950等を表示する。文書管理モジュール/表示モジュール415が、画面900を表示する。
文書表示領域910には、対象としている文書を表示する。プレビュー表示ともいわれる。
属性A表示領域920には、環境設定(属性A抽出規則)画面600で設定された規則にしたがって抽出された属性Aを表示する。
例えば、属性A表示領域920には、文書種類「〇〇〇」として、1行目には、属性名「文書作成日時」、種類「日時」、入力欄「2020/02/20(木)20:20:20」が示されており、2行目には、属性名「文書作成者」、種類「テキスト」、入力欄「xyz」が示されており、3行目には、属性名「データ形態」、種類「テキスト」、入力欄「画像」が示されている。
属性B表示領域930には、環境設定(属性B抽出規則)画面700で設定された規則にしたがって抽出された属性Bを表示する。なお、属性B表示領域930の詳細については、図10の例を用いて後述する。
登録先表示領域940には、その文書の登録先についての情報を表示する。例えば、登録先表示領域940には、登録先を示す情報として、ルートフォルダ「c¥DdddWwwww¥ユーザーフォルダ」、フォルダ名「設計書」、ファイル名「開発G_インストーラ開発環境の検討.xdw」が示されている。
画面900の
・文書種類915
・属性A表示領域920
・属性B表示領域930
に表示された属性を、「登録」ボタン950がユーザーにクリックされたことを検知した場合に、文書に属性として付与する。そして、登録先表示領域940に表示された登録先に文書を格納する。
図10は、属性B表示領域930の表示例を示す説明図である。
属性B表示領域930には、属性B(大きい文字)欄1010、キーワード欄1015、属性B(ヘッダー領域、フッター領域の抽出)欄1020、キーワード欄1025、属性B(ワード出現回数)欄1030、キーワード欄1035、属性B(キー・バリュー抽出)欄1040、キーワード欄1045、属性B(抽出品詞)欄1050、キーワード欄1055、属性B(フォント指定)欄1060、キーワード欄1065、属性B(手書き文字/印刷文字の抽出)欄1070、キーワード欄1075、優先度変更(上)ボタン1090A、優先度変更(下)ボタン1090Bを表示する。これらの表示内容は、図7の例で示した環境設定(属性B抽出規則)画面700で設定された規則にしたがって抽出された結果である。
属性B(大きい文字)欄1010では、文字の大きさが大である単語の抽出結果を表示している。具体的には、キーワード欄1015に、属性Bのキーワードとして大きな文字で記載された「インストーラ 開発 環境」が抽出されている。
属性B(ヘッダー領域、フッター領域の抽出)欄1020では、ヘッダー領域とフッター領域に記載されている単語の抽出結果を表示している。具体的には、キーワード欄1025では、属性Bのキーワードとしてヘッダー領域又はフッター領域に記載された「開示 範囲 ソリューション 開発部…」が抽出されている。
属性B(ワード出現回数)欄1030では、出現回数が上位5位(出現回数が多いものが上位)までの単語の抽出結果を表示している。具体的には、キーワード欄1035では、属性Bのキーワードとして出現回数が多い「インストーラ 開発 環境」が抽出されている。
属性B(キー・バリュー抽出)欄1040では、キー・バリュー抽出処理による単語の抽出結果を表示している。具体的には、キーワード欄1045では、属性Bのキーワードとして抽出結果である「5年 2019年 11月 11日 …」が抽出されている。
属性B(抽出品詞)欄1050では、人物名である単語の抽出結果を表示している。具体的には、キーワード欄1055では、属性Bのキーワードとして人物名である「ABCD」が抽出されている。
属性B(フォント指定)欄1060では、指定されたフォントの抽出結果を表示している。具体的には、キーワード欄1065では、属性Bのキーワードとして指定されたフォントで記載された「事業 本部 会社…」が抽出されている。
属性B(手書き文字/印刷文字の抽出)欄1070では、指定された手書き文字(又は印刷文字)である単語の抽出結果を表示している。具体的には、キーワード欄1075では、属性Bのキーワードとして手書き文字である「あいうえ」が抽出されている。
また、優先度変更(上)ボタン1090A、優先度変更(下)ボタン1090Bにより、検索の対象とする場合の優先度を変更することが可能である。具体的には、属性B(大きい文字)欄1010、属性B(ヘッダー領域、フッター領域の抽出)欄1020、属性B(ワード出現回数)欄1030、属性B(キー・バリュー抽出)欄1040、属性B(抽出品詞)欄1050、属性B(フォント指定)欄1060、属性B(手書き文字/印刷文字の抽出)欄1070のいずれかを選択し、優先度変更(上)ボタン1090A又は優先度変更(下)ボタン1090Bを選択すると、選択された属性B(大きい文字)欄1010等が上下する。その結果、属性B表示領域930内の順位が変更されることになる。つまり、これらの属性Bを検索の対象とする場合に、上側にあるキーワードほど、検索対象として採用される可能性が高いキーワードとなる。これによって、属性Bの優先順位を変更することを可能としている。
また、属性B(大きい文字)欄1010、属性B(ヘッダー領域、フッター領域の抽出)欄1020、属性B(ワード出現回数)欄1030、属性B(キー・バリュー抽出)欄1040、属性B(抽出品詞)欄1050、属性B(フォント指定)欄1060、属性B(手書き文字/印刷文字の抽出)欄1070内において、図7の例に示した設定ができるようにしてもよい。例えば、属性B(フォント指定)欄1060内で、「明朝体」、「ゴシック体」、「OCR−B体」等を設定できるようにしてもよい。
また、キーワード欄1015、キーワード欄1025、キーワード欄1035、キーワード欄1045、キーワード欄1055、キーワード欄1065、キーワード欄1075内のキーワードを、ユーザーの操作にしたがって、変更することができる。キーワード欄1015等内のキーワードは、文字認識結果であり、誤認識している場合があるからである。
図11は、属性検索画面1100の表示例を示す説明図である。
属性検索画面1100は、属性検索ツール335内の検索条件設定モジュール430によって表示される画面であって、ユーザーが検索を指示するための画面である。
属性検索画面1100には、探す場所欄1105、サブフォルダも検索チェック欄1110、属性Aの検索条件欄1115、属性Bの検索条件欄1140、検索ボタン1190を表示する。
探す場所欄1105は、検索対象となる文書が格納されている場所が指定される。具体的には、フォルダ、URL(Uniform Resource Locatorの略)等が指定される。サブフォルダも検索チェック欄1110によって、探す場所欄1105で指定された場所にあるサブフォルダ下にある文書も検索対象とするか否かが指定される。
属性Aの検索条件欄1115には、検索語指定欄1120、検索語指定欄1125、検索語指定欄1130を表示する。各検索語に対して、完全一致の検索であるか、部分一致の検索であるかを指定することができる。検索語指定欄1120等では、属性Aの属性情報に対しての検索を行う場合の検索語が入力される。
属性Bの検索条件欄1140には、属性B取り込み度合設定欄1145、検索語指定欄1155、検索語指定欄1160を表示する。検索語指定欄1155等では、属性Bの属性情報に対しての検索を行う場合の検索語が入力される。
そして、属性B取り込み度合設定欄1145内のスライドバー1150を用いて、どの属性Bのキーワードに対して、検索語指定欄1155等内の検索語の検索を行うかを指定する。スライドバー1150を左右に移動させることによって、図10の例で示した属性B表示領域930内の上位の順位を指定することができる。スライドバー1150を右側に移動させることによって、下位の順位までの属性Bの種類を検索対象とすることができる。例えば、属性B取り込み度合設定欄1145の右側の最端にスライドバー1150がある場合は、属性B表示領域930で指定された属性Bの全て(具体的には、キーワード欄1015、キーワード欄1025、キーワード欄1035、キーワード欄1045、キーワード欄1055、キーワード欄1065、キーワード欄1075内のキーワード)が、検索対象となる。属性B取り込み度合設定欄1145の左側の最端にスライドバー1150がある場合は、属性B表示領域930で指定された属性Bの一番上にあるもの(具体的には、キーワード欄1015内のキーワード)が、検索対象となる。属性B取り込み度合設定欄1145の中央にスライドバー1150がある場合は、属性B表示領域930で指定された属性Bの中位の順位にあるもの(具体的には、キーワード欄1015、キーワード欄1025、キーワード欄1035、キーワード欄1045内のキーワード)が、検索対象となる。このようにして、ユーザーは、検索にあたって属性Bを用いる上位の順位を指定することが可能である。
また、この例では、属性Bに対しては、完全一致による検索ではなく、部分一致による検索のみを行う。前述したように、属性Bのキーワードは誤認識によるものが含まれている可能性があるので、完全一致ではなく、部分一致による検索を行うようにしている。
図12は、検索結果画面1200の表示例を示す説明図である。
検索結果画面1200は、属性検索ツール335内の検索モジュール/結果表示モジュール435によって表示される画面であって、図11の例で示した属性検索画面1100による検索指示にしたがって検索した結果を示すものである。
検索結果画面1200には、検索結果テーブル1210、属性A情報1230、属性B情報1240を表示する。
検索結果テーブル1210には、検索結果の文書をリスト形式で表示する。検索結果テーブル1210は、ファイル名欄1212、サイズ欄1214、種類欄1216、最終更新日時欄1218、ファイルパス欄1220を有している。ファイル名欄1212には、文書のファイル名が表示され、サイズ欄1214には、その文書のサイズが表示され、種類欄1216には、その文書のファイル種が表示され、最終更新日時欄1218には、その文書の最終更新日時が表示され、ファイルパス欄1220には、その文書が記憶されている格納先が表示される。
検索結果テーブル1210では、1文書が1行に表示される。例えば、検索結果テーブル1210の1行目には、検索された1件目の文書として、ファイル名欄1212に「開発分担.xdw」、サイズ欄1214に「9KB」、種類欄1216に「DdddWwwww文書」、最終更新日時欄1218に「2019/12/10 14:00」、ファイルパス欄1220に「C:¥Work」と表示され、2行目には、検索された2件目の文書として、ファイル名欄1212に「アクションリスト.xdw」、サイズ欄1214に「5KB」、種類欄1216に「DdddWwwww文書」、最終更新日時欄1218に「2019/12/10 9:00」、ファイルパス欄1220に「C:¥Work¥AI」と表示される。
属性A情報1230には、検索結果テーブル1210でユーザーに選択された文書の属性Aに関する情報を表示する。
属性A情報1230は、属性A欄1232、値欄1234を有している。属性A欄1232には、属性Aが表示され、値欄1234には、その値が表示される。
例えば、属性A情報1230内の1行目には、属性A欄1232に属性Aの「有効期限」、値欄1234にその値である「2020/12/10」が表示され、2行目には、属性A欄1232に属性Aの「文書作成者」、値欄1234にその値である「佐藤」が表示される。
属性B情報1240には、検索結果テーブル1210でユーザーに選択されたファイルの属性Bに関する情報を表示する。
属性B情報1240は、属性Bの分類欄1242、キーワード欄1244を有している。属性Bの分類欄1242には、属性Bの分類(種類)が表示され、キーワード欄1244には、その分類に属しているキーワードが表示される。
例えば、属性B情報1240内の1行目には、属性Bの分類欄1242に属性Bの「文字の大きさが大」、キーワード欄1244に「文字の大きさが大」と判断された単語である「インストーラ 開発 環境」が表示され、2行目には、属性Bの分類欄1242に属性Bの「ヘッダー領域、フッター領域」、キーワード欄1244に「ヘッダー領域、フッター領域」に記載されていた単語である「開示 範囲 開発部」が表示され、3行目には、属性Bの分類欄1242に属性Bの「文書中のワード出現回数」、キーワード欄1244に「文書中のワード出現回数」の上位5位までの単語である「インストーラ 開発 環境」が表示される。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digitalの略)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
100…情報処理装置
105…プロセッサ
110…メモリ
115…データメモリ
120…プログラムメモリ
125…文書記憶モジュール
130…属性記憶モジュール
135…検索モジュール
140…属性付与(A)モジュール
145…属性付与(B)モジュール
150…画像処理モジュール
155…文字認識モジュール
185…出力装置
187…表示装置
189…印刷装置
190…受付装置
192…指示受付装置
194…文書読取装置
195…通信装置
198…バス
200…画像処理装置
210…ユーザー端末
290…通信回線
300…情報処理装置
325…フォルダ
335…属性検索ツール
340…文書管理ソフト
390…文書

Claims (5)

  1. メモリと一又は複数のプロセッサを備え、
    前記メモリは、文書に付与された属性情報と、該属性情報はユーザーが付与できる第1の属性情報又は文書管理ソフトウェアによって抽出される第2の属性情報のいずれであるかを示す情報を対応させて記憶しており、
    前記プロセッサは、
    前記第1の属性情報と前記第2属性情報を用いて文書の検索を行う、
    情報処理装置。
  2. 前記第2の属性情報は、複数の種類があり、
    前記プロセッサは、
    前記第2の属性情報の種類の優先順位を用いて検索を行う、
    請求項1に記載の情報処理装置。
  3. 前記文書は画像であり、
    前記第2の属性情報として、画像を解析した結果を含み、
    第2の属性情報の前記種類として、文字の形態、文字が記載されている位置、文字列の統計的情報、文字列の品詞、予め定められた文字列と予め定められた位置関係にある文字列のいずれか1つ以上を有し、
    前記プロセッサは、
    前記種類の優先順位を変更することを可能とし、
    検索にあたって第2の属性情報を用いる上位の順位を指定することを可能とする、
    請求項2に記載の情報処理装置。
  4. 前記プロセッサは、
    前記第1の属性情報に対しては、検索における完全一致と部分一致のいずれかを指定することを可能とし、
    前記第2の属性情報に対しては、部分一致による検索を行う、
    請求項1に記載の情報処理装置。
  5. メモリと一又は複数のプロセッサを備えたコンピュータの前記メモリは、文書に付与された属性情報と、該属性情報はユーザーが付与できる第1の属性情報又は文書管理ソフトウェアによって抽出される第2の属性情報のいずれであるかを示す情報を対応させて記憶しており、
    前記プロセッサに、
    前記第1の属性情報と前記第2の属性情報を用いて文書の検索を行う、
    処理を実行させるための情報処理プログラム。
JP2020048019A 2020-03-18 2020-03-18 情報処理装置及び情報処理プログラム Pending JP2021149439A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020048019A JP2021149439A (ja) 2020-03-18 2020-03-18 情報処理装置及び情報処理プログラム
US16/986,244 US20210295033A1 (en) 2020-03-18 2020-08-05 Information processing apparatus and non-transitory computer readable medium
CN202010927720.8A CN113495874A (zh) 2020-03-18 2020-09-07 信息处理装置和计算机可读取介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020048019A JP2021149439A (ja) 2020-03-18 2020-03-18 情報処理装置及び情報処理プログラム

Publications (1)

Publication Number Publication Date
JP2021149439A true JP2021149439A (ja) 2021-09-27

Family

ID=77748190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020048019A Pending JP2021149439A (ja) 2020-03-18 2020-03-18 情報処理装置及び情報処理プログラム

Country Status (3)

Country Link
US (1) US20210295033A1 (ja)
JP (1) JP2021149439A (ja)
CN (1) CN113495874A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022091530A (ja) * 2020-12-09 2022-06-21 キヤノン株式会社 情報処理装置、画像処理システム、制御方法、並びにプログラム
JP2022092837A (ja) * 2020-12-11 2022-06-23 株式会社東海理化電機製作所 制御装置およびプログラム

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742815A (en) * 1994-10-04 1998-04-21 Stern; Yonatan Pesach Method for storing and retrieving images in/from a database
JPH09251547A (ja) * 1996-03-18 1997-09-22 Toshiba Corp 文書イメージ管理装置、及び文書イメージ管理方法
US6562077B2 (en) * 1997-11-14 2003-05-13 Xerox Corporation Sorting image segments into clusters based on a distance measurement
US5999664A (en) * 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
US6353823B1 (en) * 1999-03-08 2002-03-05 Intel Corporation Method and system for using associative metadata
US6397213B1 (en) * 1999-05-12 2002-05-28 Ricoh Company Ltd. Search and retrieval using document decomposition
FR2806814B1 (fr) * 2000-03-22 2006-02-03 Oce Ind Sa Procede de reconnaissance et d'indexation de documents
JP2001318948A (ja) * 2000-05-09 2001-11-16 Hitachi Ltd 文書検索方法及び装置並びにその処理プログラムを記憶した媒体
JP4718699B2 (ja) * 2001-03-15 2011-07-06 株式会社リコー 文字認識装置、文字認識方法、プログラム、およびコンピュータ読み取り可能な記録媒体
US6826305B2 (en) * 2001-03-27 2004-11-30 Ncr Corporation Methods and apparatus for locating and identifying text labels in digital images
US20020176628A1 (en) * 2001-05-22 2002-11-28 Starkweather Gary K. Document imaging and indexing system
US7099508B2 (en) * 2001-11-29 2006-08-29 Kabushiki Kaisha Toshiba Document identification device, document definition method and document identification method
US7400422B2 (en) * 2002-01-08 2008-07-15 International Business Machines Corporation Method, apparatus, and program to prevent computer recognition of data
JP4251629B2 (ja) * 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7418141B2 (en) * 2003-03-31 2008-08-26 American Megatrends, Inc. Method, apparatus, and computer-readable medium for identifying character coordinates
JP2004326491A (ja) * 2003-04-25 2004-11-18 Canon Inc 画像処理方法
US20050097080A1 (en) * 2003-10-30 2005-05-05 Kethireddy Amarender R. System and method for automatically locating searched text in an image file
KR100747879B1 (ko) * 2004-06-10 2007-08-08 캐논 가부시끼가이샤 화상 처리 장치, 제어 방법 및 기록 매체
JP2006048536A (ja) * 2004-08-06 2006-02-16 Canon Inc 情報処理装置、文書検索方法、ならびにプログラム、記憶媒体
JP4817108B2 (ja) * 2004-11-05 2011-11-16 富士ゼロックス株式会社 画像処理装置、画像処理方法及び画像処理プログラム
WO2006059246A2 (en) * 2004-11-08 2006-06-08 Dspv, Ltd. System and method of enabling a cellular/wireless device with imaging capabilities to decode printed alphanumeric characters
JP4681863B2 (ja) * 2004-11-30 2011-05-11 キヤノン株式会社 画像処理装置、および、その制御方法
US7860844B2 (en) * 2005-07-15 2010-12-28 Indxit Systems Inc. System and methods for data indexing and processing
EP1843276A1 (en) * 2006-04-03 2007-10-10 Océ-Technologies B.V. Method for automated processing of hard copy text documents
JP2008234203A (ja) * 2007-03-19 2008-10-02 Ricoh Co Ltd 画像処理装置
US8261200B2 (en) * 2007-04-26 2012-09-04 Fuji Xerox Co., Ltd. Increasing retrieval performance of images by providing relevance feedback on word images contained in the images
US9141607B1 (en) * 2007-05-30 2015-09-22 Google Inc. Determining optical character recognition parameters
JP5033724B2 (ja) * 2007-07-12 2012-09-26 株式会社沖データ 文書検索装置及び画像形成装置、文書検索システム
US20090052804A1 (en) * 2007-08-22 2009-02-26 Prospect Technologies, Inc. Method process and apparatus for automated document scanning and management system
US8081848B2 (en) * 2007-09-13 2011-12-20 Microsoft Corporation Extracting metadata from a digitally scanned document
JP5258313B2 (ja) * 2008-01-31 2013-08-07 キヤノン株式会社 画像処理システム、画像処理方法、及びプログラム
JP5247177B2 (ja) * 2008-02-08 2013-07-24 キヤノン株式会社 文書管理装置、文書管理方法およびプログラム
JP5121599B2 (ja) * 2008-06-30 2013-01-16 キヤノン株式会社 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
WO2010049889A1 (en) * 2008-10-27 2010-05-06 Yosef Mintz System and method to retrieve search results from a distributed database
US8228542B2 (en) * 2009-03-31 2012-07-24 1st Management Services, Inc. Systems and methods for storing multiple records using identifiers, storage locations, and attributes associated with electronic documents
CN102971697B (zh) * 2010-06-17 2016-08-24 联想创新有限公司(香港) 电子设备和用于调整设置值的调整方法
US20110314044A1 (en) * 2010-06-18 2011-12-22 Microsoft Corporation Flexible content organization and retrieval
US8606789B2 (en) * 2010-07-02 2013-12-10 Xerox Corporation Method for layout based document zone querying
US8402023B2 (en) * 2010-10-19 2013-03-19 Reachable, Inc. Systems and methods for ranking user defined targets in a universal graph database
US8788972B2 (en) * 2011-01-26 2014-07-22 Cisco Technology, Inc. Graphical display for sorting and filtering a list in a space-constrained view
US8935246B2 (en) * 2012-08-08 2015-01-13 Google Inc. Identifying textual terms in response to a visual query
US20140267282A1 (en) * 2013-03-14 2014-09-18 Robert Bosch Gmbh System And Method For Context Dependent Level Of Detail Adjustment For Navigation Maps And Systems
US10650264B2 (en) * 2013-05-31 2020-05-12 Nec Corporation Image recognition apparatus, processing method thereof, and program
CN105095900B (zh) * 2014-05-04 2020-12-08 斑马智行网络(香港)有限公司 一种提取标准卡片中特定信息的方法和装置
US10467465B2 (en) * 2015-07-20 2019-11-05 Kofax, Inc. Range and/or polarity-based thresholding for improved data extraction
US9990544B1 (en) * 2016-03-31 2018-06-05 Intuit Inc. Data accuracy in OCR by leveraging user data and business rules to improve data accuracy at field level
JP6711203B2 (ja) * 2016-08-19 2020-06-17 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US10528055B2 (en) * 2016-11-03 2020-01-07 Ford Global Technologies, Llc Road sign recognition
US10169325B2 (en) * 2017-02-09 2019-01-01 International Business Machines Corporation Segmenting and interpreting a document, and relocating document fragments to corresponding sections
JP7102103B2 (ja) * 2017-03-31 2022-07-19 キヤノン株式会社 携帯型の情報処理装置及び当該情報処理装置を用いた方法及びプログラム
CN107748888B (zh) * 2017-10-13 2019-11-08 众安信息技术服务有限公司 一种图像文本行检测方法及装置
US10803350B2 (en) * 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
FR3082336B1 (fr) * 2018-07-31 2021-06-11 Madame Je Vous Aime Procede et dispositif de classement des objets d'un catalogue
US11450417B2 (en) * 2019-01-28 2022-09-20 Rivia Health Inc. System and method for healthcare document management
JP2021114225A (ja) * 2020-01-21 2021-08-05 キヤノン株式会社 ファイル検索システム、ファイル検索方法及びプログラム
US11562593B2 (en) * 2020-05-29 2023-01-24 Microsoft Technology Licensing, Llc Constructing a computer-implemented semantic document
CN113255659B (zh) * 2021-01-26 2022-07-29 南京邮电大学 一种基于MSAFF-Yolov3的车牌校正检测识别方法

Also Published As

Publication number Publication date
US20210295033A1 (en) 2021-09-23
CN113495874A (zh) 2021-10-12

Similar Documents

Publication Publication Date Title
JP5387124B2 (ja) コンテンツタイプ検索を行う方法及びシステム
JP5353148B2 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
JP2010073114A6 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
Walker et al. A web-based ocr service for documents
US10057449B2 (en) Document analysis system, image forming apparatus, and analysis server
US8208726B2 (en) Method and system for optical character recognition using image clustering
JP2014182477A (ja) プログラム及び帳票処理装置
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP2021149439A (ja) 情報処理装置及び情報処理プログラム
JP2006221569A (ja) 文書処理システム、文書処理方法、プログラムおよび記憶媒体
JP6262708B2 (ja) 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2021144565A (ja) 情報処理装置及び情報処理プログラム
JP2019057137A (ja) 情報処理装置及び情報処理プログラム
RU2571379C2 (ru) Интеллектуальная обработка электронного документа
US11165737B2 (en) Information processing apparatus for conversion between abbreviated name and formal name
US20200104342A1 (en) Content providing system that provides document as reference for editing, content providing method, information processing apparatus, and storage medium
JP2011034504A (ja) 文書処理装置、文書処理方法、プログラム及び記憶媒体
JP2009087037A (ja) 文書管理装置、画像処理装置、文書登録方法およびプログラム並びに記録媒体
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
US20180307669A1 (en) Information processing apparatus
US20210191991A1 (en) Information processing apparatus and non-transitory computer readable medium
US20230102476A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
US10990338B2 (en) Information processing system and non-transitory computer readable medium
US20230205910A1 (en) Information processing device, confidentiality level determination program, and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240116