JP2022050169A - 情報処理システム及びプログラム - Google Patents

情報処理システム及びプログラム Download PDF

Info

Publication number
JP2022050169A
JP2022050169A JP2020156618A JP2020156618A JP2022050169A JP 2022050169 A JP2022050169 A JP 2022050169A JP 2020156618 A JP2020156618 A JP 2020156618A JP 2020156618 A JP2020156618 A JP 2020156618A JP 2022050169 A JP2022050169 A JP 2022050169A
Authority
JP
Japan
Prior art keywords
attribute
document
processor
group
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020156618A
Other languages
English (en)
Inventor
結衣 坂田
Yui Sakata
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Priority to JP2020156618A priority Critical patent/JP2022050169A/ja
Priority to US17/176,715 priority patent/US20220083576A1/en
Priority to CN202110250107.1A priority patent/CN114201456A/zh
Publication of JP2022050169A publication Critical patent/JP2022050169A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • G06F16/3323Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/176Support for shared access to files; File sharing support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】類似する属性の代表値への集約後でも、集約前の属性を用いた検索を可能にする。【解決手段】情報処理システムは、プロセッサを有し、プロセッサは、文書を検索する検索キーとして、文書に付与されている属性の入力を受け付け、意味が類似する複数の第1の属性を要素に含む集合の代表値として第2の属性が設定されている場合において、受け付けた検索キーに第1の属性が含まれるとき、第1の属性が属する集合の代表値を用いて文書を検索する。【選択図】図5

Description

本発明は、情報処理システム及びプログラムに関する。
文書の管理システムでは、ユーザによる任意の属性名の付与が可能な場合がある。この場合、属性名の自由度が高いため、ユーザの違い等により属性名に表記ゆれが現れやすく、類似する属性名が乱立することがある。この表記ゆれは、例えば手作業や管理システムによる別の属性名への置換により解消される。
特開2008-310626号公報
属性名の置換により表記ゆれは解消されるが、これにより置換前の属性名は失われてしまうと、属性名の置換を知らないユーザが自身の付与した属性名で文書を検索しても、想定する文書を見つけ出せないことが起こりうる。
本発明は、類似する属性の代表値への集約後でも、集約前の属性を用いた検索を可能にすることを目的とする。
請求項1に記載の発明は、プロセッサを有し、前記プロセッサは、文書を検索する検索キーとして、文書に付与されている属性の入力を受け付け、意味が類似する複数の第1の属性を要素に含む集合の代表値として第2の属性が設定されている場合において、受け付けた検索キーに当該第1の属性が含まれるとき、当該第1の属性が属する集合の代表値を用いて文書を検索する情報処理システムである。
請求項2に記載の発明は、前記プロセッサは、前記第1の属性を要素に含む集合の代表値である前記第2の属性が付与された文書を検索する、請求項1に記載の情報処理システムである。
請求項3に記載の発明は、前記第2の属性は、文書の階層的な管理に使用するディレクトリを単位に付与される、請求項2に記載の情報処理システムである。
請求項4に記載の発明は、プロセッサを有し、前記プロセッサは、文書を検索する検索キーとして、文書に付与されている属性の入力を受け付け、意味が類似する複数の第1の属性を要素に含む集合の代表値として第2の属性が設定されている場合において、受け付けた検索キーに当該第1の属性が含まれるとき、当該第1の属性が属する集合の全ての要素を用いて文書を検索する情報処理システムである。
請求項5に記載の発明は、前記プロセッサは、前記第1の属性を要素に含む集合の全ての要素のいずれかが付与された文書を検索する、請求項4に記載の情報処理システムである。
請求項6に記載の発明は、前記第1の属性は、ユーザにより付与される、請求項5に記載の情報処理システムである。
請求項7に記載の発明は、前記プロセッサは、前記第2の属性が、文書の階層的な管理に使用するディレクトリを単位に付与される場合、前記ディレクトリに属する文書に付されている意味が類似する前記第1の属性の集合と、当該集合の代表値を与える前記第2の属性とを生成する、請求項1又は4に記載の情報処理システムである。
請求項8に記載の発明は、前記プロセッサは、前記集合の要素に変化があった場合、前記第1の属性と前記第2の属性との紐付けを更新する、請求項7に記載の情報処理システムである。
請求項9に記載の発明は、前記プロセッサは、ユーザが文書に対して前記第1の属性を付与する場合、使用の頻度の履歴に基づいて前記第2の属性を提示する、請求項1又は4に記載の情報処理システムである。
請求項10に記載の発明は、前記プロセッサは、検索キーでの使用の頻度が高い順番に前記第1の属性を提示する、請求項9に記載の情報処理システムである。
請求項11に記載の発明は、前記プロセッサは、前記集合としての第1の集合と第2の集合の両方に属する前記第1の属性が存在する場合、予め定めた規則に従って、当該第1の属性と前記第2の属性との紐付けを更新する、請求項1又は4に記載の情報処理システムである。
請求項12に記載の発明は、前記プロセッサは、前記第1の集合の全体が前記第2の集合に含まれる場合、当該第1の集合の代表値を与える前記第2の属性を、当該第2の集合の要素に追加する、請求項11に記載の情報処理システムである。
請求項13に記載の発明は、前記プロセッサは、前記第1の集合の一部と前記第2の集合の一部が重複し、一方が他方を包含しない場合、重複部分の前記第1の属性を、要素の数が少ない方の集合の要素に設定する、請求項11に記載の情報処理システムである。
請求項14に記載の発明は、前記プロセッサは、前記第1の集合の一部と前記第2の集合の一部が重複し、一方が他方を包含しない場合、重複部分の前記第1の属性を、対応する文書が属するディレクトリがより下位の集合の要素に設定する、請求項11に記載の情報処理システムである。
請求項15に記載の発明は、コンピュータに、文書を検索する検索キーとして、文書に付与されている属性の入力を受け付ける機能と、意味が類似する複数の第1の属性を要素に含む集合の代表値として第2の属性が設定されている場合において、受け付けた検索キーに当該第1の属性が含まれるとき、当該第1の属性が属する集合の代表値を用いて文書を検索する機能と、を実現させるプログラムである。
請求項16に記載の発明は、コンピュータに、文書を検索する検索キーとして、文書に付与されている属性の入力を受け付ける機能と、意味が類似する複数の第1の属性を要素に含む集合の代表値として第2の属性が設定されている場合において、受け付けた検索キーに当該第1の属性が含まれるとき、当該第1の属性が属する集合の全ての要素を用いて文書を検索する機能とを実現させるプログラムである。
請求項1記載の発明によれば、類似する属性の代表値への集約後でも、集約前の属性を用いた検索を実行できる。
請求項2記載の発明によれば、第1の属性が検索キーとして与えられた場合でも、第1の属性が属する集合に関連する全ての文書を検索できる。
請求項3記載の発明によれば、検索キーで検索される文書とディレクトリとの関連性を高めることができる。
請求項4記載の発明によれば、類似する属性の代表値への集約後でも、集約前の属性を用いた検索を実行できる。
請求項5記載の発明によれば、第1の属性が検索キーとして与えられた場合でも、第1の属性が属する集合に関連する全ての文書を検索できる。
請求項6記載の発明によれば、表記ゆれが想定される第1の属性を用いても関連する文書を検索できる。
請求項7記載の発明によれば、ユーザによる第2の属性の付与を不要にできる。
請求項8記載の発明によれば、第1の属性と第2の属性との紐付けの更新に伴う処理負荷を低減できる。
請求項9記載の発明によれば、ユーザが付与する第1の属性の表記ゆれを少なくできる。
請求項10記載の発明によれば、ユーザが付与する第1の属性の表記ゆれを少なくできる。
請求項11記載の発明によれば、集合間の関係により検索結果として出力される文書数が増えすぎないようにできる。
請求項12記載の発明によれば、第1の集合に含まれる第1の属性が検索キーとして与えられた場合、検索結果として出力される文書を第1の集合に関連する文書に制限できる。
請求項13記載の発明によれば、第1の集合に含まれる第1の属性が検索キーとして与えられた場合、検索結果として出力される文書の数を絞り込むことができる。
請求項14記載の発明によれば、第1の集合に含まれる第1の属性が検索キーとして与えられた場合、検索結果として出力される文書の数を絞り込むことができる。
請求項15記載の発明によれば、類似する属性の代表値への集約後でも、集約前の属性を用いた検索を実行できる。
請求項16記載の発明によれば、類似する属性の代表値への集約後でも、集約前の属性を用いた検索を実行できる。
実施の形態1で使用する文書管理システムの全体構成の例を概略的に示す図である。 実施の形態1で使用する共有サーバのハードウェア構成の一例を説明する図である。 プロセッサにより実現される機能の一部を説明する図である。 文書DBの構成例を説明する図である。 属性グループDBに記憶される属性グループの例を説明する図である。 属性グループの構造例を示す図である。 実施の形態1で使用する共有サーバで実行される処理動作のうち属性グループの登録に関する処理動作の一例を説明するフローチャートである。 実施の形態1におけるグルーピング処理後のフォルダと属性グループとの関係を説明する図である。 実施の形態1で使用する共有サーバで実行される処理動作のうち文書の検索に関する処理動作の一例を説明するフローチャートである。 実施の形態1による検索の実行の過程の一例を説明する図である。 実施の形態2で使用する共有サーバで実行される属性グループの登録に関する処理動作のうちグルーピング処理の一例を説明するフローチャートである。 実施の形態2におけるグルーピング処理の途中段階の状態を説明する図である。 実施の形態2におけるグルーピング処理の完了後の状態を説明する図である。 実施の形態2で使用する共有サーバで実行される処理動作のうち文書の検索に関する処理動作の一例を説明するフローチャートである。 実施の形態2による検索の実行の過程を説明する図である。 実施の形態3で使用する共有サーバで実行される属性グループの登録に関する処理動作のうちグルーピング処理の一例を説明するフローチャートである。 実施の形態2におけるグルーピング処理の完了後の状態を説明する図である。 実施の形態における文書の属性の表示例を説明する図である。 実施の形態4で使用する共有サーバのプロセッサにより実現される機能の一部を説明する図である。 文書DBの構成例を説明する図である。 実施の形態4における属性グループの生成例を説明する図である。 実施の形態4で使用する共有サーバで実行される属性グループの登録に関する処理動作のうちグルーピング処理の一例を説明するフローチャートである。 複数の属性グループ間の関係を説明する図である。(A)は一方の属性グループが他方の属性グループの全てを包含する関係を示し、(B)は一方の属性グループと他方の属性グループが一部分で重なるが、一方が他方を包含しない関係を示す。 優先度が同じ属性グループが他に存在する場合における属性グループの構造例を示す図である。 実施の形態5で使用する共有サーバのプロセッサにより実現される機能の一部を説明する図である。 新しい文書を登録するユーザ端末の表示部に表示される属性名の画面の例を示す図である。
以下、図面を参照して、本発明の実施の形態を説明する。
<実施の形態1>
<システムの構成>
図1は、実施の形態1で使用する文書管理システム1の全体構成の例を概略的に示す図である。
図1に示す文書管理システム1は、ネットワーク10と、システムを利用するユーザが操作するユーザ端末20と、文書の共有に使用される共有サーバ30とで構成される。
本実施の形態における文書は、例えばオフィスソフトその他のアプリケーションプログラムで作成されたオフィス文書、電子メール、原稿から光学的に読み取ったイメージデータ、ファクシミリ文書、写真、会計データ、医療データ、データベースその他を含む。本実施の形態における文書は、複数のユーザによる共有が可能であればよい。なお、画像系の文書には、静止画像に限らず、動画像も含まれる。
ネットワーク10には、例えばLAN(=Local Area Network)やインターネットを使用する。もっとも、ネットワーク10は、LANとインターネットとの複合型の構成でもよい。
ユーザ端末20は、例えばノート型のコンピュータ、デスクトップ型のコンピュータ、タブレット型のコンピュータ、スマートフォン、画像形成装置であり、共有サーバ30への文書のアップロードや文書のダウンロードに使用される。
いずれのユーザ端末20も、データを処理する回路が集積されたマザーボードと、データを記憶するストレージと、情報の表示に使用されるディスプレイと、操作の入力に使用されるタッチパネルやキーボードと、ネットワーク10との通信に使用される通信モジュールとを有している。
マザーボードには、例えばプロセッサ、プログラムの実行領域として使用されるRAM(=Random Access Memory)、BIOS(=Basic Input / Output System)等が記憶されるROM(=Read Only Memory)が設けられている。
本実施の形態で想定する画像形成装置は、用紙に画像を印刷する機能に加え、原稿等の画像イメージを光学的に読み取る機能やファクシミリ通信を実行する機能も備えている。この種の画像形成装置は、複合機とも呼ばれる。なお、画像形成装置について列記した機能は一例に過ぎず、他の機能を備えることを妨げない。
また、ストレージには、ハードディスク装置や書き換えが可能な不揮発性の半導体メモリが用いられる。
図1では、複数台のユーザ端末20を描いているが、ユーザ端末20は1台でもよい。
共有サーバ30は、文書の共有を支援するクラウドサービスを提供する。図1の場合、共有サーバ30は1台であるが、物理的には複数台のサーバで構成されてもよい。例えば共有サーバ30は、いわゆるクラウドサーバとして構成されてもよい。もっとも、共有サーバ30は、オンプレミス型のサーバでもよい。
本実施の形態における共有サーバ30は、情報処理システムの一例である。
<共有サーバの構成>
図2は、実施の形態1で使用する共有サーバ30のハードウェア構成の一例を説明する図である。
共有サーバ30は、装置全体の動作を制御するプロセッサ31と、半導体メモリ32と、ハードディスク装置33と、通信モジュール34とを有している。これらは、信号線やバスを通じて接続されている。
プロセッサ31は、プログラムの実行を通じて各種の機能を実現する。本実施の形態におけるプロセッサ31は、例えば属性名を用いた文書の検索サービスを提供する。
半導体メモリ32は、例えばROMと、RAMとで構成される。RAMは主記憶装置の一例である。
ここでのプロセッサ31と半導体メモリ32は、いわゆるコンピュータを構成する。
通信モジュール34は、例えばイーサネット(登録商標)モジュール、無線LAN用のモジュール、第5世代移動通信システム(すなわち5G)用のモジュールである。
ハードディスク装置33は、補助記憶装置の一例であり、例えばオペレーティングシステムやアプリケーションプログラムを記憶する。もっとも、ハードディスク装置33に代えて、大容量の半導体メモリを用いてもよい。
本実施の形態におけるハードディスク装置33には、共有の対象である文書を記憶する文書データベース(以下「文書DB」という)331と、各文書に付与されている属性のうち意味が類似する属性名の集合を管理する属性グループのデータベース(以下「属性グループDB」という)332とが記憶されている。
属性名は、対応する属性値との組で用いられる。属性名は属性の一例である。
属性名は、属性の性質や種類を与える。属性名には、例えば「ファイル名」、「作成者」、「作成日」、「送付先」、「承認ステータス」がある。
属性値は、属性名に対応する具体的な値である。属性値には、例えば「ABC提案書」、「富士太郎」、「2020/08/30」、「XYZシステム」、「承認済」がある。
本実施の形態における属性グループDB332は、意味が類似する属性名の集合を管理するデータベースである。意味が類似する属性名が複数出現するのは、ユーザがフリーワードを属性名として入力可能であることによる。意味が類似する属性名には、表記ゆれがある。なお、意味の類似は、表現の類似や汎用的な辞書における記載に限定されず、特定の業種や特定の業界における共通の知識を前提とした類似も含む。
属性グループDB332を構成する個々の属性グループには、属性名の代表値が付与される。
本実施の形態の場合、属性グループDB332は、文書DB331から文書を検索する際に用いられる。本実施の形態の場合、類似する属性名は、階層的に文書を管理する場合の文書の入れ物となるディレクトリを単位として管理される。
図3は、プロセッサ31により実現される機能の一部を説明する図である。図3には、プロセッサ31が実現する機能の一部として、属性付与部311と、属性グループ管理部312と、登録完了通知部313と、検索受付部314と、検索実行部315とを表している。これらの機能は、プロセッサ31によるプログラムの実行を通じて実現される。
属性付与部311は、ユーザ端末20(図1参照)からの指示に従い、共有サーバ30(図1参照)に記憶されている文書に属性名を付与する機能を実現する。
属性名は、ユーザ端末20を操作するユーザが自由に指定することが可能である。このため、表記ゆれが発生する。本実施の形態の場合、1つの文書に対して付与される属性名の数に制限は設けられていない。
文書に対する属性名の付与は、オペレーティングシステムやアプリケーションプログラムによっても可能である。
属性グループ管理部312は、文書DB331(図2参照)に記憶されている文書に付与されている属性名のうち意味が類似する属性名の集合(以下「属性グループ」ともいう)を管理する機能である。
属性グループは、ユーザが手動で生成してもよいし、オペレーティングシステムやアプリケーションプログラムが、予め定めた規則に従って生成してもよい。属性グループ管理部312は、例えば予め定められたスケジュール等に従って属性グループを生成する。
本実施の形態の場合、属性グループは、フォルダ(すなわちディレクトリ)を単位として生成される。すなわち、本実施の形態では、1つの階層のフォルダを単位とするが、親子関係や兄弟関係にある複数のフォルダを単位とすることも可能である。もっとも、親子関係等とは関係なく、属性グループを管理してもよい。ここでの親子関係は、文書の管理に木構造を用いる場合における上位ノードと下位ノードの関係をいう。一方、兄弟関係は、共通の上位ノードを有する複数の下位ノードの関係をいう。
本実施の形態における属性グループDB332は、属性グループと、属性グループの代表値と、属性グループに対応するフォルダの位置を対応付けたスキーマレス構造を有する。
登録完了通知部313は、属性名のグルーピングが完了した場合に、処理の結果の確認をユーザに促す通知を発行する機能を実現する。
検索受付部314は、共有サーバ30(図1参照)に記憶されている文書の検索を受け付ける機能を実現する。検索クエリは、ユーザ端末20(図1参照)から与えられる。検索クエリには、例えば1つ又は複数の検索語が含まれる。本実施の形態における検索語は、属性名である。検索語は検索キーの一例である。
検索受付部314は、検索の実行を指示するユーザを特定する情報、検索の実行が指示された日時、検索クエリの情報等も、ユーザ端末20から取得して記憶する。
検索実行部315は、指定された検索クエリを満たす文書を検索し、検索の結果をユーザ端末20に出力する機能を実現する。
<文書DBの例>
図4は、文書DB331(図2参照)の構成例を説明する図である。本実施の形態で使用する文書DB331は、木構造のノードに対応するフォルダに紐付けて文書を記憶する。
各フォルダには、識別用のID(=IDentifier)が付されている。
図4の場合、ルートに位置するフォルダのIDは「001」であり、その子ノードに当たるフォルダのIDは「0011」である。
ルートに位置するフォルダは、親ノードを有しないフォルダである。子ノードのフォルダは、ルートのフォルダの下位に位置するフォルダである。図4では、子ノードは、ルートから数えて1つ目の階層にあるが、複数番目の階層にあってもよい。また、図4では、子ノードは1つであるが、子ノードは複数でもよい。
本実施の形態の場合、識別用のIDは、例えば属性グループとの紐付けに使用される。
図4の場合、識別用のID「0011」で特定されるフォルダには複数の文書が記憶されている。図4には、複数の文書の一例として文書A、文書B、文書Cが例示されている。
なお、文書Aには、属性名として「作成者」と「承認済み」が付与されている。
因みに、「作成者」に対応する属性値は「Xさん」である。また、「承認済み」に対応する属性値は「TRUE」である。「TRUE」は、承認が済んでいる状態を表している。
文書Bには、属性名として「作成者」と「承認済」が付与されている。因みに、作成者に対応する属性値は「Yさん」である。文書BにYさんが付与した属性名の「承認済」と、文書AにXさんが付与した属性名の「承認済み」とは意味が同じであるが、表記が異なっている。「承認済」と「承認済み」は表記ゆれの一例である。文書Bの場合、「承認済」に対応する属性値は「FALSE」である。「FALSE」は、承認が済んでいない状態を表している。
文書Cには、属性名として「作成者」と「完了」が付与されている。因みに、作成者に対応する属性値は「Yさん」である。文書CにYさんが付与した属性名の「完了」も、文書AにXさんが付与した属性名の「承認済み」や文書BにYさんが付与した属性名の「承認済」と同じ意味であるが、表記が異なっている。「承認済み」と「承認済」と「完了」は、いずれも意味が類似する属性名の一例である。
また、「完了」に対応する属性値は「FALSE」である。
図4の例では、意味が類似する属性名が付与されている文書のみを表しているが、同じフォルダに属する属性名の全てが類似するとは限らない。例えば「作成者」と「承認済み」は意味が類似しない。
また、図4の例では、各文書に2つの属性名が付与されているが、付与される属性名の数は1つでもよいし、3つ以上でもよい。
<属性グループDBの例>
図5は、属性グループDB332(図2参照)に記憶される属性グループの例を説明する図である。
図5に示す属性グループは、図4に示すフォルダIDの「0011」に属する文書に付与されている属性名のうち意味が類似する属性名の集合を表している。このため、属性グループには、前述した「承認済み」と「承認済」と「完了」が要素として含まれている。「承認済み」と「承認済」と「完了」は、第1の属性の一例である。
また、図5の場合、同じ属性グループに属する3つの属性名の代表値として「承認済」が指定されている。代表値としての「承認済」は第2の属性の一例である。図5の場合、代表値は、要素である属性名の1つと同じであるが、要素である属性名と同じであるとは限らない。
本実施の形態の場合、代表値は、ユーザが指定する。もっとも、オペレーティングシステムやアプリケーションプログラムが代表値を与えることも可能である。
図6は、属性グループの構造例を示す図である。図6の例は、代表値が「承認済」である属性グループを表している。
図6の場合、属性グループに属する属性名として「承認済」、「承認済み」、「完了」が例示されている。また、属性グループとして更新フラグが「TRUE」に設定されている。
本実施の形態における更新フラグは、グルーピング処理の実行が必要か否かを表している。
「TRUE」は、グルーピング処理が必要であることを示し、例えば代表値が変更された場合、要素である属性名の数が増減した場合、要素である属性名の内容に変更があった場合に使用される。換言すると、属性グループに変化があった場合には更新フラグが「TRUE」に設定される。
本実施の形態の場合、属性グループの管理は、例えば毎日午前1時のように定期的に実行される。グルーピング処理が終了すると、更新フラグは「TRUE」から「FALSE」に変更される。
更新フラグが「TRUE」の属性グループは、属性グループ管理部312によるグルーピング処理の対象となる。グルーピング処理では、属性名が属する属性グループと、要素である属性名が付与されている文書とが紐付けられる。一方、更新フラグが「FALSE」の属性グループは、属性グループ管理部312によるグルーピング処理の対象から除外される。
<処理動作>
<属性グループの登録>
図7は、実施の形態1で使用する共有サーバ30(図1参照)で実行される処理動作のうち属性グループの登録に関する処理動作の一例を説明するフローチャートである。図中に示す記号のSはステップを意味する。
なお、図7に示す処理動作は、プロセッサ31(図2参照)が実行する。
プロセッサ31は、属性グループとその代表値を、属性グループDB332(図2参照)に登録する(ステップ1)。
本実施の形態の場合、属性グループの代表値や属性グループの要素とする属性名は、サービスを利用するユーザや登録の権限を有する管理者(以下「ユーザ等」という)が指定する。
ここでの登録には、新規の登録だけでなく、既存の属性グループに対する変更も含まれる。
次に、プロセッサ31は、処理の対象とするフォルダの各文書の属性名が属性グループに属するか否かを判定する(ステップ2)。
文書の属性名がステップ1で登録された属性グループの要素に含まれていない場合、プロセッサ31は、ステップ2で否定結果を得る。一方、文書の属性名がステップ1で登録された属性グループの要素に含まれる場合、プロセッサ31は、ステップ2で肯定結果を得る。
ステップ2で否定結果が得られた場合、プロセッサ31は、登録完了通知部313の機能を通じ、ユーザ端末20(図1参照)に対し、登録の完了を通知する(ステップ4)。
一方、ステップ2で肯定結果が得られた場合、プロセッサ31は、属性グループ管理部312の機能を通じてグルーピング処理を実行し(ステップ3)、その後、登録の完了を通知する(ステップ4)。
本実施の形態におけるグルーピング処理では、属性グループとその要素を属性名に含む文書のフォルダとの紐付けが行われる。属性グループとフォルダとが紐付けられることで、属性グループの要素である属性名のいずれかが検索クエリとして与えられた場合に、属性グループの要素である属性名を有する文書が検索の結果に含まれるようになる。
本実施の形態では、図6に示すように、属性グループとフォルダIDとの紐付けが実行される。
本実施の形態では、1つの属性グループは1つのフォルダに紐付けられるが、複数のフォルダを紐付けることも可能である。
図8は、実施の形態1におけるグルーピング処理後のフォルダと属性グループとの関係を説明する図である。図8には、図4との対応部分に対応する符号を付して示している。
図8の場合、フォルダIDが「0011」のフォルダと属性グループの「承認済」グループとが紐付けられている。グループ名には、代表値である「承認済」を用いている。
「承認済」グループには、フォルダIDが「0011」であるフォルダに紐付けられた文書A、文書B及び文書Cに付与されている属性名の「承認済み」、「承認済」、「完了」を要素に含んでいる。
<文書の検索>
図9は、実施の形態1で使用する共有サーバ30(図1参照)で実行される処理動作のうち文書の検索に関する処理動作の一例を説明するフローチャートである。図中に示す記号のSはステップを意味する。
文書の検索では、ユーザがユーザ端末20(図1参照)を操作し、検索クエリを入力する。入力された検索クエリは、共有サーバ30に与えられる。
検索クエリを受け取ったプロセッサ31(図2参照)は、ユーザが入力した検索クエリから検索語を抽出する(ステップ11)。
次に、プロセッサ31は、検索語を要素に含む属性グループがあるか否かを判定する(ステップ12)。例えば抽出された検索語が、前述した「承認済」グループに含まれるか否かを判定する。判定の対象となる属性グループは複数存在してもよい。
ステップ12で肯定結果が得られた場合、プロセッサ31は、属性グループを用いた新たな検索クエリを生成する(ステップ13)。本実施の形態では、プロセッサ31は、属性グループに属する属性名を並列に列記した新たな検索クエリを生成する。
ステップ13の終了後、又は、ステップ12で否定結果が得られた後、プロセッサ31は、検索クエリによる検索を実行する(ステップ14)。
図10は、実施の形態1による検索の実行の過程の一例を説明する図である。
前述したように、まず、検索語が抽出される。図10では、「承認済み」が抽出されている。
次に、抽出された「承認済み」を含む属性グループが検索される。ここでは、「承認済」グループが発見されている。「承認済」グループの要素は、「承認済」と「承認済み」と「完了」の3つである。
このため、検索クエリは、「承認済」又は「承認済み」又は「完了」に書き換えられる。
結果的に、書き換え後の検索クエリを用いると、「承認済み」との属性名が付与されている文書Aだけでなく、意味が類似の属性名が付与されている文書Bと文書Cも検索の結果に含まれることになる。
以上のように、不特定のユーザが自由に属性名を付与した文書が検索の対象となる場合において、意味が類似する属性名の全てを知らなくても、ユーザは、自身が知っている属性名を指定するだけで、関連する文書を検索の結果として取得することが可能になる。
<実施の形態2>
前述の実施の形態では、文書DB331(図2参照)に記憶されている文書の属性名が登録時のままの場合を想定しているが、本実施の形態では、属性グループの代表値を関連する各文書の属性名に追加する場合について説明する。
<属性グループの登録>
図11は、実施の形態2で使用する共有サーバ30(図1参照)で実行される属性グループの登録に関する処理動作のうちグルーピング処理の一例を説明するフローチャートである。図11には、図7との対応部分に対応する符号を付して示している。
なお、グルーピング処理以外の処理動作は、図7の処理動作と同様である。
図11に示すグルーピング処理はステップ3Aである。ステップ3Aは、ステップ2(図7参照)で肯定結果が得られた場合に実行される。
まず、プロセッサ31は、文書に付与されている属性名が属性グループの代表値と同じか否かを判定する(ステップ31)。同じ場合は、ステップ31で肯定結果が得られ、異なる場合は、ステップ31で否定結果が得られる。
ステップ31で肯定結果が得られた文書について、プロセッサ31は、本実施の形態におけるグルーピング処理の必要がない。このため、プロセッサ31は、該当する文書についてはステップ4に進む。
一方、ステップ31で否定結果が得られた文書について、プロセッサ31は、1つの文書内に、複数の属性グループに属する属性名があるか否かを判定する(ステップ32)。
ステップ32で否定結果が得られた場合、プロセッサ31は、対象とする文書の属性名に代表値を追加する(ステップ33)。これにより、文書は、特定の属性グループに紐付けられる。
一方、ステップ32で肯定結果が得られた場合、プロセッサ31は、グルーピングの未処理をユーザに通知する(ステップ34)。この場合、ユーザは、個別に、文書に付与する属性名を検討することになる。
図12は、実施の形態2におけるグルーピング処理の途中段階の状態を説明する図である。図12には、図8との対応部分に対応する符号を付して示している。
図12の場合、「承認済」グループは、フォルダIDが「0011」のフォルダと紐付けられている。なお、「承認済」グループの更新フラグは「TRUE」であり、グルーピング処理の対象であることが示されている。図12の段階では、「承認済」グループと文書との紐付けはない。
図13は、実施の形態2におけるグルーピング処理の完了後の状態を説明する図である。図13には、図12との対応部分に対応する符号を付して示している。
図13の場合、「承認済」グループの代表値と同じ属性名が付与されている文書B以外の文書Aと文書Cに対し、代表値である「承認済」が追加されている。結果的に、意味が類似する属性名が付与されている文書には、属性グループの代表値が含まれる状態になる。
<文書の検索>
図14は、実施の形態2で使用する共有サーバ30(図1参照)で実行される処理動作のうち文書の検索に関する処理動作の一例を説明するフローチャートである。図14には、図9との対応部分に対応する符号を付して示している。
本実施の形態の場合も、ユーザがユーザ端末20(図1参照)を操作し、検索クエリを入力する。
検索クエリを受け取ったプロセッサ31(図2参照)は、ユーザが入力した検索クエリから検索語を抽出する(ステップ11)。
次に、プロセッサ31は、検索語を要素に含む属性グループがあるか否かを判定する(ステップ12)。例えば抽出された検索語が、前述した「承認済」グループに含まれるか否かを判定する。判定の対象となる属性グループは複数存在してもよい。
ステップ12で肯定結果が得られた場合、プロセッサ31は、属性グループの代表値を用いた新たな検索クエリを生成する(ステップ13A)。
本実施の形態の場合、検索クエリの検索語が属性グループの代表値と同じであれば、入力された検索語がそのまま用いられるが、検索クエリの検索語が属性グループの代表値と異なるときは検索語が代表値に書き換えられる。
ステップ13Aの終了後、又は、ステップ12で否定結果が得られた後、プロセッサ31は、検索クエリによる検索を実行する(ステップ14)。
図15は、実施の形態2による検索の実行の過程を説明する図である。
前述したように、まず、検索語が抽出される。図15では、「承認済み」が抽出されている。
次に、抽出された「承認済み」を含む属性グループが検索される。ここでは、「承認済」グループが発見されている。「承認済」グループの要素は、「承認済」と「承認済み」と「完了」の3つである。
本実施の形態の場合、検索クエリは、「承認済」グループの代表値である「承認済」に書き換えられる。
結果的に、書き換え後の検索クエリを用いると、「承認済み」との属性名が付与されている文書Aだけでなく、意味が類似の属性名が付与されている文書Bと文書Cも検索の結果に含まれることになる。本実施の形態の場合、各文書の属性名には「承認済」が含まれるからである。
以上のように、不特定のユーザが自由に属性名を付与した文書が検索の対象となる場合において、意味が類似する属性名の全てを知らなくても、ユーザは、自身が知っている属性名を指定するだけで、関連する文書を検索の結果として取得することが可能になる。
なお、本実施の形態の場合も、実施の形態1の場合のように、「承認済」グループの要素は、「承認済」と「承認済み」と「完了」の3つを含めた検索クエリを用いて検索を実行することも可能である。
<実施の形態3>
本実施の形態では、各文書の属性名を属性グループの代表値で置換する場合について説明する。本実施の形態は、実施の形態2の変形例に当たる。
<属性グループの登録>
図16は、実施の形態3で使用する共有サーバ30(図1参照)で実行される属性グループの登録に関する処理動作のうちグルーピング処理の一例を説明するフローチャートである。図16には、図11との対応部分に対応する符号を付して示している。
なお、グルーピング処理以外の処理動作は、図7の処理動作と同様である。
図16に示すグルーピング処理はステップ3Bである。ステップ3Bは、ステップ2(図7参照)で肯定結果が得られた場合に実行される。
まず、プロセッサ31は、文書に付与されている属性名が属性グループの代表値と同じか否かを判定する(ステップ31)。同じ場合は、ステップ31で肯定結果が得られ、異なる場合は、ステップ31で否定結果が得られる。
ステップ31で肯定結果が得られた文書について、プロセッサ31は、本実施の形態におけるグルーピング処理の必要がない。このため、プロセッサ31は、該当する文書についてはステップ4に進む。
一方、ステップ31で否定結果が得られた文書について、プロセッサ31は、1つの文書内に、複数の属性グループに属する属性名があるか否かを判定する(ステップ32)。
ステップ32で否定結果が得られた場合、プロセッサ31は、対象とする文書の属性名に代表値に置換する(ステップ33A)。これにより、文書は、特定の属性グループに紐付けられる。実施の形態2との違いは、属性名の数が増えない点と、ユーザが付与した属性名が文書に残らない点である。
一方、ステップ32で肯定結果が得られた場合、プロセッサ31は、グルーピングの未処理をユーザに通知する(ステップ34)。この場合、ユーザは、個別に、文書に付与する属性名を検討することになる。
図17は、実施の形態2におけるグルーピング処理の完了後の状態を説明する図である。図17には、図13との対応部分に対応する符号を付して示している。
なお、グルーピング処理の途中段階の状態は、実施の形態2で説明した図12と同じである。
図17の場合、「承認済」グループの代表値と同じ属性名が付与されている文書B以外の文書Aと文書Cの属性名が、属性グループの代表値である「承認済」に置換されている。本実施の形態の場合、属性名が同じ属性グループに属する文書における属性名は全て同じ代表値に統一される。
<文書の検索>
本実施の形態の場合に文書の検索に関する処理動作は、実施の形態2で説明した処理動作と同じである。すなわち、図14に示した処理動作を本実施の形態でも使用する。すなわち、実際の検索は、属性グループの代表値を用いて実行される。このため、検索の実行の過程は、実施の形態2で説明した図15と同じ内容になる。
このため、文書の属性名に表記ゆれがあったとしても、属性グループの要素が検索語に含まれる場合には、入力された検索語に一致する属性名を有する文書Bと文書Cも検索の結果に含まれることになる。
ただし、本実施の形態の場合には、文書の属性名が登録者であるユーザの意思とは無関係に書き換えられてしまう。このため、ユーザが文書の属性を確認する場合に、自身の付与した属性名との違いに驚く可能性がある。
図18は、実施の形態における文書の属性の表示例を説明する図である。図18の場合、文書Aを例示している。
文書Aの属性名は、前述した属性名とは異なり、[G]のマークが追加されている。この[G]のマークは属性グループの代表値に置換されたことを表している。このため、「承認済[G]」の表記を確認したユーザは、代表値への書き換えの事実を知ることが可能になる。
以上のように、不特定のユーザが自由に属性名を付与した文書が検索の対象となる場合において、意味が類似する属性名の全てを知らなくても、ユーザは、自身が知っている属性名を指定するだけで、関連する文書を検索の結果として取得することが可能になる。
<実施の形態4>
前述の実施の形態の場合、属性グループとその代表値は事前に与えられる場合を想定している。本実施の形態では、共有サーバ30(図1参照)が属性グループとその代表値を自動的に生成する機能を有する場合について説明する。
<システムの構成>
図19は、実施の形態4で使用する共有サーバ30のプロセッサ31Aにより実現される機能の一部を説明する図である。図19には、図3との対応部分に対応する符号を付して示している。
図19に示すプロセッサ31Aでは、属性グループ生成部316が追加されている点で前述した他の実施の形態と異なっている。
属性グループ生成部316は、文書DB331(図2参照)に記憶されている文書を順番に読み出し、それぞれに付与されている属性名を抽出する。また、抽出された属性名を集めて属性グループを生成する。
意味が類似するか否かの判定には、例えば予め用意した類語辞書を使用する。類語辞書は、人手で編集されてもよいし、機械学習により生成されてもよい。
本実施の形態の場合、フォルダ単位で意味が類似する属性名を集める。同じフォルダに属する文書の内容は、関連性が高いと推測されるためである。また、関連性の低い文書が検索の結果に含まれないようにするためでもある。
<文書DBの例>
図20は、文書DB331(図2参照)の構成例を説明する図である。本実施の形態で使用する文書DB331も、木構造のノードに対応するフォルダに紐付けて文書を記憶している。
図20の場合、ルートに位置するフォルダのIDは「001」であり、その子ノードの位置に2つのフォルダが存在する。1つは、IDが「0011」の「契約」フォルダであり、1つは、IDが「0012」の「設計」フォルダである。
「契約」フォルダは第1の集合の一例であり、「設計」フォルダは第2の集合の一例である。
図20に示す「設計」フォルダには2つの文書、すなわち文書AAと文書BBが記憶されている。なお、文書AAの作成者に対応する属性値は「Pさん」であり、「設計済み」に対応する属性値は「TRUE」である。文書BBの作成者に対応する属性値は「Qさん」であり、「完了」に対応する属性値は「FALSE」である。
図20の例では、属性名の「完了」を有する文書として文書Cと文書BBを例示しているが、同じ文書Cが「契約」フォルダと「設計」フォルダの両方に含まれてもよい。
図20の場合、「契約」フォルダには、属性グループの「承認済」グループが既に紐付けられている。なお、「承認済」グループの更新フラグは「FALSE」である。
図20では、ルートフォルダに属性グループを新規に登録する。この場合、前述した属性グループ生成部316は、子ノードに位置する2つのフォルダから5つの文書を取得し、それぞれに付与されている属性名のうち意味が類似する属性名のグループを生成する。
図21は、実施の形態4における属性グループの生成例を説明する図である。
図21に示す属性グループの例は、図20に示したルートフォルダに属する5つの文書から生成されている。
図21に示すように、5つの文書に付与されている属性名は、2つの属性グループに分類が可能である。1つは、他の実施の形態でも説明した「承認済」グループであり、1つは、「納品完了」グループである。代表値は、集合の要素である属性名の中から1つを選んでもよいが、図21の例では、ユーザが事前に与えている。
図21の場合、属性名の「完了」が2つの属性グループに属している。すなわち、属性名の「完了」は、2つの属性グループの重複部分に存在する。この場合、例えばステップ32(図11参照)等で肯定結果が得られる。
この場合、「完了」の属性名が付与されている文書をどちらの属性グループと紐付けるかが問題となる。
因みに、「完了」の属性名が付与されている文書Cと文書BBの両方を、「承認済」グループと「納品完了」グループの両方に紐付けることも可能である。
ただし、1つの属性名を複数の属性グループに紐付けると、検索結果に、ユーザが想定する文書だけでなく、関連性がない文書が多く混ざり混む可能性がある。例えば文書AAと文書BBを検索したい場合に、文書A、文書B、文書Cも検索の結果に含まれることが起こり得る。
そこで、本実施の形態におけるプロセッサ31A(図19参照)では、予め定めた規則に従ってグルーピング処理を実行する。すなわち、属性グループと文書との紐付け処理を実行する。予め定めた規則の具体例は、以下で説明する。
<属性グループの登録>
図22は、実施の形態4で使用する共有サーバ30(図1参照)で実行される属性グループの登録に関する処理動作のうちグルーピング処理の一例を説明するフローチャートである。図22には、図7との対応部分に対応する符号を付して示している。
なお、グルーピング処理以外の処理動作は、図7の処理動作と同様である。
図22に示すグルーピング処理はステップ3Cである。ステップ3Cは、ステップ2(図7参照)で肯定結果が得られた場合に実行される。
まず、プロセッサ31は、処理の対象とする属性グループに、他の属性グループにも属する属性名があるか否かを判定する(ステップ301)。具体的には、図21の「完了」に対応する属性名が含まれるか否かが判定される。
処理の対象とする属性グループに判定の条件を満たす属性名が存在する場合、ステップ301で肯定結果が得られる。一方、処理の対象とする属性グループに判定の条件を満たす属性名が存在しない場合、ステップ301で否定結果が得られる。
ステップ301で否定結果が得られた場合、プロセッサ31は、処理対象とする属性グループとその要素である属性名を有する文書のグルーピングを実行する(ステップ302)。ここでのグルーピングは、実施の形態1~3で説明したいずれかの方法により行う。
ステップ301で肯定結果が得られた場合、プロセッサ31は、共通する属性名を有する複数の属性グループの一方が他方の全部と重なるか否かを判定する(ステップ303)。
図23は、複数の属性グループ間の関係を説明する図である。(A)は一方の属性グループが他方の属性グループの全てを包含する関係を示し、(B)は一方の属性グループと他方の属性グループが一部分で重なるが、一方が他方を包含しない関係を示す。
図23(A)の例は、属性グループの「保管文書」に属性グループの「納品完了」の全部が含まれる場合である。なお、図23(B)の例は、2つの属性グループ間で属性名の「完了」だけが重複する例である。
図22の説明に戻る。
ステップ303で肯定結果が得られた場合、プロセッサ31は、包含される側の属性グループの代表値を、対応する文書の属性名に追加する(ステップ304)。図23(A)の例であれば、属性名の「設計済み」と「完了」は、「納品完了」グループに紐付けられているフォルダの5つの文書に紐付けられる。
この例は、実施の形態2で説明したグルーピング処理に対応する。なお、グルーピング処理の方法には、実施の形態1で説明した方法や実施の形態3で説明した方法を用いることも可能である。
一方、ステップ303で否定結果が得られた場合、プロセッサ31は、各属性グループに対応するフォルダに含まれる文書の数を求め、文書の数が少ない方の属性グループの優先度を上位とする(ステップ305)。
次に、プロセッサ31は、優先度が同じ属性グループが複数あるか否かを判定する(ステップ306)。
優先度が同じ属性グループが複数存在しない場合、プロセッサ31は、ステップ306で否定結果を得、優先度が高い順にグルーピングを実行する(ステップ307)。
具体的には、属性グループに対応する文書の数が少ない方について属性名が紐付けられる。図23(B)の例であれば、属性名の「完了」は、「承認済」グループに紐付けられる。
なお、優先度が同じ属性グループが複数存在する場合、プロセッサ31は、ステップ306で肯定結果を得、グルーピングの未処理をユーザに通知する(ステップ308)。この場合、ユーザは、個別に、文書に付与する属性名を検討することになる。
本実施の形態の場合、複数の属性グループに属する属性名は、属性グループに対応するフォルダの文書の数が少ない方に紐付けられる。
このため、与えられた検索語を用いた検索の結果としてユーザに提示される文書の数は、別の属性グループに紐付けられる場合に比して少なくなる。
提示される文書の数が多すぎると、目的とする文書を特定するまでの時間が長くなり易い。しかし、本実施の形態のように、紐付けられる文書の数が少ない方の属性グループに文書が紐付けられるので、属性グループを用いた検索の結果の数が少なくなり、目的とする文書が特定されるまでの時間が短く済む。
同じ属性名を含み、かつ、対応するフォルダに含まれる文書が一部又は全部重なるような属性グループどうしは、類似の属性グループとみることができる。そこで、類似の属性グループを関連付けて属性グループDB332に記憶させてもよい。
図24は、属性グループDB332に記憶される「承認済」グループの構造例を示している。図24には、図6との対応部分に対応する符号を付して示している。
図24の場合も、属性グループに属する属性名として「承認済」、「承認済み」、「完了」が例示されている。また、属性グループとして更新フラグが「TRUE」に設定されている。ここで、「承認済」グループと「保管文書」グループとは、同じ「承認済み」という属性名を含み、かつ対応するフォルダに含まれる文書が一部重複している状態であり、類似の属性グループどうしである。
図24に示す属性グループの構造と図6に示す属性グループの構造との違いは、図24の場合、“Similar Group”として類似の属性グループに関する項目が存在する点である。このように類似の属性グループを記憶させておくことで、ユーザが「承認済」グループの代表値又は「承認済」グループに属する属性名で検索を実行した際に、類似の属性グループとして「保管文書」があることをユーザに提示して、再検索を促してもよい。
また、図24に示す属性グループの構造には、図6に示す属性グループの構造と違って、”Priority”として優先度の項目も存在する。このように、上述した優先度を数値化して属性グループに対応付けて属性グループDB332に記憶させてもよい。新たにグルーピング処理の対象となったフォルダに、以前に判定された優先度が記憶されている複数のフォルダが含まれ、それらの優先度の関係性が変わらない場合、優先度を再度判定する処理を省いてもよい。
<実施の形態5>
本実施の形態では、共有サーバ30(図1参照)が、ユーザによる属性名の付与を補助する機能を有する場合について説明する。
<システムの構成>
図25は、実施の形態5で使用する共有サーバ30のプロセッサ31Bにより実現される機能の一部を説明する図である。図25には、図19との対応部分に対応する符号を付して示している。
図25に示すプロセッサ31Bでは、属性名入力補助部317が追加されている点で前述した実施の形態4と異なっている。
属性名入力補助部317は、共有サーバ30にアップロードされる新しい文書に付与する属性名の入力を補助する。
本実施の形態における属性名入力補助部317は、既存の属性グループをユーザの使用の頻度が高い順に並び替え、その代表値を属性名の候補としてユーザに提示する。これにより、属性名の表記ゆれを抑制する。ユーザの使用の頻度は、使用の頻度の履歴として記憶されている。
ここで、ユーザの使用の頻度には、例えば検索を実行する場合の入力率や属性名の付与率を使用する。入力率は、ユーザの検索の総回数に対する検索語として入力された回数の商として計算される。また、付与率は、ユーザが属性名を付与した総回数に対する特定の属性名が付与された回数の商として計算される。
図26は、新しい文書を登録するユーザ端末20(図1参照)の表示部に表示される属性名の画面100の例を示す図である。
図26に示す画面100には、文書名101として「文書A」が表示され、1つ目の属性名102として「作成者」が表示され、2つ目の属性名103として4つの候補103Aが表示されている。
図26の場合、代表名である「承認済」が1番目の候補であり、2番目の候補が「承認済み」であり、3つ目の候補が「完了」であり、4番目の候補が「その他」である。候補の並びは、入力率や付与率に基づいて決定される。この例の場合、ユーザの使用する頻度は、候補1が最も高く、次が候補2であり、次が候補3である。
なお、候補103Aの下には、ユーザの操作を促す説明文104が表示されている。
図26に示す画面100が文書をアップロードするユーザに提示することにより、属性名の表記ゆれが少なくなる。
<他の実施の形態>
以上、本発明の実施の形態について説明したが、本発明の技術的範囲は前述した実施の形態に記載の範囲に限定されない。前述した実施の形態に、種々の変更又は改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。
前述の実施の形態では、属性名を検索キーに用いる場合を想定しているが、属性値を検索キーに用いてもよい。属性値についても、ユーザが自由に登録することで表記ゆれが生じるが、類似する属性値の集合を管理することにより、表記ゆれによる検索漏れが解消される。属性値も属性の一例である。
前述した各実施の形態におけるプロセッサは、広義的な意味でのプロセッサを指し、汎用的なプロセッサ(例えばCPU等)の他、専用的なプロセッサ(例えばGPU、ASIC(=Application Specific Integrated Circuit)、FPGA、プログラム論理デバイス等)を含む。
また、前述した各実施の形態におけるプロセッサの動作は、1つのプロセッサが単独で実行してもよいが、物理的に離れた位置に存在する複数のプロセッサが協働して実行してもよい。また、プロセッサにおける各動作の実行の順序は、前述した各実施の形態に記載した順序のみに限定されるものでなく、個別に変更してもよい。
1…文書管理システム、10…ネットワーク、20…ユーザ端末、30…共有サーバ、31、31A、31B…プロセッサ、32…半導体メモリ、33…ハードディスク装置、34…通信モジュール、100…画面、101…文書名、102、103…属性名、103A…候補、104…説明文、311…属性付与部、312…属性グループ管理部、313…登録完了通知部、314…検索受付部、315…検索実行部、316…属性グループ生成部、317…属性名入力補助部、331…文書DB、332…属性グループDB

Claims (16)

  1. プロセッサを有し、
    前記プロセッサは、
    文書を検索する検索キーとして、文書に付与されている属性の入力を受け付け、
    意味が類似する複数の第1の属性を要素に含む集合の代表値として第2の属性が設定されている場合において、受け付けた検索キーに当該第1の属性が含まれるとき、当該第1の属性が属する集合の代表値を用いて文書を検索する
    情報処理システム。
  2. 前記プロセッサは、
    前記第1の属性を要素に含む集合の代表値である前記第2の属性が付与された文書を検索する、請求項1に記載の情報処理システム。
  3. 前記第2の属性は、文書の階層的な管理に使用するディレクトリを単位に付与される、請求項2に記載の情報処理システム。
  4. プロセッサを有し、
    前記プロセッサは、
    文書を検索する検索キーとして、文書に付与されている属性の入力を受け付け、
    意味が類似する複数の第1の属性を要素に含む集合の代表値として第2の属性が設定されている場合において、受け付けた検索キーに当該第1の属性が含まれるとき、当該第1の属性が属する集合の全ての要素を用いて文書を検索する
    情報処理システム。
  5. 前記プロセッサは、
    前記第1の属性を要素に含む集合の全ての要素のいずれかが付与された文書を検索する、請求項4に記載の情報処理システム。
  6. 前記第1の属性は、ユーザにより付与される、請求項5に記載の情報処理システム。
  7. 前記プロセッサは、
    前記第2の属性が、文書の階層的な管理に使用するディレクトリを単位に付与される場合、
    前記ディレクトリに属する文書に付されている意味が類似する前記第1の属性の集合と、当該集合の代表値を与える前記第2の属性とを生成する、請求項1又は4に記載の情報処理システム。
  8. 前記プロセッサは、
    前記集合の要素に変化があった場合、前記第1の属性と前記第2の属性との紐付けを更新する、請求項7に記載の情報処理システム。
  9. 前記プロセッサは、
    ユーザが文書に対して前記第1の属性を付与する場合、使用の頻度の履歴に基づいて前記第2の属性を提示する、請求項1又は4に記載の情報処理システム。
  10. 前記プロセッサは、
    検索キーでの使用の頻度が高い順番に前記第1の属性を提示する、請求項9に記載の情報処理システム。
  11. 前記プロセッサは、
    前記集合としての第1の集合と第2の集合の両方に属する前記第1の属性が存在する場合、予め定めた規則に従って、当該第1の属性と前記第2の属性との紐付けを更新する、請求項1又は4に記載の情報処理システム。
  12. 前記プロセッサは、
    前記第1の集合の全体が前記第2の集合に含まれる場合、当該第1の集合の代表値を与える前記第2の属性を、当該第2の集合の要素に追加する、請求項11に記載の情報処理システム。
  13. 前記プロセッサは、
    前記第1の集合の一部と前記第2の集合の一部が重複し、一方が他方を包含しない場合、重複部分の前記第1の属性を、要素の数が少ない方の集合の要素に設定する、請求項11に記載の情報処理システム。
  14. 前記プロセッサは、
    前記第1の集合の一部と前記第2の集合の一部が重複し、一方が他方を包含しない場合、重複部分の前記第1の属性を、対応する文書が属するディレクトリがより下位の集合の要素に設定する、請求項11に記載の情報処理システム。
  15. コンピュータに、
    文書を検索する検索キーとして、文書に付与されている属性の入力を受け付ける機能と、
    意味が類似する複数の第1の属性を要素に含む集合の代表値として第2の属性が設定されている場合において、受け付けた検索キーに当該第1の属性が含まれるとき、当該第1の属性が属する集合の代表値を用いて文書を検索する機能と、
    を実現させるプログラム。
  16. コンピュータに、
    文書を検索する検索キーとして、文書に付与されている属性の入力を受け付ける機能と、
    意味が類似する複数の第1の属性を要素に含む集合の代表値として第2の属性が設定されている場合において、受け付けた検索キーに当該第1の属性が含まれるとき、当該第1の属性が属する集合の全ての要素を用いて文書を検索する機能と
    を実現させるプログラム。
JP2020156618A 2020-09-17 2020-09-17 情報処理システム及びプログラム Pending JP2022050169A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020156618A JP2022050169A (ja) 2020-09-17 2020-09-17 情報処理システム及びプログラム
US17/176,715 US20220083576A1 (en) 2020-09-17 2021-02-16 Information processing system and non-transitory computer readable medium
CN202110250107.1A CN114201456A (zh) 2020-09-17 2021-03-08 信息处理系统、信息处理方法及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020156618A JP2022050169A (ja) 2020-09-17 2020-09-17 情報処理システム及びプログラム

Publications (1)

Publication Number Publication Date
JP2022050169A true JP2022050169A (ja) 2022-03-30

Family

ID=80626694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020156618A Pending JP2022050169A (ja) 2020-09-17 2020-09-17 情報処理システム及びプログラム

Country Status (3)

Country Link
US (1) US20220083576A1 (ja)
JP (1) JP2022050169A (ja)
CN (1) CN114201456A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12013822B1 (en) * 2022-12-02 2024-06-18 Bedrock Labs, Inc. Discovery of data sets

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006134102A (ja) * 2004-11-05 2006-05-25 Fuji Xerox Co Ltd ディレクトリ編集支援プログラム、ディレクトリ編集支援方法及びディレクトリ編集支援装置
US8510325B1 (en) * 2004-12-30 2013-08-13 Google Inc. Supplementing search results with information of interest
US8966576B2 (en) * 2012-02-27 2015-02-24 Axiomatics Ab Provisioning access control using SDDL on the basis of a XACML policy
JP6573162B2 (ja) * 2015-08-28 2019-09-11 富士ゼロックス株式会社 画像読取装置、画像形成装置およびプログラム
WO2017195388A1 (ja) * 2016-05-12 2017-11-16 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
EP3699785A1 (en) * 2019-02-22 2020-08-26 Thales Dis France SA Method for managing data of digital documents
JP2021144565A (ja) * 2020-03-13 2021-09-24 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Also Published As

Publication number Publication date
CN114201456A (zh) 2022-03-18
US20220083576A1 (en) 2022-03-17

Similar Documents

Publication Publication Date Title
US10025904B2 (en) Systems and methods for managing a master patient index including duplicate record detection
US10572461B2 (en) Systems and methods for managing a master patient index including duplicate record detection
WO2014010082A1 (ja) 検索装置、検索装置の制御方法及び記録媒体
JP5482667B2 (ja) ポリシー管理装置、ポリシー管理システム、それに用いる方法およびプログラム
KR101355273B1 (ko) 컴퓨팅 시스템 및 그 실행 제어 방법과, 그 실행 제어 프로그램을 기록한 기록 매체
EP3637277B1 (en) Sorting of devices for file distribution
JP5836893B2 (ja) ファイル管理装置、ファイル管理方法、及びプログラム
JP2022050169A (ja) 情報処理システム及びプログラム
JP4287464B2 (ja) システム基盤構成策定支援システム及び支援方法
CN113282579A (zh) 一种异构数据存储与检索方法、装置、设备及存储介质
JP2005316699A (ja) コンテンツ公開システム、コンテンツ公開方法、及びコンテンツ公開プログラム
US20090049015A1 (en) Data management device and terminal device
JP6251860B2 (ja) 情報管理装置並びにファイル管理方法
JP6710881B1 (ja) ドキュメント作成支援システム
JP6638053B1 (ja) ドキュメント作成支援システム
JP7381290B2 (ja) 計算機システム及びデータの管理方法
JP4469818B2 (ja) データ管理装置、データプログラム及びデータ管理方法
US20160019204A1 (en) Matching large sets of words
JP2022074238A (ja) 情報処理システム及びプログラム
JP2018032113A (ja) 情報管理装置並びにファイル管理方法
JP3660390B2 (ja) 用語辞書管理装置
JP2003091535A (ja) データ管理方法及びプログラム並びに装置
JPH11203314A (ja) 文書番号自動採番システム
JP2010271910A (ja) リポジトリ管理サーバ
WO2020240831A1 (ja) ファイル管理装置、ファイル管理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240531