JP6404971B2 - データ管理システムおよびデータ管理プログラム - Google Patents

データ管理システムおよびデータ管理プログラム Download PDF

Info

Publication number
JP6404971B2
JP6404971B2 JP2017046543A JP2017046543A JP6404971B2 JP 6404971 B2 JP6404971 B2 JP 6404971B2 JP 2017046543 A JP2017046543 A JP 2017046543A JP 2017046543 A JP2017046543 A JP 2017046543A JP 6404971 B2 JP6404971 B2 JP 6404971B2
Authority
JP
Japan
Prior art keywords
data
processing unit
grouping
group
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2017046543A
Other languages
English (en)
Other versions
JP2018151781A (ja
Inventor
栄之 小島
栄之 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Information Systems Corp
Original Assignee
Mitsubishi Electric Information Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Information Systems Corp filed Critical Mitsubishi Electric Information Systems Corp
Priority to JP2017046543A priority Critical patent/JP6404971B2/ja
Publication of JP2018151781A publication Critical patent/JP2018151781A/ja
Application granted granted Critical
Publication of JP6404971B2 publication Critical patent/JP6404971B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、データ管理システムおよびデータ管理プログラムに関するものである。
特許文献1には、データを自動的に分類する自動グルーピングに関する技術が記載されている。
特開2011−18111号公報
従来の自動グルーピングでは、項目ごとに同じ値のデータが同じグループに分類されるだけである。
従来の自動グルーピングでは、ある時期のひとまとまりの作業ごとに文書の自動グルーピングを行うことはできない。例えば、特許関連の業務で、先行技術調査、出願および拒絶理由通知への対応といった作業で扱われる文書を、作業ごとのグループに自動的に分類することはできない。
従来の自動グルーピングでは、文書の大分類および中分類が項目として独立していなかった場合は、文書の大分類および中分類で文書の自動グルーピングを行うことはできない。例えば、システム開発のプロジェクトで作成される文書の大分類および中分類が、文書名に含まれるシステム名およびサブシステム名でそれぞれ表されるだけで、文書の大分類および中分類がそれぞれ独立した項目としてデータベースに設定されていないとする。この場合、システム名が共通する文書を同じグループに自動的に分類することはできないし、さらにそのグループ内でサブシステム名が共通する文書を同じグループに自動的に分類することもできない。
従来の自動グルーピングでは、文書のタイプが項目として独立していなかった場合は、文書のタイプで文書の自動グルーピングを行うことはできない。例えば、仕様書、説明書および報告書といった文書のタイプが、文書名に含まれる文字列で表されるだけで、文書のタイプが独立した項目としてデータベースに設定されていないとする。この場合、仕様書、説明書および報告書を個別のグループに自動的に分類することはできない。
このように、従来の自動グルーピングでは、ある項目によって関連性が示唆されていても、その項目が同じ値でないデータは同じグループに分類されないため、利便性が十分ではない。
本発明は、自動グルーピングの利便性の向上を目的とする。
本発明の一態様に係るデータ管理システムは、
時間情報の項目を含む複数の項目を持つデータをデータベースから複数件取得する検索処理部と、
前記検索処理部により取得された複数件のデータに対し、前記時間情報の差が閾値以下のデータ同士を同じグループに分類するグルーピングを行うグルーピング処理部と、
前記グルーピング処理部により分類された複数件のデータを分類先のグループごとにまとめてディスプレイに表示する制御を行う表示制御部とを備える。
前記グルーピング処理部は、前記検索処理部により取得された複数件のデータに対し、分類先の各グループ内で最先の前記時間情報を示す項目と、分類先の各グループ内で最後の前記時間情報を示す項目との少なくともいずれかを追加し、
前記表示制御部は、前記グルーピング処理部により分類された複数件のデータを分類先のグループごとに表示する際に、分類先の各グループを識別する項目として前記グルーピング処理部により追加された項目を表示する制御を行う。
前記表示制御部は、前記グルーピング処理部により分類された複数件のデータを分類先のグループごとに折り畳んで表示するか展開して表示するかを選択するためのユーザインタフェースを提供する。
前記時間情報の項目は、日付を示す項目であり、
前記閾値は、暦日数と営業日数とのいずれかを示す値である。
前記複数の項目には、文書名を示す項目が含まれ、
前記時間情報の項目は、前記文書名に対応する文書が前記データベースに登録された日付を示す項目である。
本発明の別の一態様に係るデータ管理システムは、
文字列の項目を含む複数の項目を持つデータをデータベースから複数件取得する検索処理部と、
前記検索処理部により取得された複数件のデータについて、前記文字列を複数の文節に分割する文節解析部と、
前記検索処理部により取得された複数件のデータに対し、前記複数の文節のうち対応する位置にある文節が一致するデータ同士を同じグループに分類するグルーピングを行うグルーピング処理部と、
前記グルーピング処理部により分類された複数件のデータを分類先のグループごとにまとめてディスプレイに表示する制御を行う表示制御部とを備える。
前記グルーピング処理部は、前記検索処理部により取得された複数件のデータに対し、前記複数の文節のうち対応する1つの位置にある文節が一致するデータ同士を同じグループに分類し、分類先の各グループ内で、前記複数の文節のうち対応する別の位置にある文節が一致するデータ同士を同じサブグループに分類するグルーピングを行う。
前記グルーピング処理部は、前記検索処理部により取得された複数件のデータに対し、前記文字列の最初の文節が一致するデータ同士を同じグループに分類するグルーピングを行う。
前記グルーピング処理部は、前記検索処理部により取得された複数件のデータに対し、前記文字列の最後の文節が一致するデータ同士を同じグループに分類するグルーピングを行う。
前記グルーピング処理部は、前記検索処理部により取得された複数件のデータに対し、分類先の各グループを識別する項目を追加し、
前記表示制御部は、前記グルーピング処理部により分類された複数件のデータを分類先のグループごとに表示する際に、前記グルーピング処理部により追加された項目を表示する制御を行う。
前記表示制御部は、前記グルーピング処理部により分類された複数件のデータを分類先のグループごとに折り畳んで表示するか展開して表示するかを選択するためのユーザインタフェースを提供する。
前記文字列の項目は、文書名を示す項目である。
本発明の一態様に係るデータ管理プログラムは、
コンピュータに、
時間情報を示す項目を含む複数の項目を持つデータをデータベースから複数件取得する検索処理と、
前記検索処理により取得された複数件のデータに対し、時間情報の差が閾値以下のデータ同士を同じグループに分類するグルーピングを行うグルーピング処理と、
前記グルーピング処理により分類された複数件のデータを分類先のグループごとにまとめてディスプレイに表示する制御を行う表示制御処理とを実行させる。
本発明の別の一態様に係るデータ管理プログラムは、
コンピュータに、
文字列の項目を含む複数の項目を持つデータをデータベースから複数件取得する検索処理と、
前記検索処理により取得された複数件のデータについて、前記文字列を複数の文節に分割する文節解析処理と、
前記検索処理により取得された複数件のデータに対し、前記複数の文節のうち対応する位置にある文節が一致するデータ同士を同じグループに分類するグルーピングを行うグルーピング処理と、
前記グルーピング処理により分類された複数件のデータを分類先のグループごとにまとめてディスプレイに表示する制御を行う表示制御処理とを実行させる。
本発明によれば、自動グルーピングの利便性が向上する。
実施の形態1に係るデータ管理システムおよびクライアント装置の構成を示すブロック図。 実施の形態1に係るデータ管理システムの動作を示すフローチャート。 実施の形態1に係る検索結果の例を示す表。 実施の形態1に係るグルーピング結果の例を示す表。 実施の形態1に係る画面表示の例を示す表。 実施の形態2に係るデータ管理システムおよびクライアント装置の構成を示すブロック図。 実施の形態2に係るデータ管理システムの動作を示すフローチャート。 実施の形態2に係る検索結果の例を示す表。 実施の形態2に係るグルーピング結果の例を示す表。 実施の形態2に係る画面表示の例を示す表。 実施の形態3に係るグルーピング結果の例を示す表。 実施の形態3に係る画面表示の例を示す表。
以下、本発明の実施の形態について、図を用いて説明する。各図中、同一または相当する部分には、同一符号を付している。実施の形態の説明において、同一または相当する部分については、説明を適宜省略または簡略化する。なお、本発明は、以下に説明する実施の形態に限定されるものではなく、必要に応じて種々の変更が可能である。例えば、以下に説明する実施の形態のうち、2つ以上の実施の形態が組み合わせられて実施されても構わない。あるいは、以下に説明する実施の形態のうち、1つの実施の形態または2つ以上の実施の形態の組み合わせが部分的に実施されても構わない。
実施の形態1.
本実施の形態について、図1から図5を用いて説明する。
***構成の説明***
図1を参照して、本実施の形態に係るデータ管理システム100およびクライアント装置200の構成を説明する。
データ管理システム100は、コンピュータである。データ管理システム100は、プロセッサ101を備えるとともに、メモリ102および通信装置103といった他のハードウェアを備える。プロセッサ101は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。
データ管理システム100は、機能要素として、検索処理部111と、検索結果作成処理部112と、グルーピング処理部113と、表示制御部114と、通信処理部115とを備える。検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114および通信処理部115の機能は、ソフトウェアにより実現される。
プロセッサ101は、各種処理を行うICである。「IC」は、Integrated
Circuitの略語である。プロセッサ101は、例えば、CPUである。「CPU」は、Central Processing Unitの略語である。
メモリ102には、データベース121が構築される。データベース121には、時間情報の項目を含む複数の項目を持つデータが格納されている。データは、任意のデータでよいが、本実施の形態では、文書に関するデータである。そのため、上記複数の項目には、文書名を示す項目が含まれている。時間情報の項目は、本実施の形態では、日付を示す項目であるが、年を示す項目、月を示す項目、週を示す項目、または、時刻を示す項目等であってもよい。時間情報の項目は、具体的には、文書名に対応する文書の作成日を示す項目である。ある文書の作成日とは、その文書がデータベース121に登録された日付のことである。メモリ102は、例えば、フラッシュメモリまたはRAMである。「RAM」は、Random Access Memoryの略語である。
通信装置103は、データを受信するレシーバおよびデータを送信するトランスミッタを含む。通信装置103は、例えば、通信チップまたはNICである。「NIC」は、Network Interface Cardの略語である。
メモリ102には、検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114および通信処理部115の機能を実現するプログラムであるデータ管理プログラムが記憶されている。データ管理プログラムは、プロセッサ101に読み込まれ、プロセッサ101によって実行される。メモリ102には、OSも記憶されている。「OS」は、Operating Systemの略語である。プロセッサ101は、OSを実行しながら、データ管理プログラムを実行する。なお、データ管理プログラムの一部または全部がOSに組み込まれていてもよい。
データ管理プログラムおよびOSは、補助記憶装置に記憶されていてもよい。補助記憶装置は、例えば、フラッシュメモリまたはHDDである。「HDD」は、Hard Disk Driveの略語である。補助記憶装置に記憶されているデータ管理プログラムおよびOSは、メモリ102にロードされ、プロセッサ101によって実行される。
データベース121は、補助記憶装置に構築されてもよい。
データ管理システム100は、プロセッサ101を代替する複数のプロセッサを備えていてもよい。これら複数のプロセッサは、データ管理プログラムの実行を分担する。それぞれのプロセッサは、プロセッサ101と同じように、各種処理を行うICである。
検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114および通信処理部115の処理の結果を示す情報、データ、信号値および変数値は、メモリ102、補助記憶装置、または、プロセッサ101内のレジスタまたはキャッシュメモリに記憶される。
データ管理プログラムは、磁気ディスクおよび光ディスクといった可搬記録媒体に記憶されてもよい。
クライアント装置200は、インターネット等のネットワーク300を介してデータ管理システム100に接続される。
クライアント装置200は、コンピュータである。クライアント装置200は、図示していないプロセッサを備えるとともに、図示していないメモリ、通信装置201、入力装置202およびディスプレイ203といった他のハードウェアを備える。
クライアント装置200は、機能要素として、通信処理部211と、入力処理部212と、画面表示処理部213とを備える。通信処理部211、入力処理部212および画面表示処理部213の機能は、ソフトウェアにより実現される。
通信装置201は、データを受信するレシーバおよびデータを送信するトランスミッタを含む。通信装置201は、例えば、通信チップまたはNICである。
入力装置202は、例えば、マウス、キーボードまたはタッチパネルである。
ディスプレイ203は、例えば、LCDである。「LCD」は、Liquid Crystal Displayの略語である。
クライアント装置200のメモリには、通信処理部211、入力処理部212および画面表示処理部213の機能を実現するプログラムが記憶されている。このプログラムは、クライアント装置200のプロセッサにより読み込まれて実行される。
***動作の説明***
図2を参照して、本実施の形態に係るデータ管理システム100の動作を説明する。データ管理システム100の動作は、本実施の形態に係るデータ管理方法に相当する。
ステップS11において、検索処理部111は、時間情報の項目を含む複数の項目を持つデータをデータベース121から複数件取得する。具体的には、検索処理部111は、文書名を示す項目と、その文書名に対応する文書の作成日を示す項目とを含む複数の項目を持つデータをデータベース121から複数件取得する。検索結果作成処理部112は、検索処理部111により取得された複数件のデータを検索結果としてグルーピング処理部113に入力する。
ステップS12において、グルーピング処理部113は、検索処理部111により取得された複数件のデータに対し、時間情報の差が閾値以下のデータ同士を同じグループに分類するグルーピングを行う。具体的には、グルーピング処理部113は、ステップS11で取得された複数件のデータの中で、作成日の間隔が閾値によって示された日数以下のデータ同士を同じグループに分類する。なお、閾値によって示される日数は、暦日数でもよいし、データ管理システム100を利用する企業等の組織における営業日数でもよい。
本実施の形態において、グルーピング処理部113は、検索処理部111により取得された複数件のデータに対し、分類先の各グループ内で最先の時間情報を示す項目を追加する。具体的には、グルーピング処理部113は、ステップS11で取得された複数件のデータが持つ項目として、同一グループ内で最も古い作成日を、そのグループの代表値として示す項目を追加する。
具体例として、ステップS11で、図3に示すような検索結果が得られたとする。グルーピング処理用の閾値は、2日に設定されているとする。この場合、ステップS12では、図4に示すようなグルーピング結果が得られる。すなわち、グルーピング処理部113は、検索結果で、作成部門、作成者、さらに作成日について、作成日でソートしたときに連続する文書の作成日の間隔が2日以内のものを同じグループに分類する。このとき、グルーピング処理部113は、同一グループ内の最も古い日付を、そのグループの「作業開始日」として示す項目を追加している。ここで、グルーピング処理用の閾値は、2日に限らず、5日または7日といった任意の日数に設定可能であり、適宜変更することも可能である。作成日が複数月あるいは複数年にまたがるグループがあってもよい。
なお、グルーピング処理部113は、検索処理部111により取得された複数件のデータに対し、分類先の各グループ内で最先の時間情報を示す項目の代わりに、あるいは、分類先の各グループ内で最先の時間情報を示す項目とともに、分類先の各グループ内で最後の時間情報を示す項目を追加してもよい。具体的には、グルーピング処理部113は、ステップS11で取得された複数件のデータが持つ項目として、同一グループ内で最も新しい作成日を、そのグループの代表値として示す項目を追加してもよい。図4の例では、グルーピング処理部113は、同一グループ内の最も新しい日付を、そのグループの「作業終了日」として示す項目を追加してもよい。
ステップS13において、表示制御部114は、グルーピング処理部113により分類された複数件のデータを分類先のグループごとにまとめてディスプレイ203に表示する制御を行う。具体的には、表示制御部114は、ステップS12で分類された複数件のデータを分類先のグループごとにまとめて画面表示可能な形式で記述したメッセージを作成する。このメッセージの記述に用いられる言語は、任意の言語でよいが、本実施の形態では、XMLまたはHTMLといったマークアップ言語が用いられる。「XML」は、Extensible Markup Languageの略語である。「HTML」は、Hypertext Markup Languageの略語である。通信処理部115は、表示制御部114により作成されたメッセージを通信装置103によりネットワーク300経由でクライアント装置200に送信する。
本実施の形態において、表示制御部114は、グルーピング処理部113により分類された複数件のデータを分類先のグループごとに表示する際に、分類先の各グループを識別する項目としてグルーピング処理部113により追加された項目を表示する制御を行う。具体的には、表示制御部114は、メッセージに記述した複数件のデータが持つ項目として、同一グループ内で最も古い作成日を、そのグループの代表値として示す項目を含める。
本実施の形態において、表示制御部114は、グルーピング処理部113により分類された複数件のデータを分類先のグループごとに折り畳んで表示するか展開して表示するかを選択するためのユーザインタフェースを提供する。
具体例として、ステップS12で、図4に示すようなグルーピング結果が得られたとする。この場合、クライアント装置200では、通信処理部211が、ステップS13で送信されたメッセージを通信装置201により受信し、画面表示処理部213が、そのメッセージに記述されたデータを、図5に示すような形式でディスプレイ203に表示する。入力処理部212は、入力装置202によりユーザの操作を受け付けることで、ステップS12のグルーピングによる分類先のグループごとに、すなわち、作業開始日ごとに、表示中のデータを折り畳んで表示したり、展開して表示したりすることができる。この例では、作業開始日の1つ上のレベルとして、作成者による分類が行われているため、入力処理部212は、入力装置202によりユーザの操作を受け付けることで、作成者ごとに、表示中のデータを折り畳んで表示したり、展開して表示したりすることもできる。さらに、作成者の1つ上のレベルとして作成部門による分類も行われているため、入力処理部212は、入力装置202によりユーザの操作を受け付けることで、作成部門ごとに、表示中のデータを折り畳んで表示したり、展開して表示したりすることもできる。
図5の(a)は、初期表示を示している。図5の(a)では、作成部門が「部門1」のデータは折り畳まれ、作成部門が「部門2」のデータは展開されている。作成部門が「部門2」のデータ中、作成者が「いいい」のデータは折り畳まれている。
「部門1」の左の「+」が押されると、図5の(b)のような表示になる。
図5の(b)では、作成部門が「部門1」のデータは展開されている。作成部門が「部門1」のデータ中、作成者が「あああ」のデータと、作成者が「えええ」のデータは折り畳まれ、作成者が「ううう」のデータは展開されている。作成者が「ううう」のデータ中、作成開始日が2016年6月2日のデータは折り畳まれている。
「えええ」の左の「+」が押されると、図5の(c)のような表示になる。
図5の(c)では、作成部門が「部門1」かつ作成者が「えええ」のデータは展開されている。作成者が「えええ」のデータ中、作成開始日が2016年3月5日のデータと、作成開始日が2016年7月11日のデータと、作成開始日が2016年8月21日のデータは折り畳まれている。
「2016−07−11」の左の「+」が押されると、図5の(d)のような表示になる。
図5の(d)では、作成部門が「部門1」かつ作成者が「えええ」のデータ中、作成開始日が2016年3月5日のデータと、作成開始日が2016年8月21日のデータは折り畳まれ、作成開始日が2016年7月11日のデータは展開されている。
この例では、折り畳み表示されていない行は、すべての項目の値が表示されている。折り畳み表示されている行は、その行に含まれるデータの件数が、一番左に表示されている。
なお、初期表示の状態は、図5の(a)に限らず、作成部門をすべて展開して、作成者のレベルで折り畳み表示する等、任意の状態に変更可能である。
折り畳み表示されているレベルの1つ下のレベルの欄は、図5の(c)における「あああ」の右の欄のような空白にする代わりに、代表値を表示してもよいし、小さい文字で複数の値を表示してもよい。代表値を表示する場合は、その欄に該当する値をソートしたときの最初の値、あるいは、最も件数の多い値を表示することが望ましい。
データベース121に格納されたデータが、特許関連の業務で、先行技術調査、出願および拒絶理由通知への対応といった作業で扱われる文書に関するデータであれば、データが持つ複数の項目に、事件番号または出願番号といった作業対象の識別番号を示す項目が含まれることが望ましい。そして、作業開始日と作成者との間のレベルとして、その識別番号による分類が行われていることが望ましい。作業対象の識別番号による分類が行われている場合、入力処理部212は、入力装置202によりユーザの操作を受け付けることで、識別番号ごとに、表示中のデータを折り畳んで表示したり、展開して表示したりすることもできる。また、作業対象の識別番号だけでなく、国または地域の識別番号についても、同様の分類が行われてよい。
***実施の形態の効果の説明***
本実施の形態によれば、自動グルーピングの利便性が向上する。
本実施の形態では、検索結果をグループごとにまとめて表示することで、大量の検索結果をグルーピングが行われた結果ごとに見ていくことができる。具体的には、文書の検索結果のデータが大量にあるときに、大量のデータを作成日等の日付の偏り、作成者の所属および作成者名といった多段階で自動的にグループ化して表示することができる。
本実施の形態によれば、ある時期のひとまとまりの作業ごとに文書の自動グルーピングを行うことができる。例えば、特許関連の業務で、先行技術調査、出願および拒絶理由通知への対応といった作業で扱われる文書を、作業ごとのグループに自動的に分類することができる。
***他の構成***
本実施の形態では、検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114および通信処理部115の機能がソフトウェアにより実現されるが、変形例として、検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114および通信処理部115の機能がソフトウェアとハードウェアとの組み合わせにより実現されてもよい。すなわち、検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114および通信処理部115の機能の一部が専用の電子回路により実現され、残りがソフトウェアにより実現されてもよい。
専用の電子回路は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックIC、GA、FPGAまたはASICである。「GA」は、Gate Arrayの略語である。「FPGA」は、Field−Programmable Gate Arrayの略語である。「ASIC」は、Application Specific Integrated Circuitの略語である。
プロセッサ101、メモリ102および専用の電子回路を、総称して「プロセッシングサーキットリ」という。つまり、検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114および通信処理部115の機能がソフトウェアにより実現されるか、ソフトウェアとハードウェアとの組み合わせにより実現されるかに関わらず、検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114および通信処理部115の機能は、プロセッシングサーキットリにより実現される。
実施の形態2.
本実施の形態について、主に実施の形態1との差異を、図6から図10を用いて説明する。
***構成の説明***
図6を参照して、本実施の形態に係るデータ管理システム100およびクライアント装置200の構成を説明する。
データ管理システム100は、機能要素として、文節解析部116をさらに備える。検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114、通信処理部115および文節解析部116の機能は、ソフトウェアにより実現される。
データベース121には、文字列の項目を含む複数の項目を持つデータが格納されている。データは、任意のデータでよいが、本実施の形態では、文書に関するデータである。そのため、文字列の項目は、文書名を示す項目である。
***動作の説明***
図7を参照して、本実施の形態に係るデータ管理システム100の動作を説明する。データ管理システム100の動作は、本実施の形態に係るデータ管理方法に相当する。
ステップS21において、検索処理部111は、文字列の項目を含む複数の項目を持つデータをデータベース121から複数件取得する。具体的には、検索処理部111は、文書名を示す項目を含む複数の項目を持つデータをデータベース121から複数件取得する。検索結果作成処理部112は、検索処理部111により取得された複数件のデータを検索結果としてグルーピング処理部113を介して文節解析部116に入力する。
ステップS22において、文節解析部116は、検索処理部111により取得された複数件のデータについて、上記文字列を複数の文節に分割する。具体的には、文節解析部116は、ステップS21で取得された複数件のデータについて、文書名を解析して、文書名の文字列を文節ごとに区切る。文字列を文節ごとに区切る方法としては、従来の方法を用いることができる。
ステップS23において、グルーピング処理部113は、検索処理部111により取得された複数件のデータに対し、上記複数の文節のうち対応する位置にある文節が一致するデータ同士を同じグループに分類するグルーピングを行う。具体的には、グルーピング処理部113は、ステップS21で取得された複数件のデータに対し、上記複数の文節のうち対応する1つの位置にある文節が一致するデータ同士を同じグループに分類し、分類先の各グループ内で、複数の文節のうち対応する別の位置にある文節が一致するデータ同士を同じサブグループに分類するグルーピングを行う。より具体的には、グルーピング処理部113は、ステップS21で取得された複数件のデータの中で、文書名の最初の文節が一致するデータ同士を同じグループに分類する。そして、グルーピング処理部113は、その分類先の各グループ内で、前から2番目の文節が一致するデータ同士を同じサブグループに分類する。
本実施の形態において、グルーピング処理部113は、検索処理部111により取得された複数件のデータに対し、分類先の各グループを識別する項目を追加する。具体的には、グルーピング処理部113は、ステップS11で取得された複数件のデータが持つ項目として、グルーピングに用いた文節を示す項目を追加する。
具体例として、ステップS21で、図8に示すような検索結果が得られたとする。この場合、ステップS22で文書名が文節ごとに区切られた後、ステップS23では、図9に示すようなグルーピング結果が得られる。すなわち、グルーピング処理部113は、文書名の前の文節2個でグルーピングを行う。このとき、グルーピング処理部113は、各グループの分類に用いた文節を「分類1」として示す項目を追加している。また、グルーピング処理部113は、各サブグループの分類に用いた文節を「分類2」として示す項目を追加している。なお、「分類1」および「分類2」は、「システム名」および「サブシステム名」といった、項目の内容を表す名称にしてもよい。
ステップS24において、表示制御部114は、グルーピング処理部113により分類された複数件のデータを分類先のグループごとにまとめてディスプレイ203に表示する制御を行う。具体的には、表示制御部114は、ステップS23で分類された複数件のデータを分類先のグループごとにまとめて画面表示可能な形式で記述したメッセージを作成する。このメッセージの記述に用いられる言語は、任意の言語でよいが、本実施の形態では、実施の形態1と同じように、XMLまたはHTMLといったマークアップ言語が用いられる。通信処理部115は、表示制御部114により作成されたメッセージを通信装置103によりネットワーク300経由でクライアント装置200に送信する。
本実施の形態において、表示制御部114は、グルーピング処理部113により分類された複数件のデータを分類先のグループごとに表示する際に、分類先の各グループを識別する項目としてグルーピング処理部113により追加された項目を表示する制御を行う。具体的には、表示制御部114は、メッセージに記述した複数件のデータが持つ項目として、グルーピングに用いられた文節を示す項目を含める。
本実施の形態において、表示制御部114は、グルーピング処理部113により分類された複数件のデータを分類先のグループごとに折り畳んで表示するか展開して表示するかを選択するためのユーザインタフェースを提供する。
具体例として、ステップS23で、図9に示すようなグルーピング結果が得られたとする。この場合、クライアント装置200では、通信処理部211が、ステップS24で送信されたメッセージを通信装置201により受信し、画面表示処理部213が、そのメッセージに記述されたデータを、図10に示すような形式でディスプレイ203に表示する。入力処理部212は、入力装置202によりユーザの操作を受け付けることで、ステップS23のグルーピングによる分類先のグループごとに、すなわち、分類1ごと、および、分類2ごとに、表示中のデータを折り畳んで表示したり、展開して表示したりすることができる。
図10の(a)は、初期表示を示している。
「111」の左の「+」が押されると、図10の(b)のような表示になる。
「DDD」の左の「+」が押されると、図10の(c)のような表示になる。
この例では、折り畳み表示されていない行は、すべての項目の値が表示されている。折り畳み表示されている行は、その行に含まれるデータの件数が、一番左に表示されている。
なお、初期表示の状態は、図10の(a)に限らず、分類1をすべて展開して、分類2のレベルで折り畳み表示する等、任意の状態に変更可能である。
折り畳み表示されているレベルの1つ下のレベルの欄は、図10の(b)における「AAA」の右の欄のような空白にする代わりに、代表値を表示してもよいし、小さい文字で複数の値を表示してもよい。代表値を表示する場合は、その欄に該当する値をソートしたときの最初の値を表示することが望ましい。
***実施の形態の効果の説明***
本実施の形態によれば、自動グルーピングの利便性が向上する。
本実施の形態では、検索結果をグループごとにまとめて表示することで、大量の検索結果をグルーピングが行われた結果ごとに見ていくことができる。具体的には、文書の検索結果のデータが大量にあるときに、文書名について文節に区切った上で、大量のデータを文節ごとに前から大分類および中分類といった多段階に自動的にグループ化して表示することができる。
本実施の形態によれば、文書の大分類および中分類が項目として独立していなかった場合でも、文書の大分類および中分類で文書の自動グルーピングを行うことができる。例えば、システム開発のプロジェクトで作成される文書の大分類および中分類が、文書名に含まれるシステム名およびサブシステム名でそれぞれ表されるだけで、文書の大分類および中分類がそれぞれ独立した項目としてデータベースに設定されていないとする。この場合でも、システム名が共通する文書を同じグループに自動的に分類することができる。さらにそのグループ内でサブシステム名が共通する文書を同じグループに自動的に分類することもできる。
***他の構成***
本実施の形態では、実施の形態1と同じように、検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114、通信処理部115および文節解析部116の機能がソフトウェアにより実現されるが、実施の形態1の変形例と同じように、検索処理部111、検索結果作成処理部112、グルーピング処理部113、表示制御部114、通信処理部115および文節解析部116の機能がソフトウェアとハードウェアとの組み合わせにより実現されてもよい。
実施の形態3.
本実施の形態について、主に実施の形態2との差異を、図11および図12を用いて説明する。
***構成の説明***
本実施の形態に係るデータ管理システム100およびクライアント装置200の構成については、図6に示した実施の形態2のものと同じである。
***動作の説明***
図7を参照して、本実施の形態に係るデータ管理システム100の動作を説明する。データ管理システム100の動作は、本実施の形態に係るデータ管理方法に相当する。
ステップS21およびステップS23については、実施の形態2のものと同じである。
ステップS23において、グルーピング処理部113は、ステップS21で取得された複数件のデータの中で、文書名の最後の文節が一致するデータ同士を同じグループに分類する。
具体例として、ステップS21で、図8に示すような検索結果が得られたとする。この場合、ステップS22で文書名が文節ごとに区切られた後、ステップS23では、図11に示すようなグルーピング結果が得られる。すなわち、グルーピング処理部113は、文書名の後ろの文節1個でグルーピングを行う。このとき、グルーピング処理部113は、各グループの分類に用いた文節を「分類1」として示す項目を追加している。なお、「分類1」は、「文書タイプ」といった、項目の内容を表す名称にしてもよい。
ステップS24については、実施の形態2のものと同じである。
具体例として、ステップS23で、図11に示すようなグルーピング結果が得られたとする。この場合、クライアント装置200では、通信処理部211が、ステップS24で送信されたメッセージを通信装置201により受信し、画面表示処理部213が、そのメッセージに記述されたデータを、図12に示すような形式でディスプレイ203に表示する。入力処理部212は、入力装置202によりユーザの操作を受け付けることで、ステップS23のグルーピングによる分類先のグループごとに、すなわち、分類1ごとに、表示中のデータを折り畳んで表示したり、展開して表示したりすることができる。
図12の(a)は、初期表示を示している。
「報告書」の左の「+」が押されると、図12の(b)のような表示になる。
この例でも、折り畳み表示されていない行は、すべての項目の値が表示されている。折り畳み表示されている行は、その行に含まれるデータの件数が、一番左に表示されている。
***実施の形態の効果の説明***
本実施の形態では、検索結果をグループごとにまとめて表示することで、大量の検索結果をグルーピングが行われた結果ごとに見ていくことができる。具体的には、文書の検索結果のデータが大量にあるときに、文書名について文節に区切った上で、大量のデータを文節ごとに後ろから仕様書、説明書および報告書等の文書タイプごとに自動的にグループ化して表示することができる。
本実施の形態によれば、文書のタイプが項目として独立していなかった場合でも、文書のタイプで文書の自動グルーピングを行うことができる。例えば、仕様書、説明書および報告書といった文書のタイプが、文書名に含まれる文字列で表されるだけで、文書のタイプが独立した項目としてデータベースに設定されていないとする。この場合でも、仕様書、説明書および報告書を個別のグループに自動的に分類することができる。
100 データ管理システム、101 プロセッサ、102 メモリ、103 通信装置、111 検索処理部、112 検索結果作成処理部、113 グルーピング処理部、114 表示制御部、115 通信処理部、116 文節解析部、121 データベース、200 クライアント装置、201 通信装置、202 入力装置、203 ディスプレイ、211 通信処理部、212 入力処理部、213 画面表示処理部。

Claims (9)

  1. 調査、出願および拒絶理由通知への対応の各作業が行われた事件の識別番号を示す項目と、前記識別番号に対応する事件の作業で扱われた文書の文書名を示す項目と、前記文書名に対応する文書がデータベースに登録された日付を示す項目を含む複数の項目を持つデータを前記データベースから複数件取得する検索処理部と、
    前記検索処理部により取得された複数件のデータに対し、前記日付の差が閾値によって示された暦日数または営業日数以下のデータ同士を同じグループに分類するグルーピングを行うグルーピング処理部と、
    前記グルーピング処理部により分類された複数件のデータを分類先のグループごとにまとめてディスプレイに表示する制御を行う表示制御部と
    を備えるデータ管理システム。
  2. 前記グルーピング処理部は、前記検索処理部により取得された複数件のデータに対し、分類先の各グループを識別する項目として、分類先の各グループ内で最も新しい前記日付を示す項目を追加し、
    前記表示制御部は、前記グルーピング処理部により分類された複数件のデータを分類先のグループごとに表示する際に、分類先の各グループを識別する項目として前記グルーピング処理部により追加された項目を表示する制御を行う請求項1に記載のデータ管理システム。
  3. 前記表示制御部は、前記グルーピング処理部により分類された複数件のデータを分類先のグループごとに折り畳んで1行で表示するか展開して表示するかを選択するためのユーザインタフェースを提供し、折り畳んで表示する行については、その行に含まれるデータの件数を一番左に表示する請求項1または2に記載のデータ管理システム。
  4. 文字列の項目を含む複数の項目を持つデータをデータベースから複数件取得する検索処理部と、
    前記検索処理部により取得された複数件のデータについて、前記文字列を複数の文節に分割する文節解析部と、
    前記検索処理部により取得された複数件のデータに対し、前記複数の文節のうち前記文字列の最後の文節が一致するデータ同士を同じグループに分類するグルーピングを行うグルーピング処理部と、
    前記グルーピング処理部により分類された複数件のデータを分類先のグループごとにまとめてディスプレイに表示する制御を行う表示制御部と
    を備えるデータ管理システム。
  5. 前記グルーピング処理部は、前記検索処理部により取得された複数件のデータに対し、分類先の各グループを識別する項目として、グルーピングに用いた文節を示す項目を追加し、
    前記表示制御部は、前記グルーピング処理部により分類された複数件のデータを分類先のグループごとに表示する際に、前記グルーピング処理部により追加された項目を表示するとともに、その項目の名称として、その項目の内容を表す名称を表示する制御を行う請求項に記載のデータ管理システム。
  6. 前記表示制御部は、前記グルーピング処理部により分類された複数件のデータを分類先のグループごとに折り畳んで1行で表示するか展開して表示するかを選択するためのユーザインタフェースを提供し、折り畳んで表示する行については、その行に含まれるデータの件数を一番左に表示する請求項4または5に記載のデータ管理システム。
  7. 前記文字列の項目は、文書名を示す項目である請求項からのいずれか1項に記載のデータ管理システム。
  8. コンピュータに、
    調査、出願および拒絶理由通知への対応の各作業が行われた事件の識別番号を示す項目と、前記識別番号に対応する事件の作業で扱われた文書の文書名を示す項目と、前記文書名に対応する文書がデータベースに登録された日付を示す項目を含む複数の項目を持つデータを前記データベースから複数件取得する検索処理と、
    前記検索処理により取得された複数件のデータに対し、前記日付の差が閾値によって示された暦日数または営業日数以下のデータ同士を同じグループに分類するグルーピングを行うグルーピング処理と、
    前記グルーピング処理により分類された複数件のデータを分類先のグループごとにまとめてディスプレイに表示する制御を行う表示制御処理と
    を実行させるデータ管理プログラム。
  9. コンピュータに、
    文字列の項目を含む複数の項目を持つデータをデータベースから複数件取得する検索処理と、
    前記検索処理により取得された複数件のデータについて、前記文字列を複数の文節に分割する文節解析処理と、
    前記検索処理により取得された複数件のデータに対し、前記複数の文節のうち前記文字列の最後の文節が一致するデータ同士を同じグループに分類するグルーピングを行うグルーピング処理と、
    前記グルーピング処理により分類された複数件のデータを分類先のグループごとにまとめてディスプレイに表示する制御を行う表示制御処理と
    を実行させるデータ管理プログラム。
JP2017046543A 2017-03-10 2017-03-10 データ管理システムおよびデータ管理プログラム Expired - Fee Related JP6404971B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017046543A JP6404971B2 (ja) 2017-03-10 2017-03-10 データ管理システムおよびデータ管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017046543A JP6404971B2 (ja) 2017-03-10 2017-03-10 データ管理システムおよびデータ管理プログラム

Publications (2)

Publication Number Publication Date
JP2018151781A JP2018151781A (ja) 2018-09-27
JP6404971B2 true JP6404971B2 (ja) 2018-10-17

Family

ID=63681662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017046543A Expired - Fee Related JP6404971B2 (ja) 2017-03-10 2017-03-10 データ管理システムおよびデータ管理プログラム

Country Status (1)

Country Link
JP (1) JP6404971B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4437559B2 (ja) * 2007-05-15 2010-03-24 ソニー株式会社 データ処理装置および方法、プログラム、並びに記録媒体
JP2010277204A (ja) * 2009-05-26 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 情報分類処理装置、方法、およびプログラム
JP5939141B2 (ja) * 2012-11-21 2016-06-22 富士ゼロックス株式会社 プログラム及び診療記録検索装置
JP6340936B2 (ja) * 2014-06-16 2018-06-13 大日本印刷株式会社 画像プリント装置及び注文受付端末

Also Published As

Publication number Publication date
JP2018151781A (ja) 2018-09-27

Similar Documents

Publication Publication Date Title
US10380197B2 (en) Network searching method and network searching system
US9047346B2 (en) Reporting language filtering and mapping to dimensional concepts
US9501455B2 (en) Systems and methods for processing data
US20050216830A1 (en) Access tool to facilitate exchange of data to and from an end-user application software package
US20140075347A1 (en) Simplifying development of user interfaces of applications
US20150026159A1 (en) Digital Resource Set Integration Methods, Interfaces and Outputs
US10146881B2 (en) Scalable processing of heterogeneous user-generated content
US9430528B2 (en) Grid queries
US10503743B2 (en) Integrating search with application analysis
US11907278B2 (en) Method and apparatus for deriving keywords based on technical document database
Brody Scite
JP2006323517A (ja) テキスト分類装置およびプログラム
EP3208726A1 (en) Multi-language support for dynamic ontology
JP6404971B2 (ja) データ管理システムおよびデータ管理プログラム
JP2009093389A (ja) 情報処理装置、情報処理方法、およびプログラム
US20140223274A1 (en) Information processing device and information processing method
US20240104303A1 (en) Research viewpoint presentation system and research viewpoint presentation method
US11132421B1 (en) Enhanced information extraction from web pages
US11275729B2 (en) Template search system and template search method
Bramer Web Programming with PHP and MySQL
US11215971B2 (en) Support system and non-transitory computer readable medium
JP4923413B2 (ja) 情報抽出プロブラム及び方法
US20190012400A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2011198285A (ja) 文書処理システム、及びプログラム
US20090259995A1 (en) Apparatus and Method for Standardizing Textual Elements of an Unstructured Text

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180913

R150 Certificate of patent or registration of utility model

Ref document number: 6404971

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees