JP2010108173A - 文書処理装置 - Google Patents

文書処理装置 Download PDF

Info

Publication number
JP2010108173A
JP2010108173A JP2008278644A JP2008278644A JP2010108173A JP 2010108173 A JP2010108173 A JP 2010108173A JP 2008278644 A JP2008278644 A JP 2008278644A JP 2008278644 A JP2008278644 A JP 2008278644A JP 2010108173 A JP2010108173 A JP 2010108173A
Authority
JP
Japan
Prior art keywords
group
document
change
identification information
suggestion information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008278644A
Other languages
English (en)
Other versions
JP5209438B2 (ja
Inventor
Hiroshi Taira
博司 平
Yasunari Miyabe
泰成 宮部
Toshiyuki Kano
敏行 加納
Shigeru Matsumoto
茂 松本
Kazuyuki Goto
和之 後藤
Katei To
嘉挺 董
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2008278644A priority Critical patent/JP5209438B2/ja
Publication of JP2010108173A publication Critical patent/JP2010108173A/ja
Application granted granted Critical
Publication of JP5209438B2 publication Critical patent/JP5209438B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書群のグループに対する識別情報の人為的な付与の妥当性を判定する。
【解決手段】表示制御部3の文書分類結果画面表示制御部31が文書分類結果記憶部21に記憶される文書分類情報をもとに文書分類結果画面を表示装置7に表示した状態で、変更対象のグループ名の変更先のグループ名が入力されると、示唆情報提供判定部5は、記憶装置2の示唆情報提供ルール記憶部23に記憶された示唆情報提供ルールに基づき、変更先のグループ名が不適切であることを示すための示唆情報を提供するかどうか、提供する場合はどのような示唆情報を提供するかを判定する。示唆情報提供判定部5は、示唆情報を提供すると判定した場合は、示唆情報提供ルールおよび所定のテンプレートを用いて生成した示唆情報を表示装置7に表示する。示唆情報提供判定部5が示唆情報を提供しないと判定した場合は、グループ名変更処理部4はグループ名の変更を行なう。
【選択図】 図1

Description

本発明は、複数のグループに分けられた文書群に対するユーザによるグループ識別情報の付与を支援する文書処理装置に関する。
近年、計算機の高性能化や記憶媒体の大容量化、計算機ネットワークの普及などに伴い、電子化された大量の文書群を計算機システムに記憶管理して利用することが可能となった。ここでいう文書とは、例えば、帳票、企画書、設計書といった業務文書や、マニュアル、特許、技術文献、法令、規程、議事録、ニュース記事、電子メール、ウェブページ、書籍などを指す。
ユーザが計算機システム上で各種作業を行う際、もし取り扱う文書群が少数である場合は、文書群を事前に整理しておく必要はない。しかし、もし文書が数百〜数千と大量になる場合は、作業を行う前に文書を複数のグループに整理しておく方が、作業を効率よく実施しやすくなる。
例えば、電子メール閲覧・送受信システムにおいて、過去に自分が受け取ったメールを閲覧するという作業を行う際、無整理のままでいる場合に比べて、事前に過去のメールを「Aさんからのメール」、「プロジェクトBに関係のあるメール」などのグループに分けておいた方が、自分が見たいメールをより手早く見ることが出来るようになる。このように、文書分類は計算機システムを用いて文書処理を行う際に欠かせないものとなっている。
一方、文書分類を行う際、文書群の傾向がわからないと、分け方そのものが思い付きにくいというケースがある。例えば、特許調査において、特許検索システムによって検索した数千件の自社・他社の特許を、記載されている技術内容をもとに複数のグループに分けて分析するという事があるが、このような場合、どのようなグループに分ければ最適な分析が出来るかというのは、実際に全ての特許を見てからでないとわからない。これは非常に手間のかかる作業であり、特許調査に多大な所要時間がかかる一因となっている。
このように文書全体の傾向が分からない場合の分類作業を支援するため、例えば非特許文献1に開示されるように、大量の文書群を当該文書群に含まれる単語の統計的傾向などにより複数のグループに自動的に分類する自動分類技術が存在する。一般に「文書クラスタリング」と呼ばれるこの技術を用いることによって、文書群の傾向をある程度把握することができ、文書群の分け方のヒントとすることができる。これにより文書分類の際の所要時間を低減させることができる。
前記の文書クラスタリング技術の大きな特徴は、事前に「どのようなグループに分けるのか」という情報が不必要であるという点にある。逆に、「どのようなグループに分けるのか」をユーザが指定できない(指定しない)ため、そのままでは各グループにどのような性質の文書が入っているのか分からないという特徴もある。
そこで、各グループに含まれている文書群の特性を利用して、各グループに名称を付与することが必要となってくる。例えば特許文献1に開示されるように、各グループに対し、そのグループに含まれる単語の頻度などを利用して各グループに自動的に名称をつける技術が存在する。名称の付与方法は、単語や形態素、複数の単語や形態素の集合などさまざまである。
特開2005−182611号公報 岸田和明,文書クラスタリングの手法:文献レビュー,Library and Information Science. No.49, 2003, p.33-75
ここで、各グループに付与された名称はあくまで機械的に付与されたものであり、これを人間がより識別しやすい名称に人手で変更したいというケースがある。例えば、遠隔通信関連特許文書1000件が文書クラスタリング技術によって6つのグループに自動的に分類された際、自動的に付与されたグループ名が、第1のグループ名「管理」、第2のグループ名「操作」、第3のグループ名「液晶」、第4のグループ名「モバイル」、第5のグループ名「表示」および第6のグループ名「突起」であったとする。
この際、ユーザが第2のグループ名である「操作」という名称が分かりにくいと感じ、このグループ名に対応するグループに属する特許文書群の内容を見たところ、「画面操作」という名称の方が適切であると判断し、現在の「操作」というグループ名を、「画面操作」というグループ名に人手で変更するというケースがこれにあたる。
しかし、ユーザは文書グループに名称を付与する際、分類結果全体から相対的に判断するのではなく、各グループに予め付けられた名称や、名称変更対象のグループに含まれる文書群の特徴にのみ依拠した名称を付けようとする傾向がある。このため、例えば、他のグループにも数多く含まれるキーワードを付けてしまう等、変更後の名称が分類結果全体で見た場合に適切な名称となっていない場合がある。
前述した第1乃至第6のグループを例にとると、第4のグループの「モバイル」という名称がそのままでは分かりにくいため、当該第4のグループ属する特許群を見たところ、「携帯電話」という名称の方が適切である事が分かり、現在の「モバイル」という名称を、「携帯電話」という名称に人手で変更したとする。
しかし、分類対象となっている遠隔通信関連特許が、実はほとんどが携帯電話関連の特許であったとすると、「携帯電話」という名称を付けることは、他のグループに対して識別性があるとはいえず、適切な名称ではない。このような場合、従来の各種手法では、グループにユーザが付与する名称の妥当性を判定することは出来なかった。
そこで、本発明の目的は、文書群を分類したグループに対する識別情報の人為的な付与の妥当性を判定することが可能になる文書処理装置を提供することにある。
すなわち、本発明に係わる文書処理装置は、複数の文書のそれぞれをグループ識別情報が付与される複数のグループのいずれかに分類した文書分類情報を管理する管理手段と、前記管理される文書分類情報を出力する分類情報出力手段と、当該出力された文書分類情報におけるグループ識別情報のうち変更対象のグループ識別情報に対する変更先のグループ識別情報の入力を受け付ける入力手段と、前記管理されるグループごとに、当該グループに属する文書数に対する前記入力された変更先のグループ識別情報の出現文書数の割合を計算する計算手段と、前記計算手段による計算結果をもとに、前記変更対象のグループ識別情報の前記変更先のグループ識別情報への変更が適切であるか否かを判定する判定手段と、前記変更が適切であると前記判定手段により判定した場合に、前記管理手段により管理される変更対象のグループ識別情報を前記入力された変更先のグループ識別情報に変更する変更手段と、前記変更が適切でないと前記判定手段により判定した場合に当該判定結果を出力する判定結果出力手段とを備えたことを特徴とする。
本発明によれば、文書群を分類したグループに対する識別情報の人為的な付与の妥当性を判定することができる。
以下図面により本発明の実施形態について説明する。
図1は、本発明の実施形態における文書処理装置の構成例を示すブロック図である。
図1に示すように、本発明の実施形態における文書処理装置は、装置全体の処理動作を司る制御部1、記憶装置2、表示制御部3、グループ名変更処理部4、示唆情報提供判定部5、入力装置6、表示装置7を備え、それぞれがバス8により相互に接続される。
入力装置6は、例えばキーボードやマウスであり、表示装置7は例えば液晶ディスプレイ装置である。
記憶装置2は、例えば不揮発性メモリやHDD(Hard Disk Drive)などの記憶媒体であり、表示制御部3、グループ名変更処理部4、示唆情報提供判定部5による処理動作のためのプログラムを記憶する他、文書分類結果記憶部21、文書内容記憶部22、示唆情報提供ルール記憶部23を有する。
文書分類結果記憶部21は、複数の文書の分類結果である文書分類結果情報を記憶する。図2は、本発明の実施形態における文書処理装置の記憶装置の文書分類結果記憶部に記憶される文書分類情報の構成例を表形式で示す図である。
図2に示すように、記憶装置2の文書分類結果記憶部21に記憶される文書分類結果情報では、文書群でなるグループに付与されたグループ識別情報であるグループ名、当該グループ名に対応するグループに分類された文書の文書名および当該グループに属する文書群の件数がグループごとに示される。
ここでは、文書は特許文書であるとし、「特許1」〜「特許20」までの20の特許文書のそれぞれが、「管理」、「操作」、「液晶」、「モバイル」、「押下」、「突起」の6つの名称が自動的に付与されたグループのいずれかに自動的に分類されているものとする。なお、自動分類の手法やグループへの名称付与の手法そのものは既知の手法が使われているものとし、ここでは説明を略する。
文書内容記憶部22は、文書分類結果情報で示された複数の文書のそれぞれの記載内容を示す文書内容情報を記憶する。図3は、本発明の実施形態における文書処理装置の記憶装置の文書内容記憶部に記憶される文書内容情報の構成例を表形式で示す図である。
文書内容記憶部22に記憶される文書内容情報では、文書名、および当該文書名に対応する文書の中身を示す文書内容が文書ごとに示される。図3に示した例では、文書名「特許1」には「携帯電話における管理画面を…」という文書内容が記載されており、同様に「特許2」〜「特許20」までの各文書名に対応する文書内容が記載されている。
なお、実際の特許文書には、「出願人」、「実施例」、「図面の簡単な説明」など、多様な情報が記載されているが、ここでは簡便のため特許文書の要約文の一部を文書内容として記憶しているものとする。
記憶装置2の示唆情報提供ルール記憶部23は、入力装置6による入力内容にしたがったグループ名の変更が妥当ではないことを示すための示唆情報をユーザに提供するかどうか、および示唆情報を提供する場合どのような情報をユーザに提供するかを定めたルールである示唆情報提供ルールを記憶する。
グループ名変更処理部4は、入力装置6による入力内容を元に、文書分類結果情報における特定のグループのグループ名を変更する。
示唆情報提供判定部5は、入力装置6による入力内容にしたがったグループ名の変更が妥当であるか、つまり適切であるかどうか、もしくはグループ名の変更が妥当ではなく示唆情報をユーザに提供すべきかを示唆情報提供ルール記憶部23に記憶された示唆情報提供ルールをもとに判定する。
表示制御部3は、文書分類結果画面表示制御部31、文書内容画面表示制御部32、グループ名変更用画面表示制御部33、示唆情報画面表示制御部34を有する。
文書分類結果画面表示制御部31は、文書分類結果記憶部21に記憶された文書分類結果情報を表示装置7に表示することでユーザに提示する。本実施形態では、各種の表示処理はWebブラウザを用いてなされるものとする。文書内容画面表示制御部32は、記憶装置2の文書内容記憶部22に記憶された文書内容情報を表示装置7に表示することでユーザに提示する。
グループ名変更用画面表示制御部33はグループ名を変更するための画面を表示装置7に表示する。
示唆情報画面表示制御部34は、示唆情報を提供することが適切であると示唆情報提供判定部5によって判定された場合、記憶装置2の示唆情報提供ルール記憶部23に記憶された示唆情報提供ルールに従って示唆情報を表示装置7に表示させることでユーザに提供する。
次に、図1に示した構成の文書処理装置の動作について説明する。
図4は、本発明の実施形態における文書処理装置の処理動作の一例を示すフローチャートである。
まず、表示制御部3の文書分類結果画面表示制御部31は、記憶装置2の文書分類結果記憶部21に記憶される文書分類情報をもとに、文書分類結果画面を表示装置7に表示する(ステップS1)。
図5は、本発明の実施形態における文書処理装置の表示装置に表示される文書分類結果画面の第1の例を示す図である。
図5に示すように、文書分類結果画面では、各グループのグループ名、当該グループ名に対応するグループに分類される文書の件数、および後述するグループ名変更画面に遷移するための、「グループ名変更画面へ」とラベリングされたグループ名変更画面遷移ボタンが表示される。
また、入力装置6により、文書分類結果画面上のグループ名が選択されると(ステップS2のYES)、表示制御部3の文書内容画面表示制御部32は、文書分類結果記憶部21に記憶される文書分類結果情報と文書内容記憶部22に記憶される文書内容情報とを元に、文書内容画面を提示する(ステップS3)。
図6は、本発明の実施形態における文書処理装置の表示装置に表示される文書内容画面の一例を示す図である。
図6に示した文書内容画面は、図5に示した文書分類結果画面上で、グループ名「モバイル」にマウスポインタ(矢印マーク)をあわせてマウスによるクリックがなされた場合の当該クリックされたグループ名「モバイル」とそのグループに含まれる文書である特許文書名、および各特許文書の文書内容がリスト状に表示したものである。
また、前述した文書分類結果画面において、変更対象のグループ名に対応して設けられる「グループ名変更画面遷移ボタン」が入力装置6により選択されると(ステップS2→ステップS4)、表示制御部3のグループ名変更用画面表示制御部33は、グループ名を変更するための画面であるグループ名変更用画面を表示装置7に表示する(ステップS5)。
図7は、本発明の実施形態における文書処理装置の表示装置に表示される文書分類結果画面の第2の例を示す図である。
図8は、本発明の実施形態における文書処理装置の表示装置に表示されるグループ名変更画面の第1の例を示す図である。
図8に示したように、グループ名変更用画面は、今のグループ名と変更先のグループ名の入力欄、および変更する名称を決定するための、「グループ名変更」とラベリングされたグループ名変更ボタンから構成される。
図8に示したグループ名変更用画面は、図7に示した文書分類結果画面上のグループ名「操作」の行にある、「グループ名変更画面へ」とラベリングされたグループ名変更画面遷移ボタンが入力装置6により選択された場合に表示される画面であり、現在のグループ名である「操作」と、現在のグループ名に代わるグループ名である変更先のグループ名を入力するための空の入力欄とが表示されている。
図9は、本発明の実施形態における文書処理装置の表示装置に表示されるグループ名変更画面の第2の例を示す図である。
ここではユーザはグループ名称を「画面操作」に変更したいとする。具体的にはユーザは、図9に示すように、入力装置6により変更先のグループ名を入力するための入力欄に当該変更先のグループ名「画面操作」を入力してグループ名変更ボタンを選択する(ステップS6)。
すると、示唆情報提供判定部5は、記憶装置2の示唆情報提供ルール記憶部23に記憶された示唆情報提供ルールに基づき、示唆情報を提供するかどうか、提供する場合はどのような示唆情報を提供するかを判定する(ステップS7)。
ここで、ステップS7の処理の詳細について説明する。図10は、本発明の実施形態における文書処理装置による示唆情報提供判定処理の一例を示すフローチャートである。図11は、本発明の実施形態における文書処理装置の記憶装置の示唆情報提供ルール記憶部に記憶される示唆情報提供ルールの一例を示す図である。図12は、本発明の実施形態における文書処理装置の記憶装置の示唆情報提供ルール記憶部に記憶される示唆情報テンプレートの一例を示す図である。
本実施形態では、示唆情報を生成するために、示唆情報提供ルールおよび当該ルールに対応する所定の雛形(テンプレート)を用いており、図12に示すように、2種類の示唆情報テンプレートが示唆情報提供ルール記憶部23に記憶されている。
まず、示唆情報提供判定部5は、記憶装置2の文書内容記憶部22に記憶される文書内容情報で示される文書の一つを選択し、当該文書中にユーザが入力した変更先のグループ名が含まれているか否かを調べる(ステップS71)。
示唆情報提供判定部5は、ステップS71の処理を文書内容情報で示される全文書について繰り返して終了したら(ステップS72のYES)、各グループのうち1つを選択し、当該選択したグループに属する全文書のうち実際に変更先のグループ名が含まれる文書の数、つまり変更先のグループ名の出現文書頻度をカウントする(ステップS73)。そして、示唆情報提供判定部5は、選択済みのグループにおける「変更先のグループ名の出現文書頻度/グループに属する全文書数」Dを計算する(ステップS74)。
示唆情報提供判定部5は、ステップS73,S74の処理をグループについて繰り返して終了したら(ステップS75のYES)、もしステップS74の処理で計算したDが0.5を越えるグループが全グループ数の半数以上ある場合は(ステップS76のYES)、図12に示したテンプレートAを用いて示唆情報を生成し、この生成した示唆情報を示す示唆情報画面を表示装置7に表示させる(ステップS78,S8→S9)。
また、示唆情報提供判定部5は、ステップS74の処理で計算したDが0.5を超えるグループが全グループの半分未満しかなく(ステップS76のNO)、かつ、ステップS74の処理で計算したDが0.5を超えるグループがグループ名を変更するグループ以外に2グループ以下存在する場合は(ステップS77のYES)、図12に示したテンプレートBを用いて示唆情報を生成し、この生成した示唆情報を示す示唆情報画面を表示装置7に表示させる(ステップS79,S8→S9)。
また、示唆情報提供判定部5は、ステップS74の処理で計算したDが0.5を超えるグループが全グループの半分未満しかなく(ステップS76のNO)、かつステップS74の処理で計算したDが0.5を超えるグループがグループ名を変更するグループ以外に存在しない、もしくは3グループ以上存在する場合は(ステップS77のNO)、示唆情報を提供しないと判定し、グループ名変更処理部4は、変更対象のグループ名を前述のように入力された変更先グループ名に変更する(ステップS8→S9,S10)。
以下、ステップS7以降の処理の具体例を説明する。
図13は、本発明の実施形態における文書処理装置が管理する各文書における変更先グループ名の出現分布の一例を表形式で示す図である。
図13に示した出現分布はステップS71の処理結果であり、変更先のグループ名が「画面操作」である場合の各文書における出現有無、変更先のグループ名が「携帯電話」である場合の各文書における出現有無、および変更先のグループ名が「ボタン」である場合の各文書における出現有無を纏めて示したものである。
ここでは「特許1」〜「特許20」までの各文書のうち文言「画面操作」は、「特許5」,「特許6」,「特許13」,「特許17」に含まれており、文言「携帯電話」は、「特許1」,「特許2」,「特許4」〜「特許7」,「特許9」〜「特許11」,「特許13」〜「特許15」,「特許17」,「特許19」,「特許20」に含まれており、文言「ボタン」は、「特許3」,「特許12」,「特許15」,「特許16」,「特許18」〜「特許20」に含まれている。
第1の例として、図5に示した文書分類結果画面上のグループ名「操作」の変更先のグループ名としてグループ名「画面操作」が入力された場合の処理を説明する。
図14は、本発明の実施形態における文書処理装置におけるグループごとの当該グループに属する文書数に対する変更先の第1のグループ名の出現文書頻度の割合の計算結果の一例を示す図である。
この処理では、図2に示した文書分類結果の状況、および図13に示す、文書内容における特定の単語の出現分布により、「グループに属する全文書件数」、「「画面操作」の出現文書の頻度」、「「画面操作」の出現文書頻度/グループに属する全文書数」Dはそれぞれ図14のように算出される。
この場合、計算した値Dが0.5を超えているグループがグループ数全体、つまり6グループのうちグループ名「操作」に対応するグループのみ、つまり1つしかなく、グループ数全体の半分に満たないため、図11に示した示唆情報提供ルールの項目(1)は満たさない。
また、計算した値Dが0.5を超えているグループが、名称を変更しようとするグループであるグループ名「操作」に対応するグループ以外に存在しないため、図11に示した示唆情報提供ルールの項目(2)も満たさない。このため、図11に示した示唆情報提供ルールの項目(3)が適用され、示唆情報は提供されず、「操作」から「画面操作」へのグループ名変更を行うため、グループ名変更処理部4が呼び出される。
グループ名変更処理部4は、前述したグループ名「操作」を前述したように入力されたグループ名「画面操作」に変更する。具体的には、グループ名変更処理部4は、まず、文書分類結果記憶部21に記憶される文書分類結果情報のグループ名「操作」を新しいグループ名「画面操作」に書き換える。
図15は、本発明の実施形態における文書処理装置の記憶装置の文書分類結果記憶部に記憶される文書分類情報のグループ名変更後の構成例を表形式で示す図である。
すると、図2に示した文書分類結果情報に記憶されている「操作」は図15のように「画面操作」に書き換えられる。その後、表示制御部3の文書分類結果画面表示制御部31は、図15に示したグループ名変更後の文書分類結果情報を元に新たな文書分類結果画面を表示装置7に表示する。
図16は、本発明の実施形態における文書処理装置の表示装置に表示されるグループ名変更後の文書分類結果画面の一例を示す図である。
次に、第2の例として、図5に示した文書分類結果画面上のグループ名「モバイル」の変更先のグループ名として、グループ名「携帯電話」が入力された場合の処理を説明する。
図17は、本発明の実施形態における文書処理装置におけるグループごとの当該グループに属する文書数に対する変更先の第2のグループ名の出現文書頻度の割合の計算結果の一例を示す図である。
ここでは、各グループについての「グループに属する全文書件数」、「「携帯電話」の出現文書の頻度」、「「携帯電話」の出現文書頻度/グループに属する全文書数」Dは図17のようになる。
この場合、計算した値Dが0.5を超えているグループが、グループ数全体の6グループのうちグループ名「押下」に対応するグループ以外の全て、つまり5グループにものぼり、グループ数全体の半分を超えている。よって、図11に示した示唆情報提供ルールの項目(1)に合致することになり、「所定のテンプレートAを用いて示唆情報を提示する」ことになる。
すると、示唆情報提供判定部5は、テンプレートAを用いて、ユーザが入力した変更先のグループ名は他のグループにも高頻度で出現している言葉であって、変更先のグループ名として不適切であり、それでもなお変更を行なうかを問う示唆情報を提示するという情報、および当該テンプレートA中の「変更しようとするグループ名」つまり変更対象のグループ名が「携帯電話」であることを示す情報を表示制御部3の示唆情報画面表示制御部34に送る。
示唆情報画面表示制御部34は、示唆情報提供判定部5からの情報を元に示唆情報を生成し、この情報を示す示唆情報画面を表示装置7に表示する。
図18は、本発明の実施形態における文書処理装置の表示装置に表示される示唆情報画面の第1の例を示す図である。
ここでは示唆情報画面は図18のようになる。図18に示した例では、ユーザが入力した変更先のグループ名「携帯電話」は他のグループにも高頻度で出現している言葉であり、変更先のグループ名として不適切であることを明示している。
この画面において、「はい」と表記されたアイコンが選択されると、グループ名変更処理部4による変更対象のグループ名の変更先のグループ名への変更処理がなされ、「いいえ」と表記されたアイコンが選択されると、前述のように入力された変更先のグループ名がクリアされて、元の文書分類結果画面が表示装置7に表示される。
次に、第3の例として、図5に示した文書分類結果画面上のグループ名「押下」の変更先のグループ名として、グループ名「ボタン」が入力された場合の処理を説明する。
図19は、本発明の実施形態における文書処理装置におけるグループごとの当該グループに属する文書数に対する変更先の第3のグループ名の出現文書頻度の割合の計算結果の一例を示す図である。
ここでは、各グループについての「グループに属する全文書件数」、「「ボタン」の出現文書の頻度」、「「ボタン」の出現文書頻度/グループに属する全文書数」Dは図19のようになる。
この場合、計算した値Dが0.5を超えているグループは、グループ数全体である6グループのうちグループ名「押下」に対応するグループおよびグループ名「突起」に対応するグループ、つまり2グループしかないため、図11に示した示唆情報提供ルールの項目(1)には当てはまらない。
しかし、計算した値Dが0.5を超えているグループとして、変更対象のグループ名「押下」に対応するグループ以外に、グループ名「突起」のグループが存在する。よって、変更対象のグループ名以外における、値Dが0.5を超えているグループの個数が2以下であるため、図11に示した示唆情報提供ルールの項目(2)を満たすことになり「所定のテンプレートBを用いて示唆情報を提示する」ことになる。
すると、示唆情報提供判定部5は、テンプレートBを用いて、ユーザが入力した変更先のグループ名は、他のグループ名、つまり変更対象のグループ名に対応するグループ以外における値Dが0.5を超えているグループにも高頻度で出現している言葉であり、これらのグループをマージ(合併)することを勧める示唆情報を提示するという情報、および当該テンプレートB中の「変更しようとするグループ名」が「押下」であることを示す情報、およびテンプレートB中の「他の該当グループ名(複数ある場合は「,」区切りですべて記載)」が「突起」であることを示す情報を表示制御部3の示唆情報画面表示制御部34に送る。
示唆情報画面表示制御部34は、示唆情報提供判定部5からの情報を元に示唆情報を生成し、この情報を示す示唆情報画面を表示装置7に表示する。
図20は、本発明の実施形態における文書処理装置の表示装置に表示される示唆情報画面の第2の例を示す図である。
ここでは示唆情報画面は図20のようになる。図20に示した例では、ユーザが入力した変更先のグループ名「ボタン」は、他のグループ名「突起」に対応するグループにも高頻度で出現している言葉であり、これらのグループをマージしてはどうかとユーザに提案している。
この画面において、「はい」と表記されたアイコンが選択されると、グループ名変更処理部4による複数のグループのマージ処理がなされ、「いいえ」と表記されたアイコンが選択されると、前述のように入力された変更先のグループ名がクリアされて、元の文書分類結果画面が表示装置7に表示される。
この画面において「いいえ」と表記されたアイコンが選択された場合は、グループ名変更処理部4による変更対象のグループ名の変更先のグループ名への変更処理を行うようにしてもよい。
以上のように、本発明の実施形態における文書処理装置では、ユーザは複数のグループのグループ名を変更する際、自分が入力した変更先のグループ名が適切な名称なのかどうかを事前にユーザに確認させることができるので、文書群を分類した各グループに対し、ユーザが適切な名称を付与することを支援することができ、結果として各グループに適切な名称が付与されることになり、後に、ユーザは分類結果を用いた計算機システム上での各種作業を実行しやすくなる。
なお、本実施形態に記載の手段や装置、部位については、本発明を実現するものであればどのような実装形態であってもよい。例えば各種処理はCPU(Central Processing Unit)上で実行されるとしてもよい。また、本実施形態では、画面はWebブラウザを用いて表示されることを前提として説明を行ったが、同様の情報を表現可能であればWebブラウザ以外の表示手段によって表示されるとしてもよい。
また、文書分類結果や文書内容についても本実施の形態以外の構造、名称、内容であってもよい。また、格納されている文書分類結果は、自動分類結果でなくてもよい。文書種別も特許文書以外の文書であってもよい。また、グループ名についても、本実施形態では単語1語であらわしたが、複数の単語や文章であるとしてもよい。
また、各表示画面については、ここまで示した以外の表示形態、表示内容であるとしてもよい。さらには、複数の画面を組み合わせて、あるいは一つの画面を分割して複数の画面で表示するとしてもよい。
また、示唆情報提供ルールは本実施形態に記載のルール以外のものであるとしてもよい。例えば、前述したテンプレートA,Bの文言が異なっていてもよく、図11に示したルール(1)、(2)の閾値が0.5以外の値、例えば0.3や0.7などであってもよく、図11の示したルール(2)の閾値が2つ以下以外の値(例えば3つ以下など)であってもよい。さらには、「特定のグループ名に変えようとする場合は示唆情報を出す」などの別の示唆情報提供ルール、および当該特定の不適切なグループ名を記憶装置2に記憶しておき、入力済みの変更先のグループ名が当該特定のグループ名に該当する場合には、当該グループ名が変更先のグループ名として適切でないことをしめす示唆情報を表示装置7に表示する形態であってもよい。さらには、前記のようにグループ名を複数の単語や文章で付与できる場合には、そこに含まれる複数の単語それぞれについて、本実施形態に記載の処理を実施するとしてもよい。
なお、この発明は前記実施形態そのままに限定されるものではなく実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を省略してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
本発明の実施形態における文書処理装置の構成例を示すブロック図。 本発明の実施形態における文書処理装置の記憶装置の文書分類結果記憶部に記憶される文書分類情報の構成例を表形式で示す図。 本発明の実施形態における文書処理装置の記憶装置の文書内容記憶部に記憶される文書内容情報の構成例を表形式で示す図。 本発明の実施形態における文書処理装置の処理動作の一例を示すフローチャート。 本発明の実施形態における文書処理装置の表示装置に表示される文書分類結果画面の第1の例を示す図。 本発明の実施形態における文書処理装置の表示装置に表示される文書内容画面の一例を示す図。 本発明の実施形態における文書処理装置の表示装置に表示される文書分類結果画面の第2の例を示す図。 本発明の実施形態における文書処理装置の表示装置に表示されるグループ名変更画面の第1の例を示す図。 本発明の実施形態における文書処理装置の表示装置に表示されるグループ名変更画面の第2の例を示す図。 本発明の実施形態における文書処理装置による示唆情報提供判定処理の一例を示すフローチャート。 本発明の実施形態における文書処理装置の記憶装置の示唆情報提供ルール記憶部に記憶される示唆情報提供ルールの一例を示す図。 本発明の実施形態における文書処理装置の記憶装置の示唆情報提供ルール記憶部に記憶される示唆情報テンプレートの一例を示す図。 本発明の実施形態における文書処理装置が管理する各文書における変更先グループ名の出現分布の一例を表形式で示す図。 本発明の実施形態における文書処理装置におけるグループごとの当該グループに属する文書数に対する変更先の第1のグループ名の出現文書頻度の割合の計算結果の一例を示す図。 本発明の実施形態における文書処理装置の記憶装置の文書分類結果記憶部に記憶される文書分類情報のグループ名変更後の構成例を表形式で示す図。 本発明の実施形態における文書処理装置の表示装置に表示されるグループ名変更後の文書分類結果画面の一例を示す図。 本発明の実施形態における文書処理装置におけるグループごとの当該グループに属する文書数に対する変更先の第2のグループ名の出現文書頻度の割合の計算結果の一例を示す図。 本発明の実施形態における文書処理装置の表示装置に表示される示唆情報画面の第1の例を示す図。 本発明の実施形態における文書処理装置におけるグループごとの当該グループに属する文書数に対する変更先の第3のグループ名の出現文書頻度の割合の計算結果の一例を示す図。 本発明の実施形態における文書処理装置の表示装置に表示される示唆情報画面の第2の例を示す図。
符号の説明
1…制御部、2…記憶装置、3…表示制御部、4…グループ名変更処理部、5…示唆情報提供判定部、6…入力装置、7…表示装置、8…バス、21…文書分類結果記憶部、22…文書内容記憶部、23…示唆情報提供ルール記憶部、31…文書分類結果画面表示制御部、32…文書内容画面表示制御部、33…グループ名変更用画面表示制御部、34…示唆情報画面表示制御部。

Claims (5)

  1. 複数の文書のそれぞれをグループ識別情報が付与される複数のグループのいずれかに分類した文書分類情報を管理する管理手段と、
    前記管理される文書分類情報を出力する分類情報出力手段と、
    当該出力された文書分類情報で示されるグループ識別情報のうち変更対象のグループ識別情報に対する変更先のグループ識別情報の入力を受け付ける入力手段と、
    前記管理されるグループごとに、当該グループに属する文書数のうち前記入力された変更先のグループ識別情報の出現する文書数の割合を計算する計算手段と、
    前記計算手段による計算結果をもとに、前記変更対象のグループ識別情報の前記変更先のグループ識別情報への変更が適切であるか否かを判定する判定手段と、
    前記変更が適切であると前記判定手段により判定した場合に、前記管理手段により管理される変更対象のグループ識別情報を前記入力された変更先のグループ識別情報に変更する変更手段と、
    前記変更が適切でないと前記判定手段により判定した場合に当該判定結果を出力する判定結果出力手段と
    を備えたことを特徴とする文書処理装置。
  2. 前記判定手段は、
    前記計算手段により計算した割合が所定の値を超えるグループの数が前記管理手段により管理されるグループ全体の数の所定割合以上である場合に前記変更が適切でないと判定する
    ことを特徴とする請求項1に記載の文書処理装置。
  3. 前記判定手段は、
    前記計算手段により計算した割合が所定の値を超えるグループの数が前記管理手段により管理されるグループ全体の数の所定割合未満である場合で、かつ、前記計算した割合が前記所定の値を超えるグループが前記変更対象のグループ識別情報に対応するグループ以外で所定数以下存在する場合に、前記変更が適切でなく、かつ、前記変更対象のグループ識別情報に対応するグループと前記変更対象のグループ識別情報に対応するグループ以外における前記計算した割合が前記所定の値を超えるグループとのマージが適切であると判定し、前記計算した割合が所定の値を超えるグループの数がグループ全体の数の所定割合未満である場合で、かつ、前記計算した割合が前記所定の値を超えるグループが前記変更対象のグループ識別情報に対応するグループ以外で所定数以下存在しない場合に、前記変更が適切であると判定する
    ことを特徴とする請求項1に記載の文書処理装置。
  4. 前記判定手段は、
    前記入力手段により入力した変更先のグループ識別情報が所定の不適切な識別情報である場合に、前記変更が不適切であると判定する
    ことを特徴とする請求項1に記載の文書処理装置。
  5. 前記出力手段は、
    前記変更が適切でないと前記判定手段により判定した場合に、前記入力した変更先のグループ識別情報は不適切であって、それでもなお前記変更対象のグループ識別情報を前記変更先のグループ識別情報に変更するか否かを問うメッセージを出力する
    ことを特徴とする請求項1に記載の文書処理装置。
JP2008278644A 2008-10-29 2008-10-29 文書処理装置 Expired - Fee Related JP5209438B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008278644A JP5209438B2 (ja) 2008-10-29 2008-10-29 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008278644A JP5209438B2 (ja) 2008-10-29 2008-10-29 文書処理装置

Publications (2)

Publication Number Publication Date
JP2010108173A true JP2010108173A (ja) 2010-05-13
JP5209438B2 JP5209438B2 (ja) 2013-06-12

Family

ID=42297576

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008278644A Expired - Fee Related JP5209438B2 (ja) 2008-10-29 2008-10-29 文書処理装置

Country Status (1)

Country Link
JP (1) JP5209438B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011253535A (ja) * 2010-06-03 2011-12-15 Palo Alto Research Center Inc 混成ユーザ行為モデルを用いた行為識別
WO2021177073A1 (ja) * 2020-03-05 2021-09-10 ソニーグループ株式会社 情報処理装置及び情報処理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000305948A (ja) * 1999-04-26 2000-11-02 Ricoh Co Ltd 文書群分類装置および文書群分類方法
JP2005275556A (ja) * 2004-03-23 2005-10-06 Toshiba Solutions Corp 分割クラスタリング装置及び分割データ数決定方法
JP2008165572A (ja) * 2006-12-28 2008-07-17 Fuji Xerox Co Ltd データ分類装置、データ分類プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000305948A (ja) * 1999-04-26 2000-11-02 Ricoh Co Ltd 文書群分類装置および文書群分類方法
JP2005275556A (ja) * 2004-03-23 2005-10-06 Toshiba Solutions Corp 分割クラスタリング装置及び分割データ数決定方法
JP2008165572A (ja) * 2006-12-28 2008-07-17 Fuji Xerox Co Ltd データ分類装置、データ分類プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200800140008; 馬場 康夫 外2名: '"検索エンジン基盤TSUBAKIを用いた大規模ウェブ情報クラスタリングシステムの構築"' 情報処理学会研究報告 第2008巻,第4号, 20080121, p.67-74, 社団法人情報処理学会 *
JPN6012054503; 馬場 康夫 外2名: '"検索エンジン基盤TSUBAKIを用いた大規模ウェブ情報クラスタリングシステムの構築"' 情報処理学会研究報告 第2008巻,第4号, 20080121, p.67-74, 社団法人情報処理学会 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011253535A (ja) * 2010-06-03 2011-12-15 Palo Alto Research Center Inc 混成ユーザ行為モデルを用いた行為識別
KR101830061B1 (ko) 2010-06-03 2018-03-29 팔로 알토 리서치 센터 인코포레이티드 하이브리드 사용자-활동 모델을 이용한 활동들의 식별
WO2021177073A1 (ja) * 2020-03-05 2021-09-10 ソニーグループ株式会社 情報処理装置及び情報処理方法

Also Published As

Publication number Publication date
JP5209438B2 (ja) 2013-06-12

Similar Documents

Publication Publication Date Title
CN109299169B (zh) 数据可视化方法、系统、终端及计算机可读存储介质
JP5313337B2 (ja) モバイル・コンピューティング装置に対する検索結果の提供
US9245238B2 (en) Dynamic grouping of email recipients
JP5788911B2 (ja) データ構造マッピングおよびナビゲーション
CN104834759A (zh) 电子设计的实现方法和装置
JP6038232B2 (ja) 効率的なメール検索のためのメールサービスシステムおよび方法
JP5209438B2 (ja) 文書処理装置
US20100333009A1 (en) Operation support apparatus, operation support method and computer program
JP5557617B2 (ja) 作業パートナ選定方法、装置、及びプログラム
CN114072787A (zh) 用于促进文档审核的快速数据输入的系统和方法
JP2020123321A (ja) クリップボードデータに基づく検索処理方法および装置
US9424256B2 (en) Method and apparatus for performing type-aware change tracking in a document
US20180136791A1 (en) Conversation connected visualization of items based on a user created list
US20120016890A1 (en) Assigning visual characteristics to records
JP5861545B2 (ja) 情報処理装置、履歴制御方法および履歴制御プログラム
JPWO2012101700A1 (ja) UI(UserInterface)作成支援装置、UI作成支援方法及びプログラム
JP2013057999A (ja) 電子メールテンプレート作成装置、電子メールテンプレート作成方法、および電子メールテンプレート作成プログラム
JP2018036855A (ja) 情報処理システム、情報処理システムの制御方法、及びプログラム
US10614104B2 (en) Processing of data relating to entities
US20230136837A1 (en) Method for navigating thread-type messages and apparatus implementing the same method
US9990420B2 (en) Method of searching and generating a relevant search string
JP7528422B2 (ja) 情報処理装置およびプログラム
JP6056546B2 (ja) UI(UserInterface)設計支援装置、UI設計支援方法及びプログラム
JP6146417B2 (ja) 入力支援装置、入力支援方法、及び、プログラム
JP2014178841A (ja) 電子メール管理装置、電子メール管理方法およびコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130221

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160301

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5209438

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees