JP2003203082A - 文書分類システム - Google Patents

文書分類システム

Info

Publication number
JP2003203082A
JP2003203082A JP2002199997A JP2002199997A JP2003203082A JP 2003203082 A JP2003203082 A JP 2003203082A JP 2002199997 A JP2002199997 A JP 2002199997A JP 2002199997 A JP2002199997 A JP 2002199997A JP 2003203082 A JP2003203082 A JP 2003203082A
Authority
JP
Japan
Prior art keywords
correspondence table
evaluation
keyword
document
department
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002199997A
Other languages
English (en)
Other versions
JP3670629B2 (ja
Inventor
Hiroshi Nakano
拓 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002199997A priority Critical patent/JP3670629B2/ja
Publication of JP2003203082A publication Critical patent/JP2003203082A/ja
Application granted granted Critical
Publication of JP3670629B2 publication Critical patent/JP3670629B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 数多くの文書の評価において、1つ1つの文
書に対して複数の評価部署から自動的に最適な評価部署
を割り当てるシステムを提供する。 【解決手段】 優先、通常、補助の3種類のキーワード
と評価部署との対応テーブルを設定し(101)、文書
のテキストデータを解析して、対応テーブルに含まれる
キーワードの出現回数を計数し(105)、優先、通
常、補助の順で、対応テーブルに含まれるキーワードの
出現回数にゼロでないものがあれば出現回数の最大のキ
ーワードに対応する部署を評価部署として決定する(1
07,108,109)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書の分類システ
ムに関し、特に特許文書等の文書評価において、1つ1
つの文書に対して複数の評価部署から自動的に最適な評
価部署を割り当てるシステムに関するものである。
【0002】
【従来の技術】従来、技術文書データベースは技術文書
を評価する技術者の意図する範囲で検索されてきた。例
えば、特開平6−139291号(名称「情報検索方法
およびシステム」)では予め登録した検索条件による高
速な検索を行い、利用者の要求する条件に合う情報を指
定部署に早期に配布するシステムが示されている。この
システムでは技術文書を評価する技術者が作成した検索
条件によって検索されるため、企業として調査すべき文
書が残らず検索される保証はない。
【0003】
【発明が解決しようとする課題】しかし、知的財産権に
関する紛争件数が多くなり、また知的財産権侵害に対す
る賠償額が高額になり、経営者が自社の取り扱う製品に
関する技術に関して広範囲の評価を研究開発部署に課し
て、自社の製品の知的財産権に関する安全性、つまり他
者の知的財産権を侵害しないことを確認したいと切望す
るような時代となってきた。
【0004】本発明の目的は、文書をカテゴリ別に分類
するシステム、特に数多くの技術文書の1つ1つを複数
の研究開発部署の中から自動的に評価部署として最適な
部署に割り当てるシステムを提供することにある。
【0005】
【課題を解決するための手段】本発明では上記目的を達
成するために、優先、通常、補助の3種類のキーワード
と評価部署との対応テーブルを設定し、文書のテキスト
データを解析して、対応テーブルに含まれるキーワード
の出現回数を計数し、優先対応テーブルに含まれるキー
ワードの出現回数にゼロでないものがあれば出現回数の
最大のキーワードに対応する部署を評価部署として決定
し、優先対応テーブルに含まれるキーワードの出現回数
が全てゼロのときには、通常対応テーブルに含まれるキ
ーワードの出現回数にゼロでないものがあれば出現回数
の最大のキーワードに対応する部署を評価部署として決
定し、優先対応テーブル、通常対応テーブルそれぞれに
含まれるキーワードの出現回数が全てゼロのときには、
補助対応テーブルに含まれるキーワードの出現回数にゼ
ロでないものがあれば出現回数の最大のキーワードに対
応する部署を評価部署として決定し、優先、通常、補助
の3種の対応テーブルそれぞれに含まれるキーワードの
出現回数が全てゼロのときには未選定とする。
【0006】
【発明の実施の形態】以下、図面を参照して、本発明の
文書分類システム、特に本発明の文書評価部署割り当て
システムをモデル会社に適用した例を説明する。図1に
モデル会社の組織図を、図2に図1中のA事業部の組織
図をそれぞれ示す。ここでは図1中のA事業部につい
て、中でも図2に示すZ開発センターに所属する各開発
チームT1〜T8に対して図3に示す30件の米国特許
文書の評価をどのように割り当てるかを説明する。図4
に示すとおり、Z開発センターの各開発チームT1〜T
8では種々のデジタルAV製品に使用されるシステムL
SIを研究開発しているものとする。
【0007】《第1の実施形態》まず、キーワードと評
価部署との対応テーブルを使用した文書評価部署割り当
てシステムの例を説明する。
【0008】図5は本発明の第1の実施形態の構成を示
すブロック図である。図5において、101はキーワー
ドと評価部署との対応テーブルを格納するテーブル記憶
手段、102はキーワード評価部署対応テーブル入力手
段、103は複数の特許文書を格納する文書記憶手段、
104は文書入力手段、105は特許文書からキーワー
ドを抽出し、キーワード毎の出現回数を計数するキーワ
ード抽出・計数手段、106はキーワードの出現回数の
最大値判定手段、107は優先評価部署決定手段、10
8は評価部署決定手段、109は補助評価部署決定手
段、110は評価部署決定結果出力手段、111は表示
装置、112は評価部署決定結果記憶手段、113はプ
リンタである。
【0009】文書記憶手段103には図3に示す30件
の米国特許のテキストデータが格納されている。また、
キーワード評価部署対応テーブル記憶手段101には図
6A〜図6Cに示すキーワードと評価部署との対応テー
ブルが格納されている。“T1”〜“T8”は上記Z開
発センターに所属する各開発チームを、“Y”は図2に
示すY開発センターをそれぞれ意味する。Y開発センタ
ーではアナログAV製品用システムLSIの研究開発を
担当しているものとする。“該当なし”はこの会社では
該当製品を開発・製造していないことを表している。な
お、図6A〜図6Cではキーワードは評価部署と1対1
に対応しているが、例えばキーワード“video disk”が
開発チームT3及びT4と1対2に対応する場合には、
“videodisk”に対応する評価部署の欄を“T3,T
4”とすればよい。図6A〜図6Cを逆引きして各評価
部署がどのようなキーワードに対応しているかを、図7
に示す。
【0010】また、本実施形態の文書評価部署割り当て
システムでは、図6A〜図6Cの対応テーブル(以下、
通常対応テーブルと呼ぶ)とあわせて、図8に示す優先
対応テーブルと、図9に示す補助対応テーブルとをキー
ワード評価部署対応テーブル記憶手段101に更に格納
しておく。なお、図6A〜図6Cの通常対応テーブル、
図8の優先対応テーブル、図9の補助対応テーブルにそ
れぞれ、キーワード毎の重みを追加して格納しておく。
【0011】はじめにキーワード評価部署対応テーブル
入力手段102が図6A〜図6C、図8、図9に示すテ
ーブルを読み出す。次に図3に示す30件の米国特許文
書を1件毎に処理する。文書入力手段104が特許文書
テキストデータを1件毎に読み出し、キーワード抽出・
計数手段105では図6A〜図6C、図9に示すテーブ
ルのキーワードについては特許テキストの全体を抽出の
対象とし、図8に示すテーブルのキーワードについては
要約とクレームの部分を抽出の対象とする。抽出された
キーワードは出現回数が計数される。キーワード出現回
数最大値判定手段106では優先、通常、補助の3種の
対応テーブルそれぞれについて出現回数が最大値を有す
るキーワードを判定する。これより、キーワード出現回
数最大値判定手段106の判定結果をもとにして、優先
評価部署決定手段107では図8に示す優先テーブルの
キーワードの出現回数がゼロでないとき、出現回数が最
も多いキーワードに対応する評価部署を最適な評価部署
として決定する。最も多いキーワードが複数ある場合に
は先に見つかったキーワードから評価部署を選択して
も、また最も多いキーワードの数だけ評価部署を選択し
ても、いずれにせよ評価部署を割り当てることができた
という点では同じである。
【0012】優先評価部署決定手段107によって評価
部署が決まらなかったとき、評価部署決定手段108で
は図6A〜図6Cに示す通常対応テーブルのキーワード
の出現回数がゼロでないものがあるとき、出現回数が最
も多いキーワードに対応する評価部署を最適な評価部署
として決定する。
【0013】評価部署決定手段108によっても評価部
署が決まらなかったとき、補助評価部署決定手段109
では図9に示す補助対応テーブルのキーワードの出現回
数がゼロでないものがあるとき、出現回数が最も多いキ
ーワードに対応する評価部署を最適な評価部署として決
定する。図9の補助対応テーブルに登録するキーワード
としては、出現回数が図6A〜図6Cの通常対応テーブ
ルに登録するキーワードよりも優先度として劣るが評価
部署が未選定とならないような働きをするキーワードを
登録する。
【0014】評価部署決定結果出力手段110で優先評
価部署決定手段107、評価部署決定手段108、補助
評価部署決定手段109での決定をまとめた結果を表示
装置111及び評価部署決定結果記憶手段112へ出力
し、後に必要があれば、評価部署決定結果記憶手段11
2に記憶された決定結果をプリンタ113へ更に出力す
る。
【0015】図10に表示装置111への出力例を示
す。図10では最初に文書評価部署割り当てシステムを
起動したあと、開始時刻が出力され、以降30件の特許
明細書のファイル名と選定された評価部署が出力されて
いる。ファイル名は米国特許番号に“0”を冠し、ファ
イル拡張子“.TXT”が付加された形で表示されている。
“stage 1”とは優先評価部署決定手段107で評価部
署が決定されたこと、“stage 2”とは評価部署決定手
段108で評価部署が決定されたこと、“stage 3”と
は補助評価部署決定手段109で評価部署が決定された
ことをそれぞれ示している。各行の最後は評価部署を示
しており、最後に文書評価部署割り当てシステムの終了
時刻が出力される。なお、図10にはないが、優先評価
部署決定手段107、評価部署決定手段108、補助評
価部署決定手段109で評価部署が決定されない場合に
は評価部署は「未選定」と表示される。
【0016】評価部署決定結果記憶手段112へは、最
初に図11に示す全件のまとめ結果が出力されたあと、
一時的に溜め込んでおいた各特許文書に対する結果が出
力される。評価部署決定結果記憶手段112への出力は
HTML形式で出力されるが本実施形態の説明ではブラ
ウザを通した形で表示する。図11で左上の縦線を伴わ
ない右矢印は1番目の決定結果へのリンクボタン、また
縦線を伴った右矢印は本出力最後尾へのリンクボタンで
ある。特許ファイルの欄の各特許はそれぞれ個別の結果
へとリンクが張られている。
【0017】各個別の結果については優先評価部署決定
手段107で決定される場合、評価部署決定手段108
で決定される場合、補助評価部署決定手段109で決定
される場合、それぞれ1ケースずつ以下に示す。まず、
図12に米国特許6148136に対する結果を示す。
図12の左上の縦線を伴う左矢印は先頭の全体まとめ結
果へのリンクボタン、縦線を伴わない左矢印は1つ前の
結果へのリンクボタン、縦線を伴わない右矢印は1つ後
の結果へのリンクボタン、縦線を伴った右矢印は本出力
最後尾へのリンクボタンである。最後である30番目の
結果に対しては縦線を伴わない右矢印は本出力最後尾へ
のリンクボタンと同じ作用になる。リンクボタンのあ
と、通し番号、特許文書ファイル名、タイトル、登録
日、要約が出力されている。米国特許6148136の
要約で図8の優先対応テーブルに含まれる“digital VC
R”が1回出現しているので、評価部署として開発チー
ムT6が選択されている。以下、評価部署決定手段10
8、補助評価部署決定手段109で決定が行われた場合
に使用されるキーワードと出現回数が評価部署とともに
出力されている。図6A〜図6C、図8、図9に含まれ
るキーワードが全くない場合には30番目の結果の「補
助割り当てによる評価推薦部署」のようにキーワード欄
に「部署に対応するキーワードなし」と表示される。
【0018】更に、オプションとして単語を解析して出
現回数順に出力するかどうかが選択可能であり、選択し
た場合、米国特許6148136に対しては図13A及
び図13Bが出力される。図13A及び図13Bの結果
は図6A〜図6C、図8、図9の対応テーブルに登録し
たキーワードに不足はないか検討するときに参考にな
る。
【0019】次に評価部署決定手段108で決定される
場合の例を図14に示す。図12と共通する事柄につい
ては説明を省略して米国特許5699125に対して優
先評価部署決定手段107では評価部署が決定されなか
ったため、「優先割り当てによる評価推薦部署」では推
薦部署が「未選定」と表示されている。評価部署決定手
段108では図6A〜図6Cの通常対応テーブルに登録
されているキーワードの中で“electronic TV program
guide”と“EPG”が見つかり、最大出現回数を与え
る“electronic TV program guide”に対応する開発チ
ームT2が評価部署として決定される。以下、補助評価
部署決定手段109で決定が行われた場合に使用される
キーワードと出現回数が評価部署とともに出力されてい
る。米国特許5699125に対する単語と出現回数の
結果は図13A及び図13Bと中身は異なるが形式は同
じであり省略する。
【0020】更に補助評価部署決定手段109で決定さ
れる場合の例を図15に示す。図12と共通する事柄に
ついては説明を省略する。米国特許5657098に対
して優先評価部署決定手段107、評価部署決定手段1
08で評価部署が決定されなかったため、「優先割り当
てによる評価推薦部署」、「通常割り当てによる評価推
薦部署」ではそれぞれ推薦部署が「未選定」と表示され
ている。補助評価部署決定手段109では図9の補助対
応テーブルに登録されているキーワードの中で“color
temperature”と“television”が見つかり、最大出現
回数を与える“color temperature”に対応するY開発
センターが評価部署として決定される。
【0021】本実施形態によれば、優先、通常、補助の
3種類のキーワードと評価部署との対応テーブルを設定
し、文書のテキストデータを解析して、対応テーブルに
含まれるキーワードの出現回数を計数し、優先対応テー
ブルに含まれるキーワードの出現回数にゼロでないもの
があれば出現回数の最大のキーワードに対応する部署を
評価部署として決定し、優先対応テーブルに含まれるキ
ーワードの出現回数が全てゼロのときには、通常対応テ
ーブルに含まれるキーワードの出現回数にゼロでないも
のがあれば出現回数の最大のキーワードに対応する部署
を評価部署として決定し、優先対応テーブル、通常対応
テーブルそれぞれに含まれるキーワードの出現回数が全
てゼロのときには、補助対応テーブルに含まれるキーワ
ードの出現回数にゼロでないものがあれば出現回数の最
大のキーワードに対応する部署を評価部署として決定
し、優先、通常、補助の3種の対応テーブルそれぞれに
含まれるキーワードの出現回数が全てゼロのときには未
選定とすることとしたので、簡単な検索のみで評価部署
を決定することができる。しかも、キーワードの抽出及
び計数にあたり、優先対応テーブルのキーワードについ
ては要約とクレームの部分を抽出の対象とし、通常対応
テーブル及び補助対応テーブルのキーワードについては
特許テキストの全体を抽出の対象としたので、割り当て
洩れが最小限になるように最適な評価部署を決定するこ
とができる。
【0022】ここで、図6A〜図6C、図8、図9の各
テーブルに示されるキーワード毎の重みの利用方法を説
明する。キーワード抽出・計数手段105では、抽出し
たキーワード毎の計数値に、これに対応する重みを掛け
て得た値を当該キーワードの出現回数としてキーワード
出現回数最大値判定手段106へ渡す。キーワード出現
回数最大値判定手段106では、優先、通常、補助の3
種の対応テーブルそれぞれについて重み付けされた出現
回数が最大値を有するキーワードを判定し、その判定結
果を優先評価部署決定手段107、評価部署決定手段1
08、補助評価部署決定手段109へ渡すのである。な
お、図6A〜図6C、図8、図9の例では重みを“1.
0”、“0.5”、“0.1”の3種類しか設定してい
ないが、重みの値は任意である。したがって、キーワー
ド毎に任意の重みが設定可能であり、柔軟な評価部署選
定条件をキーワードと評価部署との対応テーブルに設定
することができる。
【0023】なお、キーワード出現回数最大値判定手段
106では評価部署毎に対応するキーワードの出現回数
の和を求めたあと、出現回数の和の最大値を判定するこ
ととし、評価部署決定手段108では出現回数の和の最
大値を与える部署を評価部署として決定するようにして
もよい。例えば、キーワード出現回数最大値判定手段1
06では優先、通常、補助の3種の対応テーブルについ
て、評価部署毎の対応キーワードの重み付けされた出現
回数の和を求めたあと、当該出現回数の和が最大値とな
る評価部署を最適な評価部署として決定する。図16に
キーワード出現回数最大値判定手段106で最大値を判
定する準備として各評価部署に対応するキーワードの出
現回数に重みを掛けたあと、評価部署毎の重み付けされ
た出現回数の和(スコア)を1件毎の特許文書について
表示した一例を示す。図16の例によれば、例えば米国
特許5526045の評価部署として、最大スコアを示
す開発チームT5が選択される。
【0024】また、上記説明では出現回数が最も多いキ
ーワードに対応する評価部署を最適な評価部署として決
定することとしたが、出現回数が一定範囲内にあるキー
ワードに対応する複数の評価部署を選択するようにして
もよい。
【0025】《第2の実施形態》次に、特許分類コード
と評価部署との対応テーブルを自動的に作成するシステ
ムの例を説明する。
【0026】図17は本発明の第2の実施形態の構成を
示すブロック図である。図17において、101はキー
ワードと評価部署との対応テーブルを格納するテーブル
記憶手段、102はキーワード評価部署対応テーブル入
力手段、103は複数の特許文書を格納する文書記憶手
段、104は文書入力手段、105は特許文書からキー
ワードを抽出し、キーワード毎の出現回数を計数するキ
ーワード抽出・計数手段、106はキーワードの出現回
数の最大値判定手段、107は優先評価部署決定手段、
108は評価部署決定手段、109は補助評価部署決定
手段、210は特許分類コード抽出手段、211は特許
分類コード評価部署対応テーブル作成手段、212は特
許分類コード評価部署対応テーブル出力手段、213は
表示装置、214は特許分類コード評価部署対応テーブ
ル記憶手段、215はプリンタである。
【0027】図17において評価部署を決定するまでの
動作は図5の第1の実施形態と同じであるので省略す
る。特許分類コードの抽出にあたっては評価部署を決定
するために1つ1つ特許文書を文書入力手段104から
入力したときに特許分類コード抽出手段210によって
抽出してもよいし、評価部署を全て決定してから再度文
書入力手段104により特許文書を1つ1つ入力して特
許分類コード抽出手段210によって抽出してもよい。
最終的に図18に示す特許文書に対応した評価部署、特
許分類コードが得られる。
【0028】特許分類コード評価部署対応テーブル作成
手段211では図18の表を特許分類コードに対応する
評価部署の表に変換して図19A〜図19Dに示す表を
得る。特許分類コードに対応する評価部署が1部署しか
ないときはその部署をその特許分類コードに対応する評
価部署として決定し、特許分類コードに対応する評価部
署が複数部署あるときは件数が最大の部署を評価部署と
して決定する。また、件数が最大の部署が複数部署ある
ときはその複数部署をその特許分類コードに対応する評
価部署として決定してもよいし、先に見つかった部署を
その特許分類コードに対応する評価部署として決定して
もよいが、本実施形態では前者を採用する。図19A〜
図19Dではほとんどの特許分類コードに対して1部署
しか対応していないが、特許分類コード“35890
6”には開発チームT5、T6それぞれ1件ずつなの
で、開発チームT5、T6の2部署を同コード“358
906”に対応する評価部署として決定する。特許分類
コード“386 46”には開発チームT1が3件、開
発チームT6が2件なので、開発チームT1を同コード
“386 46”に対応する評価部署として決定する。
特許分類コード“38695”には開発チームT3が2
件、開発チームT5が1件なので、開発チームT3を同
コード“386 95”に対応する評価部署として決定
する。特許分類コード“386 98”には開発チーム
T3が3件、開発チームT6が1件なので、開発チーム
T3を同コード“386 98”に対応する評価部署と
して決定する。この結果を特許分類コードに対応する評
価部署として表すと図20A〜図20Cのテーブル、す
なわち特許分類コード評価部署対応テーブルが得られ
る。また、同じ結果を評価部署に対応する特許分類コー
ドとして表すと図21の表を得る。特許分類コード評価
部署対応テーブル作成手段211が作成した特許分類コ
ード評価部署対応テーブルを、特許分類コード評価部署
対応テーブル出力手段212ではHTML形式で特許分
類コード評価部署対応テーブル記憶手段213に出力す
る。
【0029】本実施形態によれば、キーワード評価部署
対応テーブルをもとにして特許分類コード評価部署対応
テーブルを自動的に作成することができ、例えば次に説
明する第3の実施形態に係る文書評価部署割り当てシス
テムにおいてその結果が利用される。
【0030】《第3の実施形態》次に、特許分類コード
と評価部署との対応テーブルを使用した文書評価部署割
り当てシステムの例を説明する。
【0031】図22は本発明の第3の実施形態の構成を
示すブロック図である。図22において、301は特許
分類コードと評価部署との対応テーブルを格納する特許
分類コード評価部署対応テーブル記憶手段、302は特
許分類コード評価部署対応テーブル入力手段、303は
複数の特許文書を格納する文書記憶手段、304は文書
入力手段、305は特許文書から特許分類コードを抽出
し、特許分類コード毎の出現回数を計数する特許分類コ
ード抽出・計数手段、306は特許分類コード出現回数
最大値判定手段、307は評価部署決定手段、308は
評価部署決定結果出力手段、309は表示装置、310
は評価部署決定結果記憶手段、311はプリンタであ
る。
【0032】文書記憶手段303には図3に示す30件
の米国特許のテキストデータが格納されている。また、
特許分類コード評価部署対応テーブル記憶手段301に
は図20A〜図20Cに示す特許分類コードと評価部署
との対応テーブルが格納されている。図20A〜図20
Cでは、特許分類コード“358906”が開発チーム
T5及びT6の2部署に対応している以外は、特許分類
コードが評価部署と1対1に対応している。
【0033】はじめに特許分類コード評価部署対応テー
ブル入力手段302が特許分類コード評価部署対応テー
ブル記憶手段301に格納されている図20A〜図20
Cに示すテーブルを読み出す。次に図3に示す30件の
米国特許文書を1件毎に処理する。文書入力手段304
が文書記憶手段303から特許文書テキストデータを1
件毎に読み出し、特許分類コード抽出・計数手段305
では図20A〜図20Cに示すテーブルの特許分類コー
ドについて特許テキストの当該特許に付けられた米国特
許分類コードの主分類、及び主分類以外から抽出し、引
用特許からは特許分類コードを抽出しないものとする。
次に抽出された特許分類コードの出現回数を特許分類コ
ード抽出・計数手段305で求める。特許分類コード抽
出・計数手段305で求めた特許分類コードの出現回数
を入力として特許分類コード出現回数最大値判定手段3
06では図20A〜図20Cに示すテーブルの特許分類
コードの出現回数がゼロでないものがあるとき、各評価
部署に対応する特許分類コードの出現回数の和を求め、
出現回数の和が最も多い評価部署を判定する。次に評価
部署決定手段307では特許分類コード出現回数最大値
判定手段306の判定した出現回数の和が最も多い評価
部署を最適な評価部署として決定する。最も多い出現回
数の和が複数ある場合には先に見つかった評価部署を選
択しても、また最も多い出現回数の和を有する評価部署
の数だけ評価部署を選択しても、いずれにせよ評価部署
を割り当てることができたという点では同じである。
【0034】評価部署決定手段307での決定を評価部
署決定結果出力手段308でまとめた結果を表示装置3
09、評価部署決定結果記憶手段310へ出力する。図
23に表示装置309への出力例を示す。図23では最
初にプログラムを起動したあと、開始時刻が出力され、
以降30件の特許明細書のファイル名と選定された評価
部署が出力されている。以下、“stage 1”、“stage
2”、“stage 3”が図23にはないことが図10と異な
っているだけでそれ以外は同じである。
【0035】評価部署決定結果記憶手段310へは、最
初に第1の実施形態の図11に示した全件のまとめ結果
と同様な結果が出力されたあと、一時的に溜め込んでお
いた各特許文書に対する結果が出力される。評価部署決
定結果記憶手段310への出力はHTML形式で出力さ
れるが本実施形態の説明ではブラウザを通した形で表示
する。
【0036】各個別の結果については米国特許6044
198の1ケースを図24に示す。図24の左上のリン
クボタンは第1の実施形態と同じなので説明を省略す
る。リンクボタンのあと、通し番号、特許文書ファイル
名、タイトル、登録日、要約が出力されている。図24
に含まれる表の「出現回数」の欄には部署に対応した全
ての特許分類コードの出現回数が表示されている。表の
「出現回数和」の欄には部署毎の特許分類コードの出現
回数の和が表示されている。米国特許6044198の
米国特許分類コードは、 主分類 :“386 98” 主分類以外:“386 46”、“386 52”、
“348705”、“358906” であり、“386 98”には開発チームT3が、“3
86 46”には開発チームT1が、“386 52”
には開発チームT6が、“348705”には開発チー
ムT6が、“358906”には開発チームT5及びT
6がそれぞれ対応している。最も出現回数の和が大きい
開発チームT6が評価部署に決定される。
【0037】本実施形態(特許分類コードによる割り当
て)によれば、第1の実施形態(キーワードによる割り
当て)に比べて短時間で評価部署を決定することができ
る。30件の米国特許を処理するのに要した時間を、第
1の実施形態では単語解析を行うかどうかのオプション
指定の有無についても測定し、結果を図25に示す。割
り当てシステムを実行する環境も3つの場合について測
定したが、どの場合も特許分類コードによる割り当てが
キーワードによる割り当てに比べて100倍以上速い。
米国特許10000件については、図25を単純に比例
計算すると図26を得る。
【0038】第3の実施形態で使用した特許分類コード
は10部署で82個であり、1部署平均8.2であるが
より多くの部署を扱うためには特許分類コードを増やし
ていく必要があり、処理時間は特許分類コードに比例す
るという粗い見積もりを行うと1部署平均100の特許
分類コードで部署の数を20にしても2000÷82≒
24.3倍となり、仮にキーワードの種類を増やさない
ことにしてもキーワードによる割り当て時間よりも短
く、5分の1以下となることが予想される。よって、本
発明の文書評価部署割り当てシステムを特許文書に適用
する場合にはキーワードによる割り当てから評価部署の
対応する特許分類コードを求め、非常に数が多い特許文
書の割り当ては特許分類コードにより割り当てることが
推奨される。
【0039】《第4の実施形態》次に、キーワードと評
価部署との対応テーブルを自動的に作成するシステムの
例を説明する。
【0040】図27は本発明の第4の実施形態の構成を
示すブロック図である。図27において、401は人名
と評価部署との対応テーブルを格納するテーブル記憶手
段、402は人名評価部署対応テーブル入力手段、40
3は複数のキーワードを格納するキーワード記憶手段、
404はキーワード入力手段、405は複数の特許文書
を格納する文書記憶手段、406は文書入力手段、40
7は特許文書から発明者を抽出し、特許文書に記載され
ている発明者数を評価部署毎に計数する発明者抽出・計
数手段、408は発明者数最大値判定手段、409は特
許文書からキーワードを抽出し、キーワード毎の出現回
数を計数するキーワード抽出・計数手段、410はキー
ワード評価部署対応テーブル作成手段、411はキーワ
ード評価部署対応テーブル出力手段、412は表示装
置、413はキーワード評価部署対応テーブル記憶手
段、414はプリンタである。
【0041】文書記憶手段405には図3に示す30件
の米国特許のテキストデータが格納されている。また、
人名評価部署対応テーブル記憶手段401には図28A
及び図28Bに示す人名と評価部署との対応テーブルが
格納されている。図28A及び図28Bを逆引きして各
評価部署にどのようなメンバが含まれているかを図29
に示す。ただし、図28A、図28B、図29の例は本
発明を説明するために、実際に存在する特許文書に記載
されている発明者をメンバとして架空的に構成したもの
である。キーワード記憶手段403には図30に示すキ
ーワードが格納されている。
【0042】はじめに人名評価部署対応テーブル入力手
段402が図28A及び図28Bに示すテーブルを、ま
たキーワード入力手段404が図30に示すキーワード
をそれぞれ読み出す。次に図3に示す30件の米国特許
文書を1件毎に処理する。文書入力手段406が特許文
書テキストデータを1件毎に読み出し、発明者抽出・計
数手段407では図28A及び図28Bに示すテーブル
の人名について特許テキストの発明者を記述している領
域を抽出の対象とする。抽出された発明者は評価部署毎
に発明者数が計数される。ただし、図1の会社とは別の
会社に所属する同姓同名人を計数から排除するため、特
許文書テキストデータから更に出願人又は譲受人を抽出
し、当該出願人又は譲受人が上記評価部署の属する法人
(図1の会社)であることを確認したあと、抽出した発
明者を図28A及び図28Bに示すテーブルに含まれる
人名と照合し、評価部署毎に発明者が何名記載されてい
るか計数するのがよい。発明者数最大値判定手段408
では発明者数が最大値である評価部署を判定する。発明
者数がゼロの場合には評価部署の「該当なし」と判定す
る。一方、キーワード抽出・計数手段409では図30
に示すキーワードについて特許テキスト全体を対象とし
て抽出し、抽出されたキーワードは出現回数が計数され
る。キーワード評価部署対応テーブル作成手段410で
は1件毎に発明者数最大値判定手段408から評価部署
を、またキーワード抽出・計数手段409からキーワー
ドと出現回数とを受け取り、例えば第1番目の特許文書
の評価部署が“T5”である場合には第1番目の特許文
書で抽出されたキーワードは全て“T5”に対応するも
のとする。
【0043】本実施形態では図3に示す30件の特許文
書に対してキーワード毎に、発明者数が最大値である評
価部署を発明者数最大値判定手段408が判定する。図
31A及び図31Bは、キーワード評価部署対応テーブ
ル作成手段410でキーワードに対して評価部署を対応
させるための準備として、評価部署毎にキーワード出現
回数の和を求めた結果を示す。そして、キーワード出現
回数の和の最大値を与える評価部署をキーワードに対応
付けることによって図32A及び図32Bに示すキーワ
ード評価部署対応テーブルを作成する。図32A及び図
32Bを逆引きして評価部署毎のキーワード群を表示す
ると図33となる。第1の実施形態の図7と比較する
と、例えば“EDTV”が図7では“Y”のキーワード
であるのに対して図33では“T1”のキーワードにな
っているなど、少し違いはあるものの類似したキーワー
ド評価部署対応テーブルになっている。
【0044】本実施形態によれば、評価部署が出願した
特許をもとにしてキーワード評価部署対応テーブルを自
動的に作成することができ、少し人手修正を必要とする
にしてもキーワード評価部署対応テーブルの作成時間を
格段に短縮できる。なお、発明者抽出・計数手段40
7、発明者数最大値判定手段408に依らずに、評価部
署が出願した特許に類似した特許を使用して前もって評
価部署と特許文書とを対応付け、キーワード抽出・計数
手段409の処理を本実施形態のようにしても、キーワ
ード評価部署対応テーブルを自動的に作成可能なことは
明らかである。
【0045】《第5の実施形態》最後に、特許分類コー
ドと評価部署との対応テーブルと、キーワードと評価部
署との対応テーブルとの両方を使用した文書評価部署割
り当てシステムの例を説明する。
【0046】図34は本発明の第5の実施形態の構成を
示すブロック図である。図34において、501は特許
分類コードと評価部署との対応テーブルを格納する特許
分類コード評価部署対応テーブル記憶手段、502は特
許分類コード評価部署対応テーブル入力手段、503は
キーワードと評価部署との対応テーブルを格納するキー
ワード評価部署対応テーブル記憶手段、504はキーワ
ード評価部署対応テーブル入力手段、505は複数の特
許文書を格納する文書記憶手段、506は文書入力手
段、507は特許文書から特許分類コードを抽出する特
許分類コード抽出手段、508は特許文書からキーワー
ドを抽出し、キーワード毎の出現回数を計数するキーワ
ード抽出・計数手段、509はキーワードの出現回数の
最大値判定手段、510は優先評価部署決定手段、51
1は評価部署決定手段、512は補助評価部署決定手
段、513は評価部署決定結果出力手段、514は表示
装置、515は評価部署決定結果記憶手段、516はプ
リンタである。
【0047】文書記憶手段505には図3に示す30件
の米国特許のテキストデータが格納されている。また、
特許分類コード評価部署対応テーブル記憶手段501に
は図35に示す特許分類コードと評価部署との対応テー
ブルが格納されている。図35を逆引きして各評価部署
がどのような特許分類コードに対応しているかを図36
に示す。更にキーワード評価部署対応テーブル記憶手段
503には図6A〜図6Cの通常対応テーブル、図8の
優先対応テーブル、図9の補助対応テーブルが格納され
ている。
【0048】はじめに特許分類コード評価部署対応テー
ブル入力手段502が図35に示すテーブルを、またキ
ーワード評価部署対応テーブル入力手段504が図6A
〜図6C、図8、図9に示す3種のキーワード評価部署
対応テーブルをそれぞれ読み出す。次に図3に示す30
件の米国特許文書を1件毎に処理する。文書入力手段5
06が特許文書テキストデータを1件毎に読み出し、特
許分類コード抽出手段507では図35に示すテーブル
の特許分類コードについて特許テキストのその特許自体
の米国特許分類コードを記述している領域を抽出の対象
とする。ここで、抽出された特許分類コードにより特許
分類コード評価部署対応テーブルから評価部署を一意に
決定できる場合には、キーワード抽出・計数手段508
から補助評価部署決定手段512までの処理を省略す
る。例えば、図35の例では特許分類コード“375”
から評価部署“T1”を一意に決定できるので、評価部
署決定結果出力手段513に直ちに処理を移す。評価部
署を一意に決定できない場合には、キーワード抽出・計
数手段508へ進む。キーワード抽出・計数手段508
では図6A〜図6C、図9に示すテーブルのキーワード
については特許テキストの全体を抽出の対象とし、図8
に示すテーブルのキーワードについては要約とクレーム
の部分を抽出の対象とするのに加えて、特許分類コード
抽出手段507で抽出された特許分類コードに対応した
評価部署のみについて、当該評価部署に対応したキーワ
ードを抽出する。抽出されたキーワードは出現回数が計
数される。キーワード出現回数最大値判定手段509で
は優先、通常、補助の3種の対応テーブルそれぞれにつ
いて出現回数が最大値を有するキーワードを判定する。
これ以降の処理は第1の実施形態と同じである。ただ
し、評価部署決定手段511では、キーワード出現回数
最大値判定手段509から得られた最大値を持つキーワ
ードを少なくとも入力として、特許分類コード抽出手段
507により抽出された特許分類コードに対応する評価
部署に対応したキーワード評価部署対応テーブルを索引
することにより、評価部署を決定する。
【0049】本実施形態においてキーワード抽出・計数
手段508で特許文書1件毎にどの評価部署に対応した
キーワードが使用されるかを図37に示す。図37で
“1”は評価部署に対応するキーワードを抽出対象にし
たことを、“0”は評価部署に対応するキーワードを抽
出対象にしなかったことをそれぞれ示している。CPU
333MHz、メモリ384MB、ハードディスク30
GBの環境で特許分類コード評価部署対応テーブルを使
用せず、全てのキーワードを抽出の対象としたときの評
価部署割り当て実行時間が27秒、特許分類コード評価
部署対応テーブルを使用して、特許分類コードに対応し
ない評価部署に対応したキーワードを抽出の対象外とし
たときの評価部署割り当て実行時間が30秒となった
が、これは図3の30件の米国特許が技術的に近接して
いるものになっていることと、本実施形態の評価部署ど
うしも近接した技術を扱っていることにより、図37か
ら分かるようにキーワード抽出・計数手段508で抽出
対象外となるキーワードは多くないことに起因してお
り、調査対象特許の技術範囲が広く、また評価部署もい
ろいろな技術を扱う組織に対して本発明を実施すれば、
評価部署割り当て実行時間の短縮が図れることが予想さ
れる。
【0050】なお、上記各実施形態では米国特許文書を
対象に説明したが本発明は一般の文書にも適用可能であ
り、また米国以外の特許文書の場合にも本発明は適用可
能であること、また特許分類コードとして国際特許分類
コードや各国独自の特許分類コードにも本発明は適用可
能であることは明白である。
【0051】キーワード評価部署対応テーブルの作成に
例えば学会発表文書を利用する場合には、図27中の発
明者抽出・計数手段407に代えて、学会発表文書から
執筆者を抽出して人名評価部署対応テーブルに含まれる
人名と照合し、評価部署毎に執筆者が何名いるか計数す
る執筆者抽出・計数手段を設ければよい。
【0052】
【発明の効果】以上説明したように本発明によれば、文
書をカテゴリ別に分類するシステムにおいて、特に大量
の文書に対して評価部署を自動的に適切に割り当てるこ
とが可能となり、企業の経営戦略の強力なツールの1つ
となる。
【図面の簡単な説明】
【図1】本発明に係る文書評価部署割り当てシステムの
適用対象の一例であるモデル会社の組織図である。
【図2】図1中のA事業部の詳細な組織図である。
【図3】本発明に係る文書評価部署割り当てシステムの
評価対象の一例である30件の米国特許文書の番号を示
す説明図である。
【図4】図2中の各開発チームの研究開発対象の例を示
す説明図である。
【図5】本発明の第1の実施形態に係る文書評価部署割
り当てシステムの構成を示すブロック図である。
【図6A】図5中のキーワード評価部署対応テーブル記
憶手段に格納されているテーブル(通常対応テーブル)
の一例を示す説明図である。
【図6B】図6Aに続く説明図である。
【図6C】図6Bに続く説明図である。
【図7】図6A〜図6Cに対応した逆引きテーブルを示
す説明図である。
【図8】図5中のキーワード評価部署対応テーブル記憶
手段に更に格納されている優先対応テーブルの一例を示
す説明図である。
【図9】図5中のキーワード評価部署対応テーブル記憶
手段に更に格納されている補助対応テーブルの一例を示
す説明図である。
【図10】図5中の表示装置への出力例を示す説明図で
ある。
【図11】図5中の評価部署決定結果記憶手段へ出力さ
れる、まとめ結果の一例を示す説明図である。
【図12】図5中の評価部署決定結果記憶手段へ出力さ
れる、あるケースに関する決定結果の例を示す説明図で
ある。
【図13A】第1の実施形態のオプションである単語解
析の結果の一例を示す説明図である。
【図13B】図13Aに続く説明図である。
【図14】図5中の評価部署決定結果記憶手段へ出力さ
れる、他のケースに関する決定結果の例を示す説明図で
ある。
【図15】図5中の評価部署決定結果記憶手段へ出力さ
れる、更に他のケースに関する決定結果の例を示す説明
図である。
【図16】図5のシステムにおける図6A〜図6C、図
8、図9中のキーワード毎の重みの使用例を示す説明図
である。
【図17】本発明の第2の実施形態に係る特許分類コー
ド評価部署対応テーブル作成システムの構成を示すブロ
ック図である。
【図18】図17中の特許分類コード評価部署対応テー
ブル作成手段の2入力を示す図であって、特許文書毎の
評価部署決定結果と、抽出された特許分類コードとを示
す説明図である。
【図19A】図18中の特許分類コードと評価部署との
対応関係を示す説明図である。
【図19B】図19Aに続く説明図である。
【図19C】図19Bに続く説明図である。
【図19D】図19Cに続く説明図である。
【図20A】図19A〜図19Dの対応関係をもとにし
て作成された、特許分類コード評価部署対応テーブルの
一例を示す説明図である。
【図20B】図20Aに続く説明図である。
【図20C】図20Bに続く説明図である。
【図21】図20A〜図20Cに対応した逆引きテーブ
ルを示す説明図である。
【図22】本発明の第3の実施形態に係る文書評価部署
割り当てシステムの構成を示すブロック図である。
【図23】図22中の表示装置への出力例を示す説明図
である。
【図24】図22中の評価部署決定結果記憶手段へ出力
される、あるケースに関する決定結果の例を示す説明図
である。
【図25】図3の30件の米国特許文書について、上記
第1の実施形態と第3の実施形態との各々の処理時間を
比較して示す説明図である。
【図26】図25の内容を10,000件の米国特許文
書の処理に敷衍した場合の説明図である。
【図27】本発明の第4の実施形態に係るキーワード評
価部署対応テーブル作成システムの構成を示すブロック
図である。
【図28A】図27中の人名評価部署対応テーブル記憶
手段に格納されているテーブルの一例を示す説明図であ
る。
【図28B】図28Aに続く説明図である。
【図29】図28A及び図28Bに対応した逆引きテー
ブルを示す説明図である。
【図30】図27中のキーワード記憶手段に格納されて
いるキーワードの一例を示す説明図である。
【図31A】図27のシステムでキーワードに対して評
価部署を対応させるための準備として、各々の評価部署
に対応した特許文書でのキーワード出現回数の和を求め
た結果の一例を示す説明図である。
【図31B】図31Aに続く説明図である。
【図32A】図27のシステムで作成された、キーワー
ド評価部署対応テーブルの一例を示す説明図である。
【図32B】図32Aに続く説明図である。
【図33】図32A及び図32Bに対応した逆引きテー
ブルを示す説明図である。
【図34】本発明の第5の実施形態に係る文書評価部署
割り当てシステムの構成を示すブロック図である。
【図35】図34中の特許分類コード評価部署対応テー
ブル記憶手段に格納されているテーブルの一例を示す説
明図である。
【図36】図35に対応した逆引きテーブルを示す説明
図である。
【図37】図34中のキーワード抽出・計数手段で特許
文書1件毎にどの評価部署に対応したキーワードが使用
されるか、一例を示す説明図である。
【符号の説明】
101 キーワード評価部署対応テーブル記憶手段 102 キーワード評価部署対応テーブル入力手段 103 文書記憶手段 104 文書入力手段 105 キーワード抽出・計数手段 106 キーワード出現回数最大値判定手段(カテゴリ
決定手段) 107 優先評価部署決定手段(カテゴリ決定手段) 108 評価部署決定手段(カテゴリ決定手段) 109 補助評価部署決定手段(カテゴリ決定手段) 110 評価部署決定結果出力手段 111 表示装置 112 評価部署決定結果記憶手段 113 プリンタ 210 特許分類コード抽出手段 211 特許分類コード評価部署対応テーブル作成手段 212 特許分類コード評価部署対応テーブル出力手段 213 表示装置 214 特許分類コード評価部署対応テーブル記憶手段 215 プリンタ 301 特許分類コード評価部署対応テーブル記憶手段 302 特許分類コード評価部署対応テーブル入力手段 303 文書記憶手段 304 文書入力手段 305 特許分類コード抽出・計数手段 306 特許分類コード出現回数最大値判定手段 307 評価部署決定手段 308 評価部署決定結果出力手段 309 表示装置 310 評価部署決定結果記憶手段 311 プリンタ 401 人名評価部署対応テーブル記憶手段 402 人名評価部署対応テーブル入力手段 403 キーワード記憶手段 404 キーワード入力手段 405 文書記憶手段 406 文書入力手段 407 発明者抽出・計数手段 408 発明者数最大値判定手段 409 キーワード抽出・計数手段 410 キーワード評価部署対応テーブル作成手段 411 キーワード評価部署対応テーブル出力手段 412 表示装置 413 キーワード評価部署対応テーブル記憶手段 414 プリンタ 501 特許分類コード評価部署対応テーブル記憶手段 502 特許分類コード評価部署対応テーブル入力手段 503 キーワード評価部署対応テーブル記憶手段 504 キーワード評価部署対応テーブル入力手段 505 文書記憶手段 506 文書入力手段 507 特許分類コード抽出手段 508 キーワード抽出・計数手段 509 キーワード出現回数最大値判定手段 510 優先評価部署決定手段 511 評価部署決定手段 512 補助評価部署決定手段 513 評価部署決定結果出力手段 514 表示装置 515 評価部署決定結果記憶手段 516 プリンタ

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 各々キーワードとカテゴリとの対応を示
    す優先対応テーブル、通常対応テーブル及び補助対応テ
    ーブルを格納するテーブル記憶手段と、 前記テーブル記憶手段から各対応テーブルを入力するテ
    ーブル入力手段と、 複数の文書を格納する文書記憶手段と、 前記文書記憶手段から文書を入力する文書入力手段と、 前記文書入力手段から得られた文書から各対応テーブル
    に含まれるキーワードを抽出して何個含まれているか計
    数するキーワード抽出・計数手段と、 前記優先対応テーブルに含まれるキーワードの出現回数
    にゼロでないものがあれば出現回数の最大のキーワード
    に対応するカテゴリを少なくとも割り当てカテゴリとし
    て決定し、前記優先対応テーブルに含まれるキーワード
    の出現回数が全てゼロのときには、前記通常対応テーブ
    ルに含まれるキーワードの出現回数にゼロでないものが
    あれば出現回数の最大のキーワードに対応するカテゴリ
    を少なくとも割り当てカテゴリとして決定し、前記優先
    対応テーブル及び前記通常対応テーブルそれぞれに含ま
    れるキーワードの出現回数が全てゼロのときには、前記
    補助対応テーブルに含まれるキーワードの出現回数にゼ
    ロでないものがあれば出現回数の最大のキーワードに対
    応するカテゴリを少なくとも割り当てカテゴリとして決
    定するカテゴリ決定手段とを備えたことを特徴とする文
    書分類システム。
  2. 【請求項2】 請求項1記載の文書分類システムにおい
    て、 前記文書は複数の領域に分かれており、前記キーワード
    抽出・計数手段では、前記優先対応テーブルに含まれる
    キーワードについては前記文書中の特定の領域のみを、
    前記通常対応テーブル及び前記補助対応テーブルそれぞ
    れに含まれるキーワードについては前記文書の全体をそ
    れぞれ参照することを特徴とする文書分類システム。
  3. 【請求項3】 請求項1記載の文書分類システムにおい
    て、 前記カテゴリ決定手段では、カテゴリ毎に対応するキー
    ワードの出現回数の和を求めたあと、出現回数の和の最
    大値を判定し、当該出現回数の和の最大値を与えるカテ
    ゴリを少なくとも割り当てカテゴリとして決定すること
    を特徴とする文書分類システム。
  4. 【請求項4】 請求項1記載の文書分類システムにおい
    て、 前記優先対応テーブル、通常対応テーブル及び補助対応
    テーブルにキーワード毎の重みを追加して格納するとと
    もに、 前記キーワード抽出・計数手段では、キーワード毎の計
    数値に前記重みを掛けて得た値を当該キーワードの出現
    回数とすることを特徴とする文書分類システム。
  5. 【請求項5】 キーワードと評価部署との対応テーブル
    を格納するテーブル記憶手段と、 前記テーブル記憶手段からキーワードと評価部署との対
    応テーブルを入力するテーブル入力手段と、 複数の文書を格納する文書記憶手段と、 前記文書記憶手段から文書を入力する文書入力手段と、 前記文書入力手段から得られた文書から前記対応テーブ
    ルに含まれるキーワードを抽出して何個含まれているか
    計数するキーワード抽出・計数手段と、 前記キーワード抽出・計数手段により計数されたキーワ
    ードの出現回数の最大値を判定する最大値判定手段と、 前記最大値判定手段から得られた最大値を持つキーワー
    ドを少なくとも入力として前記対応テーブルを索引する
    ことにより評価部署を決定する評価部署決定手段とを備
    えたことを特徴とする文書評価部署割り当てシステム。
  6. 【請求項6】 請求項5記載の文書評価部署割り当てシ
    ステムにおいて、 前記テーブル記憶手段にキーワードと評価部署との優先
    対応テーブルを追加して格納するとともに、 前記キーワード抽出・計数手段では前記優先対応テーブ
    ルに含まれるキーワードを抽出して何個含まれているか
    計数し、 前記最大値判定手段では前記キーワード抽出・計数手段
    で計数した前記優先対応テーブルに含まれるキーワード
    の出現回数の最大値を判定し、 前記優先対応テーブルに含まれるキーワードの出現回数
    がゼロでないときには、前記評価部署決定手段よりも優
    先して前記優先対応テーブルに含まれるキーワードの出
    現回数の最大値を持つキーワードを少なくとも入力とし
    て前記優先対応テーブルを索引することにより評価部署
    を決定する優先評価部署決定手段を更に備えたことを特
    徴とする文書評価部署割り当てシステム。
  7. 【請求項7】 請求項6記載の文書評価部署割り当てシ
    ステムにおいて、 前記文書は複数の領域に分かれており、前記キーワード
    抽出・計数手段では前記優先対応テーブルに含まれるキ
    ーワードについて前記文書中の特定の領域のみを参照す
    ることを特徴とする文書評価部署割り当てシステム。
  8. 【請求項8】 請求項5記載の文書評価部署割り当てシ
    ステムにおいて、 前記テーブル記憶手段にキーワードと評価部署との補助
    対応テーブルを追加して格納するとともに、 前記キーワード抽出・計数手段では前記補助対応テーブ
    ルに含まれるキーワードを抽出して何個含まれているか
    計数し、 前記最大値判定手段では前記キーワード抽出・計数手段
    で計数した前記補助対応テーブルに含まれるキーワード
    の出現回数の最大値を判定し、 前記評価部署決定手段によって評価部署が決定されない
    ときには、前記補助対応テーブルに含まれるキーワード
    の出現回数の最大値を持つキーワードを少なくとも入力
    として前記補助対応テーブルを索引することにより評価
    部署を決定する補助評価部署決定手段を更に備えたこと
    を特徴とする文書評価部署割り当てシステム。
  9. 【請求項9】 請求項5記載の文書評価部署割り当てシ
    ステムにおいて、 前記最大値判定手段では評価部署毎に対応するキーワー
    ドの出現回数の和を求めたあと、出現回数の和の最大値
    を判定し、 前記評価部署決定手段では前記出現回数の和の最大値を
    与える部署を少なくとも評価部署として決定することを
    特徴とする文書評価部署割り当てシステム。
  10. 【請求項10】 請求項5記載の文書評価部署割り当て
    システムにおいて、 前記対応テーブルにキーワード毎の重みを追加して格納
    するとともに、 前記キーワード抽出・計数手段では、キーワード毎の計
    数値に前記重みを掛けて得た値を当該キーワードの出現
    回数とすることを特徴とする文書評価部署割り当てシス
    テム。
  11. 【請求項11】 キーワードと評価部署との対応テーブ
    ルを格納するテーブル記憶手段と、 前記テーブル記憶手段からキーワードと評価部署との対
    応テーブルを入力するテーブル入力手段と、 複数の特許文書を格納する文書記憶手段と、 前記文書記憶手段から特許文書を入力する文書入力手段
    と、 前記文書入力手段から得られた特許文書から前記対応テ
    ーブルに含まれるキーワードを抽出して何個含まれてい
    るか計数するキーワード抽出・計数手段と、 前記キーワード抽出・計数手段により計数されたキーワ
    ードの出現回数の最大値を判定する最大値判定手段と、 前記最大値判定手段から得られた最大値を持つキーワー
    ドを少なくとも入力として前記対応テーブルを索引する
    ことにより評価部署を決定する評価部署決定手段と、 前記文書入力手段から得られた特許文書に記述されてい
    る特許分類コードを抽出する特許分類コード抽出手段
    と、 前記評価部署決定手段から得られた評価部署と前記特許
    分類コード抽出手段から得られた特許分類コードとに基
    づいて、特許分類コードと評価部署との対応テーブルを
    作成するテーブル作成手段とを備えたことを特徴とする
    特許分類コード評価部署対応テーブル作成システム。
  12. 【請求項12】 請求項11記載の特許分類コード評価
    部署対応テーブル作成システムにおいて、 前記テーブル記憶手段にキーワードと評価部署との優先
    対応テーブルを追加して格納するとともに、 前記キーワード抽出・計数手段では前記優先対応テーブ
    ルに含まれるキーワードを抽出して何個含まれているか
    計数し、 前記最大値判定手段では前記キーワード抽出・計数手段
    で計数した前記優先対応テーブルに含まれるキーワード
    の出現回数の最大値を判定し、 前記優先対応テーブルに含まれるキーワードの出現回数
    がゼロでないときには、前記評価部署決定手段よりも優
    先して前記優先対応テーブルに含まれるキーワードの出
    現回数の最大値を持つキーワードを少なくとも入力とし
    て前記優先対応テーブルを索引することにより評価部署
    を決定する優先評価部署決定手段を更に備えたことを特
    徴とする特許分類コード評価部署対応テーブル作成シス
    テム。
  13. 【請求項13】 請求項12記載の特許分類コード評価
    部署対応テーブル作成システムにおいて、 前記キーワード抽出・計数手段では、前記優先対応テー
    ブルに含まれるキーワードについて前記特許文書中の要
    約とクレームの部分のみを参照することを特徴とする特
    許分類コード評価部署対応テーブル作成システム。
  14. 【請求項14】 請求項11記載の特許分類コード評価
    部署対応テーブル作成システムにおいて、 前記テーブル記憶手段にキーワードと評価部署との補助
    対応テーブルを追加して格納するとともに、 前記キーワード抽出・計数手段では前記補助対応テーブ
    ルに含まれるキーワードを抽出して何個含まれているか
    計数し、 前記最大値判定手段では前記キーワード抽出・計数手段
    で計数した前記補助対応テーブルに含まれるキーワード
    の出現回数の最大値を判定し、 前記評価部署決定手段によって評価部署が決定されない
    ときには、前記補助対応テーブルに含まれるキーワード
    の出現回数の最大値を持つキーワードを少なくとも入力
    として前記補助対応テーブルを索引することにより評価
    部署を決定する補助評価部署決定手段を更に備えたこと
    を特徴とする特許分類コード評価部署対応テーブル作成
    システム。
  15. 【請求項15】 請求項11記載の特許分類コード評価
    部署対応テーブル作成システムにおいて、 前記最大値判定手段では評価部署毎に対応するキーワー
    ドの出現回数の和を求めたあと、出現回数の和の最大値
    を判定し、 前記評価部署決定手段では前記出現回数の和の最大値を
    与える部署を少なくとも評価部署として決定することを
    特徴とする特許分類コード評価部署対応テーブル作成シ
    ステム。
  16. 【請求項16】 特許分類コードと評価部署との対応テ
    ーブルを格納するテーブル記憶手段と、 前記テーブル記憶手段から特許分類コードと評価部署と
    の対応テーブルを入力するテーブル入力手段と、 複数の特許文書を格納する文書記憶手段と、 前記文書記憶手段から特許文書を入力する文書入力手段
    と、 前記文書入力手段から得られた特許文書から前記対応テ
    ーブルに含まれる特許分類コードを抽出して何個含まれ
    ているか計数する特許分類コード抽出・計数手段と、 前記特許分類コード抽出・計数手段から得られた特許分
    類コードの出現回数の最大値を判定する最大値判定手段
    と、 前記最大値判定手段から得られた最大値を持つ特許分類
    コードを少なくとも入力として前記対応テーブルを索引
    することにより評価部署を決定する評価部署決定手段と
    を備えたことを特徴とする特許文書評価部署割り当てシ
    ステム。
  17. 【請求項17】 請求項16記載の特許文書評価部署割
    り当てシステムにおいて、 前記最大値判定手段では評価部署毎に対応する特許分類
    コードの出現回数の和を求めたあと、出現回数の和の最
    大値を判定し、 前記評価部署決定手段では前記出現回数の和の最大値を
    与える部署を少なくとも評価部署として決定することを
    特徴とする特許文書評価部署割り当てシステム。
  18. 【請求項18】 人名と評価部署との対応テーブルを格
    納するテーブル記憶手段と、 前記テーブル記憶手段から人名と評価部署との対応テー
    ブルを入力するテーブル入力手段と、 複数のキーワードを格納するキーワード記憶手段と、 前記キーワード記憶手段からキーワードを入力するキー
    ワード入力手段と、 執筆者を記載している複数の文書を格納する文書記憶手
    段と、 前記文書記憶手段から文書を入力する文書入力手段と、 前記文書入力手段から得られた文書から執筆者を抽出し
    て前記対応テーブルに含まれる人名と照合し、評価部署
    毎に執筆者が何名いるか計数する執筆者抽出・計数手段
    と、 前記執筆者抽出・計数手段により計数された評価部署毎
    の執筆者数の最大値を判定する最大値判定手段と、 前記文書入力手段から得られた文書から前記キーワード
    記憶手段に含まれるキーワードを抽出して何個含まれて
    いるか計数するキーワード抽出・計数手段と、 前記最大値判定手段から得られた最大値を持つ評価部署
    と前記キーワード抽出・計数手段から得られたキーワー
    ド及び当該キーワードの出現回数とに基づいて、キーワ
    ードと評価部署との対応テーブルを作成するテーブル作
    成手段とを備えたことを特徴とするキーワード評価部署
    対応テーブル作成システム。
  19. 【請求項19】 請求項18記載のキーワード評価部署
    対応テーブル作成システムにおいて、 前記文書記憶手段では複数の特許文書を格納するととも
    に、 前記執筆者抽出・計数手段に代えて、前記文書入力手段
    から得られた特許文書から発明者を抽出して前記対応テ
    ーブルに含まれる人名と照合し、評価部署毎に発明者が
    何名記載されているか計数する発明者抽出・計数手段を
    備えたことを特徴とするキーワード評価部署対応テーブ
    ル作成システム。
  20. 【請求項20】 請求項19記載のキーワード評価部署
    対応テーブル作成システムにおいて、 前記発明者抽出・計数手段では特許文書から更に出願人
    又は譲受人を抽出し、当該出願人又は譲受人が前記評価
    部署の属する法人であることを確認したあと、前記抽出
    した発明者を前記対応テーブルに含まれる人名と照合
    し、評価部署毎に発明者が何名記載されているか計数す
    ることを特徴とするキーワード評価部署対応テーブル作
    成システム。
  21. 【請求項21】 特許分類コードと評価部署との対応テ
    ーブルを格納する特許分類コード評価部署対応テーブル
    記憶手段と、 前記特許分類コード評価部署対応テーブル記憶手段から
    特許分類コードと評価部署との対応テーブルを入力する
    特許分類コード評価部署対応テーブル入力手段と、 キーワードと評価部署との対応テーブルを格納するキー
    ワード評価部署対応テーブル記憶手段と、 前記キーワード評価部署対応テーブル記憶手段からキー
    ワードと評価部署との対応テーブルを入力するキーワー
    ド評価部署対応テーブル入力手段と、 複数の特許文書を格納する文書記憶手段と、 前記文書記憶手段から特許文書を入力する文書入力手段
    と、 前記文書入力手段から得られた特許文書から前記特許分
    類コード評価部署対応テーブルに含まれる特許分類コー
    ドを抽出する特許分類コード抽出手段と、 前記文書入力手段から得られた特許文書から前記キーワ
    ード評価部署対応テーブルに含まれるキーワードを抽出
    するときに前記特許分類コード抽出手段により抽出され
    た特許分類コードに対応する評価部署に対応したキーワ
    ードのみを抽出して何個含まれているか計数するキーワ
    ード抽出・計数手段と、 前記キーワード抽出・計数手段により計数されたキーワ
    ードの出現回数の最大値を判定する最大値判定手段と、 前記最大値判定手段から得られた最大値を持つキーワー
    ドを少なくとも入力として前記特許分類コード抽出手段
    により抽出された特許分類コードに対応する評価部署に
    対応した前記キーワード評価部署対応テーブルを索引す
    ることにより評価部署を決定する評価部署決定手段とを
    備えたことを特徴とする特許文書評価部署割り当てシス
    テム。
  22. 【請求項22】 請求項21記載の特許文書評価部署割
    り当てシステムにおいて、 前記特許分類コード抽出手段により抽出された特許分類
    コードにより、前記特許分類コード評価部署対応テーブ
    ルから評価部署を一意に決定できる場合には、前記キー
    ワード抽出・計数手段、前記最大値判定手段及び前記評
    価部署決定手段の各々の動作を省略するように構成され
    たことを特徴とする特許文書評価部署割り当てシステ
    ム。
  23. 【請求項23】 請求項21記載の特許文書評価部署割
    り当てシステムにおいて、 前記キーワード評価部署対応テーブル記憶手段にキーワ
    ードと評価部署との優先対応テーブルを追加して格納す
    るとともに、 前記キーワード抽出・計数手段では前記優先対応テーブ
    ルに含まれるキーワードを抽出して何個含まれているか
    を計数し、 前記最大値判定手段では前記キーワード抽出・計数手段
    で計数した前記優先対応テーブルに含まれるキーワード
    の出現回数の最大値を判定し、 前記優先対応テーブルに含まれるキーワードの出現回数
    がゼロでないときには、前記評価部署決定手段よりも優
    先して前記優先対応テーブルに含まれるキーワードの出
    現回数の最大値を持つキーワードを少なくとも入力とし
    て前記優先対応テーブルを索引することにより評価部署
    を決定する優先評価部署決定手段を更に備えたことを特
    徴とする特許文書評価部署割り当てシステム。
  24. 【請求項24】 請求項21記載の特許文書評価部署割
    り当てシステムにおいて、 前記特許文書は複数の領域に分かれており、前記キーワ
    ード抽出・計数手段では前記優先対応テーブルに含まれ
    るキーワードについて前記特許文書中の特定の領域のみ
    を参照することを特徴とする特許文書評価部署割り当て
    システム。
  25. 【請求項25】 請求項21記載の特許文書評価部署割
    り当てシステムにおいて、 前記キーワード評価部署対応テーブル記憶手段にキーワ
    ードと評価部署との補助対応テーブルを追加して格納す
    るとともに、 前記キーワード抽出・計数手段では前記補助対応テーブ
    ルに含まれるキーワードを抽出して何個含まれているか
    を計数し、 前記最大値判定手段では前記キーワード抽出・計数手段
    で計数した前記補助対応テーブルに含まれるキーワード
    の出現回数の最大値を判定し、 前記評価部署決定手段によって評価部署が決定されない
    ときには、前記補助対応テーブルに含まれるキーワード
    の出現回数の最大値を持つキーワードを少なくとも入力
    として前記補助対応テーブルを索引することにより評価
    部署を決定する補助評価部署決定手段を更に備えたこと
    を特徴とする特許文書評価部署割り当てシステム。
  26. 【請求項26】 請求項21記載の特許文書評価部署割
    り当てシステムにおいて、 前記最大値判定手段では評価部署毎に対応するキーワー
    ドの出現回数の和を求めたあと、出現回数の和の最大値
    を判定し、 前記評価部署決定手段では前記出現回数の和の最大値を
    与える部署を少なくとも評価部署として決定することを
    特徴とする特許文書評価部署割り当てシステム。
JP2002199997A 2001-11-01 2002-07-09 文書分類システム Expired - Fee Related JP3670629B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002199997A JP3670629B2 (ja) 2001-11-01 2002-07-09 文書分類システム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001-336052 2001-11-01
JP2001336052 2001-11-01
JP2002199997A JP3670629B2 (ja) 2001-11-01 2002-07-09 文書分類システム

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2005059054A Division JP2005216321A (ja) 2001-11-01 2005-03-03 文書評価部署割り当てシステム
JP2005059053A Division JP2005339510A (ja) 2001-11-01 2005-03-03 特許文書評価部署割り当てシステム

Publications (2)

Publication Number Publication Date
JP2003203082A true JP2003203082A (ja) 2003-07-18
JP3670629B2 JP3670629B2 (ja) 2005-07-13

Family

ID=27666771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002199997A Expired - Fee Related JP3670629B2 (ja) 2001-11-01 2002-07-09 文書分類システム

Country Status (1)

Country Link
JP (1) JP3670629B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050019240A (ko) * 2003-08-18 2005-03-03 삼성전자주식회사 네트워크 시스템의 제어 방법
CN100336056C (zh) * 2005-01-07 2007-09-05 清华大学 基于成熟工艺文档的工艺术语提取、规律分析和重用方法
JP2020091552A (ja) * 2018-12-03 2020-06-11 株式会社アイアイビー 知的財産情報管理システム、プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000222431A (ja) * 1999-02-03 2000-08-11 Mitsubishi Electric Corp 文書分類装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000222431A (ja) * 1999-02-03 2000-08-11 Mitsubishi Electric Corp 文書分類装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050019240A (ko) * 2003-08-18 2005-03-03 삼성전자주식회사 네트워크 시스템의 제어 방법
CN100336056C (zh) * 2005-01-07 2007-09-05 清华大学 基于成熟工艺文档的工艺术语提取、规律分析和重用方法
JP2020091552A (ja) * 2018-12-03 2020-06-11 株式会社アイアイビー 知的財産情報管理システム、プログラム

Also Published As

Publication number Publication date
JP3670629B2 (ja) 2005-07-13

Similar Documents

Publication Publication Date Title
US7096218B2 (en) Search refinement graphical user interface
CA2578157C (en) Duplicate document detection and presentation functions
JP5392904B2 (ja) ドキュメントを分類するシステム、方法、およびソフトウェア
US20070033179A1 (en) Contextual searching
US20110087682A1 (en) Automated media analysis and document management system
JP2003345810A (ja) 文書検索方法、文書検索システム及び文書検索結果示方システム
JPH08272826A (ja) 文書加工方法および装置
US5761666A (en) Document retrieval system
US20100057559A1 (en) method of choosing advertisements to be shown to a search engine user
JP2000348041A (ja) 文書検索方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
US6219665B1 (en) Retrieval menu creation device, a retrieval menu creation method, and a recording medium that stores a retrieval menu creation program
US7836059B2 (en) System and method for minimally predictive feature identification
CN107273391A (zh) 文书推荐方法和装置
US7181688B1 (en) Device and method for retrieving documents
US6985908B2 (en) Text classification apparatus
JP2002007433A (ja) 情報分類装置、情報分類方法および情報分類プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに情報分類プログラム
JP2003281159A (ja) 文書処理装置及び文書処理方法、文書処理プログラム
JP2003203082A (ja) 文書分類システム
JP2005339510A (ja) 特許文書評価部署割り当てシステム
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JP3578651B2 (ja) 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05233719A (ja) 複合的な情報間の関連性識別方法
JPH11154164A (ja) 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体
JP2005216321A (ja) 文書評価部署割り当てシステム
KR101078966B1 (ko) 문서 분석 시스템

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050414

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees