JPH1153394A - 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 - Google Patents

文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法

Info

Publication number
JPH1153394A
JPH1153394A JP9219298A JP21929897A JPH1153394A JP H1153394 A JPH1153394 A JP H1153394A JP 9219298 A JP9219298 A JP 9219298A JP 21929897 A JP21929897 A JP 21929897A JP H1153394 A JPH1153394 A JP H1153394A
Authority
JP
Japan
Prior art keywords
document
vector
preference
matrix
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9219298A
Other languages
English (en)
Inventor
Naoyuki Nomura
直之 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP9219298A priority Critical patent/JPH1153394A/ja
Publication of JPH1153394A publication Critical patent/JPH1153394A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザーの嗜好を踏まえた文書処理を行うこ
とのできる文書処理装置、文書処理プログラムを記憶し
た記憶媒体、及び文書処理方法を提供すること。 【解決手段】 過去の処理文書中の出現頻度等から処理
重要語句(キーワード)を取得し、処理重要語句の処理
文書中の出現頻度等からユーザー全体の嗜好を表すGP
ベクトルを取得する。また、類似度を取得する基準とな
る基準文書Aにおける処理重要語句の重要度を取得し、
この重要度を要素とする文書ベクトルVaを取得し、G
Pベクトルと文書ベクトルVaの各要素を掛け合わせて
嗜好文書ベクトルV’aを得る。この嗜好文書ベクトル
には、ユーザーの嗜好が反映されている。嗜好文書ベク
トルV’aと他の文書Bの文書ベクトルVb,とでなす
角qのコサイン値cos(q)を、基準文書Aと他の文
書Bとの類似度とする。この類似度が大きいほど、他の
文書はユーザーの嗜好に近いものとなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書処理装置、文
書処理プログラムが記憶された記憶媒体、及び文書処理
方法に関し、更に詳細には、利用目的等のユーザーの嗜
好を踏まえた類似文書の検索に関する。
【0002】
【従来の技術】従来の文書処理装置、文書処理プログラ
ムが記憶された記憶媒体、及び文書処理方法による文書
処理においては、複数の文書を検索・分類するために、
それぞれの文書について当該文書を特徴付ける文書ベク
トルを取得し、この文書ベクトルから文書間の類似度を
算出することが行われている。
【0003】
【発明が解決しようとする課題】しかし、同一の文書で
も、例えば営業用や技術資料用等の利用目的その他のユ
ーザーの嗜好が異なると、重要部位等に差異が生じる。
そして、上述のような文書ベクトルを用いた文書処理に
よって文書の検索や分類をしても、ユーザーの嗜好を踏
まえた処理は行うことができないため、この様な嗜好を
加味した上での文書処理を行うことのできる文書処理装
置や文書処理プログラムが記憶された記憶媒体、文書処
理方法が望まれていた。
【0004】本発明は、上述のような課題を解決するた
めになされたもので、ユーザーの嗜好を踏まえた文書処
理を行うことのできる文書処理装置、文書処理プログラ
ムが記憶された記憶媒体、及び文書処理方法を提供する
ことを目的とする。
【0005】
【課題を解決するための手段】請求項1に記載の発明
は、図9に示すように、ユーザーの嗜好を表す複数のキ
ーワードに対する重要度を要素値とする嗜好ベクトルを
取得する嗜好ベクトル取得手段101と、文書を取得す
る文書取得手段102と、前記文書取得手段102によ
り取得された文書を特徴付ける文書ベクトルを取得する
文書ベクトル取得手段103と、前記文書ベクトル取得
手段により取得された前記文書ベクトルを前記嗜好ベク
トルによりシフトさせるシフト手段104とを具備する
文書処理装置を提供することにより前記目的を達成する
ものである。請求項2に記載の発明は、図9に示すよう
に、請求項1に記載の文書処理装置において、前記嗜好
ベクトル取得手段101は、前記ユーザーが作成した文
書又はアクセスした文書に対する複数の文書ベクトルか
ら前記嗜好ベクトルを作成する文書処理装置を提供する
ことにより前記目的を達成するものである。請求項3に
記載の発明は、図10に示すように、請求項1または請
求項2に記載の文書処理装置において、複数のユーザー
と、複数の前記ユーザーそれぞれの嗜好を表す複数のキ
ーワードとの一方を行、他方を列とし、前記各ユーザー
に対する前記各キーワードの重要度を要素値とするGP
行列を取得するGP行列取得手段105を備え、前記嗜
好ベクトル取得手段101は、前記GP行列により前記
嗜好ベクトルを取得する文書処理装置を提供することに
より前記目的を達成するものである。請求項4に記載の
発明は、図10に示すように、請求項3に記載の文書処
理装置において、前記GP行列取得手段105は、ユー
ザーが過去に処理した文書と該文書のキーワードとのう
ちの一方を行、他方を列とし、前記文書におけるキーワ
ードの重要度を要素値とする文書−キーワード行列と、
ユーザーが過去に処理した文書とユーザーとのうちの一
方を行、他方を列とし、各ユーザーの前記文書の処理回
数を要素とする文書−ユーザー行列と、からGP行列を
取得する文書処理装置を提供することにより前記目的を
達成するものである。請求項5に記載の発明は、図11
に示すように、請求項1から請求項4のうちのいずれか
1の請求項に記載の文書処理装置において、所定の文書
の文書ベクトルを嗜好ベクトルによりシフトさせた嗜好
文書ベクトルと、他の文書の文書ベクトルから、前記所
定の文書と前記他の文書との類似度を算出する類似度算
出手段106を具備する文書処理装置を提供することに
より前記目的を達成するものである。請求項6に記載の
発明は、図12に示すように、ユーザーの嗜好を表す複
数のキーワードに対する重要度を要素値とする嗜好ベク
トルを取得する嗜好ベクトル取得機能201と、文書を
取得する文書取得機能202と、前記文書取得機能20
2により取得された文書を特徴付ける文書ベクトルを取
得する文書ベクトル取得機能203と、前記文書ベクト
ル取得機能203により取得された前記文書ベクトルを
前記嗜好ベクトルによりシフトさせるシフト機能204
とをコンピュータに実現させるためのコンピュータ読み
取り可能な文書処理プログラムが記憶された記憶媒体を
提供することにより前記目的を達成するものである。請
求項7に記載の発明は、図12に示すように、請求項6
に記載の記憶媒体において、前記嗜好ベクトル取得機能
201は、前記ユーザーが作成した文書又はアクセスし
た文書に対する複数の文書ベクトルから前記嗜好ベクト
ルを作成する文書処理プログラムが記憶された記憶媒体
を提供することにより前記目的を達成するものである。
請求項8に記載の発明は、図13に示すように、請求項
6または請求項7に記載の記憶媒体において、複数のユ
ーザーと、複数の前記ユーザーそれぞれの嗜好を表す複
数のキーワードとの一方を行、他方を列とし、前記各ユ
ーザーに対する前記各キーワードの重要度を要素値とす
るGP行列を取得するGP行列取得機能205を備え、
前記嗜好ベクトル取得機能201は、前記GP行列によ
り前記嗜好ベクトルを取得する文書処理プログラムが記
憶された記憶媒体を提供することにより前記目的を達成
する。請求項9に記載の発明は、図13に示すように、
前記GP行列取得機能205は、ユーザーが過去に処理
した文書と該文書のキーワードとのうちの一方を行、他
方を列とし、前記文書におけるキーワードの重要度を要
素値とする文書−キーワード行列と、ユーザーが過去に
処理した文書とユーザーとのうちの一方を行、他方を列
とし、各ユーザーの前記文書の処理回数を要素とする文
書−ユーザー行列と、からGP行列を取得する文書処理
プログラムが記憶された記憶媒体を提供することにより
前記目的を達成するものである。請求項10に記載の発
明は、図14に示すように、請求項6から請求項9のう
ちのいずれか1の請求項に記載の記憶媒体において、所
定の文書の文書ベクトルを嗜好ベクトルによりシフトさ
せた嗜好文書ベクトルと、他の文書の文書ベクトルか
ら、前記所定の文書と前記他の文書との類似度を算出す
る類似度算出機能206を具備する文書処理プログラム
が記憶された記憶媒体を提供することにより前記目的を
達成するものである。請求項11に記載の発明は、図1
5に示すように、ユーザーの嗜好を表す複数のキーワー
ドに対する重要度を要素値とする嗜好ベクトルと文書と
を取得301し、前記文書を特徴付ける文書ベクトルを
取得302し、前記文書ベクトルを前記嗜好ベクトルに
よりシフト303させる文書処理方法を提供することに
より前記目的を達成するものである。
【0006】
【発明の実施の形態】以下、本発明の文書処理装置、文
書処理プログラムが記憶された記憶媒体及び文書処理方
法の好適な実施の形態について、図1から図8を参照し
て詳細に説明する。 (1)実施形態の概要 本実施形態では、過去の処理文書中の出現頻度等から処
理重要語句(キーワード)a,b,…を取得し、処理重
要語句の処理文書中の出現頻度、各処理文書の処理回
数、処理したメンバーの重要度から、ユーザー全体の嗜
好を表すGPベクトルを取得する。また、類似度を取得
する基準となる基準文書Aにおける処理重要語句a,
b,…の重要度g(a),g(b),…を取得し、重要
度g(a),g(b),…を要素とする文書ベクトルV
aを取得し、GPベクトルと文書ベクトルVa,Vb,
Vc,…の各要素を掛け合わせて嗜好文書ベクトルV’
aを得る。この嗜好文書ベクトルには、ユーザーの嗜好
が反映されている。嗜好文書ベクトルV’aと他の文書
の文書ベクトルVb,とでなす角qのコサイン値cos
(q)を、基準文書Aと他の文書Bとの類似度とする。
この類似度が大きいほど、他の文書はユーザーの嗜好に
近いものとなる。
【0007】(2)実施形態の詳細 図1は、本発明の文書処理装置の一実施形態であり、本
発明の文書処理プログラムが記憶された記憶媒体の一実
施形態の該プログラムが読み取られたコンピュータの構
成を表したブロック図である。この図1に示すように、
文書処理装置(コンピュータ)は、装置全体を制御する
ための制御部11を備えている。この制御部11には、
データバス等のバスライン21を介して、入力装置とし
てのキーボード12やマウス13、表示装置14、印刷
装置15、記憶装置16、記憶媒体駆動装置17、通信
制御装置18、入出力I/F19、及び文字認識装置2
0が接続されている。制御部11は、CPU111、R
OM112、RAM113を備えている。ROM112
は、CPU111が各種制御や演算を行うための各種プ
ログラムやデータが予め格納されたリードオンリーメモ
リである。
【0008】RAM113は、CPU111にワーキン
グメモリとして使用されるランダムアクセスメモリであ
る。このRAM113には、本実施形態による文書ベク
トル取得処理を行うためのエリアとして、文書ベクトル
取得の対象となる文書を格納する対象文書格納エリア1
131、キーワード格納エリア1132、文書ベクトル
格納エリア1134が確保され、また、嗜好文書ベクト
ル取得処理を行うためのエリアとして、行列格納エリア
1135、嗜好文書ベクトル格納エリア1136、類似
度格納エリア1137その他の各種エリアが確保される
ようになっている。
【0009】キーボード12は、かな文字を入力するた
めのかなキーやテンキー、各種機能を実行するための機
能キー、カーソルキー、等の各種キーが配置されてい
る。マウス13は、ポインティングデバイスであり、表
示装置14に表示されたキーやアイコン等を左クリック
することで対応する機能の指定を行う入力装置である。
表示装置14は、例えばCRTや液晶ディスプレイ等が
使用される。この表示装置14には、文書ベクトルを取
得する対象文書の内容や、本実施形態により算出された
文書間の類似度、算出された類似度をもとに行った検索
結果や分類結果等が表示されるようになっている。印刷
装置15は、表示装置14に表示された文章や、記憶装
置16の文書データベース164に格納された文書等の
印刷を行うためのものである。この印刷装置としては、
レーザプリンタ、ドットプリンタ、インクジェットプリ
ンタ、ページプリンタ、感熱式プリンタ、熱転写式プリ
ンタ、等の各種印刷装置が使用される。
【0010】記憶装置16は、読み書き可能な記憶媒体
と、その記憶媒体に対してプログラムやデータ等の各種
情報を読み書きするための駆動装置で構成されている。
この記憶装置16に使用される記憶媒体としては、主と
してハードディスクが使用されるが、後述の記憶媒体駆
動装置17で使用される各種記憶媒体のうちの読み書き
可能な記憶媒体を使用するようにしてもよい。記憶装置
16は、仮名漢字変換辞書161、プログラム格納部1
62、文書データベース164、重要語データベース1
65、行列データベース168、文書ベクトルデータベ
ース166、嗜好文書ベクトルデータベース167、図
示しないその他の格納部(例えば、この記憶装置16内
に格納されているプログラムやデータ等をバックアップ
するための格納部)等を有している。プログラム格納部
162には、本実施形態における嗜好文書ベクトル取得
処理プログラム、類似度算出処理プログラム等の各種プ
ログラムの他、仮名漢字変換辞書161を使用して入力
された仮名文字列を漢字混り文に変換する仮名漢字変換
プログラム等の各種プログラムが格納されている。
【0011】文書データベース164には、仮名漢字変
換プログラムにより作成された文書や、他の装置で作成
されて記憶媒体駆動装置17や通信制御装置18から読
み込まれた文書が格納される。この文書データベース1
64に格納される各文書の形式は特に限定されるもので
はなく、テキスト形式の文書、HTML(Hyper TextMa
rkup Language)形式の文書、JIS形式の文書等の各
種形式の文書の格納が可能である。更にこの文書データ
ベース164には、文書を処理したユーザー(処理者)
及びその処理回数が各文書に対応付けて格納されてい
る。前記処理回数は、所定期間毎に値を0にリセットさ
れる。重要語データベース165には、前記所定期間内
に処理した処理文書から抽出された重要語句(処理重要
語句)及びその重要度(処理重要度)が格納される。
【0012】行列データベース168には、過去の所定
期間に行われた文書処理の処理内容により取得される行
列Ga,Gb,Gcが格納されている。文書ベクトル
は、これらの行列Ga,Gb,Gcにより取得されるG
P(Group Personalize)行列をもとに、嗜好文書ベク
トルに変換される。図2(a)〜(c)は、行列Ga,
Gb,Gcを示す説明図である。
【0013】行列Ga(文書−キーワード行列)は、図
2(a)に示すように、前記所処理重要語句を行に、同
処理文書を列にとった行列であり、各要素は処理重要語
句の処理重要度f(x)を表している。行列Gb(文書
−ユーザー行列)は、図2(b)に示すように、前記処
理文書を行にとり、ユーザーのメンバーを列にとった行
列であり、各要素は、メンバーが各文書を前記所定期間
内に処理した回数となっている。行列Gcは、図2
(c)に示すように、行および列がともにユーザーのメ
ンバーそれぞれの重要度係数を示している。行列Ga及
び行列Gbは所定期間ごとに書き換えられ、行列Gcは
操作者からの入力により適宜書き換えられる。
【0014】文書ベクトルデータベース166、及び嗜
好文書ベクトルデータベース167には、本実施形態に
おいて類似度を算出する基準となる基準文書、及び、該
基準文書に対する類似度を比較する対象文書それぞれの
文書ベクトル及び嗜好文書ベクトルが格納される。
【0015】記憶媒体駆動装置17は、CPU111が
外部の記憶媒体からコンピュータプログラムや文書を含
むデータ等を読み込むための駆動装置である。記憶媒体
に記憶されているコンピュータプログラムには、本実施
形態の文書処理装置により実行される各種処理のための
プログラム、および、そこで使用される辞書、データ等
も含まれる。ここで、記憶媒体とは、コンピュータプロ
グラムやデータ等が記憶される記憶媒体をいい、具体的
には、フロッピーディスク、ハードディスク、磁気テー
プ等の磁気記憶媒体、メモリチップやICカード等の半
導体記憶媒体、CD−ROMやMO、PD(相変化書換
型光ディスク)等の光学的に情報が読み取られる記憶媒
体、紙カードや紙テープ等の用紙(および、用紙に相当
する機能を持った媒体)を用いた記憶媒体、その他各種
方法でコンピュータプログラム等が記憶される記憶媒体
が含まれる。本実施形態の文書処理装置において使用さ
れる記憶媒体としては、主として、CD−ROMやフロ
ッピーディスクが使用される。記憶媒体駆動装置17
は、これらの各種記憶媒体からコンピュータプログラム
を読み込む他に、フロッピーディスクのような書き込み
可能な記憶媒体に対してRAM113や記憶装置16に
格納されているデータ等を書き込むことが可能である。
【0016】本実施形態の文書処理装置では、制御部1
1のCPU111が、記憶媒体駆動装置17にセットさ
れた外部の記憶媒体からコンピュータプログラムを読み
込んで、記憶装置16の各部に格納(インストール)す
る。そして、本実施形態による類似度算出等の各種処理
を実行する場合、記憶装置16から該当プログラムをR
AM113に読み込み、実行するようになっている。但
し、記憶装置16からではなく、記憶媒体駆動装置17
により外部の記憶媒体から直接RAM113に読み込ん
で実行することも可能である。また、文書処理装置によ
っては、本実施形態の自動要約処理プログラム等を予め
ROM112に記憶しておき、これをCPU111が実
行するようにしてもよい。
【0017】通信制御装置18は、他のパーソナルコン
ピュータやワードプロセッサ等との間でテキスト形式や
HTML形式等の各種形式の文書やビットマップデータ
等の各種データの送受信を行うことができるようになっ
ている。入出力I/F19は、音声や音楽等の出力を行
うスピーカ等の各種機器を接続するためのインターフェ
ースである。文字認識装置20は、用紙等に記載された
文字をテキスト形式やHTML等の各種形式で認識する
装置であり、イメージスキャナや文字認識プログラム等
で構成されている。
【0018】本実施形態では、キーボード12の入力操
作により作成した文書(RAM113の所定格納エリア
に格納)の他、外部で作成して所定の記憶媒体に格納し
た文書で記憶媒体駆動装置17から読み込んだ文書、予
め文書データベース164に格納されている文書、通信
制御装置18からダウンロードした文書、及び文字認識
装置20で文字認識した文書、等の各種文書を対象文書
として取得することが可能である。
【0019】次に、上述のような構成の文書処理装置に
よる嗜好文書ベクトル取得処理及び類似度算出処理につ
いて図面を参照して説明する。
【0020】本実施形態においては、所定期間毎に、該
所定期間内に行われた文書処理の処理内容基づいて新た
な処理重要語句及び処理重要度が取得され、行列データ
ベース168内の行列Ga及び行列Gbが書き換えられ
る。
【0021】図3は、行列Ga,Gb書き換え処理の動
作を表したフローチャートである。CPU111は、所
定期間内に処理された文書(処理文書)を文書データベ
ース164から順次取得してRAM113の所定作業領
域に格納し(ステップ11)、各処理文書についての重
要語句(処理重要語句)及びその重要度(処理重要度)
を取得する(ステップ12)。
【0022】図4は処理重要語句・処理重要度取得処理
の動作を表したフローチャートである。図4に示すよう
に、CPU111は、文書データベース164から取得
した処理文書について、各処理文書毎に形態素解析を行
うことで自立語を抽出する(ステップ121)と共に、
名詞句、複合名詞句等を含めた候補語(句)を処理文書
から抽出する(ステップ122)。次に、抽出した候補
語(句)の処理文書での出現頻度、評価関数から、各候
補語(句)の処理重要度f(x)を取得する(ステップ
123)。ここで、評価関数としては、例えば、所定の
重要語句が予め指定されている場合にはその重要語句に
対する重み付け、単語、名詞句、複合名詞句等の候補語
(句)の種類による重み付け等が使用される。
【0023】さらにCPU111は、取得した処理重要
度f(x)の値をもとに候補語(句)から処理重要語句
a,b,…を取得し(ステップ124)、この処理重要
語句a,b,…及びその処理重要度f(a),f
(b),…を重要語データベース165に格納する(ス
テップ125)。すべての処理文書について、処理重要
語句及びその処理重要度を取得すると、図4に示す行列
Ga,Gb書き換え処理ルーチンへリターンする。
【0024】続いて、CPU111は、行列データベー
ス168の行列Gaを、前記処理重要語句a,b,…を
行に、前記所定期間の処理文書を列に、また処理重要度
f(a),f(b),…を各要素にとったものに書き換
える(ステップ13)。このとき、行列Gaの行数は、
各処理文書の処理重要語句の和集合の数とし、各処理文
書において含まれていない処理重要語句については、そ
の処理重要度f(x)は0と定義される。
【0025】例えば図2おいて、処理文書Bの処理重要
語は「重要、重要語、重要度、…」、処理文書Cの処理
重要語句は「重要、…、政治、…」であり、これらの処
理重要語句に対応する処理重要度は、処理文書Bについ
ては( 1,18,19,…)、処理文書Cについては
(18,…,21,…)である。これに対して行列Ga
においては、その行は「重要、重要語、重要度、…、政
治、…」とし、両文書の列における要素値はつぎの通り
定義される。 処理文書Bの列=( 1,18,19,…, 0,
…)、 処理文書Cの列=(18, 0, 0,…,21,…)
【0026】また、CPU111は、文書データベース
164から、各処理文書の処理回数を取得し(ステップ
14)、行列Gbを、所定期間内の処理文書を行に、文
書データベース164から取得した処理回数を各要素と
したものに書き換えて(ステップ15)、行列Ga,G
b書き換え処理を終了する。
【0027】図5は、本実施形態による文書嗜好ベクト
ル取得処理の動作を示すフローチャートである。嗜好文
書ベクトル取得に際しては、嗜好文書ベクトル取得の対
象となる文書(対象文書)を取得し、RAM113の対
象文書格納エリア1131に格納する(ステップ2
1)。対象文書は、ユーザの指示に従ってRAM11
3、記憶装置16の文書データベース164、記憶媒体
駆動装置17、または通信制御装置18(パソコン通
信、インターネット等の通信による場合)から取得す
る。
【0028】次にCPU111は、対象文書中から行列
Gaの処理重要語句を抽出する(ステップ22)。次
に、抽出した処理重要語句の対象文書中での出現頻度、
評価関数等から、重要度g(y)を取得する(ステップ
23)。ここで、評価関数としては、例えば、処理重要
語句に対する予め指定されている重み付け、単語、名詞
句、複合名詞句等の候補語(句)の種類による重み付け
等が使用される。
【0029】そして、この処理重要語句a,b,…の対
象文書中における重要度g(a),g(b)、…を要素
とする文書ベクトルVを取得する(ステップ24)。
【0030】文書ベクトルVを取得すると、CPU11
1は、行列データベース168から行列Ga,Gb,G
cを取得し、次の式に従って、GP行列を求める(ステ
ップ25)。 GP=Ga・Gb・Gc 従って、本実施形態におけるGP行列は、Ga行列の次
元合わせを行った行をそのまま行にとり、ユーザーの各
メンバーを列にとってなっており、GP行列の各要素
は、メンバー毎の過去の文書処理における処理重要語句
の処理重要度f(x)に各メンバーの重要度を加味して
表した数値となっている。
【0031】GP行列が取得されると、続いてCPU1
11は、このGP行列をもとにGPベクトル(嗜好ベク
トル)を取得する(ステップ26)。図6は、GP行列
からGPベクトルを算出する行程を概念的に説明する説
明図である。
【0032】CPU111は、まず、GP行列の各要素
gij(i=1〜メンバー数m、j=1〜処理重要語句
の和集合の数k)の各行毎の要素の平均値を算出して列
ベクトル(総GPベクトル)を得る(図6(1)→
(2))。この総GPベクトルは、各要素giが処理重
要語句毎のユーザーグループ全体における過去の文書処
理での出現頻度(但し各処理重要語句の予め決められた
処理重要語句の重み等や、メンバーの重要度が加味され
ている)を反映した数値となっている。CPU111
は、更に、この総GPベクトルの各要素giを文書の処
理回数の総数で割って、1列のGPベクトルを得る(図
6(2)→(3))。この様に、総GPベクトルを文書
の処理回数の総数で割るのは、行列Gbに文書の処理回
数が要素として含まれており、処理回数が増えるに従っ
てGPベクトルが大きくなっていくのを回避するためで
ある。
【0033】そして、CPU111は、GPベクトルの
各要素とこの各要素に対応する文書ベクトルVの要素と
を掛け合わせて、嗜好文書ベクトルV’を得る。嗜好文
書ベクトルV’は、嗜好文書ベクトルデータベース16
7に格納して(ステップ26)、嗜好文書ベクトル取得
処理を終了する。
【0034】図7は、文書ベクトルを嗜好文書ベクトル
にシフトさせた状態を概念的に示す説明図である。尚、
この説明図では、表示の都合上処理重要語句をX,Yの
2つとして説明するが、処理重要語句の数が異なってい
ても、文書ベクトルを嗜好文書ベクトルにシフトさせた
状態については本質的に同様である。図7に示すよう
に、文書ベクトルVp=(0,1)、文書ベクトルVq
=(2,1)、及び文書ベクトルVr=(8,1)をG
Pベクトル=(1,2)によりシフトさせたものであ
る。文書ベクトルVp、文書ベクトルVq、文書ベクト
ルVrは、GPベクトルにより、それぞれ嗜好文書ベク
トルVp’=(0,2)、Vq’=(2,2)、Vr=
(8,2)にシフトされる。このように、出現頻度等に
よって決定される要素値により、文書ベクトルから嗜好
文書ベクトルへ様々な角度でシフトされる。
【0035】次に、本実施形態による類似度算出処理に
ついて図8を参照して説明する。図8は、類似度算出処
理の動作を示すフローチャートである。
【0036】類似度算出に際しては、CPU111は、
類似度を算出する基準となる文書(基準文書A)につい
ての文書嗜好ベクトルV’aを取得する(ステップ2
1)。基準文書Aについての文書嗜好ベクトルV’a
は、上述の動作によって、または既に嗜好文書ベクトル
データベース167に格納されている場合にはこの文書
嗜好ベクトルデータベース167から読み出して、取得
する。尚、基準文書Aは、文書データベース164に格
納されている文書等から処理時に選択しても、予め決定
されているものを用いてもよい。また、基準文書Aとし
ては、1つの文書の他、複数の文書よりなる文書群や、
文書群からクラスタリング処理により自動抽出した文書
群を用いることもできる。
【0037】また、基準文書Aとの類似度を算出する比
較文書Bについての文書ベクトルVbを取得する(ステ
ップ22)。
【0038】次に、CPU111は、基準文書Aと比較
文書Bとの類似度Sbを、基準文書Aの嗜好文書ベクト
ルVa’と比較文書Bの文書ベクトルVb間の角度qに
依存するコサインにより求める(ステップ23)。すな
わち、比較文書Bの基準文書Aに対する類似度Sbは、
嗜好文書ベクトルVa’と文書ベクトルVbの間の角度
をq、嗜好文書ベクトルVa’と文書ベクトルVbの内
積をVa’・Vb、嗜好文書ベクトルVa’,文書ベク
トルVbの大きさをそれぞれ|Va’|、|Vb|とし
た場合、次の数式1により求まる。
【0039】
【数式1】類似度Sb=COS(q)=(Va’・V
b)/(|Va’|×|Vb|)
【0040】この類似度Sbの値は−1≦Sb≦1まで
の値をとり、1に近いほど比較文書Bの文書ベクトルV
bと基準文書Aの嗜好文書ベクトルVaとの向きが近
く、文書ベクトルVbが嗜好文書ベクトルVaに類似
し、比較文書Bが、ユーザーの嗜好に近いと考えること
ができる。
【0041】CPU111は、求められた類似度Sbを
比較文書Bと対応させて類似度格納エリア1137に格
納して(ステップ24)、類似度算出処理を終了する。
【0042】この様に、本実施形態では、ユーザーの処
理文書中における処理重要語句の頻出頻度をもとに、基
準文書Aの文書ベクトルVをシフト(文書ベクトルの各
要素値を変換)してユーザーの嗜好を加味した嗜好文書
ベクトルV’を取得し、この嗜好文書ベクトルV’に対
する他の文書の類似度が算出される。従って、この類似
度は、ユーザーの興味や注目度、目的等の嗜好ユーザー
の嗜好に対する指標となるので、この類似度に基づいて
文書の分類や検索を行うことにより、ユーザーの嗜好を
反映した分類や検索が可能となる。また、ユーザーの興
味や注目度等に合う文書を選択して配信することが可能
となる。本実施形態によると、GP行列を用いた変換に
よって文書ベクトルVを嗜好文書ベクトルV’にシフト
させているので、計算処理が簡単であり、ベクトル空間
法を採用したコア・エンジンを備えた一般の文書処理装
置に容易に適用することが可能である。
【0043】本実施形態よると、文書ベクトルを嗜好文
書ベクトルにシフトさせるGPベクトル(嗜好ベクト
ル)のもととなるGP行列を、表現すべき特徴毎の単純
な観点で構成した行列Ga,Gb,Gcの掛け合わせて
求めているので、様々な特徴を考慮に入れたGP行列を
容易に構成して文書ベクトルVをシフトさせることが可
能である。本実施形態よると、文書ベクトルを嗜好文書
ベクトルにシフトさせるGPベクトルのもととなるGP
行列は、各列がユーザーのメンバーの興味を反映してい
るので、ユーザーを数グループに分割した該グループの
GP行列や個々のメンバーのGP行列(ベクトル)を容
易に得ることができる。本実施形態よると、GP行列が
ユーザーの過去に処理した文書をもとに適宜書き換えら
れている行列Ga,Gb,Gcをもとに取得されている
ので、文書ベクトルVがユーザーの嗜好の経時的掲示変
化に対応した嗜好文書ベクトルV’にシフトされ、ユー
ザーの嗜好の変遷に追随した類似度の算出および検索・
分類等の処理が可能となる。
【0044】尚、本発明は、上述の実施形態に限定され
るものではなく、本発明の趣旨を逸脱しない限りにおい
て適宜変更が可能である。上述の実施形態においては文
書処理装置としてコンピュータを用いているが、コンピ
ュータに限定されるものではなく、ワードプロセッサ等
であってもよい。上述の実施形態においてはGP行列
は、メンバー毎の過去の文書処理回数(行列Ga)と各
文書における処理重要語句の出現頻度(行列Gb)、お
よび各メンバーの重要度(行列Gc)とから取得されて
いるが、メンバー毎の過去の文書処理回数(行列Ga)
と各文書における処理重要語句の出現頻度(行列Gb)
のみにより取得されてもよい。また、例えば、各文書の
処理時間や、他の文書作成に引用された件数、リンク付
けされている数等も加味して取得されてもよい。更に、
GP行列を上述の実施形態と同様に行列Ga〜行列Gc
等の行列の掛け合わせから取得する場合において、行列
Ga〜行列Gc等の各行列の要素はそれぞれ処理重要語
句の文書中の出現頻度や、メンバーが各文書を処理した
回数を反映した数値となっていればよく、直接出現頻度
や処理回数そのものを表していなくてもよい。
【0045】上述の実施形態においては行列Ga〜Gc
は過去の文書処理内容から取得されているが、ユーザー
が取得して行列データベース168に直接入力してもよ
い。上述の実施形態においては行列Ga〜Gcは所定期
間毎に書き換えられているが、文書処理を行う毎に、ま
たは所定回数の文書処理を行う毎等に書き換えてもよ
い。GPベクトルを表示装置に表示するGPベクトル表
示手段を備え、ユーザーやユーザーメンバーの嗜好を視
覚的に把握できるようにしてもよい。この場合、GPベ
クトルを行列データベースまたは専用のGPベクトルデ
ータベースに経時順に格納しておき、経時変化も把握で
きるようにしてもよい。
【0046】説明した実施形態では処理重要語句や処理
重要度を取得する手法として図4のフローチャートに従
った方法を1例にして説明したが、本発明でこの方法に
限られるものではなく、文書中から処理重要語句を抽出
する方法や、処理重要度の決定方法等については、公知
の各種方法により置き換えることが可能である。更に、
2つの文書嗜好ベクトルの類似度の算出方法について
は、数式1により類似度を算出することとしたが、この
数式に限定されるものではなく、文書嗜好ベクトル相互
間の類似関係を表すことが可能であれば他の数式により
類似度を算出することも可能である。算出した類似度の
表示は、類似度の操作者からの入力により類似閾値を取
得し、当該類似閾値よりも高い類似度を備えた対象文書
のみを表示させたり、類似度の高いうちから10個の文
書のみを表示させたりすることもできる。また、類似度
の高い順ではなく、あいうえお順等に表示された対象文
書名とともに表示してもよい。更に、類似度表示は、操
作者からの命令のあったときのみに表示させるようにし
たり、表示装置には表示させずに印刷させることとして
もよい。
【0047】説明した実施形態は日本語で作成された文
書に限られるものではなく、あらゆる言語で作成された
文書を対象とすることが可能である。その場合、対象と
なる文書が作成された言語用の形態素解析アルゴリズム
等を使用するといった、本発明の構成には影響のない部
分を変更するだけでよい。
【0048】なお、以上の実施形態において説明した、
各装置、各部、各動作、各処理等に対しては、それらを
含む上位概念としての各手段(〜手段)により、実施形
態を構成することが可能である。例えば、「文書データ
ベース164から、各処理文書の処理回数を取得し(ス
テップ14)」との記載に対して文書の処理回数を記憶
する処理回数データベースを文書データベース164と
は別途に構成したり、「処理回数取得手段」を構成した
り、「抽出した候補語(句)の処理文書での出現頻度、
評価関数から、各候補語(句)の処理重要度f(x)を
取得する(ステップ123)との記載に対して、「処理
重要語句取得手段」を構成するようにしてもよい。同様
に、その他各種動作に対して「〜(動作)手段」等の上
位概念で実施形態を構成するようにしてもよい。
【0049】
【発明の効果】以上説明したように、本発明によれば、
嗜好文書ベクトル取得手段により文書ベクトルをユーザ
ーの嗜好を加味した嗜好文書ベクトルにシフトさせ、こ
の嗜好文書ベクトルに対する類似度を取得することによ
り、ユーザーの興味や注目度、目的等の嗜好に対する文
書の類似度が取得でき、この類似度に基づいて分類や検
索を行うことにより、ユーザーの興味や注目度、目的等
の嗜好を反映した分類や検索、配信等の文書処理が可能
となる。
【図面の簡単な説明】
【図1】本発明の文書処理装置の一実施形態であり、本
発明の文書処理プログラムが記憶された記憶媒体の一実
施形態の該プログラムが読み取られたコンピュータの構
成を表したブロック図である。
【図2】図1の実施形態における行列Ga,Gb,Gc
を示す説明図である。
【図3】図1の実施形態による行列Ga,Gb書き換え
処理の動作を表したフローチャートである。
【図4】図1の実施形態による処理重要語句・処理重要
度取得処理の動作を表したフローチャートである。
【図5】図1の実施形態による嗜好文書ベクトル取得処
理の動作を示すフローチャートである。
【図6】図1の実施形態におけるGP行列からGPベク
トルを算出する行程を概念的に説明する説明図である。
【図7】図1の実施形態における文書ベクトルを嗜好文
書ベクトルにシフトさせた状態を概念的に説明する説明
図である。
【図8】図1の実施形態による類似度算出処理の動作を
示すフローチャートである。
【図9】請求項1に記載した発明のクレーム対応図であ
る。
【図10】請求項3に記載した発明のクレーム対応図で
ある。
【図11】請求項5に記載した発明のクレーム対応図で
ある。
【図12】請求項6に記載した発明のクレーム対応図で
ある。
【図13】請求項8に記載した発明のクレーム対応図で
ある。
【図14】請求項10に記載した発明のクレーム対応図
である。
【図15】請求項11に記載した発明のクレーム対応図
である。
【符号の説明】
11 制御部 112 ROM 113 RAM 1131 対象文書格納エリア 1132 キーワード格納エリア 1134 文書ベクトル格納エリア 1135 行列格納エリア 1136 嗜好文書ベクトル格納エリア 1137 類似度格納エリア 12 キーボード 13 マウス 14 表示装置 15 印刷装置 16 記憶装置 161 仮名漢字変換辞書 162 プログラム格納部 164 文書データベース 165 重要語データベース 166 文書ベクトルデータベース 167 嗜好文書ベクトルデータベース 168 行列データベース 17 記憶媒体駆動装置 18 通信制御装置 19 入出力I/F 101 嗜好ベクトル取得手段 102 文書取得手段 103 文書ベクトル取得手段 104 シフト手段 105 GP行列取得手段 106 類似度算出手段 201 嗜好ベクトル取得機能 202 文書取得機能 203 文書ベクトル取得機能 204 シフト機能 205 GP行列取得機能 206 類似度算出機能

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 ユーザーの嗜好を表す複数のキーワード
    に対する重要度を要素値とする嗜好ベクトルを取得する
    嗜好ベクトル取得手段と、 文書を取得する文書取得手段と、 前記文書取得手段により取得された文書を特徴付ける文
    書ベクトルを取得する文書ベクトル取得手段と、 前記文書ベクトル取得手段により取得された前記文書ベ
    クトルを前記嗜好ベクトルによりシフトさせるシフト手
    段とを具備することを特徴とする文書処理装置。
  2. 【請求項2】 前記嗜好ベクトル取得手段は、前記ユー
    ザーが作成した文書又はアクセスした文書に対する複数
    の文書ベクトルから前記嗜好ベクトルを作成することを
    特徴とする請求項1に記載の文書処理装置。
  3. 【請求項3】 複数のユーザーと、複数の前記ユーザー
    それぞれの嗜好を表す複数のキーワードとの一方を行、
    他方を列とし、前記各ユーザーに対する前記各キーワー
    ドの重要度を要素値とするGP行列を取得するGP行列
    取得手段を備え、 前記嗜好ベクトル取得手段は、前記GP行列により前記
    嗜好ベクトルを取得することを特徴とする請求項1また
    は請求項2に記載の文書処理装置。
  4. 【請求項4】 前記GP行列取得手段は、 ユーザーが過去に処理した文書と該文書のキーワードと
    のうちの一方を行、他方を列とし、前記文書におけるキ
    ーワードの重要度を要素値とする文書−キーワード行列
    と、 ユーザーが過去に処理した文書とユーザーとのうちの一
    方を行、他方を列とし、各ユーザーの前記文書の処理回
    数を要素とする文書−ユーザー行列と、からGP行列を
    取得することを特徴とする請求項3に記載の文書処理装
    置。
  5. 【請求項5】 所定の文書の文書ベクトルを嗜好ベクト
    ルによりシフトさせた嗜好文書ベクトルと、他の文書の
    文書ベクトルから、前記所定の文書と前記他の文書との
    類似度を算出する類似度算出手段を具備することを特徴
    とする請求項1から請求項4のうちのいずれか1の請求
    項に記載の文書処理装置。
  6. 【請求項6】 ユーザーの嗜好を表す複数のキーワード
    に対する重要度を要素値とする嗜好ベクトルを取得する
    嗜好ベクトル取得機能と、 文書を取得する文書取得機能と、 前記文書取得機能により取得された文書を特徴付ける文
    書ベクトルを取得する文書ベクトル取得機能と、 前記文書ベクトル取得機能により取得された前記文書ベ
    クトルを前記嗜好ベクトルによりシフトさせるシフト機
    能とをコンピュータに実現させるためのコンピュータ読
    み取り可能な文書処理プログラムが記憶された記憶媒
    体。
  7. 【請求項7】 前記嗜好ベクトル取得機能は、前記ユー
    ザーが作成した文書又はアクセスした文書に対する複数
    の文書ベクトルから前記嗜好ベクトルを作成することを
    特徴とする請求項6に記載の文書処理プログラムが記憶
    された記憶媒体。
  8. 【請求項8】 複数のユーザーと、複数の前記ユーザー
    それぞれの嗜好を表す複数のキーワードとの一方を行、
    他方を列とし、前記各ユーザーに対する前記各キーワー
    ドの重要度を要素値とするGP行列を取得するGP行列
    取得機能を備え、 前記嗜好ベクトル取得機能は、前記GP行列により前記
    嗜好ベクトルを取得することを特徴とする請求項6また
    は請求項7に記載の文書処理プログラムが記憶された記
    憶媒体。
  9. 【請求項9】 前記GP行列取得機能は、 ユーザーが過去に処理した文書と該文書のキーワードと
    のうちの一方を行、他方を列とし、前記文書におけるキ
    ーワードの重要度を要素値とする文書−キーワード行列
    と、 ユーザーが過去に処理した文書とユーザーとのうちの一
    方を行、他方を列とし、各ユーザーの前記文書の処理回
    数を要素とする文書−ユーザー行列と、からGP行列を
    取得することを特徴とする請求項8に記載の文書処理プ
    ログラムが記憶された記憶媒体。
  10. 【請求項10】 所定の文書の文書ベクトルを嗜好ベク
    トルによりシフトさせた嗜好文書ベクトルと、他の文書
    の文書ベクトルから、前記所定の文書と前記他の文書と
    の類似度を算出する類似度算出機能を具備することを特
    徴とする請求項6から請求項9のうちのいずれか1の請
    求項に記載の文書処理プログラムが記憶された記憶媒
    体。
  11. 【請求項11】 ユーザーの嗜好を表す複数のキーワー
    ドに対する重要度を要素値とする嗜好ベクトルと、文書
    とを取得し、 前記文書を特徴付ける文書ベクトルを取得し、 前記文書ベクトルを前記嗜好ベクトルによりシフトさせ
    ることを特徴とする文書処理方法。
JP9219298A 1997-07-29 1997-07-29 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 Pending JPH1153394A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9219298A JPH1153394A (ja) 1997-07-29 1997-07-29 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9219298A JPH1153394A (ja) 1997-07-29 1997-07-29 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法

Publications (1)

Publication Number Publication Date
JPH1153394A true JPH1153394A (ja) 1999-02-26

Family

ID=16733313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9219298A Pending JPH1153394A (ja) 1997-07-29 1997-07-29 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法

Country Status (1)

Country Link
JP (1) JPH1153394A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092824A (ja) * 1999-09-21 2001-04-06 Matsushita Electric Ind Co Ltd 情報提示装置、情報提示方法および記録媒体
US6321221B1 (en) 1998-07-17 2001-11-20 Net Perceptions, Inc. System, method and article of manufacture for increasing the user value of recommendations
US6334127B1 (en) * 1998-07-17 2001-12-25 Net Perceptions, Inc. System, method and article of manufacture for making serendipity-weighted recommendations to a user
US6412012B1 (en) 1998-12-23 2002-06-25 Net Perceptions, Inc. System, method, and article of manufacture for making a compatibility-aware recommendations to a user
US6704905B2 (en) 2000-12-28 2004-03-09 Matsushita Electric Industrial Co., Ltd. Text classifying parameter generator and a text classifier using the generated parameter
JP2006146621A (ja) * 2004-11-19 2006-06-08 Nec Corp 情報管理装置及び方法並びに情報管理用プログラム
CN100365628C (zh) * 2003-12-02 2008-01-30 索尼株式会社 信息处理设备、方法及其程序、信息处理系统及其方法
CN100397332C (zh) * 2002-03-01 2008-06-25 惠普开发有限公司 文档分类方法和设备
JP2008532099A (ja) * 2005-02-25 2008-08-14 ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド データベースに格納されている文書の索引付け及び検索のためにコンピュータにより実施される方法並びに文書の索引付け及び検索のためのシステム
US7461058B1 (en) 1999-09-24 2008-12-02 Thalveg Data Flow Llc Optimized rule based constraints for collaborative filtering systems
US7788123B1 (en) 2000-06-23 2010-08-31 Ekhaus Michael A Method and system for high performance model-based personalization
US8332398B2 (en) 2003-01-31 2012-12-11 Minolta Co., Ltd. Database system in which logical principles for a data retrieval process can evolve based upon learning
US8676738B2 (en) 2008-09-03 2014-03-18 Nec Corporation Relationship detector, relationship detection method, and recording medium

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321221B1 (en) 1998-07-17 2001-11-20 Net Perceptions, Inc. System, method and article of manufacture for increasing the user value of recommendations
US6334127B1 (en) * 1998-07-17 2001-12-25 Net Perceptions, Inc. System, method and article of manufacture for making serendipity-weighted recommendations to a user
US6412012B1 (en) 1998-12-23 2002-06-25 Net Perceptions, Inc. System, method, and article of manufacture for making a compatibility-aware recommendations to a user
JP2001092824A (ja) * 1999-09-21 2001-04-06 Matsushita Electric Ind Co Ltd 情報提示装置、情報提示方法および記録媒体
US7461058B1 (en) 1999-09-24 2008-12-02 Thalveg Data Flow Llc Optimized rule based constraints for collaborative filtering systems
US8548987B2 (en) 1999-09-24 2013-10-01 Thalveg Data Flow Llc System and method for efficiently providing a recommendation
US7788123B1 (en) 2000-06-23 2010-08-31 Ekhaus Michael A Method and system for high performance model-based personalization
US8155992B2 (en) 2000-06-23 2012-04-10 Thalveg Data Flow Llc Method and system for high performance model-based personalization
US6704905B2 (en) 2000-12-28 2004-03-09 Matsushita Electric Industrial Co., Ltd. Text classifying parameter generator and a text classifier using the generated parameter
CN100397332C (zh) * 2002-03-01 2008-06-25 惠普开发有限公司 文档分类方法和设备
US8332398B2 (en) 2003-01-31 2012-12-11 Minolta Co., Ltd. Database system in which logical principles for a data retrieval process can evolve based upon learning
CN100365628C (zh) * 2003-12-02 2008-01-30 索尼株式会社 信息处理设备、方法及其程序、信息处理系统及其方法
JP2006146621A (ja) * 2004-11-19 2006-06-08 Nec Corp 情報管理装置及び方法並びに情報管理用プログラム
JP2008532099A (ja) * 2005-02-25 2008-08-14 ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド データベースに格納されている文書の索引付け及び検索のためにコンピュータにより実施される方法並びに文書の索引付け及び検索のためのシステム
US8676738B2 (en) 2008-09-03 2014-03-18 Nec Corporation Relationship detector, relationship detection method, and recording medium

Similar Documents

Publication Publication Date Title
US7194471B1 (en) Document classification system and method for classifying a document according to contents of the document
US7783644B1 (en) Query-independent entity importance in books
JPWO2007108529A1 (ja) 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム
JP2011513810A (ja) 用語識別方法および装置
JPH1153394A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP4067603B2 (ja) 文書分類装置、文書分類プログラムが記憶された記憶媒体、及び文書分類方法
JP4021525B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JPH1145289A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP4005672B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2000194725A (ja) 類似グル―プ抽出装置、及び類似グル―プ抽出プログラムが記憶された記憶媒体
JP4030624B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法
JP2012230544A (ja) 画像検索装置およびプログラム
JP4025391B2 (ja) 文書処理装置、文書処理プログラムが記憶されたコンピュータ読取り可能な記憶媒体、及び文書処理方法
JP2001216311A (ja) イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置
CN110688559A (zh) 一种检索方法及装置
JP6303669B2 (ja) 資料検索装置、資料検索システム、資料検索方法、及び、プログラム
JP3154992B2 (ja) 情報検索装置、及び情報検索プログラムが記憶された記憶媒体
JP4047417B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法
JP7427510B2 (ja) 情報処理装置、情報処理方法およびプログラム
JPH1153398A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2000194723A (ja) 類似度表示装置、類似度表示プログラムが記憶された記憶媒体、文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2000194724A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP4426893B2 (ja) 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
JP2000353163A (ja) データベース処理装置、及びデータベース処理のためのプログラムが記憶された記憶媒体
JP4289891B2 (ja) 情報検索装置、情報検索方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070626

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070925

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080304