JPH1145286A - 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 - Google Patents

文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法

Info

Publication number
JPH1145286A
JPH1145286A JP9217154A JP21715497A JPH1145286A JP H1145286 A JPH1145286 A JP H1145286A JP 9217154 A JP9217154 A JP 9217154A JP 21715497 A JP21715497 A JP 21715497A JP H1145286 A JPH1145286 A JP H1145286A
Authority
JP
Japan
Prior art keywords
document
vector
matrix
user
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9217154A
Other languages
English (en)
Other versions
JP4005672B2 (ja
Inventor
Naoyuki Nomura
直之 野村
Katsuhiko Mitobe
勝彦 水戸部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP21715497A priority Critical patent/JP4005672B2/ja
Publication of JPH1145286A publication Critical patent/JPH1145286A/ja
Application granted granted Critical
Publication of JP4005672B2 publication Critical patent/JP4005672B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザーの嗜好を視覚化して表現し、ユーザ
ーによる差異や経時的変化を認識できる文書処理装置、
文書処理プログラムを記憶した記憶媒体、及び文書処理
方法を提供すること。 【解決手段】 ユーザーと、前記ユーザーの過去の処理
文書中における出現頻度等から取得した処理重要語の一
方を行、他方を列とし、前記ユーザーに対する前記各処
理重要語の重要度を要素値とするGP行列を取得する。
そして基準文書の重要語の重要度を要素とする文書ベク
トルをGP行列によりシフトさせて嗜好文書ベクトルを
取得し、嗜好文書ベクトルの各要素(重要度)を分野別
に総計し、分野別重要度F(X)を算出し、分野別重要
度F(X)の高い3分野A,B,Cを各軸とする3次元
上に、嗜好文書ベクトルを表現する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書処理装置、文
書処理プログラムを記憶した記憶媒体、及び文書処理方
法に関し、更に詳細には、ユーザーの嗜好を視覚化して
表現し、ユーザーによる差異や経時的変化を認識できる
文書処理装置、文書処理プログラムを記憶した記憶媒体
及び文書処理方法に関する。
【0002】
【従来の技術】従来の文書処理装置、文書処理プログラ
ムを記憶した記憶媒体、及び文書処理方法による文書処
理においては、文書をベクトル化して文書ベクトルとし
て表すことが行われている。この文書ベクトルは、それ
ぞれの文書におけるキーワードの出現回数等を要素とし
て取得され、各文書を特徴付けるものとなっているの
で、文書の検索・分類等を行う場合の目安として有用で
ある。
【0003】
【発明が解決しようとする課題】しかし、同一の文書で
も、例えば営業用や技術資料用等の利用目的その他のユ
ーザーの嗜好が異なると、重要部位等に差異が生じる。
また、同一のユーザーであっても、その嗜好は経時的に
変化する場合がある。そのため、従来より、文書の特徴
を文書ベクトルとして表すのと同様に、ユーザーの嗜好
を視覚化して表現し、ユーザーによる差異や経時的変化
を認識できる技術が望まれていた。
【0004】本発明は、上述のような課題を解決するた
めになされたもので、ユーザーの嗜好を視覚化して表現
し、ユーザーによる差異や経時的変化を認識できる文書
処理装置、文書処理プログラムを記憶した記憶媒体、及
び文書処理方法を提供することを目的とする。
【0005】
【課題を解決するための手段】請求項1に記載の発明
は、図15に示すように、過去に処理された文書から、
ユーザーと、前記ユーザーの嗜好を表す複数のキーワー
ドの一方を行、他方を列とし、前記ユーザーに対する前
記各キーワードの重要度を要素値とするGP行列を取得
するGP行列取得手段101と、前記GP行列を視覚化
するGP行列視覚化手段102と、を具備する文書処理
装置を提供することにより、前記目的を達成する。請求
項2に記載の発明は、図15に示すように、請求項1に
記載の文書処理装置において、前記GP行列視覚化手段
102は、前記GP行列から前記キーワードの重要度を
要素値とするGPベクトルを取得し、このGPベクトル
をn(n≧2)次元化して表示する文書処理装置を提供
することにより、前記目的を達成する。請求項3に記載
の発明は、図16に示すように、請求項2に記載の文書
処理装置において、文書を特徴付ける文書ベクトルを取
得する文書ベクトル取得手段103を備え、前記GP行
列視覚化手段102は、前記文書ベクトルを前記GP行
列を用いてシフトさせて前記GPベクトルを取得し、前
記文書ベクトルと前記GPベクトルとを表示する文書処
理装置を提供することにより、前記目的を達成する。請
求項4に記載の発明は、図16に示すように、請求項2
または請求項3に記載の文書処理装置において、文書を
特徴付ける文書ベクトルを取得する文書ベクトル取得手
段103を備え、前記GP行列視覚化手段102は、同
一のユーザーに対する前記GPベクトルの経時的変化を
表示する文書処理装置を提供することにより、前記目的
を達成する。請求項5に記載の発明は、図15または図
16に示すように、請求項2から請求項4のうちのいず
れか1の請求項に記載の文書処理装置において、前記G
P行列視覚化手段102は、複数の前記ユーザーそれぞ
れについての前記GPベクトルを同時に表示するもので
ある文書処理装置を提供することにより、前記目的を達
成する。請求項6に記載の発明は、図17に示すよう
に、過去に処理された文書から、ユーザーと、前記ユー
ザーの嗜好を表す複数のキーワードの一方を行、他方を
列とし、前記ユーザーに対する前記各キーワードの重要
度を要素値とするGP行列を取得するGP行列取得機能
201と、前記GP行列を視覚化するGP行列視覚化機
能202と、をコンピュータに実現させるためのコンピ
ュータ読みとり可能な文書処理プログラムが記憶された
記憶媒体を提供することにより、前記目的を達成する。
請求項7に記載の発明は、図17に示すように、請求項
6に記載の記憶媒体において、前記GP行列視覚化機能
202は、前記GP行列から前記キーワードの重要度を
要素値とするGPベクトルを取得し、このGPベクトル
をn(n≧2)次元化して表示する文書処理プログラム
が記憶された記憶媒体を提供することにより、前記目的
を達成する。請求項8に記載の発明は、図18に示すよ
うに、請求項7に記載の記憶媒体において、文書を特徴
付ける文書ベクトルを取得する文書ベクトル取得機能2
03を備え、前記GP行列視覚化機能202は、前記文
書ベクトルを前記GP行列を用いてシフトさせて前記G
Pベクトルを取得し、前記文書ベクトルと前記GPベク
トルとを表示する文書処理プログラムが記憶された記憶
媒体を提供することにより、前記目的を達成する。請求
項9に記載の発明は、図18に示すように、請求項7ま
たは請求項8に記載の記憶媒体において、文書を特徴付
ける文書ベクトルを取得する文書ベクトル取得機能20
3を備え、前記GP行列視覚化機能202は、同一のユ
ーザーに対する前記GPベクトルの経時的変化を表示す
る文書処理プログラムが記憶された記憶媒体を提供する
ことにより、前記目的を達成する。請求項10に記載の
発明は、図17または図18に示すように、請求項7か
ら請求項9のうちのいずれか1の請求項に記載の記憶媒
体において、前記GP行列視覚化機能202は、複数の
前記ユーザーそれぞれについての前記GPベクトルを同
時に表示するものである文書処理プログラムが記憶され
た記憶媒体を提供することにより、前記目的を達成す
る。請求項11に記載の発明は、図19に示すように、
過去に処理された文書から、ユーザーと、前記ユーザー
の嗜好を表す複数のキーワードの一方を行、他方を列と
し、前記ユーザーに対する前記各キーワードの重要度を
要素値とするGP行列を取得301し、前記GP行列を
視覚化する302ことを特徴とする文書処理方法を提供
することにより、前記目的を達成する。請求項12に記
載の発明は、図19に示すように、請求項11に記載の
文書処理方法において、前記GP行列から前記キーワー
ドの重要度を要素値とするGPベクトルを取得し、この
GPベクトルをn(n≧2)次元化して表示することに
より前記GP行列を視覚化する302文書処理方法を提
供することにより前記目的を達成する。
【0006】
【発明の実施の形態】以下、本発明の文書処理装置、文
書処理プログラムを記憶した記憶媒体、及び文書処理方
法の好適な実施の形態について、図1から図10を参照
して詳細に説明する。 (1)実施形態の概要 本実施形態では、ユーザーが過去の処理文書中における
出現頻度等から、処理重要語およびこれらの処理重要度
によりユーザーの嗜好を表すGP行列を取得する。そし
て基準文書の重要語の重要度を要素とする文書ベクトル
をGP行列によりシフトさせて嗜好文書ベクトルを取得
し、嗜好文書ベクトルの各要素(重要度)を分野別に総
計し、分野別重要度F(X)を算出し、分野別重要度F
(X)の高い3分野A,B,Cを各軸とする3次元上
に、嗜好文書ベクトルを表現する。
【0007】(2)実施形態の詳細 図1は、本発明の文書処理装置の一実施形態であり、本
発明の文書処理プログラムを記憶した記憶媒体の一実施
形態の該プログラムが読み取られたコンピュータの構成
を表したブロック図である。この図1に示すように、文
書処理装置(コンピュータ)は、装置全体を制御するた
めの制御部11を備えている。この制御部11には、デ
ータバス等のバスライン21を介して、入力装置として
のキーボード12やマウス13、表示装置14、印刷装
置15、記憶装置16、記憶媒体駆動装置17、通信制
御装置18、および、入出力I/F19、および、文字
認識装置20が接続されている。制御部11は、CPU
111、ROM112、RAM113を備えている。R
OM112は、CPU111が各種制御や演算を行うた
めの各種プログラムやデータが予め格納されたリードオ
ンリーメモリである。
【0008】RAM113は、CPU111にワーキン
グメモリとして使用されるランダムアクセスメモリであ
る。このRAM113には、本実施形態による文書ベク
トル取得処理を行うためのエリアとして、文書ベクトル
取得の対象となる文書を格納する対象文書格納エリア1
131、キーワード格納エリア1132、文書ベクトル
格納エリア1134が確保され、また、GP行列取得処
理を行うためのエリアとして、行列格納エリア113
5、GP行列視覚化処理を行うためのエリアとして、G
Pベクトル格納エリア1138その他の各種エリアが確
保されるようになっている。
【0009】キーボード12は、かな文字を入力するた
めのかなキーやテンキー、各種機能を実行するための機
能キー、カーソルキー、等の各種キーが配置されてい
る。マウス13は、ポインティングデバイスであり、表
示装置14に表示されたキーやアイコン等を左クリック
することで対応する機能の指定を行う入力装置である。
表示装置14は、例えばCRTや液晶ディスプレイ等が
使用される。この表示装置14には、文書ベクトルを得
る対象文書の内容や、本実施形態により取得されたGP
行列が視覚化された嗜好文書ベクトル、等が表示される
ようになっている。印刷装置15は、表示装置14に表
示された文書や、記憶装置16の文書データベース16
4に格納された文書等の印刷を行うためのものである。
この印刷装置としては、レーザプリンタ、ドットプリン
タ、インクジェットプリンタ、ページプリンタ、感熱式
プリンタ、熱転写式プリンタ、等の各種印刷装置が使用
される。
【0010】記憶装置16は、読み書き可能な記憶媒体
と、その記憶媒体に対してプログラムやデータ等の各種
情報を読み書きするための駆動装置で構成されている。
この記憶装置16に使用される記憶媒体としては、主と
してハードディスクが使用されるが、後述の記憶媒体駆
動装置17で使用される各種記憶媒体のうちの読み書き
可能な記憶媒体を使用するようにしてもよい。記憶装置
16は、仮名漢字変換辞書161、プログラム格納部1
62、文書データベース164、文書ベクトルデータベ
ース166、行列データベース168、図示しないその
他の格納部(例えば、この記憶装置16内に格納されて
いるプログラムやデータ等をバックアップするための格
納部)等を有している。プログラム格納部162には、
本実施形態における文書ベクトル取得処理プログラム、
GP行列取得処理プログラム、GP行列視覚化処理プロ
グラム等の各種プログラムの他、仮名漢字変換辞書16
1を使用して入力された仮名文字列を漢字混り文に変換
する仮名漢字変換プログラム等の各種プログラムが格納
されている。
【0011】文書データベース164には、仮名漢字変
換プログラムにより作成された文書や、他の装置で作成
されて記憶媒体駆動装置17や通信制御装置18から読
み込まれた文書が格納される。この文書データベース1
64に格納される各文書の形式は特に限定されるもので
はなく、テキスト形式の文書、HTML(Hyper TextMa
rkup Language)形式の文書、JIS形式の文書等の各
種形式の文書の格納が可能である。更にこの文書データ
ベース164には、文書を処理したユーザーのメンバー
及びその処理回数が各文書に対応付けて格納されてい
る。前記処理回数は、所定期間毎に値を0にリセットさ
れる。文書ベクトルデータベース166には、文書デー
タベース164に格納されている各文書に対応する文書
ベクトルが格納されるようになっている。
【0012】図2は、文書ベクトルデータベース166
の内容を概念的に表した説明図である。この図2に示さ
れるように、文書ベクトルデータベース166には、上
記所定期間内に処理された文書中から自動抽出されたキ
ーワード(処理重要語(句を含む))x、及びこの処理
重要語に対する重要度(処理重要度)が各文書の文書ベ
クトルの要素値f(x)として、格納されている。この
文書ベクトルは各文書(A、B、C…)毎に格納され、
文書データベース164に格納されている各文書と対応
づけられている。
【0013】行列データベース168には、過去の所定
期間に行われた文書処理の処理内容により取得される行
列Ga,Gb,Gcが格納されている。GP(Group Pe
rsonalize )ベクトルはこれらの行列Ga,Gb,Gc
により取得されるGP行列から取得される。図3(a)
〜(c)は、行列Ga,Gb,Gcの一例を示す説明図
である。
【0014】行列Gaは、図3(a)に示すように、上
記処理重要語を行に、同処理文書を列にとった行列であ
り、各要素は処理重要語の処理重要度f(x)を表して
いる。行列Gbは、図3(b)に示すように、前記処理
文書を行にとり、ユーザーのメンバー(処理者)を列に
とった行列であり、各要素は、メンバーが各文書を前記
所定期間内に処理した回数となっている。この処理回数
は文書データベース164から読み込まれる。行列Gc
は、図3(c)に示すように、行および列がともにユー
ザーのメンバーそれぞれの重要度係数を示している。行
列Ga及び行列Gbは所定期間ごとに書き換えられ、行
列Gcは操作者からの入力により適宜書き換えられる。
【0015】記憶媒体駆動装置17は、CPU111が
外部の記憶媒体からコンピュータプログラムや文書を含
むデータ等を読み込むための駆動装置である。記憶媒体
に記憶されているコンピュータプログラムには、本実施
形態の文書処理装置により実行される各種処理のための
プログラム、および、そこで使用される辞書、データ等
も含まれる。ここで、記憶媒体とは、コンピュータプロ
グラムやデータ等が記憶される記憶媒体をいい、具体的
には、フロッピーディスク、ハードディスク、磁気テー
プ等の磁気記憶媒体、メモリチップやICカード等の半
導体記憶媒体、CD−ROMやMO、PD(相変化書換
型光ディスク)等の光学的に情報が読み取られる記憶媒
体、紙カードや紙テープ等の用紙(および、用紙に相当
する機能を持った媒体)を用いた記憶媒体、その他各種
方法でコンピュータプログラム等が記憶される記憶媒体
が含まれる。本実施形態の文書処理装置において使用さ
れる記憶媒体としては、主として、CD−ROMやフロ
ッピーディスクが使用される。記憶媒体駆動装置17
は、これらの各種記憶媒体からコンピュータプログラム
を読み込む他に、フロッピーディスクのような書き込み
可能な記憶媒体に対してRAM113や記憶装置16に
格納されているデータ等を書き込むことが可能である。
【0016】本実施形態の文書処理装置では、制御部1
1のCPU111が、記憶媒体駆動装置17にセットさ
れた外部の記憶媒体からコンピュータプログラムを読み
込んで、記憶装置16の各部に格納(インストール)す
る。そして、本実施形態による類似度算出等の各種処理
を実行する場合、記憶装置16から該当プログラムをR
AM113に読み込み、実行するようになっている。但
し、記憶装置16からではなく、記憶媒体駆動装置17
により外部の記憶媒体から直接RAM113に読み込ん
で実行することも可能である。また、文書処理装置によ
っては、本実施形態の自動要約処理プログラム等を予め
ROM112に記憶しておき、これをCPU111が実
行するようにしてもよい。
【0017】通信制御装置18は、他のパーソナルコン
ピュータやワードプロセッサ等との間でテキスト形式や
HTML形式等の各種形式の文書やビットマップデータ
等の各種データの送受信を行うことができるようになっ
ている。入出力I/F19は、音声や音楽等の出力を行
うスピーカ等の各種機器を接続するためのインターフェ
ースである。文字認識装置20は、用紙等に記載された
文字をテキスト形式やHTML等の各種形式で認識する
装置であり、イメージスキャナや文字認識プログラム等
で構成されている。
【0018】本実施形態では、キーボード12の入力操
作により作成した文書(RAM113の所定格納エリア
に格納)の他、外部で作成して所定の記憶媒体に格納し
た文書で記憶媒体駆動装置17から読み込んだ文書、予
め文書データベースに格納されている文書、通信制御装
置18からダウンロードした文書、及び文字認識装置2
0で文字認識した文書、等の各種文書を対象文書として
取得する(文書取得手段)ことが可能である。
【0019】次に、上述のような構成の文書処理装置の
動作であって、本発明の文書処理方法の一実施形態につ
いて図4〜図9を参照して説明する。
【0020】本実施形態においては、所定期間毎に、該
所定期間内に行われた文書処理の処理内容基づいて新た
な処理重要語及び処理重要度が取得され、行列データベ
ース168内の行列Ga及び行列Gbが書き換えられ
る。
【0021】図4は、行列Ga,Gb書き換え処理の動
作を表したフローチャートである。CPU111は、所
定期間内に処理された文書(処理文書)を文書データベ
ース164から順次取得してRAM113の所定作業領
域に格納し(ステップ11)、各処理文書についての重
要語(処理重要語)及びその重要度(処理重要度)を取
得する(ステップ12)。
【0022】図5は、各文書についての処理重要語・処
理重要度取得処理の動作を表したフローチャートであ
る。図5に示すように、CPU111は、文書データベ
ース164から取得した処理文書について、各処理文書
毎に形態素解析を行うことで自立語を抽出する(ステッ
プ121)と共に、名詞句、複合名詞句等を含めた候補
語(句)を処理文書から抽出する(ステップ122)。
次に、抽出した候補語(句)の処理文書での出現頻度、
評価関数から、各候補語(句)の処理重要度f(x)を
取得する(ステップ123)。ここで、評価関数として
は、例えば、所定の重要語が予め指定されている場合に
はその重要語に対する重み付け、単語、名詞句、複合名
詞句等の候補語(句)の種類による重み付け等が使用さ
れる。
【0023】さらにCPU111は、取得した処理重要
度f(x)の値をもとに候補語(句)から処理重要語
a,b,c,…を取得し(ステップ124)、この処理
重要語a,b,c,…及びその処理重要度f(a),f
(b),f(c)…を重要語データベース165に格納
する(ステップ125)。すべての処理文書について、
処理重要語及びその処理重要度を取得すると、図4に示
す行列Ga,Gb書き換え処理ルーチンへリターンす
る。
【0024】続いて、CPU111は、行列データベー
ス168の行列Gaを、前記処理重要語a,b,c,…
を行に、前記所定期間の処理文書を列に、また処理重要
度f(x)を各要素にとったものに書き換える(ステッ
プ13)。このとき、行列Gaの行数は、各処理文書の
処理重要語の和集合の数とし、各処理文書において含ま
れていない処理重要語については、その処理重要度f
(x)は0と定義される。
【0025】例えば図2おいて、処理文書Bの処理重要
語は「重要、重要語、重要度、…」、処理文書Cの処理
重要語は「重要、…、政治、…」であり、これらの処理
重要語に対応する処理重要度は、処理文書Bについては
( 1,18,19,…)、処理文書Cについては(1
8,…,21,…)である。これに対して行列Gaにお
いては、その行は「重要、重要語、重要度、…、政治、
…」とし、両文書の列における要素値はつぎの通り定義
される。 処理文書Bの列=( 1,18,19,…, 0,
…)、 処理文書Cの列=(18, 0, 0,…,21,…)
【0026】また、CPU111は、文書データベース
164から、各文書の処理回数を取得し(ステップ1
4)、行列Gbを、所定期間内の処理文書を行に、文書
データベース164から取得した処理回数を各要素とし
たものに書き換えて(ステップ15)、行列Ga,Gb
書き換え処理を終了する。
【0027】GP行列の取得に際しては、CPU111
は、前述のようにして取得され格納された行列Ga,G
b,Gcを行列データベース168から取得し、次の式
に従ってGP行列を取得する。GP=Ga・Gb・Gc
従って、本実施形態におけるGP行列は、文書ベクトル
取得に用いられたキーワードを行に、ユーザーの各メン
バーを列にとってなっており、GP行列の各要素は、メ
ンバー毎の過去の文書処理におけるキーワードの重要度
f(x)に各メンバーの重要度を加味して表した数値と
なっている。
【0028】続いて、本実施形態におけるGP行列の視
覚化処理の動作について図6及び図7を用いて説明す
る。図6はGP行列の視覚化処理の動作を示すフローチ
ャートである。GP行列が取得されると、続いてCPU
111は、基準文書を取得し(ステップ21)、RAM
113の対象文書格納エリア1131に格納する。基準
文書は、操作者からの指示に従って、RAM113、記
憶装置16の文書データベース164、記憶媒体駆動装
置17,または通信制御装置18から取得する。そし
て、CPU111は、対象文書格納エリア1131に格
納した基準文書の文書ベクトルVを求める(ステップ2
2)。
【0029】図7は、文書ベクトル作成処理の動作を表
したフローチャートである。CPU111は、文書ベク
トルデータベース166に格納されているキーワード
を、基準文書から検出(ステップ221)し、基準文書
での出現頻度、評価関数から、キーワードの重要度f
(x)を得る(ステップ222)。そして、各キーワー
ドの重要度f(x)を要素として、文書ベクトルV=
(f(a),f(b),…)を取得し(ステップ22
3)、RAM113の文書ベクトル格納エリア1134
に格納し(ステップ224)して、図6に示すGP行列
視覚化処理にリターンする。
【0030】続いて、CPU111は 文書ベクトルと
GP行列との次元合わせを行う(ステップ23)。即
ち、文書ベクトルVの次元数とGP行列の行数とを、基
準文書のキーワードとGP行列の行があらわす処理重要
語の和集合の数とし、文書ベクトルVのみに含まれるキ
ーワードに対する行列Gaの要素値、および、GP行列
の行のみに含まれる重要語に対する文書ベクトルVの要
素値は、”0”と定義する。例えば、基準文書のキーワ
ードが「重要、重要語、重要度、…」、GP行列の行が
あらわす処理重要語が「重要、…、政治、…」であり、
基準文書の文書ベクトルV=( 1,18,19,
…)、GP行列の、ある1列が(18,…,21,…)
である場合、次元を合わせると、基準文書の文書ベクト
ルV=( 1,18,19,…, 0,…)、GP行列
の1列は(18, 0, 0,…,21,…)となる。
【0031】続いてCPU111は、次元合わせをした
後のGP行列をもとにGPベクトルを取得する(ステッ
プ24)。図8は、GP行列からGPベクトルを算出す
る行程を概念的に説明する説明図である。
【0032】CPU111は、まず、GP行列の各要素
gij( i=1〜メンバー数m、j=1〜処理重要語の
和集合の数k)の各行毎の要素の平均値を算出して列ベ
クトル(総GPベクトル)を得る(図8(1)→
(2))。この総GPベクトルは、各要素giが処理重
要語毎のユーザーグループ全体における過去の文書処理
での出現頻度(但し各処理重要語の予め決められた処理
重要語の重み等や、メンバーの重要度が加味されてい
る)を反映した数値となっている。CPU111は、更
に、この総GPベクトルの各要素giを文書の処理回数
の総数で割って、1列のGPベクトルを得る(図8
(2)→(3))。この様に、総GPベクトルを文書の
処理回数の総数で割るのは、行列Gbに文書の処理回数
が要素として含まれており、処理回数が増えるに従って
GPベクトルが大きくなっていくのを回避し、異なる期
間の長さにおいてGPベクトルを求めても、期間の長さ
が影響しなくするためである。
【0033】続いて、CPU111は、そして、CPU
111は、GPベクトルの各要素とこの各要素に対応す
る文書ベクトルVの要素とを掛け合わせて、嗜好文書ベ
クトルV’を得る。嗜好文書ベクトルV’は、嗜好文書
ベクトルデータベース167に格納して(ステップ2
5)。嗜好文書ベクトル取得処理を終了する。
【0034】次に、CPU111は、文書嗜好ベクトル
V’=(f’(a),f’(b),…)の要素f’
(a),f’(b),…を分野別に区分する(ステップ
26)。図9は文書嗜好ベクトルV’の各要素を区分す
る分野の一例を示す表である。そして、分野別に要素を
まとめて合計して分野別重要度F(X)を算出し(ステ
ップ27)、分野別重要度F(X)の最も高い3分野を
選択し、これらの3分野の分野別重要度F(A),F
(B),F(C)を要素とする分野別ベクトルV’’=
(F’(A),F’(B),F(C))を、前記3分野
をx軸,y軸,z軸とした3次元の座標上に表現して表
示装置14上に表示して、GP行列の視覚化処理を終了
する(ステップ28)。図10は、2つのユーザー
(A,B)それぞれの分野別ベクトルを表示装置14に
表示した一例を示すものである。このように、本実施形
態においては、GP行列は、分野別ベクトルV’’とし
て3次元に視覚化され表示される。この分野別ベクトル
表示から、ユーザーAは、政治および環境・自然分野に
嗜好が強く、ユーザーBは、ライフサイエンス分野に嗜
好が強い傾向があることが一目で理解できる。
【0035】この様に、本実施形態によると、ユーザー
の嗜好を表すGP行列により分野別ベクトルV’’が取
得され、ユーザーの嗜好の反映された分野別ベクトル
V’’を表示装置14に3次元表示するので、ユーザー
の嗜好が目視により確認できる。
【0036】尚、本発明は、上述の実施形態に限定され
るものではなく、本発明の趣旨を逸脱しない限りにおい
て適宜変更が可能である。例えば、上述の実施形態にお
いては文書処理装置としてコンピュータを用いている
が、コンピュータに限定されるものではなく、ワードプ
ロセッサ等であってもよい。上述の実施形態において
は、GP行列は、処理者の過去の文書処理回数(行列G
a)と各文書におけるキーワードの出現頻度(行列G
b)、および各処理者の重要度(行列Gc)とから取得
されているが、処理者毎の過去の文書処理回数(行列G
a)と各文書におけるキーワードの出現頻度(行列G
b)のみにより取得してもよい。また、例えば、各文書
の処理時間や、他の文書作成に引用された件数等も加味
して取得してもよい。更に、GP行列を上述の実施形態
と同様に行列Ga〜行列Gc等の行列から取得する場合
において、行列Ga〜行列Gc等の各行列の要素はそれ
ぞれキーワードの文書中の出現頻度や、メンバーが各文
書を処理した回数を反映した数値となっていればよく、
直接出現頻度や処理回数そのものを表していなくてもよ
い。上述の実施形態においては行列Ga〜Gcは所定期
間毎に書き換えられているが、文書処理を行う毎に、ま
たは所定回数の文書処理を行う毎等に書き換えてもよ
い。
【0037】GP行列の視覚化は、GPベクトルにより
基準文書をシフトさせて取得した文書嗜好ベクトルをn
次元化して表示せずに、GPベクトルを直接n次元化し
て表示してもよい。
【0038】また、文書嗜好ベクトルやGPベクトルの
表示は、分野別ベクトルのように3次元に変換して表示
しなくてもよく、例えば、図11に示すように、要素
(キーワード)毎に要素値(重要度)をカラーバーで表
したり、レーダーチャートにより表示する等、GPベク
トルの全ての要素について表示してもよい。更に、文書
嗜好ベクトルやGPベクトルを3次元に変換して表示す
る場合であっても、その変換手法は、上記実施形態の如
く分野別に要素をまとめて合計した分野別重要度F
(X)の最も高い3分野を選択した分野別ベクトル
V’’=(F’(A),F’(B),F(C))を表示
する手法に限られるものではなく、要素を3分野に区分
して分野別に要素をまとめて3次元のベクトルとする手
法や、GPベクトルの要素のうちのもっとも値の高い3
つを要素として3次元のベクトルとする手法等とするこ
ともできる。文書嗜好ベクトルやGPベクトルを3次元
に変換して表示する場合であっても、その表示手法は、
3次元座標上にベクトルのまま表示する以外の手法でも
よく、例えば、(x,y,z)軸にかえて3色(赤,
緑,青)の色を用いて各要素の値をこれらの3色の輝度
に換えた色表示等で表現してもよい。上記実施形態のよ
うに3次元での文書嗜好ベクトルやGPベクトル表示す
る場合に、更にその軸をマウスによりポイントする等で
指定すると、図12に示すように、軸が表す分野に含ま
れるキーワードが表示され、このキーワード中の1つを
ポイントすることにより操作者に選択させて当該キーワ
ードを軸とするベクトルを表示するようにし、文書嗜好
ベクトルの各要素を分野別にまとめずに、各要素のうち
最も値の高い3つのキーワードを軸として3次元表示し
てもよい。
【0039】嗜好文書ベクトルV’とともに文書ベクト
ルVを表示してもよい。このように嗜好文書ベクトル
V’と文書ベクトルVの両方を表示することにより、ユ
ーザーの嗜好を、文書ベクトルVと嗜好文書ベクトル
V’とのなす角度として認識可能となる。一定期間毎に
区切って文書嗜好ベクトルやGPベクトルを求めて、こ
のGPベクトルの経時的変化を目視可能に表示して、ユ
ーザーの嗜好の変化を追跡できるようにしてもよい。こ
のように文書嗜好ベクトルやGPベクトルの経時的変化
を目視可能に表示する手法としては、図13に示すよう
に、分野別ベクトルの終点の奇跡を曲線として表示する
ものや、図14に示すように、カラーバーグラフを重ね
て表示するもの等が挙げられる。
【0040】
【発明の効果】以上説明したように、本発明によれば、
ユーザーの嗜好を特徴付けるGP行列が視覚化表示され
るので、ユーザーの嗜好が目視により確認できる。
【図面の簡単な説明】
【図1】本発明の文書処理装置の一実施形態であり、本
発明の文書処理プログラムを記憶した記憶媒体の一実施
形態の該プログラムが読み取られたコンピュータの構成
を表したブロック図である。
【図2】図1の実施形態における文書ベクトルデータベ
ースの内容を概念的に表した説明図である。
【図3】図1の実施形態における行列Ga,Gb,Gc
の一例を示す説明図である。
【図4】図1の実施形態による行列Ga,Gb書き換え
処理の動作を示すフローチャートである。
【図5】図1の実施形態による処理重要語・処理重要度
取得処理の動作を示すフローチャートである。
【図6】図1の実施形態によるGP行列の視覚化処理の
動作を示すフローチャートである。
【図7】図1の実施形態による文書ベクトル作成処理の
動作を表したフローチャートである。
【図8】図1の実施形態におけるGPベクトルのその取
得手法を示す説明図である。
【図9】図1の実施形態における文書嗜好ベクトルの各
要素を区分する分野の一例を示す表である。
【図10】図1の実施形態において2つのユーザーそれ
ぞれの分野別ベクトルを表示装置に表示した一例を示す
ものである。
【図11】本発明の他の実施形態におけるGP行列視覚
化手段のGPベクトルの表示手法の一例を示す図であ
る。
【図12】本発明の他の実施形態におけるGP行列視覚
化手段のGPベクトルの表示手法の一例を示す図であ
る。
【図13】本発明の他の実施形態におけるGP行列視覚
化手段のGPベクトルの表示手法の一例を示す図であ
る。
【図14】本発明の他の実施形態におけるGP行列視覚
化手段のGPベクトルの表示手法の一例を示す図であ
る。
【図15】請求項1に記載した発明のクレーム対応図で
ある。
【図16】請求項3に記載した発明のクレーム対応図で
ある。
【図17】請求項6に記載した発明のクレーム対応図で
ある。
【図18】請求項8に記載した発明のクレーム対応図で
ある。
【図19】請求項11に記載した発明のクレーム対応図
である。
【符号の説明】
11 制御部 112 ROM 113 RAM 1131 対象文書格納エリア 1132 キーワード格納エリア 1134 文書ベクトル格納エリア 1135 行列格納エリア 1136 類似度格納エリア 1138 GPベクトル格納エリア 12 キーボード 13 マウス 14 表示装置 15 印刷装置 16 記憶装置 161 仮名漢字変換辞書 162 プログラム格納部 164 文書データベース 165 重要語データベース 166 文書ベクトルデータベース 168 行列データベース 101 GP行列取得手段 102 GP行列視覚化手段 103 文書ベクトル取得手段 201 GP行列取得機能 202 GP行列視覚化機能 203 文書ベクトル取得機能

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 過去に処理された文書から、ユーザー
    と、前記ユーザーの嗜好を表す複数のキーワードの一方
    を行、他方を列とし、前記ユーザーに対する前記各キー
    ワードの重要度を要素値とするGP行列を取得するGP
    行列取得手段と、 前記GP行列を視覚化するGP行列視覚化手段と、を具
    備することを特徴とする文書処理装置。
  2. 【請求項2】 前記GP行列視覚化手段は、前記GP行
    列から前記キーワードの重要度を要素値とするGPベク
    トルを取得し、このGPベクトルをn(n≧2)次元化
    して表示することを特徴とする請求項1に記載の文書処
    理装置。
  3. 【請求項3】 文書を特徴付ける文書ベクトルを取得す
    る文書ベクトル取得手段を備え、 前記GP行列視覚化手段は、前記文書ベクトルを前記G
    P行列を用いてシフトさせて前記GPベクトルを取得
    し、前記文書ベクトルと前記GPベクトルとを表示する
    ことを特徴とする請求項2に記載の文書処理装置。
  4. 【請求項4】 文書を特徴付ける文書ベクトルを取得す
    る文書ベクトル取得手段を備え、 前記GP行列視覚化手段は、同一のユーザーに対する前
    記GPベクトルの経時的変化を表示することを特徴とす
    る請求項2または請求項3に記載の文書処理装置。
  5. 【請求項5】 前記GP行列視覚化手段は、複数の前記
    ユーザーそれぞれについての前記GPベクトルを同時に
    表示するものであることを特徴とする請求項2から請求
    項4のうちのいずれか1の請求項に記載の文書処理装
    置。
  6. 【請求項6】 過去に処理された文書から、ユーザー
    と、前記ユーザーの嗜好を表す複数のキーワードの一方
    を行、他方を列とし、前記ユーザーに対する前記各キー
    ワードの重要度を要素値とするGP行列を取得するGP
    行列取得機能と、 前記GP行列を視覚化するGP行列視覚化機能と、をコ
    ンピュータに実現させるためのコンピュータ読みとり可
    能な文書処理プログラムが記憶された記憶媒体。
  7. 【請求項7】 前記GP行列視覚化機能は、前記GP行
    列から前記キーワードの重要度を要素値とするGPベク
    トルを取得し、このGPベクトルをn(n≧2)次元化
    して表示することを特徴とする請求項6に記載の文書処
    理プログラムが記憶された記憶媒体。
  8. 【請求項8】 文書を特徴付ける文書ベクトルを取得す
    る文書ベクトル取得機能を備え、 前記GP行列視覚化機能は、前記文書ベクトルを前記G
    P行列を用いてシフトさせて前記GPベクトルを取得
    し、前記文書ベクトルと前記GPベクトルとを表示する
    ことを特徴とする請求項7に記載の文書処理プログラム
    が記憶された記憶媒体。
  9. 【請求項9】 文書を特徴付ける文書ベクトルを取得す
    る文書ベクトル取得機能を備え、 前記GP行列視覚化機能は、同一のユーザーに対する前
    記GPベクトルの経時的変化を表示することを特徴とす
    る請求項7または請求項8に記載の文書処理プログラム
    が記憶された記憶媒体。
  10. 【請求項10】 前記GP行列視覚化機能は、複数の前
    記ユーザーそれぞれについての前記GPベクトルを同時
    に表示するものであることを特徴とする請求項7から請
    求項9のうちのいずれか1の請求項に記載の文書処理プ
    ログラムが記憶された記憶媒体。
  11. 【請求項11】 過去に処理された文書から、ユーザー
    と、前記ユーザーの嗜好を表す複数のキーワードの一方
    を行、他方を列とし、前記ユーザーに対する前記各キー
    ワードの重要度を要素値とするGP行列を取得し、 前記GP行列を視覚化することを特徴とする文書処理方
    法。
  12. 【請求項12】 前記GP行列から前記キーワードの重
    要度を要素値とするGPベクトルを取得し、このGPベ
    クトルをn(n≧2)次元化して表示することにより前
    記GP行列を視覚化することを特徴とする請求項11に
    記載の文書処理方法。
JP21715497A 1997-07-28 1997-07-28 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 Expired - Fee Related JP4005672B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21715497A JP4005672B2 (ja) 1997-07-28 1997-07-28 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21715497A JP4005672B2 (ja) 1997-07-28 1997-07-28 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法

Publications (2)

Publication Number Publication Date
JPH1145286A true JPH1145286A (ja) 1999-02-16
JP4005672B2 JP4005672B2 (ja) 2007-11-07

Family

ID=16699707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21715497A Expired - Fee Related JP4005672B2 (ja) 1997-07-28 1997-07-28 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法

Country Status (1)

Country Link
JP (1) JP4005672B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321221B1 (en) 1998-07-17 2001-11-20 Net Perceptions, Inc. System, method and article of manufacture for increasing the user value of recommendations
US6334127B1 (en) * 1998-07-17 2001-12-25 Net Perceptions, Inc. System, method and article of manufacture for making serendipity-weighted recommendations to a user
US6412012B1 (en) 1998-12-23 2002-06-25 Net Perceptions, Inc. System, method, and article of manufacture for making a compatibility-aware recommendations to a user
US6884221B2 (en) 2002-06-20 2005-04-26 Colin Medical Technology Co Corporation Circulatory-organ evaluating apparatus
JP2005128864A (ja) * 2003-10-24 2005-05-19 Ishisaki:Kk 人体カラーの数値的評価システムおよび評価評価方法
US7461058B1 (en) 1999-09-24 2008-12-02 Thalveg Data Flow Llc Optimized rule based constraints for collaborative filtering systems
US7788123B1 (en) 2000-06-23 2010-08-31 Ekhaus Michael A Method and system for high performance model-based personalization
JP2010282655A (ja) * 1999-09-30 2010-12-16 Battelle Memorial Inst データベースに対する多数のクエリの可視化方法および可視化用の装置
JP2020047121A (ja) * 2018-09-20 2020-03-26 Zホールディングス株式会社 情報処理装置、情報処理方法および情報処理プログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321221B1 (en) 1998-07-17 2001-11-20 Net Perceptions, Inc. System, method and article of manufacture for increasing the user value of recommendations
US6334127B1 (en) * 1998-07-17 2001-12-25 Net Perceptions, Inc. System, method and article of manufacture for making serendipity-weighted recommendations to a user
US6412012B1 (en) 1998-12-23 2002-06-25 Net Perceptions, Inc. System, method, and article of manufacture for making a compatibility-aware recommendations to a user
US7461058B1 (en) 1999-09-24 2008-12-02 Thalveg Data Flow Llc Optimized rule based constraints for collaborative filtering systems
US8548987B2 (en) 1999-09-24 2013-10-01 Thalveg Data Flow Llc System and method for efficiently providing a recommendation
JP2010282655A (ja) * 1999-09-30 2010-12-16 Battelle Memorial Inst データベースに対する多数のクエリの可視化方法および可視化用の装置
US7788123B1 (en) 2000-06-23 2010-08-31 Ekhaus Michael A Method and system for high performance model-based personalization
US8155992B2 (en) 2000-06-23 2012-04-10 Thalveg Data Flow Llc Method and system for high performance model-based personalization
US6884221B2 (en) 2002-06-20 2005-04-26 Colin Medical Technology Co Corporation Circulatory-organ evaluating apparatus
JP2005128864A (ja) * 2003-10-24 2005-05-19 Ishisaki:Kk 人体カラーの数値的評価システムおよび評価評価方法
JP2020047121A (ja) * 2018-09-20 2020-03-26 Zホールディングス株式会社 情報処理装置、情報処理方法および情報処理プログラム

Also Published As

Publication number Publication date
JP4005672B2 (ja) 2007-11-07

Similar Documents

Publication Publication Date Title
Venkataraman Applied optimization with MATLAB programming
JP4890851B2 (ja) 意味論的文書スマートネール
US10210141B2 (en) Stylizing text by replacing glyph with alternate glyph
US11733785B2 (en) Stylizing text by providing alternate glyphs
JP4005672B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JPH1153394A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JPH1145289A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2000285128A (ja) 業務分析システム
JP4021525B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2004110825A (ja) 自由形式注釈を強調するための方法及びシステム
JP2012230544A (ja) 画像検索装置およびプログラム
JP2000194725A (ja) 類似グル―プ抽出装置、及び類似グル―プ抽出プログラムが記憶された記憶媒体
JPH1153398A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2000194724A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2009093389A (ja) 情報処理装置、情報処理方法、およびプログラム
JP4030624B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法
JPH10289245A (ja) 画像処理装置及びその制御方法
JPH1145278A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP3154992B2 (ja) 情報検索装置、及び情報検索プログラムが記憶された記憶媒体
US20200279172A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP2000353163A (ja) データベース処理装置、及びデータベース処理のためのプログラムが記憶された記憶媒体
JP2000194723A (ja) 類似度表示装置、類似度表示プログラムが記憶された記憶媒体、文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
US11537262B1 (en) Using attributes for font recommendations
Atkinson Computer memories: The history of computer form
JPH1145281A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070529

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070821

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070824

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130831

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees