JPH09319764A - キーワード生成装置及び文書検索装置 - Google Patents

キーワード生成装置及び文書検索装置

Info

Publication number
JPH09319764A
JPH09319764A JP13930696A JP13930696A JPH09319764A JP H09319764 A JPH09319764 A JP H09319764A JP 13930696 A JP13930696 A JP 13930696A JP 13930696 A JP13930696 A JP 13930696A JP H09319764 A JPH09319764 A JP H09319764A
Authority
JP
Japan
Prior art keywords
keyword
unit
document
storage unit
classification item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP13930696A
Other languages
English (en)
Inventor
Hiroyoshi Nomura
博義 野村
Hiroshi Kutsumi
洋 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP13930696A priority Critical patent/JPH09319764A/ja
Publication of JPH09319764A publication Critical patent/JPH09319764A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】文書に簡単にキーワードを付加すること。 【解決手段】タブレット101から入力された手書き文
書に対して、その文書を構成するストロークの長さや方
向などの統計量、もしくは、いくつかの特定パターンを
検出し(1、2、3、5)、その検出結果を基に、ファ
ジィ推論を用いることにより(7)、文書に対して自動
的にキーワードを付加する(6)。これにより、ユーザ
は文書入力に際してマニュアルでキーワードを付加する
ことなく、検索や分類などの文書処理を行うことができ
る。また、スキャナから読み込まれる文書画像に対して
も、文書の大きさを求めることにより、自動的に文書に
対して適切なキーワードを付加することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、手書きの文書や画
像情報の入った文書に対するキーワードを用いた文書の
検索装置に関する。
【0002】
【従来の技術】現在、コンピュータの利用環境のひとつ
として、タブレットやタッチパネルなどを用いたペンコ
ンピューティングが注目されている。
【0003】ペン入力により文書や図形などの情報を入
力する代表的な方法として、以下の方法が従来からよく
利用されている。 1.文字認識による方法 2.ペンで入力された情報を図形データや画像データの
一種として取り扱う方法 3.自由な入力を許さず、ディスプレイに表示された選
択肢を選ぶのみの方法 4.ペンの特殊な動きパターン(ジェスチャ)を検出す
る方法 1の文字認識では、ペンで入力された手書きの文字情報
が、コンピュータで扱いやすいキャラクタ情報に変換さ
れる。したがって、データの再利用や検索などが効率的
に行えるという長所を持つ。しかし、文字認識の技術は
現在まだ完成しておらず、認識率は決して十分であると
はいえない。したがって、ユーザは必ず認識結果を訂正
するという作業を行わなければならない。
【0004】2の方法は、認識を行わないため処理的に
簡単であり、手書きの図形や文字、記号などを混在させ
自由なレイアウトで一枚の文書に書き込めるという長所
を持つ。しかし、それらは、コンピュータの中では画像
情報や図形情報などのバイナリ情報として扱われ、デー
タの検索ができないなどの問題がある。
【0005】3、4の方法は、1または2の方法、ある
いはキーボードなどの他の入力デバイスと併用されるこ
とが多く、単独で文字や図形などの自由な入力は困難で
ある。しかし、これらは、上記1、2の方法の欠点を埋
める技術として重要である。
【0006】この手法の代表的な一事例として、従来の
文書検索装置の構成を図15に示す。図15は従来の文
書検索装置であり。具体的には手書き文書の入力や検索
を行うものである。これは、上記した2と3の方法を併
用したもので、手書き入力された文書情報に対してキー
ワードを付加し、それにより検索を行うものある。
【0007】図15の101はユーザからペンによる入
力を受け付けるタブレット、102はタブレット101
からのペン入力情報やキーワード候補などを表示するた
めの表示装置、103はタブレット101から出力され
たペンの軌跡情報を蓄え手書き文書情報を画像データ
(文書画像)に変換する手書き情報変換部、104は手
書き情報変換部103からの文書画像やそれに対するキ
ーワードなどを蓄える情報記憶部、105は検索や分類
のためのキーワード候補を記憶しており、その候補を表
示装置102に表示するキーワード記憶部、106はユ
ーザがタブレット101を用いて行うキーワード選択の
結果を検出するキーワード選択部、107はキーワード
選択部106でユーザにより選択されたキーワードを手
書き情報変換部103から出力された文書画像に関連づ
けて情報記憶部104に記憶させるキーワード付加部で
ある。ここまでの構成は手書き文書の入力に関する部分
である。
【0008】図15の110はユーザが手書き文書の検
索を行うときの検索キーワードを受けつける検索キーワ
ード入力部、111は検索キーワード110で入力され
たキーワードのついた文書を情報記憶部4から検索する
情報検索部、102’は情報検索部111で検索された
文書を表示する表示装置である。
【0009】この図の構成では、手書き文書の入力時と
検索時で関連する機器の構成を点線で分けて記載してい
るが、例えば、入力部と検索部がひとつの装置であって
もかまわない。この場合、表示装置など構成が共通にな
る。このような構成に基づき従来の文書検索装置では、
次のような手順でデータを蓄え、検索する。 A)データ入力時 1.ユーザがタブレット101を用いて手書き文書を作
成する。
【0010】2.タブレット101に入力された情報を
同時に表示装置102に表示する。
【0011】3.書き終わった手書き文書を手書き情報
変換部103により画像データ(文書画像)に変換す
る。
【0012】4.キーワード記憶部105に記憶されて
いる複数のキーワード候補を図16のように表示装置1
02に出力する。
【0013】5.ユーザは、タブレット101を用い
て、キーワード候補の中から、作成した手書き文書にふ
さわしいキーワードを選択する。選択されたキーワード
はキーワード選択部106により検出する。
【0014】6.検出されたキーワードはキーワード付
加部107に送られ、作成した手書き文書と関連づけて
情報記憶部104に記憶する。
【0015】このような1〜6の手順を繰り返し文書デ
ータを蓄えていく。 B)データ検索時 1.検索キーワード入力部110からユーザは検索した
い文書に関連するキーワードを入力する。
【0016】2.情報検索部111は、検索キーワード
入力部110に入力されたキーワードを持つ文書を情報
記憶部104から検索し、表示装置102’にその検索
結果を出力する。
【0017】この従来例のように手書き文書を画像デー
タとして取り扱う方法は、文字認識を行わないため処理
が簡単であり、さらに手書きの図形や文字、記号などを
混在させて自由なレイアウトで文書を作成できるという
長所を持つ。しかし一方、これらの文書には元来キーワ
ードとなるテキスト情報がなく、検索が難しいという問
題があり、この従来例ではこの問題を解決するため、図
16のように画面上に複数のキーワード候補を表示し、
対象としている手書き文書にふさわしいキーワードをそ
の中からペンで選ばせることにより、手書き文書に適当
なキーワードを付加できるようになっている。このキー
ワードにより、ユーザは手書きの文書を検索できるよう
になる。
【0018】
【発明が解決しようとする課題】しかし、文書に対する
キーワードの付加は、次のような理由により簡単な作業
ではない。
【0019】1.家庭内やオフィス内で、ちょっとした
メモのような比較的短い文書を取り扱う場合、キーワー
ドを付加するという作業自身が煩わしい。
【0020】2.ユーザーによってキーワード付加に対
する考え方がまちまちで、ほぼ同じような文書に対して
も異なるキーワードが付加されていることがある。一貫
性のあるキーワード付加がなされたデータベースを作る
ことは大変困難である。
【0021】3.文書の内容がひとつの分野に限定され
てなく様々な種類がある場合、キーワード候補の数が多
くなり、すべてのキーワードを把握し、その中から適当
なものを選択する作業は簡単とは言えない。
【0022】このような理由により、文書に対して適切
なキーワードを付加するという作業は困難であるという
課題があった。
【0023】本発明は、このような従来の方法の課題を
考慮し、文書に対して自動的にキーワードを付加するこ
とができる文書検索装置を提供することを目的とするも
のである。
【0024】
【課題を解決するための手段】本発明は、文書の作成に
際しユーザの動かすペンや指の軌跡を検出し、検出結果
を座標系列の形で出力するタブレットと、タブレットか
ら出力される座標系列をストローク毎に蓄えるストロー
ク記憶部と、ストローク記憶部に格納されている座標系
列のパターンから所定の特徴量を検出する特徴量検出部
と、特徴量検出部で得られた座標系列の特徴量からファ
ジィ推論を行い文書に対するキーワードを生成する自動
キーワード生成部と、自動キーワード付加部で行われる
ファジィ推論の推論規則を記憶しておく推論規則記憶部
を備え、文書に対して自動的にキーワードを付加する。
【0025】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図1から図14を用いて説明する。 (実施の形態1)図1は、本発明の第一の実施の形態に
おける文書検索装置の構成図を示すものであり、具体的
にはタブレットにより入力された手書き文書の入力およ
び検索装置の構成を示している。
【0026】図1において、101はユーザからのペン
入力を受けつけ、ペンの動き(軌跡)情報を出力するタ
ブレット、102はタブレットでのペン入力結果、キー
ワード、検索文書などを表示する表示装置、103はタ
ブレット101でユーザから入力された手書き文書情報
を画像データ(文書画像)に変換する手書き情報変換
部、104は手書き情報変換部103で画像データに変
換された手書き文書やそれに対するキーワードを記憶す
る情報記憶部、101’は検索時に用いるタブレット、
102’は検索時に用いる表示装置、111’は情報記
憶部104を検索する情報検索部であり、これらは前述
した従来例の構成と同様なものである。
【0027】従来例と異なる構成は、タブレット101
に入力されたペン軌跡中に含まれるストロークを一時的
に記憶するストローク記憶部1、ストローク記憶部1に
格納されたストロークの長さを計算するストローク長計
算部2、ストローク記憶部1に記憶されたストロークが
直線であるかどうかを検出し、その長さと文書に対する
角度(方向)を検出する直線検出部3、ストローク長計
算部2と直線検出部3で検出された各ストロークに対す
る特徴量を積算し、それらについて平均値や分散値など
の統計量を求める特徴量積算部5、特徴量積算部5で得
られる統計量からファジィ推論を行い手書き文書に対す
るキーワードとそのキーワード付加に対する適切さを表
す度合いを生成し、これらを手書き情報変換部103か
ら出力される手書き文書に関連づけて情報記憶部4に記
憶させる自動キーワード付加部6、自動キーワード付加
部6で行われるファジィ推論の規則を記憶する推論規則
記憶部7、キーワードと分類項目の関係を記憶している
分類項目記憶部8、キーワードおよびその度合いに基づ
いて文書を分類し表示位置を計算するファジィ分類部9
等である。なお、ストローク記憶部1、ストローク長計
算部2、直線検出部3は手書き文書を構成する1ストロ
ークに対しての特徴量を計算する部分であり、まとめて
以後特徴量検出部4と呼ぶ。
【0028】このような構成の本実施の形態の手書き文
書の入力、検索の動作を以下に説明する。
【0029】本発明は、手書き文書に対して自動的にキ
ーワードを付加するもので、そのキーワードは、タブレ
ット101から検出されるストローク情報によって生成
する。ここでのストロークとは、タブレット101にお
いてペンを下ろしてから上げるまでの、一定時間間隔で
検出される離散的な筆面座標系列のことを指す。したが
って、一つの文書は少なくとも一つ以上の複数のストロ
ークから構成されることになる。(ただし、何も書いて
いない文書を除く。) ここで、文書に含まれるストロークを s(i), i=1,...,S
と表し、ストロークs(i) に含まれる座標系列を ( Xi
1, Xi2, ..., XiJ )と表す。ただし、Xi1=(xi1,yi1), X
i2=(xi2, yi2), ... , XiJ=(xiJ, yiJ) であり、ストロ
ークに含まれる座標の個数 J はストローク毎に異な
り、ストロークの最大個数 S は文書毎に異なる。タブ
レット101はこのストローク情報 s(i)を時系列的に
出力する。
【0030】ストローク s(i) の長さや角度などに関す
る統計量は手書き文書の内容により大きく異なる。例と
して、家庭内でよく用いられる手書き文書(簡単な手書
きメモ)の一例を図2、図3、図4に示す。(a)は地
図、(b)は同期会の連絡、(c)は子どもの書いたメ
モである。これらはいずれもタブレットによりペン入力
で書かれたものである。
【0031】これらの文書(メモ)を構成するストロー
クを抽出し、それらの特徴をまとめたのが図2、図3、
図4の下の図である。
【0032】すなわち、図2、図3、図4の各(a-1),(b
-1),(c-1)は文書(a),(b),(c)それぞれを構成するストロ
ークの長さについて、ヒストグラムを示したものであ
る。ストロークの長さは以下の式で定義する。
【0033】
【数1】
【0034】ただし、|Xi+1 - Xi|は、座標 Xi+1 か
ら Xi までの距離を表す。本実施の形態での座標はタブ
レット上の論理座標であり、距離や長さの単位はピクセ
ルである。これは、一定の値を乗算することにより、通
常の cm などの単位に変換できる。また、文書(a)(b)
(c)それぞれで文書に含まれるストロークの総数は異な
るため、図ではストロークの度数を総ストローク数で除
算し、正規化している。
【0035】図2の(a)は、図形情報だけでなく文字情
報も存在する文書である。図2の(a-1)より、この文書
には比較的短い長さのストロークの割合が多いが、長い
ストロークも存在していることがわかる。図3(b)は基
本的に文字情報だけが含まれる文書であり、図3(b-1)
では文書を構成するストロークは短いものが多く、スト
ロークのヒストグラムも非常に分散の小さいものになっ
ている。図4(c)はひらがな情報のみが含まれる文書で
あり、図4(c-1)では50ピクセル程度のところにピー
クを持つが比較的幅広い分布を持っていることがわか
る。
【0036】図2、図3、図4の各(a-2),(b-2),(c-2)
及び(a-3),(b-3),(c-3)は各手書き文書(メモ)のスト
ローク中から直線状のストロークを検出し、そのストロ
ークの数や角度についてそれぞれヒストグラムを求めた
ものである。
【0037】図2、図3、図4の(a-2),(b-2),(c-2)
は、直線ストロークの数とそれ以外のストローク(図で
は曲線と表示している)の数を全体のストローク数で除
算し正規化したものを表示している。図2(a)は図形情
報が多い文書であるため、図2(a-2)は、直線の割合が
多い。図3(b)は、漢字を用いた文字情報が多いため、
上述したようにストロークの長さは短いが、各ストロー
クは直線上のものが多いため、図3(b-2)では直線が多
くなっている。図4(c)はひらがな情報のみが含まれる
文書であり、図4(c-2)では明らかに曲線が多くなって
いる。
【0038】図2、図3、図4の(a-3),(b-3),(c-3)は
検出した直線ストロークの文書に対する絶対角度につい
てヒストグラムを求めたものである。一般的に文書(a)
(c)のような図形やひらがななどに含まれる直線ストロ
ークの方向(角度)は、あまり特定の傾向を持たない
が、文書(b)のような漢字を中心とした文書は、明確な
傾向を持ち、(b-3)のように文書に対して縦(-90度付
近)と横(0度付近)の角度を持つ直線ストロークが多
くなる。なお、(c)の例では、直線の数が極端に少なく
(この場合2個)、正規化によりそれぞれのストローク
が1.0/2=0.5 の値を持つため、ピークを持っているよう
に見えるが、基本的にはピークを持たない。
【0039】以上で説明してきたように、手書き文書の
種類に応じてストロークの統計的な性質は異なる。本発
明では、この特徴を用いて文書に対してキーワードの自
動生成を行う。具体的には、手書き文書から得られるス
トロークの長さや方向などの特徴量をもとにファジィ推
論を行い、その文書にふさわしいキーワードを自動的に
付加するものである。
【0040】図1のような構成を持つ本実施の形態の動
作を、図5および図6のフローチャートに基づいて詳細
に説明する。まず、手書き文書の入力時におけるキーワ
ードの自動生成について、図5のフローチャートに基づ
いて説明する。
【0041】(ステップ1)ユーザのタブレット101
による文書入力開始。また、タブレット101より出力
されたストロークは、表示装置102により表示される
とともに、手書き情報変換部103にも入力される。
【0042】(ステップ2)タブレット101で入力さ
れたストロークをストローク記憶部1に一時的に記憶す
る。ストローク記憶部1は比較的小さな容量のRAMで
あり、入力されたひとつのストロークの座標系列 Xi1,
Xi2, ... , XiJを一時的に記憶する。
【0043】(ステップ3)ストローク長計算部2を用
いて、ストローク記憶部1に記憶された座標系列から、
ストロークの長さを計算する。計算には(数1)を用い
る。
【0044】(ステップ4)直線判定部3を用いて、ま
ず、ストローク記憶部1に記憶されているストロークが
直線であるかどうかを判定する。
【0045】具体的には、直線判定部3は、ストローク
記憶部1内の座標系列 Xi1, Xi2, ... , XiJ に対し
て、最小二乗法を適用し直線近似を行う。このときスト
ロークを構成するすべての座標 Xi1, Xi2, ... , XiJ
が、図7(b)のように近似直線を中心とした幅dの領域
に入っていれば、このストロークを直線と判断する。た
だし、dの値は近似直線の長さに比例させて変化させ
る。図7(a)の場合は直線ではないと判断する。
【0046】一般的にペン入力やタッチパネルなどでの
指入力など、人間が直接描画するような入力デバイスを
用いた場合、完全に正確な直線を描くことは困難であ
り、多少ゆらぐのがふつうである。このため本実施の形
態では、近似直線を中心として幅dの範囲を設け、その
範囲に座標が入っていれば直線と見なしている。しか
し、一般に、描く直線が長ければ長いほど、人間の入力
の揺らぎが大きくなるため、長い直線の場合は、直線検
出感度をゆるめてやる必要がある。このため、本実施の
形態では、近似直線の長さに応じてdの値を変えてい
る。このような方法により、対象としているストローク
が直線であるかどうかを判断する。
【0047】対象ストロークが直線の場合は次のステッ
プ5へ、直線でない場合、つまり曲線と見なせる場合は
ステップ6に進む。
【0048】(ステップ5)直線判定部3により近似さ
れた直線(線分)に対して、その長さと、文書に対する
角度(方向)を計算する。この計算も直線判定部3によ
り行う。
【0049】(ステップ6)特徴量積算部5により、以
上で求めたストローク長、直線かどうか、直線の長さ、
方向などについて図2、図3、図4のような度数分布を
求め、それらの統計量である平均値や分散値を逐次的に
求める。
【0050】(ステップ7)ユーザのタブレット101
による文書入力が終わったかどうかを検出する。終わっ
てない場合は、ステップ2に戻り、タブレット101か
ら入力される次のストロークに対して上と同様な処理を
行う。
【0051】(ステップ8)以上のステップ1からステ
ップ7までの手続きにより、一枚の手書き文書を構成す
るストロークそれぞれに対して、その長さの計算、直線
判定、直線の場合はその長さと方向の計算が行われてお
り、その結果、特徴量積算部5にそれらに関する平均値
や分散値などの統計量が求められている。
【0052】自動キーワード付加部6では、この統計量
からファジィ推論を行い、対象となっている文書に対し
て、適切なキーワードを自動的に付加する。自動キーワ
ード付加部6で行われるファジィ推論の推論規則は、推
論規則記憶部7に記憶されている。推論規則の一部を以
下に示す。 規則1:もし ストローク長の分散値=大きい かつ
直線ストロークの方向の分散値=大きい ならば ”図形主体の文書”の度合い=大きい 規則2:もし ストローク長の分散値=小さい かつ
直線ストロークの数=多い ならば ”漢字主体の文書”の度合い=大きい ”書き手は大人”の度合い=大きい 規則3:もし ストローク長の分散値=大きい かつ
直線ストロークの数=少ない ならば ”ひらがな主体の文書”の度合い=大きい ”図形主体の文書”の度合い=中くらい ”書き手は子供”の度合い=大きい ....... 推論規則中の下線を付した「大きい」「小さい」などの
定性的な表現は、メンバシップ関数で定義されるもので
あり、これらの情報も推論規則記憶部7に記憶されてい
る。また、”図形主体の文書”などダブルクォーテーシ
ョンで囲まれた表現はキーワードを示しており、「”図
形主体の文書”の度合い=大きい」といった表現は、対
象としている文書に対して、”図形主体の文書”という
キーワードを付加することの適切さが大きいということ
を意味している。つまり、ここでの度合いとは、キーワ
ードを文書に付加する際の適切さを表すものである。こ
の実施の形態では、この度合いに対するメンバシップ関
数は、0から1の定義域(全体集合)上で定義し、1に
近いほど度合いが高く、そのキーワードを付加すること
が適切であるということにしている。
【0053】推論記憶記憶部7に記憶されている上記し
たような規則に対してMin・Max演算のような通常
のファジィ推論演算を行うことにより、文書に対して、
いくつかのキーワードとその度合い(適切さ)が計算で
きる。度合いは非ファジィ化演算(例えば重心演算)に
より実数値にする。この演算により、ひとつの文書に対
して、いくつかのキーワードとそのキーワード付加に対
する適切さの度合いが決定される。
【0054】(ステップ9)自動キーワード付加部6
は、ステップ8で決定されたキーワードとその度合いを
手書き情報変換部103で画像データ(文書画像)に変
換された文書と関連づけ、情報記憶部104に記憶させ
る。なお、情報記憶部104はハードディスクや光ディ
スクなどの比較的大きな容量の文書が読み書きができる
記憶装置で構成されている。
【0055】以上説明してきたステップ1〜9の手続き
を適用することにより、入力された手書きの文書に対し
て、適切なキーワードが付加できる。この動作により、
ユーザはキーワードを付加するという作業をすることな
しに、自動的にキーワードのついた文書を、データベー
スとして情報記憶部に構築することができる。
【0056】次に図6のフローチャートを用いて、検索
時の各部の動作を説明する。 (ステップA1)分類項目記憶部8には、推論規則記憶
部7の規則に用いられているキーワードと、それに対す
る分類項目が記憶されている。上述した例に対応する分
類項目の事例の一部を次に示す。 キーワード:”図形主体の文書” 分類項目: ”漢字主体の文書” → 文書種類 ”ひらがな主体の文書” キーワード:”書き手は大人” → 分類項目 ”書き手は子供” 書き手 ・・・・・・・・・・・・ このように、分類項目記憶部8にはキーワードおよび分
類項目と、その関係が記憶されている。分類項目記憶部
8は、記憶しているすべての分類項目を表示装置10
2’に表示させ、ユーザにタブレット101’を用いて
分類項目の選択をさせる。 (ステップA2)ユーザの分類項目に関する選択結果
は、情報検索部111に送られる。情報検索部111で
は、選択された分類結果に対応するキーワードを分類項
目記憶部8から求め、それらのキーワードを持つ文書
(それらのキーワードに対して、所定の値以上の度合い
を持つ文書)を情報記憶部104を検索して求める。 (ステップA3)情報検索部111で検索された文書
は、ファジィ分類部9に送られる。ファジィ分類部9で
は、検索された文書のキーワードとその度合いを基に表
示方式を決める。図8にファジィ分類部9での文書の分
類とその表示方式を示す。図8の例は、ある分類項目に
対してキーワードA、B、Cが対応づけられている場合
を示している。ファジィ分類部9は、まず、画面上にあ
るキーワードA、B、Cに対して度合いが1となる文書
を置く点(図8の×点)を設定する。この点は、キーワ
ードに対してもっともふさわしい文書を置く場所であ
る。この点を基点としてキーワードの度合いが高い文書
をこの基点に近い場所に置き、度合いの低い文書は基点
から遠くへ配置するようにする。これにより、視覚的に
文書を分類することができる。
【0057】本発明では、文書を構成するストロークか
ら自動的にキーワードを生成する。しかしながら、スト
ロークの統計量は、文書を書く人やその内容に応じて変
化し、完全に正確なキーワードを付加することはできな
い。このため、本発明では、キーワードに度合いをもた
せ、その度合いに応じて文書を表示画面に配置すること
により、大枠で間違いのない分類を行うことができる。 (ステップA4)表示装置102’は、ファジィ分類部
9での計算結果に基づき各文書を表示する。図9に配置
事例を示す。これは、”文書種類”という分類項目で、
3つのキーワードについて文書を分類したものである。
ユーザはこの分類表示を見ることにより、目的の文書を
簡単に検索することができる。
【0058】以上説明したように、本発明では、文書作
成時のペンの動き(ストローク)を検出・解析すること
により、文書に対してキーワードを自動的に付加するこ
とができる。また、そのキーワードには適切さを表す度
合いをつけており、これを利用して文書を画面上に分類
して表示することにより、ユーザに対してわかりやすい
検索が実現できる。
【0059】なお、本実施の形態では、データ入力時の
構成とデータ検索時の構成を分けて説明したが、これら
は一つの装置であってもかまわない。その場合、図1に
おいて、タブレット101と101’および表示装置1
02と102’は共通であっても良い。また、本実施の
形態では、入力デバイスとしてタブレットを使用した
が、タッチパネルのような指で入力するものや、マウス
を用いて図や文字を描画するような入力方式でも良い。 (実施の形態2)図10は、本発明の第二の実施の形態
における文書検索装置の構成図を示すものであり、具体
的にはタブレットにより入力された手書き文書の入力お
よび検索装置の構成を示している。
【0060】図10において、101はユーザからのペ
ン入力を受けつけ、ペンの動き(軌跡)情報を出力する
タブレット、102はタブレットでのペン入力結果、キ
ーワード、検索文書などを表示する表示装置、103は
タブレット101でユーザから入力された手書き文書情
報を画像データ(文書画像)に変換する手書き情報変換
部、104は手書き情報変換部103で画像データに変
換された手書き文書やそれに対するキーワードなどを記
憶する情報記憶部、1は入力されたペン軌跡中に含まれ
るストロークを一時的に記憶するストローク記憶部、6
はファジィ推論を行い手書き文書に対するキーワードと
そのキーワード付加に対する適切さを表す度合いを生成
し、これらを手書き情報変換部103から出力される画
像データに関連づけて情報記憶部4に記憶させる自動キ
ーワード付加部、7は自動キーワード付加部で行われる
ファジィ推論のための推論規則を記憶する推論規則記憶
部、101’は検索時に用いるタブレット、102’は
検索時に用いる表示装置、8はキーワードと分類項目の
関係を記憶している分類項目記憶部、9はキーワードお
よびその度合いに基づいて文書を分類し表示位置を計算
するファジィ分類部、111は情報記憶部104を検索
する情報検索部であり、これらは前述した実施の形態1
の構成と同様なものである。
【0061】実施の形態1と異なる構成は、ストローク
記憶部1に記憶されているストロークがあらかじめ決め
られた特定のパターンかどうかを判断する特定パターン
検出部11と、検出された特定パターンの度数を積算す
るパターン特徴量積算部である。このような構成の手書
き文書の入力、検索の動作を以下に説明する。
【0062】本発明は、手書き文書に対して自動的にキ
ーワードを付加するもので、そのキーワードは、タブレ
ット101から検出されるストローク情報によって生成
する。実施の形態1では、文書を構成するストロークの
長さの平均値や分散値、あるいは、直線ストロークの長
さや方向の平均値や分散値などを用いて、キーワードを
自動生成した。本実施の形態2では、これとは異なり、
ストロークの中から特定のパターンを検出して、そのパ
ターンの度数に基づきキーワードを自動生成する。
【0063】特定パターン検出部11で検出する具体的
な特定パターンの例を図11に示す。図11は、家庭内
やオフィス内でよく用いられる簡単な手書きのメモを例
として特定パターンを示したもので、この文書では、あ
る文字列を強調するために、文字列を閉曲線で囲んだ
り、文字列の下に二重線を引いたりしている。本実施の
形態では、この閉曲線と2重線を特定パターンとして取
り扱う。
【0064】なお、本実施の形態と実施の形態1で述べ
た第1の実施の形態では、共通な構成が多く、また、動
作の基本的な流れは、図5と図6のフローチャートも基
本的に同様である。ただし、図5のステップ3からステ
ップ6は以下で説明する動作に置き換わる。基本的な相
違点は、実施の形態1で述べた特徴量検出部4の中身を
特定パターン検出部11に変更した点と、推論規則記憶
部7での規則と分類項目記憶部8の記憶内容が異なる点
である。以降では、第1の実施の形態と異なる点を中心
として説明を行う。
【0065】特定パターン検出部11では、これらの閉
曲線や2重線のパターンを検出し、それらに対応するキ
ーワードを自動生成する。この特定パターン検出部11
の動作を以下に簡単に示す。
【0066】1)閉曲線の検出 まず、ストロークから閉曲線を検出する。ただし、ここ
で検出する閉曲線は文字列を囲むような閉曲線であり、
ある程度の大きさを持っているものとする。
【0067】ストローク記憶部1内に記憶されている座
標 Xi1, Xi2, ... , XiJ から、(数1)を用いてスト
ロークの長さと、始点Xi1と終点XiJの距離 |Xi1-XiJ|
を求める。そして、ストローク長が所定の値よりも大き
く、始点と終点の距離が所定の値よりも小さいストロー
クを閉曲線のストローク候補として選ぶ。次に、選ばれ
たストローク候補に対して、ストロークで囲まれた領域
の面積を計算する。具体的には、以下に示す(数2)を
用いて面積を計算する。この式により閉曲線で囲まれた
面積の概略値が計算できる。
【0068】
【数2】
【0069】この面積値が所定の値以上になるストロー
クを、最終的に閉曲線であると見なす。
【0070】2)二重線の検出 特定パターン検出部11では、実施の形態1で述べた直
線の検出方法と同様の方法で、まず、ストローク記憶部
1に記憶されているストロークが直線かどうかを検出
し、直線である場合は、その始点、終点、近似直線の傾
きを一時的に記憶しておく。そして、次のストロークが
ストローク記憶部1に入ってきたときに、再度、直線か
どうかを判定し、直線であり、しかも、その直線の始
点、終点、近似直線の傾きの値が、前回のストロークの
ものとあまり大きく離れていないときに、その連続した
2つのストロークを二重線であると見なす。
【0071】このような動作により、特定パターン検出
部11では、文書内の閉曲線や二重線のストロークを検
出することができる。この部分の動作が、図5のフロー
チャートのステップ3から6に置き換わる。他の部分の
動作は基本的に第一の実施の形態と同様である。
【0072】パターン特徴量積算部12は、特定パター
ン検出部11からの出力を積算し、ひとつの文書にいく
つの特定パターン(閉曲線、二重線)があるかをカウン
トする。自動キーワード付加部6では、この情報を元に
キーワードを自動生成する。ただし、自動キーワード付
加部6で用いられる規則は、実施の形態1とは異なり、
例えば以下のような規則が用いられる。 規則1:もし 閉曲線の数=多い かつ 2重線の数=
多い ならば ”重要文書”の度合い=とても高い 規則2:もし 閉曲線の数=多い かつ 2重線の数=
少ない ならば ”重要文書”の度合い=中くらい ..... また、分類項目記憶部8には、第一の実施の形態と同様
に、推論規則記憶部7の規則に用いられているキーワー
ドと、それに対する分類項目が記憶されている。この例
に対応する分類項目の具体的な事例の一部を次に示す。 本実施の形態における他の部分の動作は第一の実施の形
態と基本的に同様である。
【0073】以上説明したように、本発明では、文書作
成時のペンの動き(ストローク)を検出し、その中から
特定のパターンを発見することにより、文書に対してキ
ーワードを自動的に付加することができる。また、その
キーワードには適切さを表す度合いをつけており、これ
を利用して文書を画面上に分類して表示することによ
り、ユーザに対してわかりやすい検索が実現できる。
【0074】なお、本実施の形態は、第一の実施の形態
と異なる種類のキーワードを付加できるため、第一の実
施の形態と組み合わせて使うことにより、さらに多くの
種類のキーワードを自動的に文書に付加できる。また、
本実施の形態での特定パターンは、閉曲線と2重線のみ
であったが、矢印や、2重丸、×印など、他の典型的な
パターンでもかまわない。 (実施の形態3)図12は、本発明の第三の実施の形態
における文書検索装置の構成図を示すものであり、具体
的には文書画像の入力および検索装置の構成を示してい
る。
【0075】図12において、6はファジィ推論を行い
文書画像に対してキーワードとその適切さを表す度合い
を生成し、それらを文書に関連づけて情報記憶部4に記
憶させる自動キーワード付加部、7は自動キーワード付
加部で行われるファジィ推論のための推論規則を記憶す
る推論規則記憶部、104は文書画像とキーワードなど
を記憶する情報記憶部、101’は検索時に用いるタブ
レット、102’は検索時に用いる表示装置、8はキー
ワードと分類項目の関係を記憶している分類項目記憶
部、9はキーワードおよびその度合いに基づいて文書を
分類し表示位置を計算するファジィ分類部、111は情
報記憶部104を検索する情報検索部であり、これらは
前述した実施の形態1の構成と同様なものである。
【0076】実施の形態1と異なる構成は、文書を読み
込みその画像情報を出力するスキャナ21と、スキャナ
21から出力された画像情報を一時的に記憶しておく画
像一時記憶部22と、画像一時記憶部22に記憶されて
いる画像から文書の大きさを検出する大きさ抽出部23
である。
【0077】このような構成の手書き文書の入力、検索
の動作を以下に説明する。本発明は、スキャナ21から
読み込まれた文書に対して自動的にキーワードを付加す
るもので、そのキーワードはスキャナ21から読み込ま
れる画像中の文書の大きさによって生成する。
【0078】本実施の形態では、ガソリンスタンドや電
力会社などからもらうような、家庭内で日常的に取り扱
う領収書やレシートなどを対象として、これらの入力・
検索を行う装置を示す。領収書やレシートには、多くの
種類があり、その大きさも様々である。その中には、同
じ大きさで異なる種類の領収書も存在する。したがっ
て、基本的には、文書の大きさからは、その文書が何で
あるかを特定することはできない。しかし、例えば家庭
内での領収書・レシートのみを取り扱うというような限
定を加えると、家庭内で日常的に扱う領収書の種類はあ
まり多くないため、ある程度の精度で大きさから領収書
の種類を推定することが可能であると考える。
【0079】一般の家庭でよく利用される領収書(レシ
ート)の例を図13に示す。図13より、領収書の大き
さ(横、縦の長さ)は異なる場合も多く、文書の大きさ
より、その文書が何の領収書であるかを特定ができる場
合があることがわかる。
【0080】なお、本実施の形態は、実施の形態1で述
べた第1の実施の形態と共通な構成が多く、基本的な相
違点は、実施の形態1で述べたタブレット101、手書
き情報変換部103、特徴量検出部4、特徴量積算部5
の代わりに、スキャナ21、画像一時記憶部22、大き
さ抽出部23を新たに設けた点と、推論規則記憶部7で
の規則と分類項目記憶部8の記憶内容が異なる点であ
る。以後では、第1の実施の形態と異なる点を中心とし
て説明を行う。
【0081】本実施の形態では、スキャナ21で読み込
まれた文書画像の情報を画像一時記憶部22に蓄える。
スキャナ21は、所定の解像度で、一定の面積(例えば
A4サイズ)の画像を取り込む動作のみを行う。画像一
時記憶部22はRAMで構成されており、スキャナ21
から出力される画像情報を一時的に蓄えることができ
る。
【0082】大きさ抽出部23は、画像一時記憶部22
に記憶されている画像情報から、画像中の文書の大きさ
(横と縦の長さ)を検出する。検出方法を図14に示
す。
【0083】図14は、スキャナで取り込んだ画像を示
している。まず、この文書画像に対して、図14の x-y
のような座標系を設定し、スキャナにより(1,1)-(Nx,N
y)を対角線とする矩形領域を読み込んだとする(単位は
ピクセル)。この座標系において、画像中の各ピクセル
の輝度値を Y(x,y) と表す。このとき、大きさ抽出部2
3は次のような輝度積算値を計算する。
【0084】
【数3】
【0085】次に、これら E(y),F(x)にローパスフィル
ター演算を適用する。これは、ノイズ成分を低減させる
ためである。そして、最後に、このフィルターの出力
E'(y), F'(x)がある所定の値以下となる領域をそれぞれ
求め、その領域の長さを文書の縦の長さ、横の長さとす
る。なお、ここで求められる長さの単位はピクセルであ
るが、スキャナ21の読みとり解像度(DPI)などの情報
を利用して、通常のmmなどの単位に変換する。
【0086】大きさ抽出部23で求めた文書の大きさ
(縦、横の長さ)は、自動キーワード付加部6に入力さ
れる。自動キーワード付加部6では、この情報を元にキ
ーワードを自動生成する。ただし、自動キーワード付加
部6で用いられる規則は、実施の形態1とは異なり、例
えば以下のような規則が用いられる。 規則1:もし 縦の長さ=76mmぐらい かつ 横の長
さ=127mmぐらい ならば ”ガソリンスタンドの領収書”の度合い=高い ただし、下線を付した 「 76mmぐらい 」などは、メ
ンバシップ関数で定義されるファジィ集合である。上記
した検出方法により、ある程度の精度で文書の大きさを
検出可能である。しかし、文書によっては、検出誤差が
無視できないような場合もある。このような場合に対処
するため、ここでは、実施の形態1と同様に、キーワー
ドの生成にファジィ推論を用いている。上記した「
6mmぐらい 」などの表現はメンバシップ関数で表現さ
れており、これは幅を持った考え方であるため、多少の
大きさ抽出部における検出誤差をある程度、許容するこ
とができる。
【0087】次に、分類項目記憶部8の内容の事例を以
下に示す。分類項目記憶部8には、実施の形態1と同様
に、推論規則記憶部7の規則に用いられているキーワー
ドと、それに対する分類項目が記憶されている。この例
に対応する分類項目の具体的な事例の一部を次に示す。 キーワード:”ガソリンスタンドの領収書” 分類項目: ”電力会社の領収書” → 領収書 ”新聞社の領収書” キーワード:”コンビニの領収書” → レシート ”スーパーの領収書” 他の部分の構成は、第1の実施の形態と同様の動作を行
う。
【0088】以上説明してきたように、本実施の形態に
よれば、家庭内で日常的に用いられる領収書などの文書
に対して、自動的にキーワードを生成することができ、
ユーザは自らキーワードを付加することなく、領収書の
分類、検索、一覧などを実行することができる。
【0089】なお、本発明の各手段は、コンピュータを
用いてソフトウェア的に実現し、あるいはそれら各機能
を有する専用のハード回路を用いて実現する事が出来
る。
【0090】
【発明の効果】以上説明したように、タブレットから入
力された手書き文書に対して、その文書を構成するスト
ロークの長さや方向などの統計量、もしくは、いくつか
の特定パターンを検出し、その検出結果からファジィ推
論を用いることにより、文書に対して自動的にキーワー
ドを付加することができる。これにより、ユーザは文書
入力に際してキーワードを付加することなく、検索や分
類などの文書処理を行うことができる。
【0091】また、スキャナから読み込まれる文書画像
に対しても、文書の大きさを求めることにより、自動的
に文書に対して適切なキーワードを付加することができ
る。
【図面の簡単な説明】
【図1】本発明の第一の実施の形態における文書検索装
置の構成を示す図
【図2】手書き文書を構成するストロークの統計的性質
を示す図
【図3】手書き文書を構成するストロークの統計的性質
を示す図
【図4】手書き文書を構成するストロークの統計的性質
を示す図
【図5】本発明の第一の実施の形態における文書入力時
の動作を示すフローチャート
【図6】本発明の第一の実施の形態における検索時の動
作を示すフローチャート
【図7】本発明の第一の実施の形態における直線判定部
の動作の説明図
【図8】本発明の第一の実施の形態における検索時の表
示例を示す図
【図9】本発明の第一の実施の形態における検索時の表
示例を示す図
【図10】本発明の第二の実施の形態における文書検索
装置の構成を示す図
【図11】本発明の第二の実施の形態における特定パタ
ーンの例を示す図
【図12】本発明の第三の実施の形態における文書検索
装置の構成を示す図
【図13】本発明の第三の実施の形態における文書画像
の例として、領収書の形状特徴を示した図
【図14】本発明の第三の実施の形態における大きさ抽
出部の動作を説明する図
【図15】従来の文書検索装置の構成を示した図
【図16】従来の文書検索装置の構成を示した図
【符号の説明】
1 ストローク記憶部 2 ストローク長計算部 3 直線判定部 4 特徴量検出部 5 特徴量積算部 6 自動キーワード付加部 7 推論規則記憶部 8 分類項目記憶部 9 ファジィ分類部 11 特定パターン検出部 12 パターン特徴量積算部 22 画像一時記憶部 23 大きさ記憶部 101 タブレット 102 表示装置 103 手書き情報変換部 104 情報記憶部 105 キーワード記憶部 106 キーワード選択部 107 キーワード付加部 111 情報検索部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 文書の作成に際しユーザの動かすペンや
    指の軌跡を検出し、検出結果を座標系列の形で出力する
    タブレットと、 前記タブレットから出力される座標系列をストローク毎
    に蓄えるストローク記憶部と、 前記ストローク記憶部に格納されている座標系列のパタ
    ーンから所定の特徴量を検出する特徴量検出部と、 前記特徴量検出部で得られた座標系列の特徴量からファ
    ジィ推論を行い文書に対するキーワードを生成する自動
    キーワード生成部と、 前記自動キーワード付加部で行われるファジィ推論の推
    論規則を記憶しておく推論規則記憶部と、 前記タブレットから出力される座標系列を文書作成開始
    時から終了時まで蓄え、蓄えた座標系列から文書画像を
    生成する手書き情報変換部と、 前記手書き情報変換部で生成された文書画像と前記自動
    キーワード生成部により生成されたキーワードを記憶す
    る情報記憶部と、 を備えたことを特徴とするキーワード生成装置。
  2. 【請求項2】請求項2記載のキーワード生成装置と、 ユーザからの検索キーワードの入力を受け付けるキーワ
    ード入力部と、 前記キーワード入力部から入力されたキーワードから前
    記情報記憶部を検索し検索結果を出力する情報検索部
    と、 を備えたことを特徴とする文書検索装置。
  3. 【請求項3】 文書の作成に際しユーザの動かすペンや
    指の軌跡を検出し、検出結果を座標系列の形で出力する
    タブレットと、 前記タブレットから出力される座標系列をストローク毎
    に蓄えるストローク記憶部と、 前記ストローク記憶部に格納されている座標系列のパタ
    ーンから所定の特徴量を検出する特徴量検出部と、 前記特徴量検出部で得られた座標系列の特徴量からファ
    ジィ推論を行い文書に対するキーワードとそのキーワー
    ドの適切さを表す値を生成する自動キーワード生成部
    と、 前記自動キーワード生成部で行われるファジィ推論の推
    論規則を記憶しておく推論規則記憶部と、 前記タブレットから出力される座標系列を文書作成開始
    時から終了時まで蓄え、蓄えた座標系列から文書画像を
    生成する手書き情報変換部と、 前記手書き情報変換部で生成された文書画像と前記自動
    キーワード生成部により生成されたキーワードとそのキ
    ーワードの適切さを表す値を関連づけて記憶する情報記
    憶部と、 を備えたことを特徴とするキーワード生成装置。
  4. 【請求項4】請求項3記載のキーワード生成装置と、 文書を分類するための分類項目と、分類項目とキーワー
    ドとの関係を記憶している分類項目記憶部と、 ユーザからの分類項目の入力を受け付ける分類項目入力
    部と、 前記分類項目記憶部を検索して前記分類項目入力部で入
    力された分類項目に対応するキーワードを求め、そのキ
    ーワードにより前記情報記憶部に格納されている文書画
    像を検索する情報検索部と、 前記情報検索部により検索された文書画像に付加された
    キーワードおよびそのキーワードの適切さを表す値に基
    づいて文書画像の表示位置を決める文書分類部と、 前記文書分類部での表示位置の計算結果に基づいて前記
    情報検索部により検索された文書画像を表示する表示部
    と、 を備えたことを特徴とする文書検索装置。
  5. 【請求項5】 文書の作成に際しユーザの動かすペンや
    指の軌跡を検出し、検出結果を座標系列の形で出力する
    タブレットと、 前記タブレットから出力される座標系列をストローク毎
    に蓄えるストローク記憶部と、 前記ストローク記憶部に格納されている座標系列の長さ
    を計算するストローク長計算部と、 前記ストローク記憶部に格納されている座標系列に対し
    て直線近似を行い、直線近似の誤差が所定の値以下の時
    に、近似した直線の長さと方向を計算する直線判定部
    と、 前記ストローク長計算部と前記直線判定部の計算結果か
    らファジィ推論を行い文書に対するキーワードとそのキ
    ーワードの適切さを表す値を生成する自動キーワード生
    成部と、 前記自動キーワード生成部で行われるファジィ推論の推
    論規則を記憶しておく推論規則記憶部と、 前記タブレットから出力される座標系列を文書作成開始
    時から終了時まで蓄え、蓄えた座標系列から文書画像を
    生成する手書き情報変換部と、 前記手書き情報変換部で生成された文書画像と前記自動
    キーワード生成部により生成されたキーワードとそのキ
    ーワードの適切さを表す値を関連づけて記憶する情報記
    憶部と、 を備えたことを特徴とするキーワード生成装置。
  6. 【請求項6】請求項5記載のキーワード生成装置と、 文書を分類するための分類項目と、分類項目とキーワー
    ドとの関係を記憶している分類項目記憶部と、 ユーザからの分類項目の入力を受け付ける分類項目入力
    部と、前記分類項目記憶部を検索して前記分類項目入力
    部により入力された分類項目に対応するキーワードを求
    め、そのキーワードにより前記情報記憶部に格納されて
    いる文書画像を検索する情報検索部と、 前記情報検索部により検索された文書画像に付加された
    キーワードおよびそのキーワードの適切さを表す値に基
    づいて文書画像の表示位置を決める文書分類部と、 前記文書分類部での表示位置の計算結果に基づいて前記
    情報検索部により検索された文書画像を表示する表示部
    と、 を備えたことを特徴とする文書検索装置。
  7. 【請求項7】 文書の作成に際しユーザの動かすペンや
    指の軌跡を検出し、検出結果を座標系列の形で出力する
    タブレットと、 前記タブレットから出力される座標系列をストローク毎
    に蓄えるストローク記憶部と、 前記ストローク記憶部に格納されている座標系列からあ
    らかじめ定められた特定のパターンを検出するパターン
    検出部と、 前記パターン検出部により検出したパターンの種類や数
    を入力としてファジィ推論を行い文書に対するキーワー
    ドとそのキーワードの適切さを表す値を生成する自動キ
    ーワード生成部と、 前記自動キーワード生成部で行われるファジィ推論の推
    論規則を記憶しておく推論規則記憶部と、 前記タブレットから出力される座標系列を文書作成開始
    時から終了時まで蓄え、蓄えた座標系列から文書画像を
    生成する手書き情報変換部と、 前記手書き情報変換部で生成された文書画像と前記自動
    キーワード生成部により生成されたキーワードとそのキ
    ーワードの適切さを表す値を関連づけて記憶する情報記
    憶部と、 を備えたことを特徴とするキーワード生成装置。
  8. 【請求項8】請求項7記載のキーワード生成装置と、 文書を分類するための分類項目と、分類項目とキーワー
    ドとの関係を記憶している分類項目記憶部と、 ユーザからの分類項目の入力を受け付ける分類項目入力
    部と、 前記分類項目記憶部を検索して前記分類項目入力部によ
    り入力された分類項目に対応するキーワードを求め、そ
    のキーワードにより前記情報記憶部に格納されている文
    書画像を検索する情報検索部と、 前記情報検索部により検索された文書画像に付加された
    キーワードおよびそのキーワードの適切さを表す値に基
    づいて文書画像の表示位置を決める文書分類部と、 前記文書分類部での表示位置の計算結果に基づいて前記
    情報検索部により検索された文書画像を表示する表示部
    と、 を備えたことを特徴とする文書検索装置。
  9. 【請求項9】 対象とする文書の画像情報を読みとるス
    キャナと、 前記スキャナから出力される画像データから文書形状の
    大きさを検出する大きさ抽出部と、 前記大きさ抽出部の出力からファジィ推論を行い文書に
    対するキーワードとそのキーワードの適切さを表す値を
    生成する自動キーワード生成部と、 前記自動キーワード生成部で行われるファジィ推論の推
    論規則を記憶しておく推論規則記憶部と、 前記タブレットから出力される座標系列を文書作成開始
    時から終了時まで蓄え、蓄えた座標系列から文書画像を
    生成する手書き情報変換部と、 前記手書き情報変換部で生成された文書画像と前記自動
    キーワード生成部により生成されたキーワードとそのキ
    ーワードの適切さを表す値を関連づけて記憶する情報記
    憶部と、 を備えたことを特徴とするキーワード生成装置。
  10. 【請求項10】請求項9記載のキーワード生成装置と、 文書を分類するための分類項目と、分類項目とキーワー
    ドとの関係を記憶している分類項目記憶部と、 ユーザからの分類項目の入力を受け付ける分類項目入力
    部と、 前記分類項目記憶部を検索して前記分類項目入力部によ
    り入力された分類項目に対応するキーワードを求め、そ
    のキーワードにより前記情報記憶部に格納されている文
    書画像を検索する情報検索部と、 前記情報検索部により検索された文書画像に付加された
    キーワードおよびそのキーワードの適切さを表す値に基
    づいて文書画像の表示位置を決める文書分類部と、 前記文書分類部での表示位置の計算結果に基づいて前記
    情報検索部により検索された文書画像を表示する表示部
    と、 を備えたことを特徴とする文書検索装置。
JP13930696A 1996-05-31 1996-05-31 キーワード生成装置及び文書検索装置 Pending JPH09319764A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13930696A JPH09319764A (ja) 1996-05-31 1996-05-31 キーワード生成装置及び文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13930696A JPH09319764A (ja) 1996-05-31 1996-05-31 キーワード生成装置及び文書検索装置

Publications (1)

Publication Number Publication Date
JPH09319764A true JPH09319764A (ja) 1997-12-12

Family

ID=15242230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13930696A Pending JPH09319764A (ja) 1996-05-31 1996-05-31 キーワード生成装置及び文書検索装置

Country Status (1)

Country Link
JP (1) JPH09319764A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010097609A (ja) * 2008-10-15 2010-04-30 Xerox Corp ランレングスヒストグラムを用いて文書の表現を生成する方法及び装置
KR101024522B1 (ko) * 2007-12-28 2011-03-31 주식회사 디케이아이테크놀로지 키워드 데이터 추출방법 및 그 장치
WO2014050774A1 (en) 2012-09-25 2014-04-03 Kabushiki Kaisha Toshiba Document classification assisting apparatus, method and program
JP2014086021A (ja) * 2012-10-26 2014-05-12 Toshiba Corp 電子機器、手書き文書表示方法、及び表示プログラム
WO2020196636A1 (ja) * 2019-03-26 2020-10-01 株式会社ワコム 家の記憶装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101024522B1 (ko) * 2007-12-28 2011-03-31 주식회사 디케이아이테크놀로지 키워드 데이터 추출방법 및 그 장치
JP2010097609A (ja) * 2008-10-15 2010-04-30 Xerox Corp ランレングスヒストグラムを用いて文書の表現を生成する方法及び装置
WO2014050774A1 (en) 2012-09-25 2014-04-03 Kabushiki Kaisha Toshiba Document classification assisting apparatus, method and program
JP2014086021A (ja) * 2012-10-26 2014-05-12 Toshiba Corp 電子機器、手書き文書表示方法、及び表示プログラム
US9304679B2 (en) 2012-10-26 2016-04-05 Kabushiki Kaisha Toshiba Electronic device and handwritten document display method
WO2020196636A1 (ja) * 2019-03-26 2020-10-01 株式会社ワコム 家の記憶装置

Similar Documents

Publication Publication Date Title
JP3483982B2 (ja) システム動作方法及びプロセッサ制御システム
US7742642B2 (en) System and method for automated reading of handwriting
Pradeep et al. Diagonal based feature extraction for handwritten character recognition system using neural network
Matsakis Recognition of handwritten mathematical expressions
US7139004B2 (en) Method and apparatus to convert bitmapped images for use in a structured text/graphics editor
US7136082B2 (en) Method and apparatus to convert digital ink images for use in a structured text/graphics editor
US6130962A (en) Information retrieval apparatus for enabling information retrieval with ambiguous retrieval key
TW389865B (en) System and method for automated interpretation of input expressions using novel a posteriori probability measures and optimally trained information processing network
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
JP2816241B2 (ja) 画像情報検索装置
EP1655670A2 (en) Parsing hierarchical lists and outlines
US20110043869A1 (en) Information processing system, its method and program
JPH1055371A (ja) 文書探索および検索システム
JPH07182446A (ja) 機械作動方法
Huang et al. Isolated handwritten Pashto character recognition using a K-NN classification tool based on zoning and HOG feature extraction techniques
Tapia et al. Recognition of on-line handwritten mathematical formulas in the e-chalk system
Jorge et al. A simple approach to recognise geometric shapes interactively
CN112711362B (zh) 手绘流程图标准化生成方法及其装置
US20080244384A1 (en) Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus
US11615244B2 (en) Data extraction and ordering based on document layout analysis
CN115937887A (zh) 文档结构化信息的提取方法及装置、电子设备、存储介质
Obaidullah et al. Structural feature based approach for script identification from printed Indian document
JP6856916B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JPH09319764A (ja) キーワード生成装置及び文書検索装置
JPH06111073A (ja) 手書き情報認識装置