JPH08249347A - データ検索方法及びデータ検索装置 - Google Patents

データ検索方法及びデータ検索装置

Info

Publication number
JPH08249347A
JPH08249347A JP7051345A JP5134595A JPH08249347A JP H08249347 A JPH08249347 A JP H08249347A JP 7051345 A JP7051345 A JP 7051345A JP 5134595 A JP5134595 A JP 5134595A JP H08249347 A JPH08249347 A JP H08249347A
Authority
JP
Japan
Prior art keywords
data
search
output
information amount
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7051345A
Other languages
English (en)
Inventor
Kanako Teramura
佳奈子 寺村
Asami Kuramitsu
麻美 倉光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7051345A priority Critical patent/JPH08249347A/ja
Publication of JPH08249347A publication Critical patent/JPH08249347A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 電子化された上記憶保管されている大量のデ
ータや文字放送等での検索効率の改善を図る。 【構成】 (1)一応検索されたデータの情報量をもと
に、再検索の必要性やその手法を検索者に提供したりあ
るいは検索結果の出力方法等を変更する。 (2)データの利用頻度等があらかじめ判明している場
合には、検索やその後の出力にそれを反映させる。 (3)検索者の記憶する定型文書中の単語、文字等の読
み取りを検索に利用する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データ検索に関し、特
に計算機システムや情報システムにおける各種形式、量
のデータを検索する方法及び装置に関する。
【0002】
【従来の技術】近年、電子化された大量のデータを速や
かに表示、参照することを可能とすべくデータ検索装置
が広く利用されている。ところで、このようなデータ検
索装置は、全文検索を行なう場合もあるが、一般的には
大量のデータを取り扱うため、検索に際してキーワード
やデータファイルの作成日の範囲の指定等の条件(検索
用の鍵)を与え、これにより大まかな絞り込みを行い、
その結果としての候補データ内容やそのファイルの表題
のみや第一頁のみを表示させるのが普通である。
【0003】以下、このようなデータ検索装置を採用し
たデータ保存装置の一例を図を参照しつつ説明する。図
18は、その検索装置を含むデータ保存装置の構成図で
ある。本図に示すように、この装置は、読込部1と、保
存部2と、検索指示部3と、検索部4と、出力部7とを
備えている。なお、実際には、以上の他、一旦検索した
候補データ等を一時記憶する一時記憶部、表示等された
候補データのタイトル等から意図するものを指定する指
定部等を有するが、これらは本発明の趣旨には直接的に
は関係せず、また周知技術かつ自明の事項であるため、
その記載等は省略する。そして、これは後の実施例でも
同様である。
【0004】読込部1は、文書を文字、表、グラフ、図
形等のコードの集合として読み込んだり、あるいはL/
E(光/電気)変換による読み取りスキャナを用いた
り、ネットワークを介したりして読み込んだりする。保
存部2は、読込部1により読み込まれたデータを、デー
タの管理者、入力者により別途作成されたキーワードや
入力日等と対応づけて保存する。
【0005】検索指示部3は、検索者の操作により入力
された検索の起動や停止、各種検索条件などのコマンド
に応じた指示を検索部4に通知する。検索部4は、検索
指示部3からの指示に基づいて、検索条件に適合するデ
ータを候補データとして保存部2から順に読み出す。出
力部7は、検索部4により読み出された候補データをあ
らかじめのプログラムや検索者の指示により定められた
出力形式で出力する。
【0006】検索者は、この出力結果を視認して本来必
要としている目的のデータであるか否かを確認する。そ
して、所望のデータが得られない場合には新たなキーワ
ードを作成する等して再度の検索が指示されることとな
る。なおここで、出力結果は、出力データの表題、デー
タの属性(種別)、その他ケースによってはデータ内容
そのものやその一部等であり、出力形式は、CRTへの
表示、用紙への印刷、スピーカへの音声等である。
【0007】次に、以上は主に文書、画像等の保存され
ているデータの検索であったが、同様の検索、その結果
の表示等は各種検索条件の指定の一環としてチャネルの
選択等があるものの、文字放送等においてもなされる。
同じく、マルチメディアシステムの一環としての、ビデ
オ・オン・デマンドシステムにおけるサービスに供され
ている映像情報の選択等においてもなされる。
【0008】
【発明が解決しようとする課題】しかしながら、上記従
来の構成では、以下のような問題点がある。第1に、一
般にデータ量が多いこともあり、検索用鍵としての検索
条件の選定作業が繁雑である。次に、データの登録者が
検索者の便宜のため登録にあたりあらかじめ作成してあ
るキーワードと、検索者が検索のため入力するキーワー
ドとが必ずしも一致するとは限らない。そして、若し両
方のキーワードが極力一致するようにその作成と入力の
手順を厳格に定めたならば、逆にキーワードの作成と入
力のための処理が複雑、煩雑となる。このため、この手
順を統一することによる効果にも自ずと限界がある。結
果的に、検索の対象となるデータが膨大な場合には、ど
のように検索鍵を設定しても検索結果として出力される
候補データも大量となるが、この出力や検索者による確
認も手間と時間がかかる。
【0009】更に、全文検索がなされることも少なから
ずあるが、この場合には該当する候補データ量がどうし
ても多くなりがちであり、ひいてはこれらの不都合も増
大しがちである。第2に、上記第1の課題に付随した面
もあるが、保存されているデータや目的とするデータの
内容如何によっては、検索条件を変更しての再検索が必
要となることが多くなり、応答性が損なわれる。具体的
には、保存されているデータが階層的な場合、同じく膨
大な場合、同じく記載内容の趣旨と検索者の参照せんと
する意図とが相違する場合等である。
【0010】第3に、検索の対象とするデータが過去の
新聞記事等極めて膨大な一方で型式が一定の場合には、
検索の対象となるデータを検索者が一度でも視認した
り、読んだりしたことがあるときには、その際の視覚的
な記憶が上記型式と照らしあわせると有力な検索の鍵と
なり得るが、それに対する考慮がなされていない。更に
は、形式が一定であることが予想される場合も同様に検
索に利用しうるが、それへの考慮がなされていない。
【0011】第4に、上記第1の課題に共通した面もあ
るが、検索された候補データが大量の場合にその全ての
印刷出力が指示されているようなときには、出力そのも
のに時間と費用がかかる等し、この一方で課題のみ出力
させようとすれば同一課題の候補データが多数存在する
等し、このため適切な出力形式の選択も必要となる。第
5に、検索装置は、出力の如何にかかわらず、検出した
候補データを一時記憶しておく必要が多いが、検索され
た候補データが大量の場合には、そのために必要な記憶
資源の量も膨大となる。ひいては、装置も高価となる。
【0012】第6に、上記第3の課題と共通する面もあ
るが、そして理工学の分野等では特にそうであるが、図
形的な特徴が検索に利用されていない。第7に、データ
の利用頻度等が反映されていない。そして、これらの問
題点は、検索の対象となるデータが単なる文献等でな
く、文字放送、通信回線を介しての有料の映画、音楽、
その他の情報の提供等のときにも生じる。
【0013】本発明は、かかる課題に鑑みてされたもの
であり、検索対象のデータの量や種類にかかわらず効率
的なデータ検索方法及び装置を提供することを目的とす
る。同じく、検索対象のデータの量が膨大なときに、経
費、手間、時間等の面から効率的なデータ検索方法及び
装置を提供することを目的とする。同じく、検索対象の
データの量、種類、型式や利用度等があらかじめ判明し
ており、特に検索者が目的とするデータの量、種類、型
式等につき何等かの記憶を有しているときやデータの性
質からその量、種類、形式等が予想されるとき等のとき
に、効率的なデータ検索方法及び装置を提供することを
目的とする。
【0014】同じく、検索対象のデータが、単なる文献
等でなく、文字放送、通信回線を介しての映画、音楽、
その他の情報の提供等のときにも同様な効果が得られる
効率的なデータ検索方法及び装置を提供することを目的
とする。
【0015】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明は、文字、表、グラフ、図形等で構
成されるデータ、コードデータやビットデータ等を検索
し、結果をデータファイル名、データ内容、データファ
イル属性、データ特徴(その他放映)等の形式で出力す
るデータ検索方法であって、検索者の指示により、保存
されている、文字放送されている、あるいはビデオ・オ
ン・デマンド等で利用者のサービスに提供等されている
文献、映像、画像、音楽等のデータから候補データを所
定の手順で読み出す検索ステップと、前記検索ステップ
において読み出された全データのチャネル数、個数等の
情報量を測定する情報量測定ステップと、前記情報量測
定ステップによる測定値が所定の値を越えた場合には、
所定値未満の場合とは別形式の出力を行う、検索者に出
力方法の選択指示をあおぐ、検索者に他の検索内容によ
る再検索を要請する少なくも一を行う検索結果出力適切
対応ステップとを有していることを特徴としている。
【0016】請求項2の発明は、文字、表、グラフ、図
形等で構成されるデータを検索し、結果をデータファイ
ル名、データ内容、データファイル属性、データ特徴な
どの形式で出力するデータ検索装置であって、検索者の
指示により、保存、放送、提供等されているデータから
候補データを読み出す検索手段と、前記検索手段におい
て読み出された全データのビット数等の情報量を測定す
る情報量測定手段と、前記情報量測定手段による測定結
果が所定値を越えた場合には、所定値未満の場合と別形
式の出力を行う、検索者に出力方法の選択指示をあお
ぐ、検索者に他のキーワード等の入力等の他の検索内容
による再検索を要請するの少なくも一を行う検索結果出
力適切対応手段とを有していることを特徴としている。
【0017】請求項3の発明は、文字、表、グラフ、図
形等で構成されるデータを検索し、結果をデータファイ
ル名、データ内容、データファイル属性、データ特徴な
どの形式で出力するデータ検索方法であって、検索者の
指示により、保存、放送、提供等されているデータから
候補データを読み出す検索ステップと、前記検索ステッ
プにおいて読み出された全データの情報量を測定する情
報量測定ステップと、前記情報量測定ステップの測定値
があらかじめ決められた制限値を超えているか否かを判
定し、制限値を超えている場合には、前記検索ステップ
により読み出されたデータを、あらかじめ入力される等
した所定の規則により分類する検索データ分類ステップ
と、前記検索データ分類ステップにて分類された各分類
毎に出力を行うか否かを所定の手順で判断する出力デー
タ分類選択ステップとを有していることを特徴としてい
る。
【0018】請求項4の発明は、文字、表、グラフ、図
形等で構成されるデータを検索し、結果をデータファイ
ル名、データ内容、データファイル属性、データ特徴な
どの形式で出力するデータ検索装置であって、検索者の
指示により、保存、放送、提供等されているデータから
候補データを読み出す検索手段と、前記検索手段におい
て読み出された全データの情報量を計測する情報量測定
手段と、前記情報量測定手段の測定値があらかじめ決め
られた制限値を超えているか否かを判定し、制限値を超
えている場合には、前記検索手段により読み出されたデ
ータを、別途入力等されている所定の規則により分類す
る(例えば、一般向け外国語文献専門書等)検索データ
分類手段と、前記検索データ分類手段にて分類された各
分類毎に、出力を行うか否かを所定の手順で判断する
(例えば、外国語文献と専門書は出力しない。一般向け
は100頁以下のもののみ出力する等。)出力データ分
類選択手段とを有していることを特徴としている。
【0019】請求項5の発明は、文字、表、グラフ、図
形等で構成されるデータを検索し、結果をデータファイ
ル名、データ内容、データファイル属性、データ特徴な
どの形式で出力するデータ検索方法であって、検索者の
指示により、保存、放送、提供等されているデータから
候補データを読み出す検索ステップと、前記検索ステッ
プにおいて読み出された全データの情報量を測定する情
報量測定ステップと、前記情報量測定ステップの測定値
があらかじめ決められた制限値を超えているか否かを判
定して、制限値を超えている場合には、前記検索ステッ
プにより読み出されたデータについて所定のデータファ
イル属性あるいはデータ特徴(この他、言語、利用度)
等により分類する検索データ分類ステップと、前記検索
データ分類ステップにて分類された各分類毎に、同じ分
類のデータが複数存在することとなる分類のデータのみ
出力するよう制御する同一分類データ出力制御ステップ
とを有していることを特徴としている。
【0020】請求項6の発明は、文字、表、グラフ、図
形等で構成されるデータを検索し、結果をデータファイ
ル名、データ内容、データファイル属性、データ特徴な
どの形式で出力するデータ検索装置であって、検索者の
指示により、保存、放送、提供等されているデータから
候補データを読み出す検索手段と、前記検索手段におい
て読み出された全データの情報量を測定する情報量測定
手段と、前記情報量測定手段の測定値があらかじめ決め
られた制限値を超えているか否かを判定し、制限値を超
えている場合には、前記検索手段により読み出されたデ
ータについて特定のデータファイル属性あるいはデータ
特徴等により分類する検索データ分類手段と、前記検索
データ分類手段にて分類された各分類毎に、同じ分類の
データが複数存在することとなる分類のデータのみ出力
するよう制御する同一分類データ出力制御手段とを有し
ていることを特徴としている。
【0021】請求項7の発明は、文字、表、グラフ、図
形等で構成されるデータを検索し、結果をデータファイ
ル名、データ内容、データファイル属性、データ特徴な
どの形式で出力するデータ検索方法であって、検索者の
指示により、保存、放送、提供等されているデータから
候補データを読み出す検索ステップと、前記検索ステッ
プにて読み出された全データの情報量を測定する情報量
測定ステップと、前記情報量測定ステップの測定値があ
らかじめ決められた制限値を超えているか否かを判定
し、制限値を超えている場合には、前記検索ステップに
より読み出されたデータについて所定のデータファイル
属性あるいはデータ特徴等により分類する分類ステップ
と、前記分類ステップの結果、同じ分類のデータが存在
しないデータのみ出力するよう制御する非同一属性デー
タ出力制御ステップとを有していることを特徴としてい
る。
【0022】請求項8の発明は、文字、表、グラフ、図
形等で構成されるデータを検索し、結果をデータファイ
ル名、データ内容、データファイル属性、データ特徴な
どの形式で出力するデータ検索装置であって、検索者の
指示により、前記保存、放送、提供等されているデータ
から候補データを読み出す検索手段と、前記検索手段に
おいて読み出された全データの情報量を測定する情報量
測定手段と、前記情報量測定手段の測定値があらかじめ
決められた制限値を超えているか否かを判定し、制限値
を超えている場合には、前記検索手段により読み出され
たデータについて特定のデータファイル属性あるいはデ
ータ特徴等により分類する検索データ分類手段と、前記
検索データ分類手段にて分類された各分類毎に、同じ分
類のデータが存在しないデータのみ出力するよう制御す
る非同一分類データ出力制御手段とを有していることを
特徴としている。
【0023】請求項9の発明は、文字、表、グラフ、図
形等で構成されるデータを検索し、結果をデータファイ
ル名、データ内容、データファイル属性、データ特徴な
どの形式で出力するデータ検索方法であって、検索者の
指示により、保存、放送、提供等されているデータから
候補データを読み出す検索ステップと、前記検索ステッ
プにおいて読み出された全データの情報量を測定する情
報量測定ステップと、前記情報量測定ステップにより測
定された情報量をあらかじめ定められたいずれの範囲内
であるかを判定する範囲判定ステップと、前記範囲判定
ステップの判定した範囲に応じて前記検索ステップから
読み出されたデータの出力方法、出力内容の少くも一を
制御する出力制御ステップとを有していることを特徴と
している。
【0024】請求項10の発明は、文字、表、グラフ、
図形等で構成されるデータを検索し、結果をデータファ
イル名、データ内容、データファイル属性、データ特徴
などの形式で出力するデータ検索装置であって、検索者
の指示により、保存、放送、提供等されているデータか
ら候補データを読み出す検索手段と、前記検索手段にお
いて読み出された全データの情報量を測定する情報量測
定手段と、前記情報量測定手段により測定された情報量
の値があらかじめ決められたどの範囲であるかを判定す
る範囲判定手段と、前記範囲判定手段の判定した範囲に
応じて前記検索手段から読み出されたデータの出力方法
若しくは出力内容の少くも一(含む、両方)を制御する
出力制御手段とを有していることを特徴としている。
【0025】請求項11の発明は、文字、表、グラフ、
図形等で構成されるデータを検索し、結果をデータファ
イル名、データ内容、データファイル属性、データ特徴
などの形式で出力するデータ検索方法であって、検索者
の指示により、保存、放送、提供等されているデータか
ら候補データを読み出す検索ステップと、前記検索ステ
ップにおいて読み出された全データの情報量を測定する
情報量測定ステップと、前記情報量測定ステップの測定
値があらかじめ設定された制限値を超えているか否かを
判定し、制限値を超えている場合には、前記検索ステッ
プにより読み出されたデータをあらかじめ決められた規
則に従って並び替えて出力するよう制御する出力順制御
ステップとを有していることを特徴としている。
【0026】請求項12の発明は、文字、表、グラフ、
図形等で構成されるデータを検索し、結果をデータファ
イル名、データ内容、データファイル属性、データ特徴
などの形式で出力するデータ検索装置であって、検索者
の指示により、保存、放送、提供等されているデータか
ら候補データを読み出す検索手段と、前記検索手段にお
いて読み出された全データの情報量を計測し、その値が
あらかじめ設定された制限値を超えているか否かを判定
する情報量測定手段と、前記情報量測定手段により測定
された情報量が制限値を超えている場合、前記検索手段
により読み出されたデータをあらかじめ決められた条件
で並び替え、その順で出力するよう出力手段に指示する
出力順制御手段とを有していることを特徴としている。
【0027】請求項13の発明は、文字、表、グラフ、
図形等で構成されるデータを検索し、結果をデータファ
イル名、データ内容、データファイル属性、データ特徴
などの形式で出力するデータ検索方法であって、検索者
の指示により、保存、放送、提供等されているデータか
ら候補データを読み出す検索ステップと、前記検索ステ
ップにおいて読み出された各データの情報量を順に確認
しつつ計測する情報量順計測ステップと、前記情報量順
計測ステップの結果に基づきそれまでの総和があらかじ
め定められた制限値を超えているか否かを判定する情報
量測定ステップと、前記情報量測定ステップにより測定
された情報量の総和が制限値を超えた場合には、制限値
に該当するデータ以降に読み出されたデータは出力しな
い若しくは制限値を越えた時点で検索を中止するよう制
御する出力検索制限制御ステップとを有していることを
特徴としている。請求項14の発明は、文字、表、グラ
フ、図形等で構成されるデータを検索し、結果をデータ
ファイル名、データ内容、データファイル属性、データ
特徴などの形式で出力するデータ検索装置であって、使
用者の操作に基づく検索起動指示により、保存、放送、
提供等されているデータから候補データを読み出す検索
手段と、前記検索手段において読み出された各データの
情報量を順に測定する情報量測定手段と、前記情報量測
定手段の測定した総和があらかじめ設定された制限値を
超えているか否かを判定し、制限値を超えた場合には、
それ以降に前記検索手段により読み出されたデータは出
力しない若しくは制限値を越えた時点で検索を中止する
よう制御する出力検索制限手段とを有していることを特
徴としている。
【0028】請求項15の発明においては、前記範囲判
定ステップにて所定の範囲にあると判断されたならば、
前記検索ステップにて検索された候補データの中に画像
データが含まれているか否かを連続する黒画素の寸法や
枠の有無等で判断する画像データ存在判断ステップを有
し、前記範囲判定ステップは更に、同じく画像データが
存在すると判断されたならば、その頁(枚)数等のデー
タ量を測定する画像データ量測定小ステップを有し、前
記手段制御ステップは更に、前記画像データ存在判断ス
テップにて存在すると判断されたならば、画像データを
先に出力されるよう候補データの配列を調整する画像デ
ータ優先配列小ステップと、前記画像データ量測定小ス
テップにて画像データ量が所定値以上と判断されたなら
ば、画像データが出力される際にこれを縮尺して、同一
表示面に複数の画像データが同時に出力されるよう制御
する画像データ出力表示制御小ステップとを有している
ことを特徴としている。
【0029】請求項16の発明においては、前記範囲判
定手段にて所定の範囲にあると判断されたならば、前記
検索手段にて検索された候補データの中に画像データが
含まれているか否かを判断する画像データ存在判断手段
を有し、前記範囲判定手段は更に、同じく画像データが
存在すると判断されたならば、その放送チャネル数等の
データ量を通信規則に基づく等して測定する画像データ
量測定部を有し、前記出力制御手段は更に、前記画像デ
ータ存在判断にて存在すると判断されたならば、画像デ
ータを先に出力されるよう候補データの配列を調整する
画像データ優先配列部と、前記画像データ量測定部にて
画像データが所定値以上と判断されたならば、画像デー
タが出力される際にこれを縮尺して、同一表示面に複数
の画像データが同時に出力されるよう制御する画像デー
タ出力表示制御部とを有していることを特徴としてい
る。
【0030】請求項17の発明においては、検索装置に
よる検索の対象とされている、そして保存されているデ
ータ若しくは保存するデータに経験則、データの意味内
容、キーワード等から定められた本来の検索の目的とさ
れる確率についての情報を検索に先立ってデータ保存者
等が付加する利用度情報付加ステップを有し、前記出力
制御ステップは、前記範囲判定ステップの判定した範囲
に応じて前記検索ステップから読み出されたデータの出
力方法若しくは出力内容を制御するに際して、前記利用
度情報付加ステップにて付加された情報を読み出し、確
率の低いデータは出力を中止する等して反映させる付加
利用度情報反映出力制御小ステップを有していることを
特徴としている。
【0031】請求項18の発明においては、検索装置に
よる検索の対象とされている、そして保存されているデ
ータ若しくは保存するデータに経験則、データの意味内
容、キーワード等から定められた本来の検索の目的とさ
れる確率についての情報を検索に先立って付加する利用
度情報付加手段を有し、前記出力制御手段は、前記範囲
判定手段の判定した範囲に応じて前記検索手段から読み
出されたデータの出力方法若しくは出力内容を制御する
に際して、前記利用度情報付加手段にて付加された情報
を反映させる付加利用度情報反映出力制御部を有してい
ることを特徴としている。
【0032】請求項19の発明は、前記出力制限制御ス
テップにより出力を制限されなかったデータについて
は、あらかじめ定められた所定の規則に並び替えて出力
するよう制御する出力順制御ステップを有していること
を特徴としている。請求項20の発明は、前記出力制限
手段により出力を制限されなかったデータについて、あ
らかじめ決められた条件で並び替え、その順で出力する
よう出力手段に指示する出力順制御手段を有しているこ
とを特徴としている。
【0033】請求項21の発明においては、記事の意味
内容から定まる記事の欄の分類と該記事の記載されてい
る位置若しくはこれに併せての記載部分の形状、寸法、
記載部やその近辺の所定の記号、図形、写真、枠等記載
部分を特定するのに役立つ視覚的特徴との間に一定の関
係の存在する日刊新聞紙、雑誌、データベース化された
名刺等の定型文書から目的とする記載を検索する方法に
おいて、検索目的たる記事等が記載されている少くも一
の種類の定型文書について、その定型性についての情報
を検索に先立ってあらかじめ入力しておく定型性情報入
力ステップと、検索目的たる記事の意味内容から定まる
記事の欄の分類若しくはこれに併せての該記事の記載さ
れている定型文書の種類を検索キーとして入力する欄定
型情報入力ステップと、検索目的たる記事中の文章、単
語、漢字等の文字の少くも一方について、少くも一個を
検索キーとして入力する若しくはこれに併せて記載位
置、近辺の所定の記号等をも検索キーとして入力する記
事情報入力ステップとを有していることを特徴としてい
る。
【0034】請求項22の発明においては、記事の意味
内容から定まる記事の欄の分類と該記事の記載されてい
る位置若しくはこれに併せての記載部分の形状、寸法、
記載部やその近辺の所定の記号、図形、写真、枠等記載
部分を特定するのに役立つ視覚的特徴との間に一定の関
係の存在する定型文書から目的とする記載を検索する装
置において、検索目的たる記事等が記載されている少く
も一の種類の定型文書について、その定型性についての
情報を検索に先立ってあらかじめ入力され記憶している
HD、磁気ディスク等からなる定型性情報保持手段と、
検索目的たる記事の意味内容から定まる記事の欄の分類
若しくはこれに併せての該記事の記載されている定型文
書の種類を検索キーとして入力するキーボード等を有す
る欄定型情報入力手段と、検索目的たる記事中の文章、
単語、漢字やドイツ文字等の文字の少くも一について、
少くも一個を検索キーとして入力する若しくはこれに併
せて記載位置、近辺の所定の記号等をも検索キーとして
入力する記事情報入力手段とを有していることを特徴と
している。
【0035】請求項23の発明においては、相前後する
単語間に余白を設ける言語で記載された文を対象とし
て、文中に存在する単語を検索キーとして、所望するデ
ーターの検索を行なうデーター検索方法であって、検索
対象の文中の単語間の余白から文中の各単語の長さを求
める単語長検出ステップと、検索キーの単語長を所定の
手順で求める検索キー単語長検出ステップと、前記両検
出ステップの結果をもとに、検索対象の文中から検索キ
ーの単語と同じ長さの単語を見出す候補単語検出ステッ
プと、前記候補単語検出ステップにより見出された候補
単語に対して、文字認識を行なって検索キーの単語か否
かの判断を行なう最終文字認識ステップとを有している
ことを特徴としていて、請求項24の発明においては、
相前後する単語間に余白を設ける言語で記載された文を
対象として、文中に存在する単語を検索キーとして、所
望するデーターの検索を行なうデーター検索装置であっ
て、検索対象の文中の単語間の余白から文中の各単語の
長さを求める単語長検出手段と、検索キーの単語長を所
定の手順で求める検索キー単語長検出手段と、前記両検
出手段の結果をもとに、検索対象の文中から検索キーの
単語と同じ長さの単語を見出す候補単語検出手段と、前
記候補単語検出手段により見出された候補単語に対し
て、文字認識を行なって検索キーの単語か否かの判断を
行なう最終文字認識手段とを有していることを特徴とし
ていて、請求項25の発明においては、図形的な特徴や
使用される文字に一定の規則性が検出される定型的な記
載型式のデータを検出するデータ検出方法であって、検
出対象のデータの定型性をあらかじめ入力する定型情報
入力ステップと、上記あらかじめ入力された定型情報の
中から第一に図形的な特徴を利用して候補データを見出
する図形利用候補データ検出ステップと、前記図形利用
候補データ検出ステップにて検出されたデータを対象と
して文字認識を行なうことにより更に候補データを絞り
込む文字認識利用候補データ検出ステップとを有してい
ることを特徴としている。
【0036】請求項26の発明においては、図形的な特
徴や使用される文字に一定の規則性が見出される定型的
な記載型式のデータを検出するデータ検出装置であっ
て、検出対象のデータの定型性をあらかじめ入力する定
型情報入力手段と、上記あらかじめ入力された定型情報
の中から第一に図形的な特徴を利用して候補データを検
出する図形利用候補データ検出手段と、前記図形利用候
補データ検出手段にて検出されたデータを対象として文
字認識を行なうことにより更に候補データを絞り込む文
字認識利用候補データ検出手段とを有していることを特
徴としている。
【0037】
【作用】上記構成により、請求項1の発明においては、
請求項1の発明においては、文字、表、グラフ、図形等
で構成されるデータを検索し、結果をデータファイル
名、データ内容、データファイル属性、データ特徴など
の形式で印刷したりCRTに表示したりして出力するデ
ータ検索方法であって、以下の作用がなされる。検索ス
テップにて、検索者(含む、その依頼者等)の指示によ
り、保存、放送、提供等されているデータから候補デー
タが読み出される。情報量測定ステップにて、前記検索
ステップにおいて読み出された全データの情報量が測定
される。検索結果出力適切対応ステップにて、前記情報
量測定ステップによる測定値が所定の値を越えた場合に
は所定値未満の場合とは別形式の出力を行う、検索者に
出力方法の選択指示をあおぐ、検索者に他の検索内容に
よる再検索を要請する、の少なくも一がその旨をCRT
に表示する等して行われる。
【0038】請求項2の発明においては、文字、表、グ
ラフ、図形等で構成されるデータを検索し、結果をデー
タファイル名、データ内容、データファイル属性、デー
タ特徴などの形式で出力するデータ検索装置であって、
以下の作用がなされる。検索手段が、検索者の指示によ
り、保存、放送、提供等されているデータから候補デー
タを読み出す。情報量測定手段が、前記検索手段におい
て読み出された全データの情報量を測定する。検索結果
出力適切対応手段が、前記情報量測定手段による測定結
果が所定値を越えた場合には、所定値未満の場合とは別
正式の出力を行なう、検索者に出力方法の選択指示をあ
おぐ、検索者に他の検索内容による再検索を要請するの
少なくも一を行う。
【0039】請求項3の発明においては、文字、表、グ
ラフ、図形等で構成されるデータを検索し、結果をデー
タファイル名、データ内容、データファイル属性、デー
タ特徴などの形式で出力するデータ検索方法であって、
以下の作用がなされる。検索ステップにて、検索者の指
示により、保存、放送、提供等されているデータから候
補データが読み出される。情報量測定ステップにて、前
記検索ステップにおいて読み出された全データの情報量
を測定される。検索データ分類ステップにて、前記情報
量測定ステップの測定値があらかじめ決められた制限値
を超えているか否かを判定し、制限値を超えている場合
には、前記検索ステップにより読み出されたデータを所
定の規則により分類される。出力データ分類選択ステッ
プにて、前記検索データ分類ステップにて分類された各
分類毎に出力を行うか否かが所定の手順で判断される。
【0040】請求項4の発明においては、文字、表、グ
ラフ、図形等で構成されるデータを検索し、結果をデー
タファイル名、データ内容、データファイル属性、デー
タ特徴などの形式で出力するデータ検索装置であって、
以下の作用がなされる。検索手段が、検索者の指示によ
り、保存、放送、提供等されているデータから候補デー
タを読み出す。情報量測定手段が、前記検索手段におい
て読み出された全データの情報量をページ数の総和を求
める等して計測する。検索データ分類手段が、前記情報
量測定手段の測定値があらかじめ決められた制限値を超
えているか否かを判定し、制限値を超えている場合に
は、前記検索手段により読み出されたデータを所定の規
則により分類する。出力データ分類選択手段が、前記検
索データ分類手段にて分類された各分類毎に、出力を行
うか否かを所定の手順で判断する。
【0041】請求項5の発明においては、文字、表、グ
ラフ、図形等で構成されるデータを検索し、結果をデー
タファイル名、データ内容、データファイル属性、デー
タ特徴などの形式で出力するデータ検索方法であって、
以下の作用がなされる。検索ステップにて、検索者の指
示により、保存、放送、提供等されているデータから候
補データが読み出される。情報量測定ステップにて、前
記検索ステップにおいて読み出された全データの情報量
が測定される。検索データ分類ステップにて、前記情報
量測定ステップの測定値があらかじめ決められた制限値
を超えているか否かが判定され、制限値を超えている場
合には、前記検索ステップにより読み出されたデータに
ついてあらかじめ付加されていたり、電波に通信規則
(規約)等にもとづき付加されていたりする所定のデー
タファイル属性あるいはデータ特徴や所定の制御信号等
により分類される。同一分類データ出力制御ステップに
て、前記検索データ分類ステップにて分類された各分類
毎に、同じ分類のデータが複数存在することとなる分類
のデータのみ、例えば日本語文字放送のみ出力するよう
制御される。
【0042】請求項6の発明においては、文字、表、グ
ラフ、図形等で構成されるデータを検索し、結果をデー
タファイル名、データ内容、データファイル属性、デー
タ特徴などの形式で出力するデータ検索装置であって、
以下の作用がなされる。検索手段が、検索者の指示によ
り、保存、放送、提供等されているデータから候補デー
タを読み出す。情報量測定手段が、前記検索手段におい
て読み出された全データの情報量を測定する。検索デー
タ分類手段が、前記情報量測定手段の測定値があらかじ
め決められた制限値を超えているか否かを判定し、制限
値を超えている場合には、前記検索手段により読み出さ
れたデータについて特定のデータファイル属性あるいは
データ特徴等により分類する。同一分類データ出力制御
手段が、前記検索データ分類手段にて分類された各分類
毎に、同じ分類のデータが複数存在することとなる分類
のデータのみ出力するよう制御する。
【0043】請求項7の発明においては、文字、表、グ
ラフ、図形等で構成されるデータを検索し、結果をデー
タファイル名、データ内容、データファイル属性、デー
タ特徴などの形式で出力するデータ検索方法であって、
以下の作用がなされる。検索ステップにて、検索者の指
示により、保存、放送、提供等されているデータから候
補データが読み出される。情報量測定ステップにて、前
記検索ステップにて読み出された全データの情報量が測
定される。分類ステップにて、前記情報量測定ステップ
の測定値があらかじめ決められた制限値を超えているか
否かが判定され、制限値を超えている場合には、前記検
索ステップにより読み出されたデータについて所定のデ
ータファイル属性あるいはデータ特徴等により分類され
る。非同一属性データ出力制御ステップにて、前記分類
ステップの結果、同じ分類のデータが存在しないデー
タ、例えば外国語データのみ出力するよう制御される。
【0044】請求項8の発明においては、文字、表、グ
ラフ、図形等で構成されるデータを検索し、結果をデー
タファイル名、データ内容、データファイル属性、デー
タ特徴などの形式で出力するデータ検索装置であって、
以下の作用がなされる。検索手段が、検索者の指示によ
り、前記保存、放送、提供等されているデータから候補
データを読み出す。情報量測定手段が、前記検索手段に
おいて読み出された全データの情報量を測定する。検索
データ分類手段が、前記情報量測定手段の測定値があら
かじめ決められた制限値を超えているか否かを判定し、
制限値を超えている場合には、前記検索手段により読み
出されたデータについて特定のデータファイル属性ある
いはデータ特徴等により分類する。非同一分類データ出
力制御手段が、前記検索データ分類手段にて分類された
各分類毎に、同じ分類のデータが存在しないデータのみ
出力するよう制御する。
【0045】請求項9の発明においては、文字、表、グ
ラフ、図形等で構成されるデータを検索し、結果をデー
タファイル名、データ内容、データファイル属性、デー
タ特徴などの形式で出力するデータ検索方法であって、
以下の作用がなされる。検索ステップにて、検索者の指
示により、保存、放送、提供等されているデータから候
補データが読み出される。情報量測定ステップにて、前
記検索ステップにおいて読み出された全データの情報量
が測定される。範囲判定ステップにて、前記情報量測定
ステップにより測定された情報量があらかじめ定められ
たいずれの範囲内であるかを判定する。出力制御ステッ
プにて、前記範囲判定ステップの判定した範囲に応じて
前記検索ステップから読み出されたデータの出力方法や
内容が制御される。
【0046】請求項10の発明においては、文字、表、
グラフ、図形等で構成されるデータを検索し、結果をデ
ータファイル名、データ内容、データファイル属性、デ
ータ特徴などの形式で出力するデータ検索装置であっ
て、以下の作用がなされる。検索手段が、検索者の指示
により、保存、放送、提供等されているデータから候補
データを読み出す。情報量測定手段が、前記検索手段に
おいて読み出された全データの情報量を測定する。範囲
判定部が、前記情報量測定手段により測定された情報量
の値があらかじめ決められたどの範囲であるかを判定す
る。出力制御手段が、前記範囲判定ステップの判定した
範囲に応じて前記検索手段から読み出されたデータの出
力方法若しくは出力内容を制御する。
【0047】請求項11の発明においては、文字、表、
グラフ、図形等で構成されるデータを検索し、結果をデ
ータファイル名、データ内容、データファイル属性、デ
ータ特徴などの形式で出力するデータ検索方法であっ
て、以下の作用がなされる。検索ステップにて、検索者
の指示により、保存、放送、提供等されているデータか
ら候補データが読み出される。情報量測定ステップに
て、前記検索ステップにおいて読み出された全データの
情報量を測定される。出力順制御ステップにて、前記情
報量測定ステップの測定値があらかじめ設定された制限
値を超えているか否かを判定し、制限値を超えている場
合には、前記検索ステップにより読み出されたデータを
あらかじめ決められた規則に従って並び替えて出力する
よう制御する。
【0048】請求項12の発明においては、文字、表、
グラフ、図形等で構成されるデータを検索し、結果をデ
ータファイル名、データ内容、データファイル属性、デ
ータ特徴などの形式で出力するデータ検索装置であっ
て、以下の作用がなされる。検索手段が、検索者の指示
により、保存、放送、提供等されているデータから候補
データを読み出す。情報量測定手段が、前記検索手段に
おいて読み出された全データの情報量を計測し、その値
があらかじめ設定された制限値を超えているか否かを判
定する。出力順制御手段が、前記情報量測定手段により
測定された情報量が制限値を超えている場合、前記検索
手段により読み出されたデータをあらかじめ決められた
条件で並び替え、その順で出力するよう出力手段に指示
する。
【0049】請求項13の発明においては、文字、表、
グラフ、図形等で構成されるデータを検索し、結果をデ
ータファイル名、データ内容、データファイル属性、デ
ータ特徴などの形式で出力するデータ検索方法であっ
て、以下の作用がなされる。検索ステップにて、検索者
の指示により、保存、放送、提供等されているデータか
ら候補データが読み出される。情報量順計測ステップに
て、前記検索ステップにおいて読み出された各データの
情報量を順に確認しつつ計測する。情報量測定ステップ
にて、前記情報量順計測ステップの結果に基づきそれま
での総和があらかじめ定められた制限値を超えているか
否かを判定する。出力検索制限制御ステップにて、前記
情報量測定ステップにより測定された情報量の総和が制
限値を超えた場合には、制限値に該当するデータ以降に
読み出されたデータは出力しない若しくは制限値を越え
た時点で検索を中止するよう制御する。
【0050】請求項14の発明においては、文字、表、
グラフ、図形等で構成されるデータを検索し、結果をデ
ータファイル名、データ内容、データファイル属性、デ
ータ特徴などの形式で出力するデータ検索装置であっ
て、以下の作用がなされる。検索手段が、使用者の操作
に基づく検索起動指示により、保存、放送、提供等され
ているデータから候補データを読み出す。情報量測定手
段が、前記検索手段において読み出された各データの情
報量を順に測定する。出力検索制限手段が、前記情報量
測定手段の測定した総和があらかじめ設定された制限値
を超えているか否かを判定し、制限値を超えた場合に
は、それ以降に前記検索手段により読み出されたデータ
は出力しない若しくは制限値を越えた時点で検索を中止
するよう制御する。
【0051】請求項15の発明においては画像データ存
在判断ステップにて、前記範囲判定ステップにて所定の
範囲にあると判断されたならば、前記検索ステップにて
検索された候補データの中に画像データが含まれている
か否かを判断する。前記範囲判定ステップ内の、画像デ
ータ量測定小ステップにて、同じく画像データが存在す
ると判断されたならば、そのデータ量を測定する。
【0052】前記出力制御ステップ内の、画像データ優
先配列小ステップにて、前記画像データ存在判断ステッ
プにて存在すると判断されたならば、画像データを先に
出力されるよう候補データの配列を調整する。同じく、
画像データ出力表示制御小ステップにて、前記画像デー
タ量測定小ステップにて画像データ量が所定値以上と判
断されたならば、画像データが出力される際にこれを縮
尺して、同一表示面に複数の画像データが同時に出力さ
れるよう制御する。
【0053】請求項17の発明においては、利用度情報
付加ステップにて、検索装置による検索の対象とされて
いる、そして保存されているデータ若しくは保存するデ
ータに経験則、データの意味内容、キーワード等から定
められた本来の検索の目的とされる確率についての情報
を検索に先立って付加する。前記出力制御ステップ内
の、付加利用度情報反映出力制御小ステップにて、前記
範囲判定ステップの判定した範囲に応じて前記検索ステ
ップから読み出されたデータの出力方法若しくは出力内
容を制御するに際して、前記利用度情報付加ステップに
て付加された情報を反映させる。
【0054】請求項19の発明においては、出力順制御
ステップが、前記出力検索制限制御ステップにより出力
を制限されないこととなったデータについては、あらか
じめ定められた所定の規則にのっとって並び替えて出力
するよう制御する。請求項16、18、20の発明にお
いては、各請求項15、17、19の発明と同じ作用が
なされる。
【0055】請求項21の発明においては、記事の意味
内容から定まる記事の欄の分類と該記事の記載されてい
る位置若しくはこれに併せての記載部分の形状、寸法、
記載部やその近辺の所定の記号、図形、写真、枠等記載
部分を特定するのに役立つ視覚的特徴との間に一定の関
係の存在する定型文書から目的とする記載を検索する方
法において、以下の作用がなされる。
【0056】定型性情報入力ステップにて、データの保
存者等より検索目的たる記事等が記載されている少くも
一の種類の定型文書について、その定型性についての情
報を検索に先立ってあらかじめ入力しておく。欄定型情
報入力ステップにて、検索者より検索目的たる記事の意
味内容から定まる記事の欄の分類若しくはこれに併せて
の該記事の記載されている定型文書の種類を検索キーと
して入力される。
【0057】記事情報入力ステップにて、検索目的たる
記事中の文章、単語、文字の少くも一について、少くも
一個を検索キーとして入力する若しくはこれに併せて記
載位置、近辺の所定の記号等をも検索キーとして入力さ
れる。請求項22の発明においては、記事の意味内容か
ら定まる記事の欄の分類と該記事の記載されている位置
若しくはこれに併せての記載部分の形状、寸法、記載部
やその近辺の所定の記号、図形、写真、枠等記載部分を
特定するのに役立つ視覚的特徴との間に一定の関係の存
在する定型文書から目的とする記載を検索する装置にお
いて、以下の作用がなされる。
【0058】定型性情報保持手段が、検索目的たる記事
等が記載されている少くも一の種類の定型文書につい
て、その定型性についての情報を検索に先立ってデータ
保存者等よりあらかじめ入力され記憶している。欄定型
情報入力手段が、検索目的たる記事の意味内容から定ま
る記事の欄の分類若しくはこれに併せての該記事の記載
されている定型文書の種類を検索キーとして入力する。
【0059】記事情報入力手段が、検索目的たる記事中
の文章、単語、漢字の少くも一方について、少くも一個
を検索キーとして入力する若しくはこれに併せて記載位
置、近辺の所定の記号その他色彩等をも検索キーとして
入力する。請求項23の発明においては、相前後する単
語間に余白を設ける言語で記載された文を対象として、
文中に存在する単語を検索キーとして、所望するデータ
ーの検索を行なうデーター検索にて、以下の作用がされ
る単語長検出ステップにて検索対象の文中の単語間の余
白から文中の各単語の長さを求める。検索キー単語長検
出ステップにて、検索キーの単語長を所定の手順で求め
る。
【0060】候補単語検出ステップにて、前記両検出ス
テップの結果をもとに、検索対象の文中から検索キーの
単語と同じ長さの単語を見出す。最終文字認識ステップ
にて、前記候補単語検出ステップにより見出された候補
単語に対して、文字認識を行なって検索キーの単語か否
かの判断を行なう。請求項24の発明においては、請求
項23の発明と同じ作用がなされる。
【0061】請求項25の発明においては、図形的な特
徴や使用される文字に一定の規則性が検出される定型的
な記載型式のデータを検出するデータ検出方法にて、以
下の作用がなされる。定型情報入力ステップにて、検出
対象のデータの定型性をあらかじめ入力する。図形利用
候補データ検出ステップにて、上記あらかじめ入力され
た定型情報の中から第一に図形的な特徴を利用して候補
データを検出する。文字認識利用候補データ検出ステッ
プにて、前記図形利用候補データ検出ステップにて検出
されたデータを対象として文字認識を行なうことにより
更に候補データを絞り込む。
【0062】請求項26の発明においては、請求項25
の発明と同じ作用がなされる。
【0063】
【実施例】以下、本発明を実施例に基づいて説明する。 (第1実施例)図1の(1)に、本発明に係るデータ検
索装置の第1実施例を採り入れたデータ保存装置の構成
を示す。本図に示すように、このデータ保存装置は、読
込部1と、保存部2と、検索部3と、検索指示部4と、
情報量測定部5と、検索出力適切対応部6と、出力部7
とを備えている。そして、情報量測定部5と検索出力適
切対応部6とを除くこれら各部は、基本的には従来のも
のと同一である。このため同一の符号を付してある。以
下、従来の技術欄と重複する部分もあるが、これら各部
を説明する。
【0064】読込部1は、キーボード、L/E変換部、
レーザディスクや磁気ディスク等からの読み取り部等を
有し、文字、表、グラフ、図形などからなるデータをコ
ードの集合やビットマップデータとして直接的、間接的
に読み込む。保存部2は、磁気ディスク等からなり、読
込部1により読み込まれた本来のデータを別途若しくは
読み込みの際にデータ作成者や装置の管理者等により作
成された検索用のキーワードや入力日時やデータの標題
等と対応づけて記憶し、管理し、また保存する。そし
て、この対応付けにより、検索用のキーワード、入力日
時、データの標題等からデータやデータの標題を検索す
ることが可能となっている。そして、勿論、全文検索も
可能としている。
【0065】更に、検索結果の出力の便宜のために各デ
ータ毎にその標題、データがビットデータかコードデー
タか等のデータの属性、データの内容や分類、記憶され
ている始点と終点の番地(address)等がいわば
タイトルとして併せて記憶され、またこのタイトルは独
立して読み出し可能とされ、更に標題等は表示等可能と
されている。この様子を図2に示す。また、これによ
り、タイトルから該当するデータを検索することも可能
である。なお、このことは図書館における書籍の分類、
収納状態や管理、検索の手段と基本的には同じである。
このため、その詳細な説明は省略する。
【0066】検索指示部3は、検索者のキーワードの入
力等の操作に基づいて、保存部2に保存されているデー
タの検索を検索部4に指示する。検索部4は、検索指示
部3からの指示に基づいて、該当するデータやそのタイ
トルのみをキーワード等を鍵として保存部2から検出す
る。情報量測定部5は、検索部4により検出された結果
たる候補データの情報量、本実施例では、個数を測定
し、その測定値を検索出力適切対応部6に出力する。こ
の際の手順を図1の(2)に示す。
【0067】検索出力適切対応部6は、処理対応表61
と処理対応表作成部62とを有している。そして、処理
対応表61は、図3の(1)に示すように、検索の結果
得られた候補データが全て検出された場合には、その情
報量の値に応じて、出力方法の指示や再検索の指示を行
うべく、処理内容が登録されている。なお、この表の内
容は、処理、対応表作成部62によりあらかじめ入力さ
れている。この際、情報量に応じての指示内容は、検索
者が1度に評価、確認、参照等可能な量に収まるように
されているが、基準となるデータ数そのものについて
は、データ管理者の経験に基づいて決定されている。具
体的には、ある検索条件での検索結果のデータ数が10
未満の場合には、各データの内容まで出力し、10以上
50未満の場合はデータの標題(タイトル又はファイル
名)のみ表示する。更に、データ数が50以上の場合に
は、検索条件を変更して再検索するよう検索者に要請す
るようにしている。
【0068】以上のもとで、検索出力適切対応部6は、
情報量測定部5から通知されたデータの個数をこの処理
対応表の値と比較して、適切な出力を行なうこととな
る。すなわち、データ数が10未満ならば、検出された
全ての候補データの内容を読み出して表示する。10以
上50未満ならばタイトルのみ表示す。50以上なら
ば、検索された候補データの個数と併せて別途のキーワ
ードの入力等、検索条件を変更して再検索する旨検索者
に表示する。この際の、出力の選択の手順を図3の
(2)に示す。
【0069】なお、検索の結果得られた候補データの標
題のみを一旦出力するよう別途あらかじめ検索者から指
示されている場合には、たとえデータ数が10未満であ
っても、標題のみが出力されるのは勿論である。次に、
上記装置の検索動作について、図4に示すフローチャー
トを参照しながら説明する。
【0070】検索に先立ち、あらかじめ読込部1から文
字、表、グラフ、図形などの電子化されたコードの集合
で構成されるデータが読み込まれ、保存部2に保存され
ている。検索者が、検索指示部3に検索鍵の入力を含む
起動を指示すると、検索指示部3がその指示を検索部4
に通知する(ステップS1)。
【0071】これにより検索部4が、保存部2から検索
条件に該当するデータを1つずつ検出し、そのタイトル
を情報量測定部5に送る(ステップS2)。検索条件に
合致する次のデータがあるか否かを判断し(ステップS
3)、次データがあればステップS2に戻って次のデー
タを読み出し、検索対象の保存されているデータがなく
なるまでステップS2〜S3の動作が繰り返される。
【0072】検索条件に合致するデータの検出が全て終
了した場合は、情報量測定部5が求められた検索結果の
候補データのタイトル数を求める(ステップS4)。そ
して、その値から、処理対応表を参照し、再検索が必要
か否かを判断する。候補データが全く存在しなかった場
合や検索結果が多くて別のキーワードの入力等再検索が
必要な場合には、その旨検索者に表示し、併せてステッ
プS2に戻って他の検索条件の入力を待ち、これによる
再検索を行うこととなる。一方、再検索の必要がなけれ
ば、検索の結果のデータの出力形式を、処理対応表に適
合するように選択する(ステップS5)。なお、本ステ
ップの具体的内容は図3の(2)に示す。
【0073】このため、候補データのタイトル数が10
以上50未満ならば、情報量測定部5に通知されている
全候補データのタイトルが出力され、同じく10未満な
らばそのタイトルに相当するデータが保存部2から全て
読み出され、出力されることとなる。検索結果のデータ
の所定の出力を終了すると、他の検索者等による次の検
索の入力を待つ(ステップS7)。
【0074】なお、本実施例では、検索結果のデータの
情報量としてデータ個数を採用しているが、これは図書
館類似のデータベースにおいて、検索者や候補データが
多数存在する場合の応答性を考慮したものである。従っ
て、応答性を特に問題としないならば、検索結果たる候
補データのページ総数であってもよい。その他、データ
をディスプレイに表示した時の表示領域サイズ、行数、
あるいはビット数等のサイズでもよい。
【0075】更に、検索対象のデータの種別に応じて、
適宜文字数、グラフの数、画像やイメージの数等の(情
報)量を基に出力を変更するようにしてもよい。なお、
これらの場合には、情報量測定部25には、各候補デー
タのページ数、行数、データの属性等をそのタイトル等
から調べたり、また各候補データのタイトルにページ数
やデータ属性等についての情報が付されていない場合に
は、直接保存部2から読み出して調べたりする候補デー
タ量内容調査部分を有しているのは勿論である。
【0076】また、情報量としてデータの行数やビット
数が採用された場合には、画像データや映像データに対
しては、必要に応じて「画像1枚は文書20桁に相当」
等の換算基準も入力されたりするのも勿論である。次
に、情報量によるデータ処理の指示の内容やその判断基
準となる値は、本装置の管理者があらかじめの経験に基
づいて最適な値を設定しておいてもよいし、検索者が検
索の対象とするデータの内容に応じて最適なものを指定
するようにしても良い。
【0077】同じく、再検索時の条件については、検索
者に新たな検索条件を参考に示してその中から指定させ
るようにしても良い。具体的には、前回の検索時に与え
た条件にキーワードを追加する形式を薦めても良いし、
画像情報化してページめくり態様で検索する等全く新た
な検索条件を薦めるようにしても良い。そして、これら
の推奨される形式は、本装置の管理者等がその経験に基
づいてあらかじめ本装置に入力しておき、必要に応じて
CRTに表示される等していてもよい。
【0078】さらにまた、候補データの出力に際しての
処理とは、検索結果を印刷出力するよう検索者に指示さ
れている場合において、その頁数が極めて多いときに
は、検索者の指示にもかかわらず、頁数が極めて多い旨
とタイトルのみ印刷出力する等であってもよい。以上の
説明でわかるように、本実施例では、検索結果たる候補
データの量によってその出力を変更等するので、候補デ
ータが多量の場合に、検索効率の向上、出力に伴う費用
の低減等が図れる。
【0079】またこの際、検索者やデータの保管者の経
験等も有効に活用しえるので、上記効果が一層増す。な
お、これら第1実施例の変形例は、後に説明する他の多
くの実施例においても適用しえるのは勿論である。 (第2実施例)図5の(1)に、本発明に係るデータ検
索装置の第2実施例を採り入れたデータ保存装置の構成
図を示す。このデータ保存装置は、読込部1と、保存部
2と、検索部3と、検索指示部4と、情報量測定部5
と、出力データ選択部6と、出力部7とを備えている。
これら各部のうち、先の第1実施例と同一の構成のもの
については同一の符号を付すことによりその説明は省略
し、以下固有の構成たる出力データ選択部26を中心に
し説明する。
【0080】出力データ選択部26は、情報量測定部5
により測定された情報量が制限値を超えている場合に
は、検索部4により読みだされたデータについて特定の
条件により分類し、この上で分類内容毎に出力を行うか
否かを指示する。出力部7は、出力データ選択部26に
より出力を指定されたデータを出力する。
【0081】次にこの動作の内容をより詳細、具体的に
説明する。情報量測定部25は、検索条件に合致する全
てのデータのタイトルを得、その値があらかじめ決めら
れた制限値を超えた場合には、出力データ選択部26に
その旨を通知する。このため、たとえば、制限値として
の情報量がデータ数30とした場合に、検索条件に合致
した候補データ数が25ならば、出力部7に全データを
全て出力するよう指示する。ところが、もし候補データ
数が40だった場合には、情報量測定部5は出力データ
選択部26に制限値を超えていることを通知する。この
通知を受けた出力データ選択部26は、特定の条件によ
りデータを分類し、この分類毎に出力するか否かを指示
することとなる。その条件であるが、本実施例では、 (1)ビットマップデータであれコードデータであれ画
像のあるデータを優先して表示する。
【0082】(2)画像データが多数存在するならばC
RTの表示面を4分割し、画像データも1/4に縮小し
て一の表示面に同時に4つの画像データが表示されるよ
うにする。 (3)文字データであるならば、ページ数の少ないもの
を優先して表示する。 (4)一応は、全てのデータを表示する。
【0083】という4種のものを採用している。以上の
結果、候補データから検索者が、いわゆるパラパラとペ
ージをめくる態様で、すなわち視覚による画像認識で目
的とするデータの検索を行なうこととなる。以上説明し
た、本実施例のデータ出力の選択手順を図5の(2)に
示す。
【0084】なお、それでも目的とするデータが得られ
ない場合には、他の手段によることとなるのは勿論であ
る。また、画像データの1/4の縮小は、上下方向は走
査線を一本毎に間引き、左右方向は画素を一個毎に間引
くこと等によりなされるが、その詳細は周知技術である
ため省略する。また、候補データの再配列等も同様に省
略する。
【0085】以上のごとく、本実施例では確認容易な候
補データから調べていくこととなるため、迅速な検索が
可能となる。次に、本実施例の変形例について説明す
る。 (第2実施例、第1変形例)一度でも見たことのある資
料ならば、その資料の表紙の図形的な印象や内部の絵画
等は人の記憶に残っていることが多い。そこで、候補デ
ータが、多数存在し、しかもそれらが書籍等多数のペー
ジからなるものであるときには、図形としての表紙を、
もし該当する記載の有る一部のページに絵画等が含まれ
ている場合には、そのページをも併せて確認のためCR
Tに表示可能なようにしている。
【0086】これにより、ページめくり態様で図形化さ
れた候補データを視覚的に確認することにより迅速に確
認することが可能となる。 (第2実施例、第2変形例)本実施例は、文字放送の中
から意図する放送を迅速に選択することに関する。な
お、本実施例の構成そのものは、文書データの読込部
1、保存部2に換えて文字放送局があり、検索指示部3
や検索部4に換えてチャネル切換部やチャネル条件入力
部が存在するだけであるため、わざわざ固有の構成を図
示しての説明は省略する。
【0087】さて、文字放送の対象となっているデータ
の内容によっては、視覚的かつ同一分類ではあるが内容
が多種のものが多々存在する。例えば、天気予報等であ
る。具体的には、本日の午前の予報、午後の予報、明日
の予報、月間予報、長期予報、それも北海道、関東、九
州等地域毎になされている。この場合、現在東京に住ん
でおり明日北海道へ出張する人にとって、九州の予報等
全く必要がない。
【0088】このため、本変形例では天気予報が検索対
象とされた場合に、多数の内容の天気予報が候補データ
として検索され、この上で縮尺されて同一画面に同時に
表示されることになる。次いで、視覚により意図するも
のを見出した視聴者は、縮尺画像に同時に表示されてい
るチャネル番号をもとにその放送局にチャネルをあわせ
る。これにより、意図する明日の北海道の予報、若しこ
れがないならば明日の東日本、北日本の予報を見ること
となる。
【0089】この結果、一々ページをめくる態様での検
索は不必要となる。似たことは、株式の放送等について
もいえる。ひいては、東京株式市場やニューヨーク株式
市場での、自分の注目する会社の株価等の確認が迅速に
なされる。 (第3実施例)図6の(1)に、本発明に係るデータ検
索装置の第3実施例を採り入れたデータ保存装置の構成
を示す。このデータ保存装置は、読込部1と、保存部2
と、検索部3と、検索指示部4と、情報量測定部5と、
同一分類データ抽出部36と、出力部7とを備えてい
る。これら各部のうち、先の第1実施例と同じ構成のも
のについては、同一符号を付すことによりその説明は省
略し、以下固有の構成たる同一データ属性抽出部36を
中心にして説明する。
【0090】情報量測定部5は、検索部4により読み出
されたデータの情報量を測定し、その値があらかじめ決
められた制限値を超えているか否かを判定する。同一分
類データ抽出部36は、情報量測定部5により測定され
た情報量が制限値を超えている場合には、検索部4によ
り読みだされた候補データを特定のデータファイル属性
あるいはデータ特徴等により分類し、同じ分類のデータ
が複数存在することとなる分類に属するデータのみを抽
出して出力するよう出力部7に指示する。このため、か
かる場合には、出力部7は、同一分類データ抽出部36
により出力を指定されたデータを出力することとなる。
【0091】次に、この動作の内容をより詳細、具体的
に説明する。たとえば、情報量をデータ数とし、あらか
じめ決められた制限値が30の場合に、検索条件に合致
するデータ数が25のとき、出力部7はデータを全て出
力する。ところが、合致するデータ数が32のときに
は、情報量測定部5は同一分類データ抽出部36に制限
値を超えていることを通知する。この通知を受けた同一
分類データ抽出部36は、あらかじめ与えられた条件で
分類したときに同じ属性を持つデータが複数個存在する
データについてのみ出力するよう出力部7に指示する。
例えば、今日作成されたデータという条件で検索し、
図7に示すように39個が該当したとする。
【0092】「データの内容」で分類した結果、天気予
報、会議議事録、テストサンプルデータがそれぞれ複数
存在するため、これらのデータ分類に属するデータのみ
が出力されることになる。以上のデータ出力の選択の手
順を図6の(2)に示す。これにより、検索対象の可能
性の高い候補データ、利用に供される頻度が高いデータ
が優先して出力されるため、検索効率が向上する。
【0093】また、文字放送においては、言語による分
類を採用していた場合に、外国語による放送の排除等な
しえる。 (第4実施例)図8に、本発明に係るデータ検索装置の
第4実施例を採用したデータ保存装置の構成を示す。こ
のデータ保存装置は、読込部1と、保存部2と、検索部
3と、検索指示部4と、情報量測定部5と、非同一分類
データ抽出部46と、出力部7とを備えている。これら
各部のうち、先の第1実施例と同じ構成ものについて
は、同一の符号を付すことにより、その説明は省略し、
本実施例固有の構成を中心に説明する。
【0094】情報量測定部5は、検索部4により読み出
されたデータの情報量を測定し、その値があらかじめ決
められた制限値を超えているか否かを判定する。非同一
分類データ抽出部46は、情報量測定部5により読みだ
されたデータを特定のデータファイルあるいはデータ特
徴等により分類し、同じ分類となるデータが存在しない
分類データのみを抽出して出力するよう出力部7に指示
する。このため出力部7は、非同一分類データ抽出部4
6により出力を指定されたデータのみを出力することと
なる。
【0095】次にその動作の内容をより具体的に説明す
る。情報量測定部5は、検索された各データの情報量を
測定し、検索条件に合致する全てのデータ情報量を得、
その値があらかじめ決められた制限値を超えた場合は、
非同一分類データ抽出部46に通知する。このため、た
とえば、情報量をデータ数とした場合に、検索条件に合
致するデータ数が25のとき、あらかじめ決められた制
限値が30の場合には、出力部7はデータを全て出力す
ることとなる。
【0096】ところが、合致するデータ数が39のとき
には、情報量測定部5は非同一分類データ抽出部46に
制限値を超えていることを通知する。この通知を受けた
非同一属性データ抽出部46は、あらかじめ与えられた
条件で分類したときに同じ分類に属するデータが他に存
在しない、すなわち1の分類に1のデータが存在するこ
ととなるデータについてのみ出力するよう出力部7に指
示する。
【0097】例えば、分類の条件をデータの内容とし、
図7に示すような候補データが検索された場合には、日
報、仕様書がそれぞれ1つだけ存在するため、これら2
データが出力されることになる。ここに、データの内容
であるが、本実施例では、図2に示すタイトルの一部た
る分類欄の一番下の段の記載を利用している。
【0098】これにより、内容が一般的であるため多数
の分類に属することとなるデータの出力が排除される。
ひいては、専門的なデータを検索する場合に、検索条件
に最っとも適合しているデータのみ出力され、データの
検索効率が向上する。また、在日かつ日本語に上手でな
い外国人が文字放送を見ようとする場合、日本語放送は
排除されたりもする。
【0099】なお、候補データを分類する条件は、デー
タの保管管理者により一括して指定されてもよいし、ま
た検索者により検索の都度指定されるようにしてもよ
い。また、この際、候補データのキーワードに着目する
ようにしてもよい。すなわち、ある特定の候補データを
とってきたとき、その候補データに付されているキーワ
ードをキーワードとする他の候補データが所定数存在す
るならば、その特定の候補データは出力しないというふ
うにしてもよい。これにより、一般的な候補データの排
除がより達成される。 (第3実施例と第4実施例の折衷例) (1) 各分類毎に、その分類に属するデータから、所
定数づつ出力するようにしている。これにより、候補デ
ータの内容の巾が広がり、一般利用者による検索に対し
て、効率的となる。 (2) 複数の分類に属することとなるデータを優先し
て出力するようにしている。これにより、候補データの
内容の巾が広がり、一般利用者の検索の効率が増大す
る。 (第5実施例)図9に、本発明に係るデータ検索装置の
第5実施例を採用したデータ保存装置の構成を示す。こ
のデータ保存装置は、読込部1と、保存部2と、検索部
3と、検索指示部4と、情報量測定部5と、出力内容制
御部56と、出力部7とを備えている。これら各部のう
ち、先の第1実施例と同じ構成のものについては、同一
の符号を付すことによりその説明は省略し、本実施例固
有の構成を中心に説明する。
【0100】情報量測定部5は、検索部4により読み出
された全候補データの情報量を測定する。出力内容制御
部56は、図10に示すような出力方法対応表を保持し
ており、情報量測定部5により測定された情報量の値か
らデータの出力方法を出力方法対応表を用いて求め、出
力部7に指示する。このため、出力部7は、出力内容制
御部56により指定された出力方法でデータを出力す
る。
【0101】次に、この動作の内容をより具体的に説明
する。情報量測定部5は、検索された各候補データの情
報量としてのタイトル数を測定し、その総和を求めて出
力内容制御部56に通知する。出力内容制御部56は、
情報量測定部5により測定された情報量の値と出力方法
対応表から、検索部4より読みだされた候補データの出
力方法を出力部7に指示する。このため、たとえば、情
報量をデータ数とした場合に検索条件に合致するデータ
数が25のとき、図10に示す出力方法対応表から、出
力部7にはデータタイトルとデータファイルの属性を出
力するよう指示がなされることになる。
【0102】以上の他、検索者は候補データ数が多い場
合には、例えば画像を含む候補データのみ表示させて、
図形としての候補データを視覚的に確認し、意図するも
のを発見し、また意図せざるものを排除等することも可
能である。ひいては、検索効率が向上する。 (第6実施例)図11に、本発明に係るデータ検索装置
の第6実施例を採用したデータ保存装置の構成を示す。
このデータ保存装置は、読込部1と、保存部2と、検索
部3と、検索指示部4と、情報量測定部5と、出力順制
御部66と、出力部7とを備えている。そして、先の第
1実施例と同じ構成のものには同一の符号を付してその
説明は省略し、本実施例固有の構成を中心にして説明す
る。
【0103】情報量測定部5は、検索部4により読み出
された全データの情報量を測定し、その値があらかじめ
決められた制限値を超えているか否かを判定する。出力
順制御部66は、情報量測定部5により測定された情報
量の値が制限値を超えている場合、検索部4より読みだ
された候補データをあらかじめ決められた条件で並び替
え、その順で出力するよう出力部7に指示する。このた
め、出力部7は、出力順制御部66により指定された出
力順で候補データを出力することとなる。
【0104】次に、この動作の内容をより具体的に説明
する。情報量測定部5は各候補データの情報量を測定
し、その総和があらかじめ決められた制限値を超えた場
合には出力順制御部66にその旨通知する。この通知を
受けた出力順制御部66は、検索部4より読みだされた
データをあらかじめ決められた条件、例えば作成日付順
に並びかえ、この上で出力部7に送る。一方、情報量が
制限値を超えなかった場合には、検索部4により読み出
された順で出力することとなる。
【0105】次に、作成日付順で出力することである
が、これは最近、近年の資料であるならば検索者の印
象、記憶が鮮明であるだけに、多くのキーワード等を入
力することにより候補データを絞り込むことが可能であ
る。しかし、それができず、候補データが多数検索され
たのであるから、本来意図するデータは昔のものである
可能性が高いことを考慮したものである。
【0106】次に、何度も改定がなされている書籍につ
いては、昔の版が検索対象となることは少ない。また、
内容によっては、昔のデータが検索対象とれれることは
少ない。このため、データの内容、分類に応じて作成日
時や入力された日時が新しい順に配列されて出力される
ようにしてもよい。これにより、例えば新聞社における
記事作成等において、読者、記者の印象に残っている事
件ほど引例として使用され、過去の事件は引例として使
用されることは少なくなり、ひいては検索結果の利用性
の向上も図られる。
【0107】また、ビデオ・オン・デマンドシステムに
おいて、フィルムの指定に先立ち、原作者がキーワード
として入力された場合、大作家の名作ほど何度も映画化
されていることが多いが、この場合にはその製作年代の
新しいもののタイトルが表示されることとなる。そし
て、これにより、検索効率が向上する。 (第7実施例)図12に、本発明に係るデータ検索装置
の第7実施例を採用したデータ保存装置の構成を示す。
このデータ保存装置は、読込部1と、保存部2と、検索
部3と、検索指示部4と、情報量測定部5と、出力制限
部76と、出力部7とを備えている。なお、先の第1実
施例と同じ構成のものについては、同じ符号を付すこと
によりその説明を省略し、本実施例固有の構成を中心に
説明する。
【0108】出力制限部76は、情報量測定部5により
測定された情報量の総和が制限値を超えた場合には、そ
れ以降に検索部4より読みだされたデータを出力しない
よう出力部7に指示する。このため、出力部7は、出力
制限部76により出力を制限されなかったデータのみを
出力することとなる。次に、この動作の内容を具体的に
説明する。
【0109】情報量測定部5は、検索された各データの
情報量を測定し、その総和があらかじめ決められた制限
値超えた時点で出力制限部76に通知する。この通知を
受けた出力制限部76は、検索部4から読み出されたデ
ータを順に出力部7に転送するのを中止する。このた
め、例えば、制限値がデータ数で20とあらかじめ決め
られていた場合は、検索部3から読み出された順に20
個のデータのみが出力部7に出力されることとなる。
【0110】これにより、大図書館等で検索装置を利用
する人が多い場合に、装置を多数の人が利用しうる。こ
とに、印字機の能力の都合で出力が、ひいては利用者数
が制限される等の不都合がなくなる。また、候補データ
数か20ともなれば以降の検索を中止して出力するた
め、装置の応答性も改善される。
【0111】なお、ここに制限値を20としたが、これ
はデータの属性、内容等に応じて適宜最適なものとする
ようにしていてもよい。また、本実施例では、データの
保存は検索の対象とされる頻度の高い順に配列しておく
のがより効率的となるであろう。 (第5実施例と第6実施例の変形例) (1) 候補データの個数が制限値を越えた場合には、
ページ数若しくは行数の少ないデータを優先して制限値
だけ出力するようにしている。
【0112】これにより、新聞、雑誌等広い範囲の候補
データが入手しえる。 (2) 上記(1)とは逆に、ページ数若しくは行数の
多いデータのみ制限値の1/5の値のデータ数だけ優先
して出力する。これにより、候補データの重複した記載
を排除しえ、ひいては真に得たい資料のみ入手しえる確
率が向上する。 (第8実施例)図13に、本発明に係るデータ検索装置
の第8実施例を採用したデータ保存装置の構成を示す。
このデータ保存装置は、読込部1と、保存部2と、検索
部3と、検索指示部4と、情報量測定部5と、出力制御
部86と、出力順制御部87と、出力部8とを備えてい
る。そして、先の第1実施例と同一の構成のものについ
ては同一の符号を付すことにより、その説明は省略し、
本実施例固有の構成を中心に説明する。
【0113】情報量測定部5は、検索部4により読み出
された各データの情報量を測定し、その総和があらかじ
め決められた制限値を超えているか否かを判定する。出
力制限部86は、情報量測定部5により測定された情報
量の総和が制限値を超えた場合、それ以降に検索部4よ
り読みだされたデータを出力しないよう出力順制御部部
87に指示する。
【0114】出力順制御部87は、出力制限部86によ
り出力を制限されなかったデータについて、あらかじめ
決められた条件で並び替え、その順で出力するよう出力
部8に指示する。このため、出力部8は、出力順制御部
87により指示された順でデータを出力することとな
る。次に、この動作の内容を具体的に説明する。
【0115】情報量測定部5は、検索された各データの
情報量としてのタイトルを数え、その総和があらかじめ
決められた制限値である30を超えた時点で出力制限部
86と出力順制御部87にその旨を通知する。この通知
を受けた出力制限部86は、これ以降検索部3から読み
出されたデータを順に出力順制御部87に転送するのを
行わない。
【0116】出力順制御部87は、この通知を受けた場
合には、出力制限部86より連送されたデータをあらか
じめ決められた条件、例えば作成日付順でソートし、出
力部8に送る。このように、情報量が多い場合は先に読
みだされたデータのみを出力させるため、使用者による
検索結果の確認が容易となる。
【0117】また、結果出力の応答が早いため、効率的
なデータ検索を行うことができる。 (第9実施例)本実施例は、検索の対象となっている資
料、データ側にも工夫を凝らしてある。以下、最初にこ
の背景となっている事実について説明する。
【0118】図書館等で、閲覧の対象、貸出しの対象と
なっている書籍、資料は自ずと一定の傾向、性質があ
る。ひいては、検索の対象、目的となるデータについて
も一定の傾向、性質がある。具体的には、例えば古代日
本の倭女王「卑弥呼」に関する資料を検索しようとする
場合、通常の図書館で一般人が参照しようとする資料
は、歴史学者等が一般人向け、あるいはアマチュア
(?)向けに著した本等である。そして「三国志の魏志
倭人伝」や「魏略の逸文」の本文そのもの(原文)が対
象となることはまずない。
【0119】同じく、一般相対性理論についても大学の
物理の教授等が一般人向けに解説した本が参照の対象と
なり、「HARMANN WEYL著「RAUM ZE
ITMATERIE」等が参照の対象となることはまず
ない。大学の図書館等では、逆であろう。そして、この
ことは大なり小なり他種のデータの検索に際しも見受け
られる事実である。このため、検索者の如何にもよる
が、滅多に検索の対象とされることのないデータには、
あらかじめその旨とその理由を示す印が付されて保存、
管理されている。
【0120】一般向けの図書館であるならば、その理由
とは、 (1)専門書 (2)外国語(特に英語でない)。 (3)旧版等データそのものが旧い。 (4)上記(1)、(2)とも重複するが難解である。 (5)狂信家の著書等内容に問題点が多い。 (6)訴訟記録等内容が特殊である。 (7)エロ.グロ等公序良識に反しかねないあるいは成
人向けであり、一般の利用に共するのに難がある。
【0121】等である。この一方で、よく利用される。
ひいては検索の対象となる資料も大体の傾向が存在す
る。具体的には、(1)有名な先生、その道の大家の著
した本、(2)官公庁による一般公衆等を対象とした公
的な出版物や報告書、若しくはこれに準じた資料。
【0122】(3)全国的な日刊新聞紙、(4)著名な
総合雑誌、(5)特定の出版社から刊行された本や雑
誌、等である。このため、保存されているデータにはそ
の旨の情報があらかじめ付されている。
【0123】図14に本実施例における資料の保存、管
理の様子を示す。図2に比較した場合、タイトル欄の先
に利用度とその理由を記載した欄が設けられているのが
異なる。本図において、「工業所有権法逐条解説(第1
2版)」という本は、「官公庁による公的な出版物や報
告書若しくはこれも準じた資料である」ため「利用者が
大」であるのがわかる。
【0124】なお、この一方で第11版以前のもの(図
示せず)は、「データそのものが旧い。」という理由の
もと「(3)」の符号を付された上で、その利用度は
「小」となっているのは勿論である。次に、これらの資
料が検索の候補データとなった場合等においては、この
「利用度及びその理由」が出力の有無等の判断資料とさ
れる。
【0125】従って、今まで説明してきた第1実施例か
ら第8実施例までのデータ検索装置において、入力され
たキーワード等の検索条件に適合する候補データ数が多
量の場合には、利用頻度の高い資料のみ出力されるよう
にする。また、利用度の低い資料、そして多くの場合保
存されている資料の過半を占める、は通常の検索ではそ
もそも候補データとされない。これにより、検索効率の
向上を図る。
【0126】なお、この場合、滅多に利用されないため
原則として検索対象とされない、そして出力をされない
こととなる資料は、その様な資料が存在すること及び出
力されない理由が表示等され、別途の入力等で出力され
るようになっているのは勿論である。また、直接その資
料を特定する入力がなされた場合等は、出力されるのも
勿論である。
【0127】また、利用度は検索者の如何によって変化
するため、これをも反映するようにしてもよい。この場
合には、検索者が一般大衆、大学の先生、学生等のいず
れに属するかも入力され、更に利用度のリストもそれら
に応じて作成されているのは勿論である。以上の動作流
れを図15に示す。 (第9実施例の変形例) (1)各資料毎に経験則等に基づく利用頻度を反映した
重み付けをなしておき、候補データの量に応じて、利用
頻度の高い資料より出力等されるようにしている。
【0128】同じく、キーワードに対応しての利用頻度
を調べ、これを反映させるようにしている。具体的に
は、外国語、専門語がキーワードとして入力された場合
には、専門書が高くされ、一般大衆向けの雑誌等は低く
評価される等である。なお、この場合には、専門語には
これを示す印が付されているのは勿論である。 (2)外国語言語をも採用したビデオ、オン・デマンド
システムや国際的な通信網を介してのビデオ、オン・デ
マンドシステム(1の映像に対して、複数の言語の音声
が対応する。)において、我国からの要求に際しては、
映像に対応する音声は日本語とする。 (3)外国語言語による文字放送において、我国での要
求に対しては、日本語放送を優先する。 (第10実施例)本実施例は、検索そのものに関する。
以下、本実施例そのものの説明に先立ち、背景技術や背
景事実について説明する。
【0129】特許情報、新聞、雑誌等、検索の対象とし
て利用されることの多い書籍データ類は、記載内容と記
載位置や図形的特徴に一定の規則が存在する。新聞紙を
例にとるならば、 (1)日付は、最上段の線の上に記載されている。 (2)第一面は社会、政治記事等、紙面(頁)と記事の
意味内容が定められている。 (3)漫画は、4コマのものは最後から2面の最左側の
上部に、政治、社会を風刺したものは第一頁めの面若し
くはその裏面の下半分の位置に掲載される。また、枠で
かこまれている。更に、4コマ漫画は最上段に標題が記
載され、登場人物の会話(台詞)は線で囲まれている。 (4)通常の訃報は、最後から2頁めの面の下側、かつ
死亡者名の右側に黒線が付される。また、広く知られた
人物では、同時に写真も掲載される。 (5)通常の人物写真の形状は長(正)方形又は楕
(円)である。 (6)広告は、全面広告や広告欄を除き原則として紙面
の最下部である。 (7)過半の記事は、直線等で囲まれたりして区分され
ている。 (8)「天声人語」等所定の記載は、所定の位置に記載
されるだけでなく、所定の図形が付されたりしている。 (9)見出し等は、大きな文字とされる。等である。
【0130】ところで、現在手書き文字や印刷文字の機
械装置による光学的読取速度は、ワークステーション等
小型のものならば手書き文字であるならば10文/秒、
多少大型のものならば100字/秒程度である。また、
大企業等が備えるような本式なものならば、更にこの速
度は大である。次に、印刷文字であるならば、新聞等字
体、文字形状、寸法等が一定かつ主として当用漢字が使
用されるものならばより早く、10万字/秒を超えるも
のさえ出現しつつある。また、コードデータならば、こ
の速度は更に早い。
【0131】さて、実生活において、昔読んだことのあ
る記事を再度読みたい、あるいは昔どこかで読んだこと
のある内容であるが再度あたってみたいと思うようなこ
とが多々ある。特許関係における先行技術の調査、新聞
社における記者が記事を書くに際しての調査等では、こ
の要請は更に大きい。ところで、現在、新聞紙一面あた
りの文字量は1万字である。この際、参照を欲する記事
の内容が、広告、科学技術、家庭、政治等定まれば、こ
れにより、該記載が新聞に記載されている紙面が自ずと
定まり、更に随筆、直線で囲まれている等他種の情報も
得られることが多い。従って、キーワード等の検索キー
と併せて大まかな掲載年月日等検索者の何等かの記憶に
よる検索候補データの絞り込みをなしえれば、後は定型
性を利用して最終的な絞り込みを行ない、最後に参照を
欲する記事中の文書中の記者の記憶に残っている単語や
文字、特に漢字、をもとに当該記事の検索を行なうこと
が可能となる。この際、検索者の記憶に残っている単語
や漢字は、その性質上新聞紙の同一面の他の記事に使用
されないものであることが多い。特に、複数の場合には
なおさらである。また、多くは見出し等大きな文字で記
載されたものである。このため、これらをも検索に利用
しえれば、更に容易となる。 また、図形的な記憶があ
れば、これをも入力可能として、検索に利用しうるよう
にすれば、更に効率は向上する。
【0132】本実施例は、これを利用したものである。
以下、本実施例そのものを説明する。図16の(1)
は、その構成図である。本図において161はデータ保
存部であり、162は定型性情報保持部であり、163
は一般検索部であり、164は定型性利用単語文字検索
部であり、165は出力部であり、167は一般検索鍵
入力部であり、168は単語文字入力部であり、169
は欄定型情報入力部である。
【0133】定型性情報保存部162は、データの保存
管理者が保存すべきデータをデータ保存部161に入力
するに際して、その定型性情報を入力され、これを利用
可能な態様で記憶している。一般検索部163は検索者
が一般検索鍵入力部167から入力した、著者、記事の
分類、月日、キーワード等の鍵をもとにデータ保存部1
61の保存されているデータを検索し、該当するものを
定型性利用単語文字検査部164に出力する。単語文字
入力部168は、検索者から記事中の単語、文字等最終
的な検索鍵として入力されて欄定型情報入力部167
は、検索目的の記事が有する各種特徴のうち定型性情報
保持部162に保存されている定型性に関係する特徴を
第2段階の検索鍵として入力される。このため、検索者
は入力に先立ち、必要な定型性情報についての指示書等
を参照したりする。なお、ここに入力される検索鍵の内
容は、新聞名、検索目的の記事の種類、例えば訃報、家
庭欄、料理欄、スポーツ、科学技術等の種類、その他記
憶している内容で指示書に記載されている事項、例えば
枠で囲まれていたか否か、記事中の写真や色彩の有無、
字体、大きな見出しの有無、大体の掲載位置や記事の所
属する欄の名称、例えば「余録」、「天声人語」等であ
る。定型性利用単語文字検索部164は、一般検索部1
63から送られてきた候補データを欄定型情報入力部1
69から入力された定型性に関する情報を基に、定型性
情報保持部162から必要な情報を読み出して絞り込み
を行なう。この上で、単語文字入力部168から入力さ
れた記事中の単語や文字をもとに最終的な検索を行な
う。これにより、目的とする記載が検索される。なお、
本が検索目的である場合には、その本の厚さ、大きさ等
の図形的特徴も定型性情報として使用される。そして、
この場合には、保存部中の候補データの記憶されている
場所(スペース)の広さとの比較も本の厚さによる絞り
込みの一環としてなされる。
【0134】以上の検索の手順を図16の(2)に示
す。なお、新聞、雑誌等の定型性は発行年等により適宜
変更されるため、定型性情報保持部162の保持する定
型性の規則は年代等に応じて整理されてのは勿論であ
る。 (第10実施例の第1変形例)第10実施例は、日本語
の新聞であったが、欧米系の言語の新聞にあっては、イ
タリック体、太字体等が定型性情報、検索キーとして採
用され、あるいは入力されたりする。また、単語間に余
白があるため、各単語や文字の認識に先立って、
「i」、「1」等単語長に影響を及ぼす文字、数字が認
識対象の単語に含まれている場合には特に、単語長を基
に図形的に先行検索を行ってもよい。また、ドイツ語に
あっては、たとえ文中であっても名詞の先頭の文字は大
文字とされる。従って、たとえ同じ文字数でも、名詞は
動詞よりも単語長が長くなる。従って、これも各文字の
認識に基づく単語認識に先立って、文中の候補単語の絞
り込みに利用しうる。図17に、これらの様子及び手順
を示す。本図において、(1)は英語文書の一部であ
り、(2)はドイツ語文であり、(3)は検索手順図で
ある。本図の(1)において、同じ2文字からなる英単
語であっても、「is」は「i」の存在のため「be」
より単語長(黒画素の水平方向長さ)が短くなっている
のがわかる。同様に、(2)において4文字からなる単
語「Baum」は大文字「B」のため「hoch」より
長くなっている。従って、文字認識に先立ち、単語長に
よる絞り込みが可能となる。 (第10実施例の第2変形例)次に、科学技術では特
に、材料毎の温度と引張り強度の関係、同じく温度によ
る腐蝕量等、テーブルやグラフで表現されるデータが検
索対象とされることが多い。そしてまた、これらのデー
タは検索対象の文献にテーブルやグラフの形式で記載さ
れていることが多い。
【0135】ところで、テーブルやグラフは、言語、技
術分野を問わずほぼ同一の形式である。すなわち、まず
第一に横書きであり、グラフならば二次元のXY座標で
示され、かつX軸(左右方向)は時間等であり、またY
軸は伸び等であったりする。テーブルならば、各材料毎
に100℃、500℃等区切りのよい温度毎に比重や粘
度が記載され、かつ所定の区分け線が上下、水平方向に
記載されている等である。また、時間や物性値等は、例
えば時間ならば、「時間」、「T」、「t」、「分」、
「sec」等一定の形式で記載されている。このため、
検索装置にテーブルやグラフの図形としての定型性や使
用される文字の規則をあらかじめ記憶させておき、その
記憶をもとに所望するテーブルやグラフを検出すること
が可能となる。なお、この場合にも、別途のキーワード
のよる文献の絞り込み、文字認識による最終確認等が併
用されれば、その効率が一層高まるのは勿論である。そ
してこの場合、図16の(1)に示す構成図は、定型性
情報保持部162等換えて、テーブル、グラフに対する
図形及び文字情報保持部等を有することとなる。また、
図16の(2)に示す「欄定型情報による絞り込み」
は、「テーブル、グラフに対する図形的及び文字的に特
徴づける情報による検出や絞り込み」となり、更に検索
対象の文献は、新聞でなく、広く科学技術文献一般とな
る。これにより、難解な外国語候補データの各単語や文
字の確認の手間もはぶける。
【0136】以上、本発明を実施例に基づいて説明して
きたが、本発明は何も上記実施例に限定されないのは勿
論である。すなわち、以下のようなものも本発明に含ま
れる。 (1)製造等の都合で、本発明の一つの必要不可欠な構
成要素(要件、ステップ、手段)を複数のものとしてい
る、あるいは逆に複数の構成要素を一体のものとしてい
る、更にはこれらを適宜組み合わせている。 (2)現在の検索装置に改造を施したり、必要なプログ
ラムを新規に記憶させたりして本発明に係わる作用、効
果を発揮させる。 (3)検索対象は、ビットマップデータ、コードデー
タ、文字放送に限定されず、ビデオ、オン・デマンドレ
スシステムにおける映画や音楽の放送としている。な
お、映画の場合、タイトルとしては標題の他に監督や主
演俳優名等が含まれるのは勿論である。これにより、
「伊豆の踊り子」、「青い山脈」、「侍日本」等何度も
製作された映画の区別がなされる。同じく、交響曲なら
ば指揮者名も含まれる。 (5)また、各検索者は所持する個人用の、そして個人
の作成したデータ保存装置であり、検索対象のデータは
各人がワードプロセッサで作成した文である。 (6)候補データが多量の場合には、特定の外国語、特
定の著者、新聞記事文書 のみのデータ等所定の分類に属するものを排除するため
の新規な排除キー依頼が表示されるようになっている。 (7)検索者の指示のもと、全文検索が可能となる。
【0137】
【発明の効果】以上説明してきたように、本発明によれ
ば、入力されたデータを保存する保存手段と、検索され
た全候補データの情報量を計測し、その値により通常の
出力や検索者の指示する出力そのままにするか否かを判
断したり、出力方法を選定したり、再検索等を検索者に
あおいだりするので、検索結果の確認が容易となる。
【0138】また、検索された全候補データの情報量が
あらかじめ決められた制限値を超えているか否かを判定
し、制限値を超えている場合には、特定の条件により検
索結果を分類し、出力を行うか否か等を定めたりするの
で、検索結果のデータの情報量を適切な値とするよう制
御可能となり、検索結果の確認が容易となり、検索の効
率が向上する。
【0139】また、同じく検索された全候補データの情
報量が制限値を超えている場合には、検索されたデータ
について特定のデータファイル属性あるいはデータ特徴
等により分類し、同じ属性のデータが複数存在する分類
のデータのみを抽出して出力するため、検索結果情報量
が適切な値となり、検索目的のデータの種類等によって
は、検索者による確認が容易となる。
【0140】また、同じく検索された全候補データの情
報量が制限値を超えている場合には、検索されたデータ
のついて特定のデータファイル属性あるいはデータ特徴
等により分類し、同じ属性のデータが存在しない分類と
なるデータのみを抽出して出力するので、検索結果のデ
ータの情報量が適切な値になり、検索目的のデータの種
類等によっては、、検索者による確認が容易となる。
【0141】また、同じく検索された全候補データの情
報量が制限値を超えている場合には、検索されたデータ
をあらかじめ決められた重要度等の条件で並び替えて出
力するので、検索者による結果の確認や整理、利用が容
易となる。また、同じく検索された各候補データの情報
量が制限値を超えた場合には、それ以降検索されたデー
タは出力を中止したり検索そのものを中止したりするの
で、検索者による結果の確認が容易かつ応答性の向上が
図れる。また、多数の検索者の利用に便となる。また、
出力を制限されなかったデータについては、あらかじめ
決められた条件で並び替えて、その順で出力するので、
先に読みだされたデータのみを出力させることとなり、
検索者のよる結果の確認が容易となり、かつ応答性が向
上する。
【0142】また、検索手段された全データの情報量が
あらかじめ決められたどの範囲であるかを判断し、その
判断結果に応じて、出力方法を変更するので、検索者に
よる結果の確認が容易となる。また、文字放送等視覚化
されたデータ、画像データ等は、縮尺した上同時に複数
表示するので、検索者が本来必要としているデータの確
認や入手が迅速となる。
【0143】また、検索された候補データが多量の場合
で、一方このことを知らない検索者による印刷出力が指
示されているようなときには、その旨の注意喚起等なさ
れるため、無駄な出費の削減が図れる。また、滅多に利
用されないデータ、逆によく利用されるデータ等を区分
けして検索するので、検索効率が向上する。
【0144】更に、定型文書中のデータの検索に、検索
者の記憶するデータ中の単語、漢字等の機械的(含む、
ソフト的)読み取りと文書の定型性の図形的特徴による
絞り込みを利用するので、検索効率が向上する。更にま
た、グラフ、テーブル等言語、記載文献の種類の如何を
問わず定型性を有するデータの検索が可能となる。
【図面の簡単な説明】
【図1】本発明に係るデータ検索装置の第1実施例を採
用したデータ保存装置の構成とデータ数測定の手順を示
す図である。
【図2】上記実施例におけるデータの保存、管理の様子
を概念的に示した図である。
【図3】上記実施例における処理対応表の内容の一例と
その表に基づく出力の選択の手順を示す図である。
【図4】上記実施例におけるデータ検索の動作流れ図で
ある。
【図5】本発明に係るデータ検索装置の第2実施例を採
用したデータ保存装置の構成図である。
【図6】本発明に係るデータ検索装置の第3実施例を採
用したデータ保存装置の構成とデータ出力の選択の手順
を示す図である。
【図7】第3及び第4実施例におけるデータ検索部の出
力内容の一例を示す図である。
【図8】本発明に係るデータ検索装置の第4実施例を採
用したデータ保存装置の構成図である。
【図9】本発明に係るデータ検索装置の第5実施例を採
用したデータ保存装置の構成図である。
【図10】第5実施例における出力方法対応表の内容の
一例である。
【図11】本発明に係るデータ検索装置の第6実施例を
採用したデータ保存装置の構成図である。
【図12】本発明に係るデータ検索装置の第7実施例を
採用したデータ保存装置の構成図である。
【図13】本発明に係るデータ検索装置の第8実施例を
採用したデータ保存装置の構成図である。
【図14】本発明の第9実施例におけるデータの保存、
管理の様子を概念的に示した図である。
【図15】本発明の第9実施例の動作流れ図である。
【図16】本発明の第10実施例の構成と手順を示す図
である。
【図17】本発明の第10実施例の第1変形例の原理、
背景の事実と処理手順を示した図である。
【図18】従来の文書検索装置を採用したデータ保存装
置の構成図である。
【符号の説明】
1 読込部 2 保存部 3 検索指示部 4 検索部 5 情報量測定部 6 検索出力適切対応部 61 処理対応表 62 処理対応表作成部 7 出力部 26 出力データ選択部 36 同一分類データ抽出部 46 非同一分類データ抽出部 56 出力内容制御部 66 出力順制御部 76 出力制限部 86 出力制御部 87 出力順制御部 161 データ保存部 162 定型性情報保存部 164 定型性利用単語文字検索部 168 単語文字入力部 169 欄定型情報入力部

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 文字、表、グラフ、図形等で構成される
    データを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索方法であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索ステップと、 前記検索ステップにおいて読み出された全データの情報
    量を測定する情報量測定ステップと、 前記情報量測定ステップによる測定値が所定の値を越え
    た場合には、所定値未満の場合とは別形式の出力を行
    う、検索者に出力方法の選択指示をあおぐ、検索者に他
    の検索内容による再検索を要請するの少なくも一を行う
    検索結果出力適切対応ステップとを有していることを特
    徴とするデータ検索方法。
  2. 【請求項2】 文字、表、グラフ、図形等で構成される
    データを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索装置であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索手段と、 前記検索手段において読み出された全データの情報量を
    測定する情報量測定手段と、 前記情報量測定手段による測定結果が所定値を越えた場
    合には、所定値未満の場合とは別形式の出力を行う、検
    索者に出力方法の選択指示をあおぐ、検索者に他の検索
    内容による再検索を要請するの少なくも一を行う検索結
    果出力適切対応手段とを有していることを特徴とするデ
    ータ検索装置。
  3. 【請求項3】 文字、表、グラフ、図形等で構成される
    データを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索方法であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索ステップと、 前記検索ステップにおいて読み出された全データの情報
    量を測定する情報量測定ステップと、 前記情報量測定ステップの測定値があらかじめ決められ
    た制限値を超えているか否かを判定し、制限値を超えて
    いる場合には、前記検索ステップにより読み出されたデ
    ータを所定の規則により分類する検索データ分類ステッ
    プと、 前記検索データ分類ステップにて分類された各分類毎に
    出力を行うか否かを所定の手順で判断する出力データ分
    類選択ステップとを有していることを特徴とするデータ
    検索方法。
  4. 【請求項4】 文字、表、グラフ、図形等で構成される
    データを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索装置であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索手段と、 前記検索手段において読み出された全データの情報量を
    計測する情報量測定手段と、 前記情報量測定手段の測定値があらかじめ決められた制
    限値を超えているか否かを判定し、制限値を超えている
    場合には、前記検索手段により読み出されたデータを所
    定の規則により分類する検索データ分類手段と、 前記検索データ分類手段にて分類された各分類毎に、出
    力を行うか否かを所定の手順で判断する出力データ分類
    選択手段とを有していることを特徴とするデータ検索装
    置。
  5. 【請求項5】 文字、表、グラフ、図形等で構成される
    データを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索方法であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索ステップと、 前記検索ステップにおいて読み出された全データの情報
    量を測定する情報量測定ステップと、 前記情報量測定ステップの測定値があらかじめ決められ
    た制限値を超えているか否かを判定して、制限値を超え
    ている場合には、前記検索ステップにより読み出された
    データについて所定のデータファイル属性あるいはデー
    タ特徴等により分類する検索データ分類ステップと、 前記検索データ分類ステップにて分類された各分類毎
    に、同じ分類のデータが複数存在することとなる分類の
    データのみ出力するよう制御する同一分類データ出力制
    御ステップとを有していることを特徴とするデータ検索
    方法。
  6. 【請求項6】 文字、表、グラフ、図形等で構成される
    データを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索装置であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索手段と、 前記検索手段において読み出された全データの情報量を
    測定する情報量測定手段と、 前記情報量測定手段の測定値があらかじめ決められた制
    限値を超えているか否かを判定し、制限値を超えている
    場合には、前記検索手段により読み出されたデータにつ
    いて特定のデータファイル属性あるいはデータ特徴等に
    より分類する検索データ分類手段と、 前記検索データ分類手段にて分類された各分類毎に、同
    じ分類のデータが複数存在することとなる分類のデータ
    のみ出力するよう制御する同一分類データ出力制御手段
    とを有していることを特徴とするデータ検索装置。
  7. 【請求項7】 文字、表、グラフ、図形等で構成される
    データを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索方法であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索ステップと、 前記検索ステップにて読み出された全データの情報量を
    測定する情報量測定ステップと、 前記情報量測定ステップの測定値があらかじめ決められ
    た制限値を超えているか否かを判定し、制限値を超えて
    いる場合には、前記検索ステップにより読み出されたデ
    ータについて所定のデータファイル属性あるいはデータ
    特徴等により分類する分類ステップと、 前記分類ステップの結果、同じ分類のデータが存在しな
    いデータのみ出力するよう制御する非同一分類データ出
    力制御ステップとを有していることを特徴とするデータ
    検索方法。
  8. 【請求項8】 文字、表、グラフ、図形等で構成される
    データを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索装置であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索手段と、 前記検索手段において読み出された全データの情報量を
    測定する情報量測定手段と、 前記情報量測定手段の測定値があらかじめ決められた制
    限値を超えているか否かを判定し、制限値を超えている
    場合には、前記検索手段により読み出されたデータにつ
    いて特定のデータファイル属性あるいはデータ特徴等に
    より分類する検索データ分類手段と、 前記検索データ分類手段にて分類された各分類毎に、同
    じ分類のデータが存在しないデータのみ出力するよう制
    御する非同一分類データ出力制御手段とを有しているこ
    とを特徴とするデータ検索装置。
  9. 【請求項9】 文字、表、グラフ、図形等で構成される
    データを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索方法であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索ステップと、 前記検索ステップにおいて読み出された全データの情報
    量を測定する情報量測定ステップと、 前記情報量測定ステップにより測定された情報量をあら
    かじめ定められたいずれの範囲内であるかを判定する範
    囲判定ステップと、 前記範囲判定ステップの判定した範囲に応じて前記検索
    ステップから読み出されたデータの出力方法若しくは出
    力内容の少くとも一を制御する出力制御ステップとを有
    していることを特徴とするデータ検索方法。
  10. 【請求項10】 文字、表、グラフ、図形等で構成され
    るデータを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索装置であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索手段と、 前記検索手段において読み出された全データの情報量を
    測定する情報量測定手段と、 前記情報量測定手段により測定された情報量の値があら
    かじめ決められたどの範囲であるかを判定する範囲判定
    手段と、 前記範囲判定手段の判定した範囲に応じて前記検索手段
    から読み出されたデータの出力方法若しくは出力内容の
    少くとも一を制御する出力制御手段とを有していること
    を特徴とするデータ検索装置。
  11. 【請求項11】 文字、表、グラフ、図形等で構成され
    るデータを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索方法であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索ステップと、 前記検索ステップにおいて読み出された全データの情報
    量を測定する情報量測定ステップと、 前記情報量測定ステップの測定値があらかじめ設定され
    た制限値を超えているか否かを判定し、制限値を超えて
    いる場合には、前記検索ステップにより読み出されたデ
    ータをあらかじめ決められた規則に従って並び替えて出
    力するよう制御する出力順制御ステップとを有している
    ことを特徴とするデータ検索方法。
  12. 【請求項12】 文字、表、グラフ、図形等で構成され
    るデータを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索装置であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索手段と、 前記検索手段において読み出された全データの情報量を
    計測し、その値があらかじめ設定された制限値を超えて
    いるか否かを判定する情報量測定手段と、 前記情報量測定手段により測定された情報量が制限値を
    超えている場合、前記検索手段により読み出されたデー
    タをあらかじめ決められた条件で並び替え、その順で出
    力するよう出力手段に指示する出力順制御手段とを有し
    ていることを特徴とするデータ検索装置。
  13. 【請求項13】 文字、表、グラフ、図形等で構成され
    るデータを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索方法であって、 検索者の指示により、保存、放送、提供等されているデ
    ータから候補データを読み出す検索ステップと、 前記検索ステップにおいて読み出された各データの情報
    量を順に確認しつつ計測する情報量順計測ステップと、 前記情報量順計測ステップの結果に基づきそれまでの総
    和があらかじめ定められた制限値を超えているか否かを
    判定する情報量測定ステップと、 前記情報量測定ステップにより測定された情報量の総和
    が制限値を超えた場合には、制限値に該当するデータ以
    降に読み出されたデータは出力しない若しくは制限値を
    越えた時点で検索を中止するよう制御する出力検索制限
    制御ステップとを有していることを特徴とするデータ検
    索方法。
  14. 【請求項14】 文字、表、グラフ、図形等で構成され
    るデータを検索し、結果をデータファイル名、データ内
    容、データファイル属性、データ特徴などの形式で出力
    するデータ検索装置であって、 使用者の操作に基づく検索起動指示により、保存、放
    送、提供等されているデータから候補データを読み出す
    検索手段と、 前記検索手段において読み出された各データの情報量を
    順に測定する情報量測定手段と、 前記情報量測定手段の測定した総和があらかじめ設定さ
    れた制限値を超えているか否かを判定し、制限値を超え
    た場合には、それ以降に前記検索手段により読み出され
    たデータは出力しない若しくは制限値を越えた時点で検
    索を中止するよう制御する出力検索制限手段とを有して
    いることを特徴とするデータ検索装置。
  15. 【請求項15】 前記範囲判定ステップにて所定の範囲
    にあると判断されたならば、前記検索ステップにて検索
    された候補データの中に画像データが含まれているか否
    かを判断する画像データ存在判断ステップを有し、 前記範囲判定ステップは更に、同じく画像データが存在
    すると判断されたならば、そのデータ量を測定する画像
    データ量測定小ステップを有し、 前記出力制御ステップは更に、 前記画像データ存在判断ステップにて存在すると判断さ
    れたならば、画像データを先に出力されるよう候補デー
    タの配列を調整する画像データ優先配列小ステップと、 前記画像データ量測定小ステップにて画像データ量が所
    定値以上と判断されたならば、画像データが出力される
    際にこれを縮尺して、同一表示面に複数の画像データが
    同時に出力されるよう制御する画像データ出力表示制御
    小ステップとを有していることを特徴とする請求項9記
    載のデータ検索方法。
  16. 【請求項16】 前記範囲判定手段にて所定の範囲にあ
    ると判断されたならば、前記検索手段にて検索された候
    補データの中に画像データが含まれているか否かを判断
    する画像データ存在判断手段を有し、前記範囲判定手段
    は更に、同じく画像データが存在すると判断されたなら
    ば、そのデータ量を測定する画像データ量測定部を有
    し、 前記出力制御手段は更に、 前記画像データ存在判断手段にて存在すると判断された
    ならば、画像データを先に出力されるよう候補データの
    配列を調整する画像データ優先配列部と、 前記画像データ量測定部にて画像データ量が所定値以上
    と判断されたならば、画像データが出力される際にこれ
    を縮尺して、同一表示面に複数の画像データが同時に出
    力されるよう制御する画像データ出力表示制御部とを有
    していることを特徴とする請求項10記載のデータ検索
    装置。
  17. 【請求項17】 検索装置による検索の対象とされてい
    る、そして保存されているデータ若しくは保存するデー
    タに経験則、データの意味内容、キーワード等から定め
    られた本来の検索の目的とされる確率についての情報を
    検索に先立って付加する利用度情報付加ステップを有
    し、 前記出力制御ステップは、前記範囲判定ステップの判定
    した範囲に応じて前記検索ステップから読み出されたデ
    ータの出力方法若しくは出力内容を制御するに際して、
    前記利用度情報付加ステップにて付加された情報を反映
    させる付加利用度情報反映出力制御小ステップを有して
    いることを特徴とする請求項9記載のデータ検索方法。
  18. 【請求項18】 検索装置による検索の対象とされてい
    る、そして保存されているデータ若しくは保存するデー
    タに経験則、データの意味内容、キーワード等から定め
    られた本来の検索の目的とされる確率についての情報を
    検索に先立って付加する利用度情報付加手段を有し、 前記出力制御手段は、前記範囲判定手段の判定した範囲
    に応じて前記検索手段から読み出されたデータの出力方
    法若しくは出力内容を制御するに際して、前記利用度情
    報付加手段にて付加された情報を反映させる付加利用度
    情報反映出力制御部を有していることを特徴とする請求
    項10記載のデータ検索装置。
  19. 【請求項19】 前記出力検索制限制御ステップにより
    出力を制限されないこととなったデータについては、あ
    らかじめ定められた所定の規則に並び替えて出力するよ
    う制御する出力順制御ステップを有していることを特徴
    とする請求項14記載のデータ検索方法。
  20. 【請求項20】 前記出力検索制限手段により出力を制
    限されないこととなったデータについて、あらかじめ定
    められた所定の規則に並び替え、その順で出力するよう
    出力手段を制御する出力順制御手段を有していることを
    特徴とする請求項15記載のデータ検索装置。
  21. 【請求項21】 記事の意味内容から定まる記事の欄の
    分類と該記事の記載されている位置若しくはこれに併せ
    ての記載部分の形状、寸法、記載部やその近辺の所定の
    記号、図形、写真、枠等記載部分を特定するのに役立つ
    視覚的特徴との間に一定の関係の存在する定型文書から
    目的とする記載を検索する方法において、 検索目的たる記事等が記載されている少くも一の種類の
    定型文書について、その定型性についての情報を検索に
    先立ってあらかじめ入力しておく定型性情報入力ステッ
    プと、 検索目的たる記事の意味内容から定まる記事の欄の分類
    若しくはこれに併せての該記事の記載されている定型文
    書の種類を検索キーとして入力する欄定型情報入力ステ
    ップと、 検索目的たる記事中の文章、単語、文字の少くも一方に
    ついて、少くも一個を検索キーとして入力する若しくは
    これに併せて記載位置、近辺の所定の記号等をも検索キ
    ーとして入力する記事情報入力ステップとを有している
    ことを特徴とする定型文書用記事中の文書検索方法。
  22. 【請求項22】 記事の意味内容から定まる記事の欄の
    分類と該記事の記載されている位置若しくはこれに併せ
    ての記載部分の形状、寸法、記載部やその近辺の所定の
    記号、図形、写真、枠等記載部分を特定するのに役立つ
    視覚的特徴との間に一定の関係の存在する定型文書から
    目的とする記載を検索する装置において、 検索目的たる記事等が記載されている少くも一の種類の
    定型文書について、その定型性についての情報を検索に
    先立ってあらかじめ入力され記憶している定型性情報保
    持出段と、 検索目的たる記事の意味内容から定まる記事の欄の分類
    若しくはこれに併せての該記事の記載されている定型文
    書の種類を検索キーとして入力する欄定型情報入力出段
    と、 検索目的たる記事中の文章、単語、文字の少くも一につ
    いて、少くも一個を検索キーとして入力する若しくはこ
    れに併せて記載位置、近辺の所定の記号等をも検索キー
    として入力する記事情報入力出段とを有していることを
    特徴とする定型文書用記事中の文書検索装置。
  23. 【請求項23】 相前後する単語間に余白を設ける言語
    で記載された文を対象として、文中に存在する単語を検
    索キーとして、所望するデーターの検索を行なうデータ
    ー検索方法であって、 検索対象の文中の単語間の余白から文中の各単語の長さ
    を求める単語長検出ステップと、 検索キーの単語長を所定の手順で求める検索キー単語長
    検出ステップと、 前記両検出ステップの結果をもとに、検索対象の文中か
    ら検索キーの単語と同じ長さの単語を見出す候補単語検
    出ステップと、 前記候補単語検出ステップにより見出された候補単語に
    対して、文字認識を行なって検索キーの単語か否かの判
    断を行なう最終文字認識ステップとを有していることを
    特徴とするデータ検索方法。
  24. 【請求項24】 相前後する単語間に余白を設ける言語
    で記載された文を対象として、文中に存在する単語を検
    索キーとして、所望するデーターの検索を行なうデータ
    ー検索装置であって、 検索対象の文中の単語間の余白から文中の各単語の長さ
    を求める単語長検出手段と、 検索キーの単語長を所定の手順で求める検索キー単語長
    検出手段と、 前記両検出手段の結果をもとに、検索対象の文中から検
    索キーの単語と同じ長さの単語を見出す候補単語検出手
    段と、 前記候補単語検出手段により見出された候補単語に対し
    て、文字認識を行なって検索キーの単語か否かの判断を
    行なう最終文字認識手段とを有していることを特徴とす
    るデータ検索装置。
  25. 【請求項25】 図形的な特徴や使用される文字に一定
    の規則性が見出される定型的な記載型式のデータを検出
    するデータ検出方法であって、 検出対象のデータの定型性をあらかじめ入力する定型情
    報入力ステップと、 上記あらかじめ入力された定型情報の中から第一に図形
    的な特徴を利用して候補データを検出する図形利用候補
    データ検出ステップと、 前記図形利用候補データ検出ステップにて検出されたデ
    ータを対象として文字認識を行なうことにより更に候補
    データを絞り込む文字認識利用候補データ検出ステップ
    とを有していることを特徴とするデータ検出方法。
  26. 【請求項26】 図形的な特徴や使用される文字に一定
    の規則性が見出される定型的な記載型式のデータを検出
    するデータ検出装置であって、 検出対象のデータの定型性をあらかじめ入力する定型情
    報入力手段と、 上記あらかじめ入力された定型情報の中から第一に図形
    的な特徴を利用して候補データを検出する図形利用候補
    データ検出手段と、 前記図形利用候補データ検出手段にて検出されたデータ
    を対象として文字認識を行なうことにより更に候補デー
    タを絞り込む文字認識利用候補データ検出手段とを有し
    ていることを特徴とするデータ検出装置。
JP7051345A 1995-03-10 1995-03-10 データ検索方法及びデータ検索装置 Pending JPH08249347A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7051345A JPH08249347A (ja) 1995-03-10 1995-03-10 データ検索方法及びデータ検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7051345A JPH08249347A (ja) 1995-03-10 1995-03-10 データ検索方法及びデータ検索装置

Publications (1)

Publication Number Publication Date
JPH08249347A true JPH08249347A (ja) 1996-09-27

Family

ID=12884346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7051345A Pending JPH08249347A (ja) 1995-03-10 1995-03-10 データ検索方法及びデータ検索装置

Country Status (1)

Country Link
JP (1) JPH08249347A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140364A (ja) * 2000-10-31 2002-05-17 Seiko Epson Corp 情報検索システム、コンテンツ検索システム、コンテンツ配信システム及び記憶媒体
JPWO2004081821A1 (ja) * 2003-03-13 2006-06-15 富士通株式会社 記事データ検索サーバ、記事データ検索方法および記事データ検索プログラム
JP2006323648A (ja) * 2005-05-19 2006-11-30 Fujitsu Ltd 検索装置及び検索方法
JP2011018311A (ja) * 2009-07-07 2011-01-27 Sharp Corp 画像検索装置、画像検索プログラムおよび記録媒体
CN108074192A (zh) * 2016-11-14 2018-05-25 平安科技(深圳)有限公司 责任定义数据导入方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140364A (ja) * 2000-10-31 2002-05-17 Seiko Epson Corp 情報検索システム、コンテンツ検索システム、コンテンツ配信システム及び記憶媒体
JPWO2004081821A1 (ja) * 2003-03-13 2006-06-15 富士通株式会社 記事データ検索サーバ、記事データ検索方法および記事データ検索プログラム
JP2006323648A (ja) * 2005-05-19 2006-11-30 Fujitsu Ltd 検索装置及び検索方法
JP2011018311A (ja) * 2009-07-07 2011-01-27 Sharp Corp 画像検索装置、画像検索プログラムおよび記録媒体
CN108074192A (zh) * 2016-11-14 2018-05-25 平安科技(深圳)有限公司 责任定义数据导入方法及装置

Similar Documents

Publication Publication Date Title
US9514216B2 (en) Automatic classification of segmented portions of web pages
US5860075A (en) Document data filing apparatus for generating visual attribute values of document data to be filed
US5903904A (en) Iconic paper for alphabetic, japanese and graphic documents
US6182090B1 (en) Method and apparatus for pointing to documents electronically using features extracted from a scanned icon representing a destination
JP5241828B2 (ja) 辞書の単語及び熟語の判定
JP3298676B2 (ja) 知覚可能情報セグメントのアクセス方法
JP4260790B2 (ja) ファイリング・検索装置およびファイリング・検索方法
US20180004850A1 (en) Method for inputting and processing feature word of file content
US7003736B2 (en) Iconic representation of content
JP2008234658A (ja) テキスト検索エンジンにより検索されたページ番号付き文書全体を通してのコースツーファイン・ナビゲーション
US20100192055A1 (en) Apparatus, method and article to interact with source files in networked environment
US10572528B2 (en) System and method for automatic detection and clustering of articles using multimedia information
JP2009289202A (ja) キーワード入力支援装置、キーワード入力支援方法及びプログラム
Rowe Tabloidization of news
JPH08249347A (ja) データ検索方法及びデータ検索装置
Allen et al. Canada's twenty-first century discovery of China: Canadian media coverage of China and Japan
JP3841318B2 (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JPH0782497B2 (ja) 文書処理装置
JP7086424B1 (ja) 特許用文章生成装置、特許用文章生成方法、および特許用文章生成プログラム
JP2004127086A (ja) 文書検索システム及びそれを用いた情報提供システム
TWI451277B (zh) 檢索標籤視覺化系統及其方法
Sjökvist Transcription in Rare Books Cataloging
Lawson Changes in Attitudes to Immigrants in Britain, 1841-1921: From Foreigner to Alien: by Ben Braber, London, Anthem Press, 2022, x.+ 120 pp.,£ 80 (hardback),£ 25 (Paperback), ISBN 978-1-8399-8560-7
Beck Revolution and Protest Online
Oberhauser Card‐image public access catalogues (CIPACs): an international survey

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031216