JPH10254896A - データ圧縮方法 - Google Patents

データ圧縮方法

Info

Publication number
JPH10254896A
JPH10254896A JP9058038A JP5803897A JPH10254896A JP H10254896 A JPH10254896 A JP H10254896A JP 9058038 A JP9058038 A JP 9058038A JP 5803897 A JP5803897 A JP 5803897A JP H10254896 A JPH10254896 A JP H10254896A
Authority
JP
Japan
Prior art keywords
data
keyword
information
keywords
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9058038A
Other languages
English (en)
Inventor
Norio Oga
典雄 大賀
Yoshiaki Ukita
義敬 宇喜多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP9058038A priority Critical patent/JPH10254896A/ja
Publication of JPH10254896A publication Critical patent/JPH10254896A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 キーワードと本文データからなるデータを圧
縮する。 【解決手段】 キーワードを、本文との関係において重
要度に付いてランク付けしたランク付け情報を作成す
る。このランク付け情報に基づいて、少なくとも一部の
キーワードを短縮/削除する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えばデータディ
スクに記録するデータを圧縮するデータ圧縮方法に関す
る。
【0002】
【従来の技術】近年において、例えば辞書や百科辞典等
のデータを光ディスクに記録し、半永久的に該データの
保存ができるようにした光ディスクである、いわゆるC
D−ROMディスク及びこのディスクに記録された記録
データを再生するディスク再生装置が知られている。
【0003】このいわゆるCD−ROMディスクとは、
デジタルオーディオディスクの一規格であるいわゆるC
D(コンパクトディスク)の規格を拡張し、該CDのオ
ーディオデータの代わりに文字データあるいはバイナリ
データを記録するようにしたディスクである。
【0004】ここで、上述のようなCD−ROMフォー
マットに従って記録されるデータの検索を行うために
は、記録データの論理フォーマットが規定されているこ
とが必要とされる。この論理フォーマットの一つとし
て、ISO(International Standars Organization)
9660規格が提供されている。
【0005】このISO9660規格は、図9に示す、
ボリウムディスクリプタ101からファイル103まで
の論理フォーマットを規定するものである。
【0006】まず、上記CD−ROMディスク上の所定
の絶対番地、すなわち2秒16セクタ位置には、ボリウ
ムディスクリプタ101が記録されている。
【0007】上記ボリウムディスクリプタ101には、
ディスクがどのように論理的に組織化されているか,標
準ファイルシステム構造のためのルートディレクトリ位
置情報,版権関係の記録,ファイル名称,発行者(社)
等が記録されている。
【0008】上記ルートディレクトリ位置情報で示され
るアドレスに記憶されたルートディレクトリ102に
は、例えばデータディスクに記録されている各ファイル
103のそれぞれの位置や長さが記録されている。
【0009】このファイル103は、例えば電話帳、国
語辞典、英和辞典等を構造化して収めるものである。上
記各ファイル103は、上記電話帳等の本体にあたるフ
ァイルであり、主として文字データで構成されている。
そして、辞書等の本と同様に各種の再生及び検索方法を
効率よく行うために、例えば図10に示すようなデータ
で構成される。
【0010】図10において上記ファイル103は、例
えば文献管理ブロック104、キーワード情報105、
本文データ106を有している。
【0011】上記文献管理ブロック104は、上記各フ
ァイル103の先頭に位置しており、該各ファイル10
3内に記憶されている上記本文データ106,キーワー
ド情報105等が記録されているアドレス他に、キーワ
ード情報105の個数、上記本文106を構成する電話
帳等の種別に関する情報を保有している。
【0012】上記キーワード情報105は、上記本文デ
ータ106から抽出したキーワードを保持している。こ
のキーワード情報105は、キーワードを入力し、その
キーワードに対応する項目を探したり、本の目次から該
当する項目を探すように画面に表示されたキーワードの
中から選択することができる。さらに、予め設定されて
いる条件に従ってキーワードを入力し、該当する項目を
探すキーワードによる条件検索も行うことができる。こ
こで、上記キーワード情報は、キーワードを階層化して
保持する場合もあるが、階層化されていない場合もあ
る。
【0013】上記本文データ106は、電話帳、国語辞
典、英和辞典等の文字列を項目順に収めている。本文デ
ータの一例として電話帳106の場合には、氏名、住所
及び電話番号の組を単位として、これらを単位項目とし
て構成されている。
【0014】
【発明が解決しようとする課題】ところで、電話帳等の
データ量の大きいデータを上述のいわゆるCD−ROM
等の記録媒体に記録しようとすると、上記記録媒体の容
量を超過する場合があった。このような場合には、該デ
ータを上記CD−ROMの容量に収めるためには、この
データを圧縮する必要がある。
【0015】このためには、CD−ROMにおいて電話
帳等のデータを構成するファイル103の内で、キーワ
ード情報105及び/又は本文データ106のデータの
少なくとも一部を削除することにより圧縮することにな
る。
【0016】しかし、キーワード情報105の含むキー
ワードを削除すると、キーワード検索における項目の個
数が減少して、このためキーワード情報105を用いる
利便が低下する。また、本文データ106は該電話帳等
の実質的な情報であるので、本文データ106から削除
すると、電話帳等の該データの価値が低減することにな
る。
【0017】この発明は、上述の課題を解決するために
なされるものであって、キーワード検索における利便を
維持し、また、本文データを削減することなく、データ
を圧縮するデータ圧縮方法を提供することを目的とす
る。
【0018】
【課題を解決するための手段】上述の課題を解決するた
めに、この発明に係るデータ圧縮方法は、少なくとも文
字データを含む本文データと、上記本文データを検索す
るために上記本文データから抽出したキーワードを配列
した単数又は複数の検索情報とを有し、上記キーワード
をランク付けし、そのランク付けの結果に応じてキーワ
ードの少なくとも一部を短縮するものである。
【0019】また、上述の課題を解決するために、この
発明に係るデータ圧縮方法は、複数のキーワードについ
てランク付けをし、ランク付けの結果に基づいて複数の
キーワードの一部を削除するものである。
【0020】ここで、上記ランク付けは、キーワードの
検索能力に基づいて、あるいはキーワードに対応する本
文の重要度に基づいて行うことが挙げられる。
【0021】キーワードを短縮したり一部のキーワード
を削除したりすることにより、データを圧縮することが
できる。
【0022】
【発明の実施の形態】以下、この発明に係るデータ圧縮
方法の実施の形態について図面を参照しながら詳細に説
明する。
【0023】先ず、図1に示すフローチャート及び図2
の電話帳のデータの例を参照しながら、データを圧縮す
る一連の工程について説明する。
【0024】図1において、例えば、オペレーティング
システムからデータを圧縮するこの一連の工程が開始さ
れ、ステップS1に進む。ステップS1においては、外
部の記録媒体から図2のキーワード情報105等の必要
なデータをRAMに読み込んだりして、このステップS
1に続くデータ圧縮の実質的な作業の準備を行う。これ
らの作業が完了すると、ステップS2に進む。
【0025】次のステップS2においては、上記キーワ
ード情報105含まれるキーワードをランク付けし、重
要度情報を作成する。ここで、キーワードのランク付け
は、該キーワードに対応する本文データの重要度、該キ
ーワードに対応する本文データ中の箇所の個数、及びキ
ーワードの検索能力等の少なくとも1つに応じて定める
ことができる。そして、この作業が完了するとステップ
S3に進む。
【0026】次のステップS3としては、ステップS2
にてランク付けして得られた結果に基づいて、キーワー
ド情報105に含まれるキーワードの少なくとも一部を
短縮及び/又は削除する。これによって、キーワード情
報105のデータ量は削減され、従って、このキーワー
ド情報105を含むファイルのデータ量も削減され、結
果としてデータが圧縮されたことになる。そして、この
作業が終了するとステップS4に進む。
【0027】次のステップS4においては、データを圧
縮するこの一連の工程を終了処理を行う。即ち、このス
テップS4としては、ステップS3においてデータが圧
縮された既ワード情報を外部記録媒体に記録する。そし
て、この操作が完了すると、この一連の工程を終了し、
例えばオペレーティングシステムに復帰する。
【0028】ここで、上述のデータ圧縮の方法を、図2
に示す電話帳のデータの例に基づいて説明する。
【0029】この電話帳のデータは、該電話帳のデータ
本体を収める本文データ106と、この本文データ10
6から所定の方法に基づいて抽出したキーワードを収め
る第一のキーワード情報1051及び第二のキーワード
情報1052と、これら第一のキーワード情報1051
び第二のキーワード情報1052のポインタ等を保持す
る文献管理ブロック104から構成されるファイル10
3となっている。
【0030】上記本文データは、氏名、住所及び電話番
号の一組を単位として、例えば氏名について五十音順
に、上記単位を項目として順に配列されている。
【0031】上記第一のキーワード情報1051は、上
記本文データ106の項目をなす氏名、住所及び電話番
号の一組の単位から氏名を抽出して、所定の順序、例え
ば五十音順に配列したものである。この第一のキーワー
ド情報1051の各キーワードは、本文データ106の
氏名、住所及び電話番号の一組を単位とする各項目に一
対一対応をしている。
【0032】上記第二のキーワード情報1052は、上
記本文データ106の氏名、住所及び電話番号の一組の
単位でなす各項目からそれぞれ住所を抽出して、所定の
順序、例えば五十音順に配列したものである。この第二
のキーワード情報1052の各キーワードは、本文デー
タ106の氏名、住所及び電話番号の一組を単位とする
各項目に一対一対応をしている。
【0033】上記文献管理ブロック104は、第一のキ
ーワード情報1051及び第二のキーワード情報1052
のポインタ、サイズ、属性等の管理情報を保持してい
る。
【0034】ここで、上記第一のキーワード情報105
1のキーワードを重要度に従ってランク付けする。上記
第一のキーワード1051に配列したキーワードである
氏名の姓は、多数個、少数個、あるいは単数個のものが
ある。図2の第一のキーワード情報1051において
は、“○○”は氏(姓)であり、例えばこの姓は電話帳
内に同じ姓が多数個が存在するものとする。“□□”は
電話帳内に唯一個のみ存在する氏(姓)であるものとす
る。
【0035】そこで、姓が多数個重複している氏名は、
姓のみでは特定することができないので重要度が高いと
する。これに対して、唯一あるいは少数個の姓を有する
氏名の場合は、姓のみでの検索がある程度可能であるこ
とから、名の重要度は低いものとする。
【0036】このようにして、キーワードの重要度に関
するランク付けが終了すると、次にこの重要度に基づい
て、上記キーワード情報のキーワードの少なくとも一部
を短縮する。ここでは、重要度の低い名、即ち図中の第
一のキーワード情報1051における削除可能部分DL
を、削除することにする。
【0037】このような削除を行っても、上記第一のキ
ーワード情報1051による本文データ106の検索能
力は殆ど損なわれないので、この第一のキーワード情報
1051の提供するキーワード検索の利便は縮減されな
い。
【0038】上記第二のキーワード情報1052のキー
ワードも、重要度に従ってランク付けすることにする。
ここでは、各キーワードの構成要素についても重要度に
ついてランク付けしている。図2に示すように、上記第
二のキーワード情報1052においては、キーワード中
の例えば“東京都”は、各キーワードにおいて識別性を
発揮していないため、重要度は低いものとする。また、
番地を示す“1−1−1”の部分まで特定しなくとも検
索能力は殆ど低下しないことから、重要度は低い。そこ
で、このように構成要素の検索能力等を考慮して、その
構成要素の重要度を決めることができる。
【0039】このようにして得られた重要度情報に基づ
いて、上記第二のキーワード情報1052から、重要度
の低い順に所定値の重要度までキーワードの構成要素を
削除することができる。ここでは、図中の第二のキーワ
ード情報1052の内で、削除可能部分DLにて示され
ている構成要素を削除する。
【0040】このような削減を行っても、上記第二のキ
ーワード検索情報1052による本文データ106の検
索能力は殆ど損なわれない。むしろ、上記第二のキーワ
ード情報1052の各キーワードの文字数が減少して簡
潔になったので、キーワード検索の効率を却って向上さ
せる。
【0041】このようにして、キーワード検索の利便を
減少させないように、キーワード情報のデータ量を圧縮
することができる。従って、この電話帳の全体のデータ
量も圧縮されることになる。
【0042】次に、図3に従って、データ圧縮の方法の
他の例を示す。この図3の例におけるキーワード情報1
053、1054は、本文データ106の中から部分的な
重複を許して、例えば姓名の“□□ △△”について
は、“□□”も“□□ △△”もそれぞれ独立のキーワ
ードとして、登録されているものとしている。
【0043】この図3において、まず、第一のキーワー
ド情報1053 内のキーワードについてランク付けを行
い、重要度を設定する。このとき、上述したように、電
話帳内に同じ姓が唯一個である姓“□□”については、
これだけで“□□ △△”を検索でき、名は不要である
から、キーワード“□□ △△”の重要度は低いものと
なる。
【0044】また、第二のキーワード情報1054 のキ
ーワードに重要度を導入し、この重要度に従って、キー
ワードをランク付けする。ここでは、キーワードの検索
能力、即ち該キーワードに対応する本文データ106の
項目の数を重要度とする。つまり、該キーワードに対応
する本文データの項目の個数が増加するほど重要度が増
加するものとする。
【0045】例えば、図中の第二のキーワード情報10
4 において、削除可能部分DLにて示すキーワード
“杉並区大泉町1−1−1”及び“東京都杉並区大泉町
1−1−1”は、対応する本文データ106の項目がそ
れぞれ唯一個であるので、重要度は最も低い。そこで、
これらのキーワードを削除することにする。
【0046】このようなキーワードを削除しても、これ
らの検索能力は低いので、キーワード検索能力の効率の
縮減の程度は小さい。逆に、このような検索能力の低い
キーワードは一般に文字数が多いので、データ量の削減
に対する寄与は大きい。
【0047】上述したように、重要度の低いキーワード
を削除することによりこのキーワード情報1053、1
054のデータ量を削減することができる。結果とし
て、このファイル103全体のデータ量も圧縮されるこ
とになる。
【0048】ここで、上述のようなデータディスクは例
えば図4に示すようなディスク再生装置により再生され
る。
【0049】この図4においてディスク再生装置は、デ
ータディスク1に記録されているデータを再生する再生
系2と、この読み出したデータの音声信号処理を主とす
る音声信号処理系3と、上記読み出したデータの検索処
理を行って画像表示するためのデータ処理系4とから成
っている。
【0050】上記再生系2において、キーボード31か
らの入力に応じてCPU5は、レーザ光源駆動回路1
0,スレッド送りモータ11,2軸アクチュエータ駆動
回路12及びモータ駆動回路13を制御する。すなわ
ち、CPU5は、モータ駆動回路13を制御してスピン
ドルモータ6を、例えばCLV(線速度一定)やCAV
(角速度一定)等で回転駆動させる。同時に、2軸アク
チュエータに取り付けられた対物レンズ14,フォトデ
ィテクタ,フォーカスエラー検出用の光学素子等から成
るピックアップ7をスレッド送りモータ11を制御しデ
ータディスク1上の所定のトラックまで移動(粗動)さ
せる、いわゆるディスクの径方向制御を行う。そして、
2軸アクチュエータ駆動回路12を制御することによ
り、上記ピックアップ7の対物レンズ14を上下させフ
ォーカシングを調整したり、該対物レンズ14を左右に
振りビームスポットを任意のトラックに照射する、いわ
ゆるトラッキング制御を行うことによりデータディスク
1に記録されたデータの再生が行われる。
【0051】上記データディスク1のディスク上には、
例えば1フレーム毎にサブコードエリアとデータエリア
が設けられており、このサブコードエリアに同期信号,
位置情報,時間情報等が書き込まれている。また、デー
タエリアに上述のデータが書き込まれている。このよう
なデータディスク1から読み出されたデータ信号は、エ
ラー検出,データ検出回路8に供給されることにより、
例えばいわゆる和や差がとられフォーカスエラーやトラ
ッキングエラーが検出される。上記フォーカスエラー及
びトラッキングエラーは2軸アクチュエータ駆動回路1
2に供給される。2軸アクチュエータ駆動回路12はフ
ォーカスエラー信号及びトラッキングエラー信号に応じ
て対物レンズ14を駆動し、フォーカシング及びトラッ
キングを正常に保ち、正確にデータの読み出しを行うよ
うに制御している。なお、データディスク1に照射され
るレーザビームは、例えば図示しないレーザダイオード
からの出力を検出し、この検出信号をレーザ光源駆動回
路10に供給することにより制御される。すなわち、レ
ーザ光源駆動回路10は上記検出信号に応じてデータデ
ィスク1に照射されるレーザビームのパワーが、再生時
において常に一定となるように制御している。
【0052】一方、上記データディスク1から再生され
た同期信号や時間情報等を含む再生信号は、エラー検
出,データ検出回路8を介して信号処理系3のCD信号
処理回路15に供給される。CD信号処理回路15に
は、装着されたデータディスクが音声データが記録され
ているいわゆるオーディオ用CDか、または、例えば辞
書や百科辞典等のように、文字情報をキャラクタ情報で
記録したキャラクタデータ等が記録されているいわゆる
CD−ROMディスクかを検出した検出信号が上記CP
U5から供給されている。CD信号処理回路15は、供
給される再生信号を同期信号や時間情報等のサブデータ
信号と、メインデータ信号とに分離し、該メインデータ
信号が音声データの場合、この音声データ信号をD−A
(デジタル−アナログ)変換器16に供給する。D−A
(デジタル−アナログ)変換器16に供給された音声デ
ータ信号は、アナログ信号に変換されオーディオ再生回
路17に供給され、音声信号として出力端子18を介し
て出力される。また、CD信号処理回路15に供給され
たデータ信号が上記キャラクタデータ信号等の場合、該
CD信号処理回路15は、該キャラクタデータ信号をC
D−ROM信号処理回路19に供給する。CD−ROM
信号処理回路19に供給されたキャラクタデータ信号
は、一時記憶用のメモリであるRAM(ランダムアクセ
スメモリ)20を介して、上記CPU5から供給される
信号に応じて読み出される。データバス21には、プロ
グラム等が記録されているROM22及びRAM23が
接続されている。上記読み出されたキャラクタデータ信
号等は、データバス21を介して伝送される。そして、
上記キャラクタデータ信号に応じて漢字ROM24から
読み出された漢字パターン等によりビデオRAM26内
に表示画像が記録形成され、上記CPU5からの信号に
応じて表示コントローラ25によりビデオRAM26内
の表示画像が読み出され、例えばLCD(液晶表示板)
等の表示部27に表示される。
【0053】なお、コネクタ28に外部のインターフェ
ースが接続された場合は、例えば接続と同時にスイッチ
29がオン動作し、上記CPU5をリセットし、該イン
ターフェースからの命令で信号処理が行われるようにな
っている。上記インターフェースからの命令は、外部イ
ンターフェース処理回路30により処理され、この処理
データはデータバス21を介し上述のように表示部27
に表示される。
【0054】このようなディスク再生装置は、データ処
理及び表示のマン−マシンインターフェース部分は、厳
密な時間処理が不要なため、これらをメインルーチンと
して処理し、他の処理を割り込みルーチンで行うことに
より全体の信号処理を上記1個のCPU5で全て処理し
ており、また、ホストCPUとドライブCPU間のソフ
トウェア制御のうち、コマンドパケット←→ステータス
のコード体系をバスラインシステムから流用するように
し、本機を外部ホストから制御したいときには、メイン
ルーチンをホルト(HALT)命令に置き換え、バスラ
イン制御用ルーチンを起動するようにしてある。
【0055】このように構成された信号処理系を備えた
ディスク再生装置は、例えば図5及び図6に示すような
外観を有している。
【0056】この図4及び図5において、上記ディスク
再生装置は、再生系2,CPU5,音声信号処理系3,
例えばLCDで構成された表示部27を除くデータ処理
系4等を装置本体44に内蔵している。
【0057】上記装置本体44には、例えば電話帳、国
語辞典、英和辞典等のデータが記録されたCD−ROM
を収納したディスクカートリッジが装着される。また、
上記装置本体44には、図5及び図6に示すように、こ
の装置本体44に対し閉蓋されたときに表面に臨む面に
アルファベットキー41,カーソル移動キー42,該カ
ーソルを移動した選択項目を選択する選択キー43等の
キーを配列したキー操作部45が支軸を介して回動可能
に取付けられている。
【0058】上記キー操作部45の上記キーが配列され
た面と対向する裏面には、CD−ROMを収納したディ
スクカートリッジが挿脱されるカートリッジホルダ46
が配設されている。
【0059】上記カートリッジホルダ46は、キー操作
部45の回動に追随して回動操作されるように上記装置
本体44に支持されている。さらに、上記装置本体44
には、キー操作部45を覆って装置本体44の上面側を
閉蓋する蓋体47が支軸48を介して回動可能に取付け
られている。
【0060】上記蓋体47の内方側の面、すなわち装置
本体44から図5に示すように開蓋させたとき、キー操
作部45に対向するようになる面には、CD−ROMか
ら読み出された文字情報等の情報を表示する表示部27
が設けられている。
【0061】なお、上記表示部27を設けた蓋体47
は、ディスク再生装置40の使用時において、図5に示
すようにキー操作部45の表面を開放し、上記表示部2
7の表示画面が見やすくなる所望の回転位置に回転操作
され、この回転操作された位置で保持されるように、装
置本体44に支持されている。
【0062】また、上記ディスク再生装置40は、非使
用時には上記蓋体47をキー操作部45上に閉蓋させる
ことにより、方形をなす形状に小型化され、持ち運び容
易な形状とされる。
【0063】次に上記複合検索に係るディスク再生装置
の具体的な再生表示動作の説明を図7に示すフローチャ
ート及び図8に示す表示具体例を用いて行う。
【0064】このフローチャートは、ディスク再生装置
にデータディスクが装着されることによりスタートとな
る。
【0065】次にステップS101において、検索にさ
きがけ装着されたデータディスクから、例えばオーディ
オ用CDのTOCデータ等に相当する上記インデックス
情報を読み出し、これを例えばRAM(ランダムアクセ
スメモリ)等に取り込みステップS102に進む。
【0066】上記ステップS102では、上記RAMに
取り込んだインデックス情報に応じた上述の各検索方法
を文字で表示手段に表示しステップS103に進む。
【0067】具体的には、上記装着されたデータディス
クに記録されているファイルが例えば所望の飲食店の検
索を行う「レストランガイド」であったとすると、図8
(a)に示すように“このディスクはレストランガイ
ド”と該データディスクの名称を表示し、次に同図
(b)に示すように検索方法を選択させるべく該検索方
法の名称である“単語検索(前方一致),複合検索”を
表示する。
【0068】ユーザは、この表示される検索方法の中か
らアイコン93を操作して任意の検索方法を選択する
が、上記ステップS103では、該選択された検索方法
が複合検索か否かを判別し、Noの場合はステップS1
04に進み他の検索方法(この場合、単語検索(前方一
致))の処理を行い、Yesの場合はステップS105
に進む。
【0069】上記ステップS105では、選択された複
合検索用のデータをデータディスクからRAMに取り込
みステップS106に進む。
【0070】上記ステップS106では、上記RAMに
取り込んだ複合検索用のデータを表示しステップS10
7に進む。
【0071】具体的には、例えば図8(c)に示すよう
に、“店の名前は?”,“食事の種類は?”,“場所は
どこがいいですか?”,“一人当たりの予算は?”等複
合検索に必要なキーワードを入力するテーブルを表示す
る。ユーザは、このキーワードを入力するテーブルに自
分の希望に合うようなキーワードを入力すれば良いが、
該キーワードがわからない場合に図示しないヘルプキー
をオンする。
【0072】上記ステップS107では、上記ヘルプキ
ーかオンされたか否かが判別され、Noの場合はステッ
プS110に進み検索を開始、Yesの場合はステップ
S108に進む。
【0073】上記ステップS108では、現在入力すべ
きキーワードを集めた入力候補テーブルを表示し、ステ
ップS109に進む。
【0074】上記ステップS109では、入力候補テー
ブルによる検索結果である、ユーザにより選択されたキ
ーワードを表示しステップS110に進む。
【0075】すなわち、上記“食事の種類は”の項目に
入力するキーワードが分からない場合は上記ヘルプキー
をオンする。これにより、表示画面には、例えば図8
(d)に示すように、“和食”,“フランス料理”,
“中華料理”,“イタリア料理”等の大まかな食事の種
類のキーワードが表示される。この中からユーザが、ア
イコン93を操作して例えば“和食”を選択したとする
と、次に該選択した“和食”の中からさらに細かく食事
の種類を選択させるために、例えば図8(e)に示すよ
うに、該“和食”に該当する食事の種類である“寿
司”,“てんぷら”,“麺類”等のキーワードの表示が
される。ユーザはこの中からアイコン93を操作して任
意の食事の種類である、例えば“寿司”を選択する。こ
れにより、該選択されたキーワードである“寿司”が上
記“食事の種類は”の項目の欄に入力される。
【0076】同じく、上記“場所は何処がいいですか”
の項目に入力するキーワードが分からない場合は上記ヘ
ルプキーをオンする。これにより、表示画面には、例え
ば図8(f)に示すように、“ニューヨーク”,“ロサ
ンゼルス”,“サンフランシスコ”,“シカゴ”等の大
まかな食事をしたい場所のキーワードが表示される。こ
の中からユーザが、アイコン93を操作して例えば“ニ
ューヨーク”を選択したとすると、次に該選択した“ニ
ューヨーク”の中からさらに細かく食事をしたい場所を
選択させるために、例えば図8(g)に示すように、該
“ニューヨーク”に該当する地域である“マンハッタ
ン”,“ロサンゼルス”,等のキーワードの表示がされ
る。ユーザはこの中からアイコン93を操作して任意の
地域である、例えば“マンハッタン”を選択する。これ
により、該選択されたキーワードである“マンハッタ
ン”が上記“食事の種類は”の項目の欄に入力される。
【0077】上記ステップS110では、上述のように
入力されたキーワードに基づいて検索を行いステップS
111に進む。
【0078】上記ステップS111では、検索結果をデ
ィスクより読み出して表示して終了する。
【0079】すなわち、上記検索を行い、入力されたキ
ーワードにより示されたユーザの希望に合った飲食店が
複数存在した場合には、例えば図8(h)に示すように
“日本寿司”,“マンハッタン寿司”,“一番寿司”,
ロングアイランド寿司”等の複数の文献のタイトルが表
示される。この中からユーザが、アイコン93を操作し
て例えば上記“日本寿司”を選択したとすると、表示画
面には、同図(i)に示すように電話番号,価格,客席
数,その店までの簡単な地図等が表示される。なお、こ
の実施の形態においては、例えばいわゆるCD−ROM
等のデータディスクについて例示したが、この発明はデ
ータディスクに限定されない。例えば、磁気ディスク等
の他の記録媒体に記録するデータにも利用することがで
きる。また、キーワードのランク付けは、該キーワード
に対応するデータ本文の該項目の重要度に対応させるこ
とができる。
【0080】さらに、この実施の形態においては、電話
帳を例として説明したが、この発明は電話帳に限定され
ず、百科事典、英和辞典等に広く利用することができ
る。
【0081】
【発明の効果】上述したように、この発明に係るデータ
圧縮方法においては、電話帳等のデータから抽出したキ
ーワードの内で少なくとも一部を短縮又は削除し、これ
らキーワード情報のデータ量を削減することによって、
全体のデータ量を圧縮する。ここで、このキーワードの
短縮又は削除は重要度のランクの低いものについて行う
ので、キーワード検索における利便の縮減の幅は小さ
い。また、このデータ圧縮方法において、データの本体
であるデータ本文に付いては変更を要しないので、この
データの価値が低減することはない。
【0082】従って、このデータ圧縮方法を用いると、
データ量の大きい例えば電話帳を、いわゆるCD−RO
M等の小型で低価格のデータディスクに収めることがで
きる。このようなデータディスクに収められた電話帳
は、ディスク再生装置上でキーワード検索によって軽快
に操作されることができる。
【図面の簡単な説明】
【図1】この発明に係るデータ圧縮方法の一連の工程を
示すフローチャートである。
【図2】上記データ圧縮方法の実施の形態の一例であ
る。
【図3】上記データ圧縮方法の実施の形態の他の一例で
ある。
【図4】上記データ圧縮方法を施したデータを記録した
データディスクを再生するディスク再生装置の概略の構
成を示すブロック図である。
【図5】上記ディスク再生装置の左側面図である。
【図6】上記ディスク再生装置の上面図である。
【図7】上記ディスク再生装置においてキーワード検索
によって対応する本文データの項目を表示する一連の工
程を示すフローチャートである。
【図8】上記ディスク再生装置においてキーワード検索
により対応する本文データの項目を表示するまでの一連
の表示を示す図である。
【図9】データディスクのデータ構造の一例を示す階層
図である。
【図10】ファイルのデータ構造の一例を示す階層図で
ある。
【符号の説明】
1 データディスク、2 再生系、3 音声信号処理
系、4 データ処理系、5 CPU、103 ファイ
ル、105 キーワード情報、106 データ本文

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも文字データを含む本文データ
    と、上記本文データを検索するために上記本文データか
    ら抽出したキーワードを配列した単数又は複数の検索情
    報とを有し、 上記キーワードの少なくとも一部をランク付けする工程
    と、 上記キーワードの少なくとも一部を上記ランク付けの結
    果に応じて短縮することを特徴とするデータ圧縮方法。
  2. 【請求項2】 上記ランク付けは、キーワードの検索能
    力に応じて行うことを特徴とする請求項1記載のデータ
    圧縮方法。
  3. 【請求項3】 上記ランク付けは、キーワードに対応す
    る本文データの重要度に応じて行うことを特徴とする請
    求項1記載のデータ圧縮方法。
  4. 【請求項4】 少なくとも文字データを含む本文データ
    と、上記本文データを検索するために上記本文データか
    ら抽出した複数のキーワードを配列した単数又は複数の
    検索情報とを有し、 上記複数のキーワードについてランク付けをする工程
    と、 上記ランク付けの結果に基づいて上記複数のキーワード
    の一部を削除する工程とを有することを特徴とするデー
    タ圧縮方法。
  5. 【請求項5】 上記ランク付けは、キーワードの検索能
    力に応じて行うことを特徴とする請求項4記載のデータ
    圧縮方法。
  6. 【請求項6】 上記ランク付けは、キーワードに対応す
    る本文の重要度に応じて行うことを特徴とする請求項4
    記載のデータ圧縮方法。
JP9058038A 1997-03-12 1997-03-12 データ圧縮方法 Withdrawn JPH10254896A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9058038A JPH10254896A (ja) 1997-03-12 1997-03-12 データ圧縮方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9058038A JPH10254896A (ja) 1997-03-12 1997-03-12 データ圧縮方法

Publications (1)

Publication Number Publication Date
JPH10254896A true JPH10254896A (ja) 1998-09-25

Family

ID=13072774

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9058038A Withdrawn JPH10254896A (ja) 1997-03-12 1997-03-12 データ圧縮方法

Country Status (1)

Country Link
JP (1) JPH10254896A (ja)

Similar Documents

Publication Publication Date Title
US6646966B2 (en) Automatic storage medium identifying method and device, automatic music CD identifying method and device, storage medium playback method and device, and storage medium as music CD
US7460443B2 (en) Folder indexing method for quickly accessing media files
JPH08279028A (ja) 可搬格納デバイス、及びリポジトリ中に格納されたドキュメントをドキュメントカードからアクセスするための方法
JP2822525B2 (ja) 記録媒体の再生装置及び再生方法並びに検索方法
US5930208A (en) Method for integrating information retrieval from a plurality of dissimilar storage media including at least one optical disk
JP2987942B2 (ja) データ検索方法
JPH10254896A (ja) データ圧縮方法
JPH06150524A (ja) 小型光ディスク自動判別起動方式
JPH07508364A (ja) 文書を蓄積および表示する方法およびその装置
JP3116425B2 (ja) 文書検索装置
JP3449494B2 (ja) 情報検索表示装置及びその表示方法
JPH03184171A (ja) 電子ブック再生装置
JPH0636529A (ja) Cd−i再生装置
JPH11212983A (ja) 検索装置
JPH09167472A (ja) Cd−rom検索装置及びしおり付与方法
JPH11232257A (ja) 光ディスク、情報表示装置及び情報表示方法
EP1327988A1 (en) Retrieval method and an apparatus for a multimedia database
JPH0962705A (ja) 記録媒体及び再生装置
JPS60225938A (ja) 情報検索方式
JPH06301723A (ja) 情報処理装置
JPH0258167A (ja) 光デイスクフアイル装置
Burnett CD-ROM Technology
JPH07311775A (ja) 情報再生装置
JPH01209525A (ja) 情報提示装置
JPH01163825A (ja) データベースの記憶およびアクセス方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040601