JP2003006216A - 情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム - Google Patents

情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム

Info

Publication number
JP2003006216A
JP2003006216A JP2001192380A JP2001192380A JP2003006216A JP 2003006216 A JP2003006216 A JP 2003006216A JP 2001192380 A JP2001192380 A JP 2001192380A JP 2001192380 A JP2001192380 A JP 2001192380A JP 2003006216 A JP2003006216 A JP 2003006216A
Authority
JP
Japan
Prior art keywords
information
data
recording medium
recording
capacity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001192380A
Other languages
English (en)
Inventor
Tamaki Maeno
環 前野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001192380A priority Critical patent/JP2003006216A/ja
Priority to KR1020020033591A priority patent/KR20030001261A/ko
Priority to US10/177,905 priority patent/US20030009490A1/en
Priority to CNB021249393A priority patent/CN1190748C/zh
Publication of JP2003006216A publication Critical patent/JP2003006216A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Abstract

(57)【要約】 【課題】 キーワードの重要度が記載されている基準辞
書データを用意する。 【解決手段】 基準辞書データは、例えばXMLなどのマ
ークアップ言語で、<Dic>と</Dic>とで囲まれる範囲に
記述される。各項目のデータは、<Word id="○○">と</
Word>とで囲まれる範囲に記述される。それぞれの項目
には、<Primary>と</Primary>とで囲まれた範囲に示さ
れる必須のキーワードと、<Secondary>と</ Secondary>
とで囲まれた範囲に示される、できるだけ加えた方がよ
いが、辞書データが記録される記録媒体の容量によって
取捨選択されるキーワードが、検索のカテゴリとともに
記述される。Secondaryで示されるキーワードは、取捨
選択を実行するために、重要な順に記述するようにして
も良い。キーワードに続いて、<Title>と</Title>との
間に、項目のタイトルが記述され、続いて、<Text>と</
Text>との間に、本文が記述される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置およ
び情報処理方法、記録媒体、プログラム、並びに電子出
版用データ提供システムに関し、特に、更新作業が行い
やすいような、所定のフォーマットで記述された基準と
なるデータを用いて、記録媒体の容量に対応して、最適
なキーワードで構成されたインデックスデータを有する
電子出版用データを作成することができる情報処理装置
および情報処理方法、記録媒体、プログラム、並びに電
子出版用データ提供システムに関する。
【0002】
【従来の技術】従来、出版は、書籍や新聞、雑誌など、
紙を主要な媒体として行われてきた。しかしながら、コ
ンピュータの発展およびその利用の拡大、並びに、ネッ
トワークの整備が進み、紙以外のメディアによる出版、
すなわち電子出版が広く行われるようになってきた。
【0003】電子出版は、辞書、辞典、百科事典、ある
いは図鑑などの、大量な情報量をもつ出版に特に向いて
おり、例えば、約30巻の百科事典を1枚のCD-ROM(Co
mpact Disk-Read Only Memory)に収録することもでき
る。これまでは紙に印刷されて出版されていた辞典や辞
書をデジタルデータ化し、テキストや画像のみならず、
音声や動画像などを、所定の記憶媒体、パーソナルコン
ピュータ、もしくは、所定の再生装置に記憶させる。ユ
ーザは、例えば、辞書データが本体に記録されている、
あるいは、辞書データが記録された記録媒体が装着され
ているパーソナルコンピュータや所定の再生装置を用い
て、所望する項目を入力することによって、知りたい情
報を検索し、そのデータを再生させることができる。
【0004】また、インターネットの急速な普及によ
り、データをサーバに保存して、インターネットを介し
て、ユーザが利用することができるようになされている
オンライン辞書も広く普及している。更に、メディアの
小型化および大容量化が進んだことによって、小型の電
子辞書も多く利用されている。
【0005】電子辞書のデータは、例えば、図1に示さ
れるように、本文データ2とインデックスデータ1とで
構成される。本文データ2には、紙媒体の辞書と同一の
形式で、テキストデータが記述されており、所定の順番
(例えば、国語辞典や百科事典では、あいうえお順、英
和辞典や英英辞典ではアルファベット順)に、項目と、
その意味などが記載されている。インデックスデータ1
は、本文データ2に含まれる多数の項目の中から、ユー
ザが求める項目を検索するために、キーワードと、その
キーワードに対応する内容(項目)が、本文データ2の
どこに記述されているのかを示すアドレスデータで構成
される。
【0006】従来の紙媒体の辞書においては、ユーザ
が、紙をめくって、所望する項目が記述されているペー
ジを探す必要があったが、電子辞書においては、ユーザ
が、例えばキーボードなどを用いて、所望する項目を入
力することによって、その項目が検索され、その内容が
表示装置に表示される。
【0007】
【発明が解決しようとする課題】例えば、従来紙媒体で
出版されていた辞書に対応する電子データを作成し、検
索処理などを実行可能にするためには、図1を用いて説
明したインデックスデータ1を、辞書の本文データ2に
対応して生成する必要があった。しかしながら、辞書デ
ータが記憶される記憶媒体の容量には限りがあり、本文
データ2のデータ量が決まっている以上、電子辞書のデ
ータ量は、インデックスデータ1で調整しなければなら
なかった。
【0008】また、本文データ2に対応するインデック
スデータ1の作成におけるキーワードの取捨選択には規
則がないため、その内容を熟知した人間が、キーワード
を吟味し、データ量を調整しながら、膨大な時間と労力
をかけて、インデックスデータ1を作成していた。
【0009】例えば、「ダイアモンド」と「ダイヤモン
ド」、「フィルム」と「フイルム」、「ユーザ」と「ユーザー」
など、主に外来語において、カタカナ表記が異なるが、
意味としては同一である単語がある。ユーザが検索操作
を行った場合、どの語が入力されても対応する(ユーザ
が求める検索結果を得る)ことができるように、インデ
ックスデータ1を構成するキーワードは、できるだけ、
これらの単語を含むようにすることが望まれる。従っ
て、ユーザにとって使いやすい辞書を提供するために
は、辞書データが記録される記録媒体の容量に合わせ
て、できるだけ多くのキーワードを含ませることができ
るように、インデックスデータ1を個別に作成する必要
があった。
【0010】また、従来の辞書データにおいては、本文
データ2を基に、独立してインデックスデータ1が作成
されているので、本文に修正が入ったり、本文の項目が
変更、あるいは追加されて、本文データ2のアドレスが
変更された場合、変更されていない項目をも含めたイン
デックスデータ1のアドレスを大幅に変更しなければな
らず、結果的に辞書データ全体の改定を行わなければな
らなかった。
【0011】本発明はこのような状況に鑑みてなされた
ものであり、更新作業が行いやすいような、所定のフォ
ーマットで記述された基準となるデータを用いて、記録
媒体の容量に対応して、最適なキーワードで構成された
インデックスデータを有する電子出版用データを作成す
ることができるようにするものである。
【0012】
【課題を解決するための手段】本発明の情報処理装置
は、第1の情報を取得する取得手段と、取得手段により
取得された第1の情報から、キーワードに対応する複数
の第3の情報および本文データに対応する第4の情報を
抽出する抽出手段と、第2の情報の出力先となる他の情
報処理装置、あるいは記録媒体の記録容量を検出する検
出手段と、複数の第3の情報それぞれに対して重要度の
レベルを判定する判定手段と、検出手段による検出結
果、および判定手段による判定結果に基づいて、第3の
情報と第4の情報との総容量が、他の情報処理装置ある
いは記録媒体に記録することができる容量となるよう
に、第3の情報を選択する選択手段と、選択手段により
選択された第3の情報をインデックスデータとして、第
4の情報を付加して第2の情報を生成する生成手段と、
生成手段により生成された第2の情報を他の情報処理装
置あるいは記録媒体に出力する出力手段とを備えること
を特徴とする。
【0013】第3の情報は、重要度のレベルによって予
め分類され、分類に対応した所定の情報が付加されて、
第1の情報に含まれるものとすることができ、判定手段
には、第3の情報が有する所定の情報に基づいて、第3
の情報の重要度を判断させるようにすることができる。
【0014】第3の情報は、重要度のレベルが高い順に
予め並べられるものとすることができ、判定手段には、
第3の情報の順番に基づいて、第3の情報の重要度を判
断させるようにすることができる。
【0015】インデックスデータは、第2の情報を取得
した他の情報処理装置に、本文の検索を実行させるため
のデータであるものとすることができ、第3の情報は、
検索の方法によって予め分類され、分類に対応した所定
の情報が付加されて、第1の情報に含まれているものと
することができる。
【0016】第1の情報は、マークアップ言語で記述さ
れているものとすることができる。
【0017】抽出手段には、キーワードに対応する複数
の第3の情報および本文データに対応する第4の情報に
それぞれ付加された、情報の種類を示すタグ情報に基づ
いて、取得手段により取得された第1の情報から、第3
の情報および第4の情報を抽出させるようにすることが
できる。
【0018】本発明の情報処理方法は、第1の情報を取
得する取得ステップと、取得ステップの処理により取得
された第1の情報から、キーワードに対応する複数の第
3の情報および本文データに対応する第4の情報を抽出
する抽出ステップと、第2の情報の出力先となる他の情
報処理装置、あるいは記録媒体の記録容量を検出する検
出ステップと、複数の第3の情報それぞれに対して重要
度のレベルを判定する判定ステップと、検出ステップの
処理による検出結果、および判定ステップの処理による
判定結果に基づいて、第3の情報と第4の情報との総容
量が、他の情報処理装置あるいは記録媒体に記録するこ
とができる容量となるように、第3の情報を選択する選
択ステップと、選択ステップの処理により選択された第
3の情報をインデックスデータとして、第4の情報を付
加して第2の情報を生成する生成ステップと、生成ステ
ップの処理により生成された第2の情報を、他の情報処
理装置あるいは記録媒体に出力する出力ステップとを含
むことを特徴とする。
【0019】本発明の記録媒体に記録されているプログ
ラムは、第1の情報を取得する取得ステップと、取得ス
テップの処理により取得された第1の情報から、キーワ
ードに対応する複数の第3の情報および本文データに対
応する第4の情報を抽出する抽出ステップと、第2の情
報の出力先となる他の情報処理装置、あるいは記録媒体
の記録容量を検出する検出ステップと、複数の第3の情
報それぞれに対して重要度のレベルを判定する判定ステ
ップと、検出ステップの処理による検出結果、および判
定ステップの処理による判定結果に基づいて、第3の情
報と第4の情報との総容量が、他の情報処理装置あるい
は記録媒体に記録することができる容量となるように、
第3の情報を選択する選択ステップと、選択ステップの
処理により選択された第3の情報をインデックスデータ
として、第4の情報を付加して第2の情報を生成する生
成ステップと、生成ステップの処理により生成された第
2の情報を、他の情報処理装置あるいは記録媒体に出力
する出力ステップとを含むことを特徴とする。
【0020】本発明のプログラムは、第1の情報を取得
する取得ステップと、取得ステップの処理により取得さ
れた第1の情報から、キーワードに対応する複数の第3
の情報および本文データに対応する第4の情報を抽出す
る抽出ステップと、第2の情報の出力先となる他の情報
処理装置、あるいは記録媒体の記録容量を検出する検出
ステップと、複数の第3の情報それぞれに対して重要度
のレベルを判定する判定ステップと、検出ステップの処
理による検出結果、および判定ステップの処理による判
定結果に基づいて、第3の情報と第4の情報との総容量
が、他の情報処理装置あるいは記録媒体に記録すること
ができる容量となるように、第3の情報を選択する選択
ステップと、選択ステップの処理により選択された第3
の情報をインデックスデータとして、第4の情報を付加
して第2の情報を生成する生成ステップと、生成ステッ
プの処理により生成された第2の情報を、他の情報処理
装置あるいは記録媒体に出力する出力ステップとを含む
ことを特徴とする。
【0021】本発明の電子出版用データ提供システム
は、所定のフォーマットで記載されている第1の情報を
記録する記録装置と、所定のフォーマットで記載された
第1の情報を、インデックスデータと本文データで構成
される第2の情報に変換する情報処理装置と情報処理装
置から第2の情報の供給を受けて記録する記録媒体とで
構成され、記録装置は、第1の情報を記録する第1の記
録手段と、第1の記録手段により記録された第1の情報
を出力する出力手段とを備え、第1の情報は複数の項目
を含み、項目は、キーワードに対応する複数の第3の情
報および本文データに対応する第4の情報から構成さ
れ、第3の情報および第4の情報には、情報の種類を示
すタグ情報が付加され、第3の情報は、重要度のレベル
によって予め分類され、分類に対応した所定の情報が付
加され、情報処理装置は、記録装置から、第1の情報を
取得する取得手段と、取得手段により取得された第1の
情報から、タグ情報を基に、第3の情報および第4の情
報を抽出する抽出手段と、記録媒体の記録容量を検出す
る検出手段と、分類に対応した所定の情報を基に、第3
の情報それぞれに対して重要度のレベルを判定する判定
手段と、検出手段による検出結果、および判定手段によ
る判定結果に基づいて、第3の情報と第4の情報との総
容量が、記録媒体に記録することができる容量となるよ
うに、第3の情報を選択する選択手段と、選択手段によ
り選択された第3の情報をインデックスデータとして、
第4の情報を付加して第2の情報を生成する生成手段
と、生成手段により生成された第2の情報を、記録媒体
に出力する出力手段とを備え、記録媒体は、出力手段に
より出力された第2の情報を記録する第2の記録手段を
備えることを特徴とする。
【0022】記録媒体は、他の情報処理装置の内部に備
えられているものとすることができる。
【0023】第1の情報は、マークアップ言語で記述さ
れているものとすることができる。
【0024】本発明の情報処理装置および情報処理方法
並びにプログラムにおいては、第1の情報が取得され、
取得された第1の情報から、キーワードに対応する複数
の第3の情報および本文データに対応する第4の情報が
抽出され、第2の情報の出力先となる他の情報処理装
置、あるいは記録媒体の記録容量が検出され、複数の第
3の情報それぞれに対して重要度のレベルが判定され、
記録容量の検出結果、およびレベルの判定結果に基づい
て、第3の情報と第4の情報との総容量が、他の情報処
理装置あるいは記録媒体に記録することができる容量と
なるように、第3の情報が選択され、選択された第3の
情報をインデックスデータとして、第4の情報を付加し
て第2の情報が生成され、生成された第2の情報が、他
の情報処理装置あるいは記録媒体に出力される。
【0025】本発明の電子出版用データ提供システムに
おいては、記録装置で、第1の情報が記録され、記録さ
れた第1の情報が出力され、第1の情報には複数の項目
が含まれ、項目は、キーワードに対応する複数の第3の
情報および本文データに対応する第4の情報から構成さ
れ、第3の情報および第4の情報には、情報の種類を示
すタグ情報が付加され、第3の情報は、重要度のレベル
によって予め分類され、分類に対応した所定の情報が付
加され、情報処理装置で、記録装置から、第1の情報が
取得され、取得された第1の情報から、タグ情報を基
に、第3の情報および第4の情報が抽出され、記録媒体
の記録容量が検出され、分類に対応した所定の情報を基
に、第3の情報それぞれに対して重要度のレベルが判定
され、記録容量の検出結果、およびレベルの判定結果に
基づいて、第3の情報と第4の情報との総容量が、記録
媒体に記録することができる容量となるように、第3の
情報が選択され、選択された第3の情報をインデックス
データとして、第4の情報を付加して第2の情報が生成
され、生成された第2の情報が、記録媒体に出力され、
記録媒体で、出力された第2の情報が記録される。
【0026】
【発明の実施の形態】以下、図を参照して、本発明の実
施の形態について説明する。
【0027】図2を用いて、本発明を適応した電子辞書
提供システムについて説明する。
【0028】辞書データベース11には、辞書の作成の
基本となる基準辞書データが、例えば、XML(eXtensibl
e Markup Language)などのマークアップ言語で記述さ
れている。XMLは、HTMLのような固定のマークアップ方
法だけではなく、独自のマークアップ方法を定義できる
マークアップ言語であり、シンプルなフォーマットで文
書構造を記述することができる。独自にタグを定義でき
るため、XMLを用いることにより、人間が理解しやすい
構造でデータを記述することが可能となり、また、柔軟
性に富んだデータ構築が可能となる。
【0029】パーソナルコンピュータ12は、辞書デー
タベース11から、XMLで記述された基準辞書データを
読み込んで、変換し、本文とインデックスデータを有す
る辞書データを生成する。
【0030】パーソナルコンピュータ12は、例えば、
インターネット20に接続されているWWWサーバ13、
磁気ディスク14、光ディスク15、光磁気ディスク1
6、もしくは、半導体メモリ17(メモリースティック
(商標)を含む)などの各種記録媒体、あるいは、専用
の再生装置である電子辞書18の内部のメモリに、それ
ぞれの記録容量に合わせたインデックスデータを有する
辞書データを出力し、記録させる。
【0031】WWWサーバ13は、インターネット20を
介して、例えば、ユーザが有するPDA21やパーソナル
コンピュータ22に、辞書データをダウンロードさせた
り、ウェブページ上の辞書検索サービスを提供する。
【0032】磁気ディスク14、光ディスク15、光磁
気ディスク16、もしくは、半導体メモリ17などの各
種記録媒体は、個人ユーザが有するPDA21、パーソナ
ルコンピュータ22、あるいは、電子辞書18などに装
着される。
【0033】電子辞書18、PDA21、もしくはパーソ
ナルコンピュータ22は、インターネット20を介して
WWWサーバ13からダウンロードし、内部のメモリに記
録した辞書データ、もしくは、装着された記録媒体(例
えば、磁気ディスク14、光ディスク15、光磁気ディ
スク16、もしくは、半導体メモリ17)に記録されて
いる辞書データから、ユーザの操作に基づいて、ユーザ
が入力した項目のデータを検索して、例えばディスプレ
イやタッチパネルなどの表示装置に表示させる。
【0034】電子辞書18は、予めその内部に記録され
ている、もしくはユーザの処理によって内部に記録され
た辞書データ、あるいは、装着された記録媒体に記録さ
れている辞書データを基に、ユーザの操作に基づいて、
ユーザが入力した項目に対応するデータを検索して、表
示させる。
【0035】図3は、図2のパーソナルコンピュータ1
2の構成を示すブロック図である。
【0036】CPU(Central Processing Unit)31は、
入出力インターフェース32および内部バス33を介し
て、ユーザが、入力部34を用いて入力した各種指令に
対応する信号や、ネットワークインターフェース40を
介して、他のパーソナルコンピュータ(例えば、パーソ
ナルコンピュータ22など)が送信した制御信号の入力
を受け、入力された信号に基づいた各種処理を実行す
る。ROM(Read Only Memory)35は、CPU31が使用す
るプログラムや演算用のパラメータのうちの基本的に固
定のデータを格納する。RAM(Random Access Memory)
36は、CPU31の実行において使用するプログラム
や、その実行において適宜変化するパラメータを格納す
る。CPU31、ROM35、およびRAM36は、内部バス3
3により相互に接続されている。
【0037】内部バス33は、入出力インターフェース
32とも接続されている。入力部34は、例えば、キー
ボード、タッチパッド、ジョグダイヤル、あるいはマウ
スなどからなり、ユーザがCPU31に各種の指令を入力
するとき操作される。表示部37は、例えば、CRT
(Cathode Ray Tube)や液晶表示装置などからなり、各
種情報をテキスト、あるいはイメージなどで表示する。
【0038】HDD(hard disk drive)38は、ハー
ドディスクを駆動し、それらにCPU31によって実行す
るプログラムや情報を記録または再生させる。ドライブ
39には、必要に応じて磁気ディスク14、光ディスク
15、光磁気ディスク16、および半導体メモリ17が
装着され、データの授受を行う。
【0039】ネットワークインターフェース40は、例
えば、WWWサーバ13や電子辞書18と所定のケーブル
を用いて接続され、それらの機器との情報の授受を行っ
たり、辞書データベース11にアクセスし、必要な情報
を検索して、読み込んだり、新たなデータを登録した
り、登録されているデータの更新を行う。
【0040】これらの入力部34乃至ネットワークイン
ターフェース40は、入出力インターフェース32およ
び内部バス33を介してCPU31に接続されている。
【0041】また、WWWサーバ13、およびインターネ
ット20を介して接続されている、ユーザが保有するパ
ーソナルコンピュータ22の構成も、図3を用いて説明
したパーソナルコンピュータ12の構成と、基本的に同
様であるので、その説明は省略する。
【0042】図4は、図2の電子辞書18の構成を示す
ブロック図である。
【0043】CPU(Central Processing Unit)51は、
ユーザが、キー操作部52を用いて入力した各種指令に
対応する信号や、通信部58を介して入力された制御信
号に基づいた各種処理を実行する。ROM(Read Only Mem
ory)53は、CPU51が使用するプログラムや演算用の
パラメータのうちの基本的に固定のデータを格納する。
RAM(Random Access Memory)54は、CPU51の実行に
おいて使用するプログラムや、その実行において適宜変
化するパラメータを格納する。
【0044】辞書ROM55は、パーソナルコンピュー
タ12から入力された、もしくは通信部58を介してWW
Wサーバ13からダウンロードされた辞書データを記録
する。
【0045】表示制御部56は、CPU51の制御に従っ
て、表示パネル57に、各種情報をテキスト、あるいは
イメージなどで表示させる。表示パネル57は、例え
ば、CRT(Cathode Ray Tube)や液晶表示装置などか
ら構成され、表示制御部56の制御に従って、各種情報
をテキスト、あるいはイメージなどで表示する。
【0046】インターフェース59には、ドライブ60
が接続されるとともに、半導体メモリ17が接続され、
データの授受を行う。ドライブ60には、必要に応じて
磁気ディスク14、光ディスク15、もしくは光磁気デ
ィスク16が装着され、データの授受を行う。
【0047】通信部58は、パーソナルコンピュータ1
2と接続され、情報の授受を行ったり、登録されている
データの更新を行うために、インターネット20を介し
て、WWWサーバ13にアクセスし、WWWサーバ13から必
要な情報を検索して、ダウンロードする処理を実行す
る。
【0048】次に、図5を用いて、PDA21の内部構成
について説明する。
【0049】CPU(Central Processing Unit)71は、
発振器72から供給されるクロック信号に同期して、Fl
ash ROM(Read only Memory)73またはEDO DRAM(Ext
ended Data Out Dynamic Random Access Memory)74
に格納されているオペレーティングシステム、または開
発されたアプリケーションプログラムなどの各種のプロ
グラムを実行する。
【0050】Flash ROM73は、EEPROM(Electrically
Erasable Programmable Read OnlyMemory)の一種であ
るフラッシュメモリで構成され、一般的には、CPU71
が使用するプログラムや演算用のパラメータのうちの基
本的に固定のデータを格納する。EDO DRAM74は、CPU
71の実行において使用するプログラムや、その実行に
おいて適宜変化するパラメータを格納する。
【0051】メモリースティックインターフェース75
は、PDA21に装着されているメモリースティック91
からデータを読み出すとともに、CPU71から供給され
たデータをメモリースティック91に書き込む。
【0052】USB(Universal Serial Bus)インターフ
ェース76は、発振器77から供給されるクロック信号
に同期して、接続されているUSB機器であるドライブ8
3からデータまたはプログラムを入力するとともに、CP
U71から供給されたデータをドライブ83に供給す
る。USBインターフェース76は、発振器77から供給
されるクロック信号に同期して、接続されているUSB機
器であるクレードル84からデータまたはプログラムを
入力するとともに、CPU71から供給されたデータをク
レードル84に供給する。
【0053】クレードル84とは、PDA21とパーソナ
ルコンピュータとを有線で接続し、いわゆるホットシン
クと称される処理により、データのシンクロナイズを実
行するためのドッキングステーションである。
【0054】また、USBインターフェース76には、ド
ライブ83も接続されている。ドライブ83は、装着さ
れている磁気ディスク14、光ディスク15、光磁気デ
ィスク16、または半導体メモリ17に記録されている
データまたはプログラムを読み出して、そのデータまた
はプログラムを、USBインターフェース76を介して、
接続されているCPU71またはEDO DRAM74に供給す
る。また、ドライブ83は、CPU71から供給されたデ
ータまたはプログラムを、装着されている磁気ディスク
14、光ディスク15、光磁気ディスク16、または半
導体メモリ17に記録させる。
【0055】また、PDA21は、携帯型電話機やPHS(Pe
rsonal Handyphone System)などと接続することも可能
であり、インターネット20を介して、WWWサーバ13
にアクセスすることができる。
【0056】Flash ROM73、EDO DRAM74、メモリー
スティックインターフェース75、およびUSBインター
フェース76は、アドレスバスおよびデータバスを介し
て、CPU71に接続されている。
【0057】表示部90は、LCDバスを介して、CPU71
からデータを受信し、受信したデータに対応する画像ま
たは文字などを表示する。タッチパッド制御部78は、
表示部90の上側に設けられたタッチパッドが操作され
たとき、操作に対応したデータ(例えば、タッチされた
座標を示す)を表示部90から受信し、受信したデータ
に対応する信号を、シリアルバスを介してCPU71に供
給する。
【0058】EL(Electroluminescence)ドライバ79
は、表示部90の液晶表示部の裏側に設けられている電
界発光素子を動作させ、表示部90の表示の明るさを制
御する。
【0059】赤外線通信部80は、CPU71から受信し
たデータを、赤外線を媒体として、UART(Universal as
ynchronous receiver transmitter)を介して、図示せ
ぬ他の機器に送信するとともに、他の機器から送信され
た赤外線を媒体とするデータを受信して、CPU71に供
給する。すなわち、PDA21は、UARTを介して、他の機
器と通信することができる。
【0060】音声再生部82は、スピーカ、および音声
のデータの復号回路などから構成され、予め記憶してい
る音声のデータ、またはインターネット20を介して受
信した音声データなどを復号して、再生し、音声を出力
する。例えば、音声再生部82は、バッファ81を介し
て、CPU71から供給された音声のデータを再生して、
データに対応する音声を出力する。
【0061】キー88は、例えば、入力キーなどで構成
され、CPU71に各種の指令を入力するとき、使用者に
より操作される。
【0062】ジョグダイヤル89は、回転操作または本
体側への押圧操作に対応するデータをCPU71に供給す
る。
【0063】電源回路87は、装着されているバッテリ
85または接続されているAC(Alternating curren
t)アダプタ86から供給される電源の電圧を変換し
て、電源をCPU71乃至音声再生部82のそれぞれに供
給する。
【0064】次に、図6を参照して、辞書データベース
11に記録されている基準辞書データについて説明す
る。
【0065】基準辞書データは、例えばXMLなどのマー
クアップ言語で記述されている。ひとつの辞書は、<Dic
>で始まり、</Dic>で終わる範囲に記述される。辞書に
掲載されている各項目のデータは、<Word id="○○">で
始まり、</Word>で終わる範囲(図6における図中Eで示
される範囲およびFで示される範囲)に記述される。
【0066】それぞれの項目(例えば、辞書の場合、
「見出し語」にあたる単語)には、レベル毎にキーワー
ドが記載され、それぞれのキーワードには、キーワード
が用いられる検索のカテゴリが記述されている。すなわ
ち、それぞれの項目には、<Primary>と</Primary>とで
囲まれた範囲(図6における図中Aで示される範囲)に
示される必須のキーワードと、<Secondary>と</ Second
ary>とで囲まれた範囲(図6における図中Bで示される
範囲)に示される、できるだけ加えた方がよいとされる
キーワードが記述されている。そして、それぞれのキー
ワードは、例えば、前方一致検索、後方一致検索、完全
一致検索、もしくはかけあわせ検索など、キーワードが
用いられる検索のカテゴリとともに、<Key category="
カテゴリ名">キーワード(項目名)</Key>という形式で
記述される。
【0067】Primaryで示される必須のキーワードは、
この基準辞書データを用いて作成される全ての辞書にお
いて記載されなければならないキーワードである。それ
に対して、Secondaryで示されるキーワードは、辞書デ
ータが記録される記録媒体の容量によって、取捨選択さ
れるキーワードである。Secondaryで示されるキーワー
ドは、後述する処理により取捨選択ができるように、例
えば、図6に示すように、<Secondary>と</Secondary>
とで囲まれる範囲で、重要な順に記述されるようにし
て、キーワードとして優先的に選択されるようにしても
良いし、図7に示されるように、<Secondary>と</Secon
dary>とで囲まれる範囲を複数用意し、上位に記述され
ている<Secondary>と</Secondary>とで囲まれる範囲
が、キーワードとして優先的に選択されるようにしても
良い。
【0068】ここでは、検索のカテゴリとして、前方一
致検索に対応する"normal-search"およびかけあわせ検
索に対応する"multi-search"が用いられているが、これ
以外のカテゴリを用いても良いし、3つ以上のカテゴリ
を用いて分類するようにしても良い。
【0069】それぞれの項目には、PrimaryおよびSecon
daryで示されるキーワードに続いて、<Title>と</Title
>との間に、項目のタイトル(図中Cで示される)が記
述され、続いて、<Text>と</Text>との間に、本文(図
中Dで示される)が記述される。<Text>と</Text>との
間に記述される本文は、複数であっても良い。
【0070】パーソナルコンピュータ12は、図6およ
び図7を用いて説明したような基準辞書データを基にし
て、図8に示されるように、検索処理がしやすいよう
に、インデックスと本文に分割された辞書データを作成
する。
【0071】インデックスには、それぞれの単語を検索
するためのキーワードと、本文中のそれぞれの単語のア
ドレスが記載され、本文には、それぞれの単語のタイト
ルおよび本文が記載される。
【0072】ここで、インデックスデータのデータ容量
は、上述したように、辞書データが記録される記録媒体
の記録容量に基づいて決定されなければならないので、
パーソナルコンピュータ12のCPU31は、基準辞書デ
ータのキーワードと本文を分割して、辞書データを生成
するのみならず、辞書データが記録される記録媒体の記
録容量に基づいて、インデックスデータのデータ容量を
決定する。そして、CPU31は、そのデータ容量にあわ
せて、インデックスデータに含まれるキーワードを、図
6および図7を用いて説明したキーワードのレベルに基
づいて、取捨選択し、辞書データを生成する。
【0073】次に、図9のフローチャートを参照して、
パーソナルコンピュータ12が実行する辞書データ変換
処理について説明する。
【0074】ステップS21において、CPU31は、
内部バス33、入出力インターフェース32、およびネ
ットワークインターフェース40を介して、辞書データ
ベース11から、変換処理を行う辞書に対応する基準辞
書データを読み込み、その中から、1つの単語のデー
タ、すなわち、図6および図7を用いて説明した<Wordi
d="○○">から、</word>までの範囲に含まれるデータを
読み込む。
【0075】ステップS22において、CPU31は、
プライマリ内のキーワード、すなわち、<Primary>と</P
rimary>とで囲まれた範囲(図6もしくは図7におい
て、Aで示される範囲)のうちの<Key category="カテ
ゴリ名">項目名</Key>という形式で記述されているキー
ワードのうちのまだ処理が終了していないキーワードに
着目し、そのカテゴリ名をRAM36に保存する。
【0076】ステップS23において、CPU31は、
ステップS22において着目したキーワードの内容、す
なわち、<Key category="カテゴリ名">項目名</Key>と
いう形式で記述されているうちの「項目名」を、ステップ
S22において保存されたカテゴリ名と対応させて、RA
M36に保存する。
【0077】ステップS24において、CPU31は、
プライマリ内、すなわち、<Primary>と</Primary>とで
囲まれた範囲(図6もしくは図7において、Aで示され
る範囲)に、未処理のキーワードが残っているか否かを
判断する。ステップS24において、プライマリ内に未
処理のキーワードが残っていると判断された場合、処理
はステップS22に戻り、それ以降の処理が繰り返され
る。
【0078】ステップS24において、プライマリ内に
未処理のキーワードが残っていない、すなわち、プライ
マリのキーワードは全て処理されたと判断された場合、
ステップS25において、CPU31は、セカンダリ内
のキーワード、すなわち、<Secondary>と</Secondary>
とで囲まれる範囲(図6もしくは図7において、Bで示
される範囲)のうちの<Key category="カテゴリ名">項
目名</Key>という形式で記述されているキーワードのう
ちの未処理のキーワードに着目し、そのカテゴリ名をRA
M36に保存する。
【0079】ステップS26において、CPU31は、
ステップS25において着目したキーワードの内容、す
なわち、<Key category="カテゴリ名">項目名</Key>と
いう形式で記述されているうちの「項目名」を、ステップ
S25において保存されたカテゴリ名に対応させて、RA
M36に保存する。
【0080】ステップS27において、CPU31は、
セカンダリ内に未処理のキーワードが残っているか否か
を判断する。ステップS27において、セカンダリ内に
未処理のキーワードが残っていると判断された場合、処
理はステップS25に戻り、それ以降の処理が繰り返さ
れる。
【0081】ステップS27において、セカンダリ内に
未処理のキーワードが残っていない、すなわち、処理中
の単語に含まれる、全てのキーワードの処理が終了され
たと判断された場合、ステップS28において、CPU
31は、タイトルと本文内容(図6もしくは図7のCお
よびDで示される情報)を、RAM36に予め用意されて
いる本文ファイルに出力する。
【0082】ステップS29において、CPU31は、
RAM36の本文ファイル中の保存領域のアドレス(ここ
では、相対アドレスとする)を、ステップS23および
ステップS26においてRAM36に保存された全てのキ
ーワードに対するアドレスとして、全てのキーワードに
関連付けて保存させる。
【0083】ステップS30において、CPU31は、
処理中の基準辞書データに、未処理の単語が残っている
か否かを判断する。ステップS30において、処理中の
基準辞書データに、未処理の単語が残っていると判断さ
れた場合、処理は、ステップS21に戻り、それ以降の
処理が繰り返される。
【0084】ステップS30において、処理中の基準辞
書データに、未処理の単語が残っていないと判断された
場合、ステップS31において、CPU31は、RAM3
6に保存された、プライマリおよびセカンダリの両方の
キーワードについて、キーワードとアドレスのペアをカ
テゴリ毎に分類する。
【0085】図10は、図6を用いて説明した基準辞書
データに対して、ステップS28において生成された本
文データと、ステップS31において分類されたキーワ
ードを示す図である。ここでは、キーワードのカテゴリ
として、前方一致検索とかけあわせ検索が用意されてい
るので、それぞれのカテゴリ毎に、プライマリとセカン
ダリに分類される。すなわち、キーワードは、4つに分
類される。
【0086】また、図11は、図7を用いて説明した基
準辞書データに対して、ステップS28において生成さ
れた本文データと、ステップS31において分類された
キーワードを示す図である。図7を用いて説明した基準
辞書データにおいては、セカンダリのキーワードが、予
め重要度によって分類されているので、ステップS31
において、キーワードとアドレスのペアをカテゴリ毎に
分類するにあたり、図11に示されるように、セカンダ
リのキーワードを複数に分類するようにしても良い。
【0087】ステップS32において、CPU31は、
変換処理によって作成される辞書データを記録させる記
憶媒体、もしくは装置の種類(例えば、図2を用いて説
明したWWWサーバ13、磁気ディスク14、光ディスク
15、光磁気ディスク16、半導体メモリ17、電子辞
書18、PDA21、もしくはパーソナルコンピュータ2
2のうちのいずれであるか)に基づいて、すべてのデー
タが記憶媒体の容量に収まるか否かを判断する。
【0088】ステップS32において、すべてのデータ
が記憶媒体の容量に収まらないと判断された場合、ステ
ップS33において、CPU31は、セカンダリのキー
ワードのデータ容量を調べ、採用するレベルを計算し、
計算結果に基づいて、セカンダリのキーワードを必要に
応じて削除する。
【0089】ステップS32において、すべてのデータ
が記憶媒体の容量に収まると判断された場合、もしく
は、ステップS33の処理の終了後、ステップS34に
おいて、CPU31は、カテゴリ毎に、プライマリ、お
よびセカンダリのキーワードをマージし、ソートして、
本文データを付加し、図8を用いて説明した形式の辞書
データを作成し、処理が終了される。
【0090】このような処理により、ただ1つの基準辞
書データを基に、簡単な処理で、記録容量に適したイン
デックスデータのデータ量を有する辞書データを作成す
ることができる。ここでは、出力先の記録媒体、もしく
は各種装置がその内部に有するメモリ等の容量に応じ
て、インデックスデータのデータ量を決定するようにし
たが、例えば、1つの記録媒体に複数の辞書データを保
存したい場合などに対応することができるように、辞書
データの作成管理者が、作成される辞書データのデータ
量を、入力部34を用いて入力し、指定することが可能
なようにしても良い。
【0091】作成された辞書データは、図2を用いて説
明したように、磁気ディスク14、光ディスク15、光
磁気ディスク16、あるいは半導体メモリ17などの記
録媒体に記録されたリ、電子辞書18が内部に有する辞
書ROM55に記録されて、ユーザに配布される。あるい
は、作成された辞書データは、WWWサーバ13に出力さ
れ、インターネット20を介して、ユーザが保有するPD
A21、もしくはパーソナルコンピュータ22によって
ダウンロードされて利用されたり(この場合は、ダウン
ロードされる装置によって容量の異なるダウンロード用
辞書データを、WWWサーバ13に記憶させるようにすれ
ば良い)、ウェブページ上での辞書検索サービスとして
提供される。
【0092】また、図9を用いて説明した処理において
は、キーワードとアドレスのペアをカテゴリ毎に分類し
た後に、変換後の辞書データの記録先の容量が確認され
て、その結果に従って、セカンダリキーワードが取捨選
択される(必要な分だけ削除される)ものとして説明し
たが、予め、変換後の辞書データの記録先の容量を確認
してから、キーワードとアドレスのペアをカテゴリ毎に
分類するようにしても良い。特に、基準辞書データが、
図7を用いて説明した形式であり、セカンダリキーワー
ドがレベル別に個別に記載されているような場合は、変
換後の辞書データの記録先データ記録容量を予め確認し
て、その容量に基づいて変換処理を実行するようにして
も良い。
【0093】図6もしくは図7を用いて説明した基準辞
書データの構成によると、変換後の辞書データの出力先
である磁気ディスク14、光ディスク15、光磁気ディ
スク16、あるいは半導体メモリ17などの記録媒体、
電子辞書18、WWWサーバ13、PDA21、もしくはパー
ソナルコンピュータ22などの記録容量に基づいて、柔
軟にデータサイズを変更することができる。
【0094】更に、図6もしくは図7を用いて説明した
基準辞書データの構成によると、基準辞書データの内容
の変更やキーワードの変更が容易であり、本文データに
変更、追加、あるいは削除などがあった場合において
も、従来の電子辞書の改定作業のように、大幅にデータ
を書き換える必要はない(必要な部分のみ、追加、削
除、もしくは変更すればよい)。また、変更が実施され
た場合においても、基準辞書データから、実際に配布さ
れる辞書データを作成する処理に何ら影響を及ぼすこと
もない。
【0095】次に、図12のフローチャートを参照し
て、図9のフローチャートを用いて説明した処理により
生成された辞書データを記憶した記録媒体が装着された
電子辞書18、あるいは、辞書データを辞書ROM55
に保存した電子辞書18が実行する辞書検索処理につい
て説明する。ここでは、完全一致検索について説明す
る。
【0096】ステップS41において、CPU51は、ユ
ーザによって、キー操作部52から、キーワードの入力
を受ける。
【0097】ステップS42において、CPU51は、RAM
54内のインデックスの番号を示すレジスタの値nをn
=0とする。
【0098】CPU51は、ステップS43において、辞
書ROM55に保存されている辞書データ、もしくは、装
着されている記録媒体に記録されている辞書データのう
ち、インデックスデータのn番目のキーワードを読み込
み、ステップS44において、読み込まれたキーワード
と入力されたキーワードが一致するか否かを判断する。
【0099】ステップS44において、読み込まれたキ
ーワードと入力されたキーワードが一致しないと判断さ
れた場合、ステップS45において、CPU51は、辞書R
OM55から読み込まれたキーワード、もしくはインター
フェース59を介して記録媒体から読み込まれたキーワ
ードは、入力されたキーワードより、昇順で後となる語
句か否かを判断する。
【0100】ステップS45において、読み込まれたキ
ーワードは、入力されたキーワードより、昇順で後とな
る語句ではない、すなわち、昇順で前の語句であると判
断された場合、ステップS46において、CPU51は、R
AM54内のインデックスの番号を示すレジスタの値nを
n=n+1とし、処理は、ステップS43に戻り、それ
以降の処理が繰り返される。
【0101】ステップS44において、読み込まれたキ
ーワードと入力されたキーワードが一致したと判断され
た場合、CPU51は、ステップS47において、一致し
たキーワードのアドレスを獲得し、辞書データのうち
の、対応する本文が記録されている領域へアクセスし、
ステップS48において、表示制御部56を制御して、
表示パネル57にアクセスした本文のデータを表示さ
せ、処理が終了される。
【0102】ステップS45において、読み込まれたキ
ーワードは、入力されたキーワードより、昇順で後とな
る語句であると判断された場合、ステップS49におい
て、CPU51は、表示制御部56を制御して、表示パネ
ル57に「該当なし」のメッセージを表示させ、処理が終
了される。
【0103】このような処理により、作成された辞書デ
ータを用いて、完全一致検索処理が実行される。なお、
前方一致検索が実行される場合は、ステップS44の処
理において、入力されたキーワードに対して、読み込ま
れたキーワードの前方向から一致するか否かを判断すれ
ばよいし、後方一致検索が実行される場合は、同様に、
読み込まれたキーワードの後方向から一致するか否かを
判断すればよい。また、かけあわせ検索が実行される場
合は、入力されたキーワードに対して、かけあわせ検索
インデックスに含まれるインデックスデータに一致する
ものがあるか否かを判断すれば良い。
【0104】ここでは、電子辞書18を例として説明し
たが、図2を用いて説明したWWWサーバ13、PDA21、
もしくはパーソナルコンピュータ22が、辞書データを
内部に保存している場合、もしくは、辞書データを記録
した磁気ディスク14、光ディスク15、光磁気ディス
ク16、半導体メモリ17などの記録媒体が装着されて
いる場合にも、同様の処理が実行される。
【0105】なお、以上においては、電子辞書を例とし
て説明したが、本発明は、例えば、百科事典や専門書な
ど、インデックスが必要な電子出版物の全てに適合させ
ることが可能である。
【0106】上述した一連の処理は、ソフトウェアによ
り実行することもできる。そのソフトウェアは、そのソ
フトウェアを構成するプログラムが、専用のハードウェ
アに組み込まれているコンピュータ、または、各種のプ
ログラムをインストールすることで、各種の機能を実行
することが可能な、例えば汎用のパーソナルコンピュー
タなどに、記録媒体からインストールされる。
【0107】この記録媒体は、図2乃至図5に示すよう
に、コンピュータとは別に、ユーザにプログラムを提供
するために配布される、プログラムが記録されている磁
気ディスク14(フレキシブルディスクを含む)、光デ
ィスク15(CD-ROM(Compact Disk-Read Only Memor
y),DVD(Digital Versatile Disk)を含む)、光磁気
ディスク16(MD(Mini-Disk)(商標)を含む)、も
しくは半導体メモリ17などよりなるパッケージメディ
アなどにより構成される。
【0108】また、本明細書において、記録媒体に記録
されるプログラムを記述するステップは、記載された順
序に沿って時系列的に行われる処理はもちろん、必ずし
も時系列的に処理されなくとも、並列的あるいは個別に
実行される処理をも含むものである。
【0109】なお、本明細書において、システムとは、
複数の装置により構成される装置全体を表すものであ
る。
【0110】
【発明の効果】本発明の情報処理装置および情報処理方
法並びにプログラムによれば、第1の情報を取得し、取
得された第1の情報から、キーワードに対応する複数の
第3の情報および本文データに対応する第4の情報を抽
出し、第2の情報の出力先となる他の情報処理装置、あ
るいは記録媒体の記録容量を検出し、複数の第3の情報
それぞれに対して重要度のレベルを判定し、記録容量の
検出結果、およびレベルの判定結果に基づいて、第3の
情報と第4の情報との総容量が、他の情報処理装置ある
いは記録媒体に記録することができる容量となるよう
に、第3の情報を選択し、選択された第3の情報をイン
デックスデータとして、第4の情報を付加して第2の情
報を生成し、生成された第2の情報を、他の情報処理装
置あるいは記録媒体に出力するようにしたので、更新作
業が行いやすいような、所定のフォーマットで記述され
た基準となるデータを用いて、記録媒体の容量に対応し
て、最適なキーワードで構成されたインデックスデータ
を有する電子出版用データを作成することができる。
【0111】本発明の電子出版用データ提供システムに
よれば、記録装置で、第1の情報を記録し、記録された
第1の情報を出力し、第1の情報には複数の項目が含ま
れ、項目は、キーワードに対応する複数の第3の情報お
よび本文データに対応する第4の情報から構成され、第
3の情報および第4の情報には、情報の種類を示すタグ
情報が付加され、第3の情報は、重要度のレベルによっ
て予め分類され、分類に対応した所定の情報が付加さ
れ、情報処理装置で、記録装置から、第1の情報を取得
し、取得された第1の情報から、タグ情報を基に、第3
の情報および第4の情報を抽出し、記録媒体の記録容量
を検出し、分類に対応した所定の情報を基に、第3の情
報それぞれに対して重要度のレベルを判定し、記録容量
の検出結果、およびレベルの判定結果に基づいて、第3
の情報と第4の情報との総容量が、記録媒体に記録する
ことができる容量となるように、第3の情報を選択し、
選択された第3の情報をインデックスデータとして、第
4の情報を付加して第2の情報を生成し、生成された第
2の情報を、記録媒体に出力し、記録媒体で、出力され
た第2の情報を記録するようにしたので、更新作業が行
いやすいような、所定のフォーマットで記述された基準
となるデータを作成して記録しておき、記録媒体の容量
に対応して、最適なキーワードで構成されたインデック
スデータを有する電子出版用データを作成して、様々な
方法でユーザに提供することができる。
【図面の簡単な説明】
【図1】電子辞書データについて説明するための図であ
る。
【図2】本発明を適応した電子辞書提供システムについ
て説明するための図である。
【図3】図2のパーソナルコンピュータの構成を示すブ
ロック図である。
【図4】図2の電子辞書の構成を示すブロック図であ
る。
【図5】図2のPDAの構成を示すブロック図である。
【図6】図2の辞書データベースに記録されているデー
タについて説明するための図である。
【図7】図2の辞書データベースに記録されている、図
6とは異なる構成のデータについて説明するための図で
ある。
【図8】辞書データベースのデータと作成される辞書デ
ータについて説明するための図である。
【図9】辞書データ変換処理について説明するためのフ
ローチャートである。
【図10】作成される辞書データのデータ構成について
説明するための図である。
【図11】図7の辞書データベースのデータに対応して
作成される辞書データのデータ構成について説明するた
めの図である。
【図12】辞書検索処理について説明するためのフロー
チャートである。
【符号の説明】
11 辞書データベース, 12 パーソナルコンピュ
ータ, 13 WWWサーバ, 14 磁気ディスク,
15 光ディスク, 16 光磁気ディスク,17 半
導体メモリ, 18 電子辞書, 21 PDA, 22
パーソナルコンピュータ, 31 CPU, 51 CP
U, 55 辞書ROM, 71 CPU
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/21 501 G06F 17/21 501T Fターム(参考) 5B009 NA06 SA12 VA09 VA12 VC03 5B075 KK03 KK07 KK13 KK33 KK37 ND03 ND22 ND34 NK10 NK13 NK22 NR05 NR12 PR08 UU01 UU11 5B082 EA05 GA02

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 所定のフォーマットで記載された第1の
    情報を、インデックスデータと本文データで構成される
    第2の情報に変換して出力する情報処理装置において、 前記第1の情報を取得する取得手段と、 前記取得手段により取得された前記第1の情報から、キ
    ーワードに対応する複数の第3の情報および前記本文デ
    ータに対応する第4の情報を抽出する抽出手段と、 前記第2の情報の出力先となる他の情報処理装置、ある
    いは記録媒体の記録容量を検出する検出手段と、 複数の前記第3の情報それぞれに対して重要度のレベル
    を判定する判定手段と、 前記検出手段による検出結果、および前記判定手段によ
    る判定結果に基づいて、前記第3の情報と前記第4の情
    報との総容量が、前記他の情報処理装置あるいは前記記
    録媒体に記録することができる容量となるように、前記
    第3の情報を選択する選択手段と、 前記選択手段により選択された前記第3の情報を前記イ
    ンデックスデータとして、前記第4の情報を付加して前
    記第2の情報を生成する生成手段と、 前記生成手段により生成された前記第2の情報を前記他
    の情報処理装置あるいは前記記録媒体に出力する出力手
    段とを備えることを特徴とする情報処理装置。
  2. 【請求項2】 前記第3の情報は、重要度のレベルによ
    って予め分類され、分類に対応した所定の情報が付加さ
    れて、前記第1の情報に含まれており、 前記判定手段は、前記第3の情報が有する前記所定の情
    報に基づいて、前記第3の情報の重要度を判断すること
    を特徴とする請求項1に記載の情報処理装置。
  3. 【請求項3】 前記第3の情報は、重要度のレベルが高
    い順に予め並べられており、 前記判定手段は、前記第3の情報の順番に基づいて、前
    記第3の情報の重要度を判断することを特徴とする請求
    項1に記載の情報処理装置。
  4. 【請求項4】 前記インデックスデータは、前記第2の
    情報を取得した他の情報処理装置に、前記本文の検索を
    実行させるためのデータであり、 前記第3の情報は、前記検索の方法によって予め分類さ
    れ、分類に対応した所定の情報が付加されて、前記第1
    の情報に含まれていることを特徴とする請求項1に記載
    の情報処理装置。
  5. 【請求項5】 前記第1の情報は、マークアップ言語で
    記述されていることを特徴とする請求項1に記載の情報
    処理装置。
  6. 【請求項6】 前記抽出手段は、前記キーワードに対応
    する複数の前記第3の情報および前記本文データに対応
    する前記第4の情報にそれぞれ付加された、情報の種類
    を示すタグ情報に基づいて、前記取得手段により取得さ
    れた前記第1の情報から、前記第3の情報および前記第
    4の情報を抽出することを特徴とする請求項5に記載の
    情報処理装置。
  7. 【請求項7】 所定のフォーマットで記載された第1の
    情報を、インデックスデータと本文データで構成される
    第2の情報に変換して出力する情報処理装置の情報処理
    方法において、 前記第1の情報を取得する取得ステップと、 前記取得ステップの処理により取得された前記第1の情
    報から、キーワードに対応する複数の第3の情報および
    前記本文データに対応する第4の情報を抽出する抽出ス
    テップと、 前記第2の情報の出力先となる他の情報処理装置、ある
    いは記録媒体の記録容量を検出する検出ステップと、 複数の前記第3の情報それぞれに対して重要度のレベル
    を判定する判定ステップと、 前記検出ステップの処理による検出結果、および前記判
    定ステップの処理による判定結果に基づいて、前記第3
    の情報と前記第4の情報との総容量が、前記他の情報処
    理装置あるいは前記記録媒体に記録することができる容
    量となるように、前記第3の情報を選択する選択ステッ
    プと、 前記選択ステップの処理により選択された前記第3の情
    報を前記インデックスデータとして、前記第4の情報を
    付加して前記第2の情報を生成する生成ステップと、 前記生成ステップの処理により生成された前記第2の情
    報を、前記他の情報処理装置あるいは前記記録媒体に出
    力する出力ステップとを含むことを特徴とする情報処理
    方法。
  8. 【請求項8】 所定のフォーマットで記載された第1の
    情報を、インデックスデータと本文データで構成される
    第2の情報に変換して出力する情報処理装置用のプログ
    ラムであって、 前記第1の情報を取得する取得ステップと、 前記取得ステップの処理により取得された前記第1の情
    報から、キーワードに対応する複数の第3の情報および
    前記本文データに対応する第4の情報を抽出する抽出ス
    テップと、 前記第2の情報の出力先となる他の情報処理装置、ある
    いは記録媒体の記録容量を検出する検出ステップと、 複数の前記第3の情報それぞれに対して重要度のレベル
    を判定する判定ステップと、 前記検出ステップの処理による検出結果、および前記判
    定ステップの処理による判定結果に基づいて、前記第3
    の情報と前記第4の情報との総容量が、前記他の情報処
    理装置あるいは前記記録媒体に記録することができる容
    量となるように、前記第3の情報を選択する選択ステッ
    プと、 前記選択ステップの処理により選択された前記第3の情
    報を前記インデックスデータとして、前記第4の情報を
    付加して前記第2の情報を生成する生成ステップと、 前記生成ステップの処理により生成された前記第2の情
    報を、前記他の情報処理装置あるいは前記記録媒体に出
    力する出力ステップとを含むことを特徴とするコンピュ
    ータが読み取り可能なプログラムが記録されている記録
    媒体。
  9. 【請求項9】 所定のフォーマットで記載された第1の
    情報を、インデックスデータと本文データで構成される
    第2の情報に変換して出力する情報処理装置を制御する
    コンピュータが実行可能なプログラムであって、 前記第1の情報を取得する取得ステップと、 前記取得ステップの処理により取得された前記第1の情
    報から、キーワードに対応する複数の第3の情報および
    前記本文データに対応する第4の情報を抽出する抽出ス
    テップと、 前記第2の情報の出力先となる他の情報処理装置、ある
    いは記録媒体の記録容量を検出する検出ステップと、 複数の前記第3の情報それぞれに対して重要度のレベル
    を判定する判定ステップと、 前記検出ステップの処理による検出結果、および前記判
    定ステップの処理による判定結果に基づいて、前記第3
    の情報と前記第4の情報との総容量が、前記他の情報処
    理装置あるいは前記記録媒体に記録することができる容
    量となるように、前記第3の情報を選択する選択ステッ
    プと、 前記選択ステップの処理により選択された前記第3の情
    報を前記インデックスデータとして、前記第4の情報を
    付加して前記第2の情報を生成する生成ステップと、 前記生成ステップの処理により生成された前記第2の情
    報を、前記他の情報処理装置あるいは前記記録媒体に出
    力する出力ステップとを含むことを特徴とするプログラ
    ム。
  10. 【請求項10】 所定のフォーマットで記載されている
    第1の情報を記録する記録装置と、 前記所定のフォーマットで記載された前記第1の情報
    を、インデックスデータと本文データで構成される第2
    の情報に変換する情報処理装置と前記情報処理装置から
    前記第2の情報の供給を受けて記録する記録媒体とで構
    成される電子出版用データ提供システムにおいて、 前記記録装置は、 前記第1の情報を記録する第1の記録手段と、 前記第1の記録手段により記録された前記第1の情報を
    出力する出力手段とを備え、 前記第1の情報は複数の項目を含み、前記項目は、キー
    ワードに対応する複数の第3の情報および前記本文デー
    タに対応する第4の情報から構成され、 前記第3の情報および前記第4の情報には、情報の種類
    を示すタグ情報が付加され、 前記第3の情報は、重要度のレベルによって予め分類さ
    れ、分類に対応した所定の情報が付加され、 前記情報処理装置は、 前記記録装置から、前記第1の情報を取得する取得手段
    と、 前記取得手段により取得された前記第1の情報から、前
    記タグ情報を基に、 前記第3の情報および前記第4の情報を抽出する抽出手
    段と、 前記記録媒体の記録容量を検出する検出手段と、 前記分類に対応した前記所定の情報を基に、前記第3の
    情報それぞれに対して重要度のレベルを判定する判定手
    段と、 前記検出手段による検出結果、および前記判定手段によ
    る判定結果に基づいて、前記第3の情報と前記第4の情
    報との総容量が、前記記録媒体に記録することができる
    容量となるように、前記第3の情報を選択する選択手段
    と、 前記選択手段により選択された前記第3の情報を前記イ
    ンデックスデータとして、前記第4の情報を付加して前
    記第2の情報を生成する生成手段と、 前記生成手段により生成された前記第2の情報を、前記
    記録媒体に出力する出力手段とを備え、 前記記録媒体は、 前記出力手段により出力された前記第2の情報を記録す
    る第2の記録手段を備えることを特徴とする電子出版用
    データ提供システム。
  11. 【請求項11】 前記記録媒体は、他の情報処理装置の
    内部に備えられていることを特徴とする請求項10に記
    載の電子出版用データ提供システム。
  12. 【請求項12】 前記第1の情報は、マークアップ言語
    で記述されていることを特徴とする請求項10に記載の
    電子出版用データ提供システム。
JP2001192380A 2001-06-26 2001-06-26 情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム Withdrawn JP2003006216A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2001192380A JP2003006216A (ja) 2001-06-26 2001-06-26 情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム
KR1020020033591A KR20030001261A (ko) 2001-06-26 2002-06-17 정보처리장치, 정보처리방법, 기록매체, 프로그램과전자출판 데이터제공 시스템
US10/177,905 US20030009490A1 (en) 2001-06-26 2002-06-20 Information processing apparatus, information processing method, recording medium, program, and electronic-publishing-data providing system
CNB021249393A CN1190748C (zh) 2001-06-26 2002-06-26 信息处理装置及方法、和电子出版数据提供系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001192380A JP2003006216A (ja) 2001-06-26 2001-06-26 情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム

Publications (1)

Publication Number Publication Date
JP2003006216A true JP2003006216A (ja) 2003-01-10

Family

ID=19030839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001192380A Withdrawn JP2003006216A (ja) 2001-06-26 2001-06-26 情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム

Country Status (4)

Country Link
US (1) US20030009490A1 (ja)
JP (1) JP2003006216A (ja)
KR (1) KR20030001261A (ja)
CN (1) CN1190748C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011090463A (ja) * 2009-10-21 2011-05-06 Fujitsu Ltd 文書検索システム、情報処理装置およびプログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062600A (ja) * 2002-07-30 2004-02-26 Fujitsu Ltd 構造型文書の変換方法、復元方法、変換及び復元方法及びプログラム
CN1320481C (zh) * 2004-11-22 2007-06-06 北京北大方正技术研究院有限公司 一种对报纸版面进行标题与正文逻辑关联的方法
CN101464875B (zh) * 2007-12-20 2011-03-16 金宝电子(中国)有限公司 使用xml表示电子字典数据的方法
JP5910134B2 (ja) * 2012-02-07 2016-04-27 カシオ計算機株式会社 テキスト検索装置及びプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276616A (en) * 1989-10-16 1994-01-04 Sharp Kabushiki Kaisha Apparatus for automatically generating index
JPH03168868A (ja) * 1989-11-29 1991-07-22 Ricoh Co Ltd 索引語管理装置
JP3981158B2 (ja) * 1994-09-02 2007-09-26 富士通株式会社 文書索引生成装置
JPH08161351A (ja) * 1994-12-07 1996-06-21 Toshiba Corp 単語番号置換方法,インデックス作成方法,文書検索方法及び文書検索装置
JPH08314973A (ja) * 1995-05-17 1996-11-29 Fuji Xerox Co Ltd 情報単位群操作装置
JP3254642B2 (ja) * 1996-01-11 2002-02-12 株式会社日立製作所 索引の表示方法
JP3143079B2 (ja) * 1997-05-30 2001-03-07 松下電器産業株式会社 辞書索引作成装置と文書検索装置
US6098066A (en) * 1997-06-13 2000-08-01 Sun Microsystems, Inc. Method and apparatus for searching for documents stored within a document directory hierarchy
JP3770919B2 (ja) * 1997-10-21 2006-04-26 富士通株式会社 ファイル処理方法、データ処理装置及び記憶媒体
JPH11143877A (ja) * 1997-10-22 1999-05-28 Internatl Business Mach Corp <Ibm> 圧縮方法、辞書の見出し語インデックス・データを圧縮するための方法、及び機械翻訳システム
US6094649A (en) * 1997-12-22 2000-07-25 Partnet, Inc. Keyword searches of structured databases
US6924828B1 (en) * 1999-04-27 2005-08-02 Surfnotes Method and apparatus for improved information representation
KR100353112B1 (ko) * 1999-06-16 2002-09-18 맹성현 정보검색 시스템의 하부저장구조 관리장치 및 그 정보 저장/검색 방법
KR20010004404A (ko) * 1999-06-28 2001-01-15 정선종 키팩트기반 텍스트 검색시스템과, 이를 이용한 키팩트기반 텍스트 색인방법 및 검색방법
WO2001013237A1 (fr) * 1999-08-13 2001-02-22 Fujitsu Limited Traitement de fichier, dispositif informatique et support memoire
JP3717730B2 (ja) * 1999-11-02 2005-11-16 セイコーインスツル株式会社 電子辞書
CA2391985A1 (en) * 1999-11-25 2001-05-31 Yeong Kuang Oon A unitary language for problem solving resources for knowledge based services
JP4627110B2 (ja) * 2000-10-16 2011-02-09 富士通株式会社 データ記憶装置
US7320019B2 (en) * 2000-11-30 2008-01-15 At&T Delaware Intellectual Property, Inc. Method and apparatus for automatically checking e-mail addresses in outgoing e-mail communications
EP1213643A1 (en) * 2000-12-05 2002-06-12 Inventec Appliances Corp. Intelligent dictionary input method
US6938046B2 (en) * 2001-03-02 2005-08-30 Dow Jones Reuters Business Interactive, Llp Polyarchical data indexing and automatically generated hierarchical data indexing paths

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011090463A (ja) * 2009-10-21 2011-05-06 Fujitsu Ltd 文書検索システム、情報処理装置およびプログラム

Also Published As

Publication number Publication date
CN1190748C (zh) 2005-02-23
KR20030001261A (ko) 2003-01-06
US20030009490A1 (en) 2003-01-09
CN1393806A (zh) 2003-01-29

Similar Documents

Publication Publication Date Title
US20110153330A1 (en) System and method for rendering text synchronized audio
US7818676B2 (en) System, method and program product for a content viewer portlet
KR100925876B1 (ko) 정보처리장치와 정보처리방법 및 기록매체
US20080021886A1 (en) Lingtweight reference user interface
CN102096667B (zh) 一种信息检索方法及系统
CN101488124B (zh) 信息处理设备、信息处理系统及信息处理方法
JP2007242013A (ja) コンテンツ管理指示を呼び出すための方法、システム、およびプログラム(コンテンツ管理指示の呼び出し)
EP2442299B1 (en) Information processing apparatus, information processing method, and program
WO2004111876A1 (ja) 検索条件を再利用する検索システムおよび方法
KR100874289B1 (ko) 전자 펜-컴퓨터 멀티미디어 대화형 시스템
JP2003006216A (ja) 情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20030058272A1 (en) Information processing apparatus, information processing method, recording medium, data structure, and program
CN104063367A (zh) 注释检索装置、方法及程序
US8050927B2 (en) Apparatus and method for outputting voice relating to the preferences of a user
JPH113296A (ja) メディア変換システム
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR20000049891A (ko) 구조화된 데이터를 이용한 전자 출판 시스템 및 서비스 방법
JP2003058545A (ja) 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
JP2003067099A (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JPH10134081A (ja) ページ作成支援方法及び装置
JP3133467B2 (ja) 可搬性文書読み上げ装置
JP2003263457A (ja) 願望又は状況表現に基づく施設情報検索装置
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP2003015936A (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080902