JP4757241B2 - データ処理装置 - Google Patents

データ処理装置 Download PDF

Info

Publication number
JP4757241B2
JP4757241B2 JP2007202123A JP2007202123A JP4757241B2 JP 4757241 B2 JP4757241 B2 JP 4757241B2 JP 2007202123 A JP2007202123 A JP 2007202123A JP 2007202123 A JP2007202123 A JP 2007202123A JP 4757241 B2 JP4757241 B2 JP 4757241B2
Authority
JP
Japan
Prior art keywords
character
content
data
content data
character set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2007202123A
Other languages
English (en)
Other versions
JP2007293923A (ja
Inventor
尚史 齋鹿
圭介 岩崎
裕司 沢田
謙作 蔭地
智雄 光冨
幹宏 門脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2007202123A priority Critical patent/JP4757241B2/ja
Publication of JP2007293923A publication Critical patent/JP2007293923A/ja
Application granted granted Critical
Publication of JP4757241B2 publication Critical patent/JP4757241B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Description

本発明は、データ処理装置に関して、特に、メッセージを所望される態様で出力可能とするためのデータ処理装置に関する
近年、ネットワーク化の進展、電子機器の技術向上に伴って、WWW(WorldWide Web)電子書籍に代表される、電子データからなるコンテンツは急速な発達を遂げている。
このためには、文字のコード化は不可欠であり、様々なエンコーディング方法が提案され、実用化されている。たとえば、わが国で広く使われているシフトJISはその一例である。
一方、文字の字形(グリフ)の集まり(文字セット)については、各国であるいは国際間で規格化が行なわれている。たとえば、わが国ではJIS X 0201、JIS X 0208:1997が代表的な規格として知られている。
文字セット自体は、構成する文字の字体(グリフ)の集合として定義できるが、通常は文字セットを構成する各文字に文字コードが割り振られている。つまり、エンコーディング(文字を符号化する方法)も同時に定めていることになる。
しかし、エンコーディングと文字セットは本来独立のものであり、例えば上記JIS X 0208を表現するエンコーディングとしては、いわゆるJISコード以外に例えばシフトJISエンコーディングが挙げられるし、ユニコードでも、対応のゆれの問題はあるものの、基本的には表現可能である。
各国・地域ごとにこのような異なる文字セットは定義されており、それらを全て表現しうるマルチリンガルな(多国語の文字を含む)文字コード空間を定義することを目指した代表的な試みとしてユニコードが提唱され、実用化されつつある。また、このような文字セットの範囲外の文字の表現形態の同一性を保証するための技術も提案されている(たとえば、特許文献1参照)。
特開2000−250897公報
来の情報機器では一般に、システムが表示するメッセージの言語はそのとき取り扱っているデータではなく、システムに依存している。例えば、スペイン語のコンテンツを表示したいニーズを持つユーザは、通常スペイン語をよく解すると考えられるが、日本語や英語を解するかどうかは分からない。
しかし、従来はどの言語でメッセージを表示するかは、システムによって決められてきたため、例えば英語をベースとしたシステムである限りは英語でメッセージが出力されてきた。もちろん各国語のリソースを持ち、手動で切り替えることができるシステムは多く存在したが、扱うデータに合わせて自動的に適切な言語に切換えてメッセージを表示するようなシステムは提案されていなかった。
それゆえにこの発明の目的は、データが処理されるとき該データ処理が想定される地域で認識可能に、該データ処理に関するメッセージを出力するデータ処理装置を提供することである。
この発明のある局面に従うデータ処理装置は、コンテンツデータを処理するデータ処理装置であって、コンテンツデータは想定される使用地域を識別するロケール識別情報を含み、データ処理装置は、コンテンツデータを入力する手段と、コンテンツデータを処理する処理手段と、使用言語の異なる1つ以上の地域それぞれ毎に、メッセージを記憶するメッセージ記憶手段と、処理手段の処理結果に従って、ロケール識別情報により識別される使用地域に基づきメッセージ記憶手段からメッセージを取り出し、取り出したメッセージを出力するメッセージ出力手段とを備え、メッセージ出力手段は、出力されるメッセージの言語を、ロケール識別情報に応じて変化させる。
この発明の他の局面に従うデータ処理装置は、コンテンツデータを処理するデータ処理装置であって、コンテンツデータは想定される使用地域を識別するロケール識別情報と、複数の文字コードセットのうちのコンテンツデータを記述するための1つ以上の文字コードセットを識別するための文字セット識別情報とを含み、データ処理装置は、コンテンツデータを入力する手段と、データ処理装置で処理可能な1つ以上の文字コードセットを識別する情報を記憶する文字セット情報記憶手段と、使用言語の異なる1つ以上の地域それぞれ毎に、メッセージを記憶するメッセージ記憶手段と、入力されたコンテンツデータの文字セット識別情報と、文字セット情報記憶手段の情報とを比較し、比較結果に基づき、当該コンテンツデータを記述するための前記文字コードセットが、処理可能な文字コードセットであるか否かを判定する判定手段と、判定手段によりコンテンツデータを記述するための文字コードセットが、処理可能な文字コードセットではないと判定されたとき、メッセージ記憶手段からメッセージを取り出し、取り出したメッセージを出力するメッセージ出力手段と、を備え、メッセージ出力手段は、出力されるメッセージの言語を、ロケール識別情報に応じて変化させる。
発明によれば、データ処理時には地域が異なっても、データ処理に関連したメッセージを地域毎に認識可能な態様で出力できる。
以下、この発明の各実施の形態について説明する。以下の記述では、特記しない限り、「文字」は記号や数字も含むものとする。また「文字コード空間」は複数種類の文字セットの全体集合であり、各文字セットは文字コード空間の部分集合である。
<第1の実施の形態>
図1は、本発明の第1の実施の形態であるコンテンツ表示システムの概略図である。複数のコンテンツ作成装置301〜302、複数のコンテンツ配布装置303〜304、複数のコンテンツ表示装置305〜309およびグリフデータ配布装置309からなる。これら装置は通信回線310を介して相互に通信する。説明を煩雑にするのを避けるため、グリフデータ配布装置は1台の場合を考えるが、複数台の場合の動作は以下から容易に理解しうる。このことも含め、図中の各装置の個数は本発明にとって本質的ではない。
コンテンツ作成装置301の構成例を図2に示す。コンテンツ作成装置302も同一の構成を持つものとする。コンテンツ作成装置301は、CPU(Central processing Unit)401、表示部402、入力部403、補助入力部404、コンテンツ表示装置405、外部記憶装置406、通信部407、記述コンテンツデータメモリ408、文字セット内容メモリ409、文字セット情報メモリ410、変換部411、配布コンテンツデータメモリ412、グリフデータメモリ413、およびこれらを相互に通信接続するデータバス414を有する。通信装置406は通信回線310とも接続されている。
表示部402としてはディスプレイおよび表示回路を、入力部403としてはキーボードを、補助入力部404としてはマウスを想定している。コンテンツ表示装置405は、後述するコンテンツ表示装置305と同一の構成、機能を持つものである。したがってコンテンツ表示装置405の表示は表示部402とは独立して行なわれることに注意されたい。
すなわち、コンテンツ作成装置301はコンテンツ表示装置405を接続したパーソナルコンピュータおよびその上で動作するソフトウエアと極めて類似した構成を持っている。コンテンツ作成装置301で、表示部402に表示できる文字は、JIS X 2101に含まれる文字、JIS X 2108:1997に含まれる文字、および図3に示されるユニコード2460から2473、2160から2169で表される文字とする。コンテンツ作成装置301で、表示部402に表示できる文字からなる文字セットを、以下「コンテンツ作成装置301で表示可能な文字セット」と呼ぶ。また、以下では、コンテンツ表示装置で表示可能な文字セットに含まれる文字を、「コンテンツ表示装置で表示可能な文字」と呼ぶことがある。コンテンツ作成装置301で表示可能な文字セットは、コンテンツ表示装置305〜308、405で表示可能な文字とは必ずしも一致していない。これは特に、コンテンツ表示装置305〜308、405がコンテンツ作成装置301とは異なった種類のハードウェアで実現される場合には自然なことである。
以下、コンテンツ作成者がデータを作成する際の細かい操作については、多くの場合、本発明にとって本質的ではないし、通常のパーソナルコンピュータからの類推で容易に理解しうるので、特に必要がない限りは詳細に立ち入らない。
以下の例では、文字コード空間としては16ビットのユニコードを想定し、他の文字セットはその部分集合と考えるが、これはあくまでも一つの例であり、本発明の内容を限定するものではない。
以下、特記しない限り、文字列は16ビットユニコードで内部表現されているとする。また、特に必要がない限り、説明を煩雑にしないためにファイル名を明示しない。以下「セーブ」とはメモリから外部記憶装置にファイルとして書き出すこと、「ロード」とは外部記憶装置からメモリにファイルの内容を読み出すことを意味する。
図4は、コンテンツ作成装置301を用いて、コンテンツ作成者が配布コンテンツを作成する際のフローチャートである。以下これを用いて、コンテンツ作成装置301の動作を詳細に説明する。
コンテンツ作成者は、記述コンテンツデータメモリ408内にコンテンツの記述を示す記述コンテンツデータを作成して、外部記憶装置406にセーブする(ステップS501)。ここで、記述コンテンツデータの形式はあらかじめ定義されたXMLの書式に従って図5のように記述されるとする。以下、この例を用いて作成したコンテンツデータを「サンプルコンテンツ」と呼び、これを用いて説明するが、本発明は、XMLで記述されたコンテンツデータに限定されるものではない。コンテンツ作成者は、表示部402に図5のように表示される記述コンテンツデータを入力部403、補助入力部404を用いて編集する。
以下図5の<book>タグの子供要素(<book>と</book>に挟まれた部分)を「コンテンツ本文データ」と呼ぶことがある。
図5の書式について、後に必要となる範囲で簡単に説明しておく。2行目のDOCTYPE宣言にあるように、このコンテンツ表示システムではBOOK.DTDという文書型定義(DTD)ファイルを用いる。この文書型定義ファイルは、このコンテンツ表示システムで扱われる全てのコンテンツで共通とする。
<author>タグは著者名を表すタグであり、子供要素の文字列が著者名となっている。特に、<author>タグの子供要素にある「﨑」は、文字参照と呼ばれる形式であり、fa11というユニコードで表される文字を示している。これは、「崎」の異体字(JIS X 2108:1997に収録されている「崎」とは異なるグリフを持つ)を示す。コンテンツ作成者は、fa11というユニコードで表される文字のように、コンテンツ作成装置301で表示可能な文字セットに含まれない文字はこのような形式で入力するものとする。なお、後述するように、コンテンツ作成装置301で表示可能な文字についても文字参照形式で書くことを許容するものとする。
<text>タグは本文を表すタグであり、子供要素の文字列が本文テキストである。特に、矢印AとBで示す○付きの文字(JIS X 2101、JIS X 2108:1997にいずれも収録されていない)に注意する。
<image>タグは本文とともに表示される画像を表すタグである。filename属性は表示される画像のファイル名を表す。<image>タグの子供要素である<caption>タグは、画像と同時に表示されるテキストを表すタグであり、その子供要素の文字列が表示されるテキストを表す。特に、<caption>タグの子供要素にある「髙」は、文字参照形式でユニコードで9ad9の文字を示している。これは、「高」の異体字(JIS X 2108:1997に収録されている「高」とは異なるグリフを持つ)を示す。このような書き方をしているのは、9ad9というユニコードを持った文字がコンテンツ作成装置301で表示可能な文字セットに含まれていないためである。記述例の中に含まれる画像のファイルもコンテンツ作成者が用意するものとする。
<sound>タグは本文とともに再生される音声を表すタグであり、filename属性は再生される音声データのファイル名を表す。
なお、図5の例では、コンテンツ作成装置301で表示可能な文字セットに含まれていない文字のみを文字参照形式で記述しているが、コンテンツ作成装置301で表示可能な文字セットに含まれる文字でも、文字参照形式で書くことをコンテンツ作成装置301では許している。図6の例では、2460、2461というユニコードで表現される○付きの数字が、コンテンツ作成装置301で表示可能な文字であるが、文字参照形式で記述されている。
このような記述が可能なようにコンテンツ作成装置301を構成する利点は、ある文字がコンテンツ作成装置301で表示可能な文字であるか否かが不明な場合に、コンテンツ作成者が、その都度確認せずとも、文字参照形式で記述することで、記述が継続できることである。
なお、ここでは、コンテンツ作成装置301で表示可能な文字セットに含まれない文字を表示可能な文字セットで表現する方法として、XMLで一般に用いられている形式を用いているが、XML形式でコンテンツを記述するか否かに関わらず、このような形式はここで用いた文字参照形式に限られるものではない。コンテンツ作成装置301で表示可能な文字セットに含まれない文字を、表示可能な文字セットに含まれる文字の組み合わせで一意的に表現する規則を与え、コンテンツ表示装置405で元の文字コードを復元することが可能な形式であれば、有効に機能する。また、以下では、このような表現を行なわないで文字を記述することを「文字を直接記述する」と表現することがある。
この例では文字セットとして、「JIS X 2101」、「JIS X 2108」、「CIRCLED_NUM」および「MISC_KANJI」の4種類の文字セットを用いる。
「JIS X 2101」は、名前の通り、JIS X 2101で定められた文字セットであり、通常はパーソナルコンピュータの世界で1バイトで表される英数字、記号、半角カタカナを含むものである。
「JIS X 2108」は、JIS X 2108:1997で定められた文字セットであり、パーソナルコンピュータの世界ではJIS第1水準、第2水準に収録されている漢字、全角英数字、全角ひらがな、カタカナにほぼ該当する。
「CIRCLED_NUM」は、名称も含めて、コンテンツ作成者が定義した文字セットであり、その内容は、図5の矢印AとBで示すような○付きの数字1、2、3、…、20を集めたものとする。
「MISC_KANJI」も、名称も含めて、コンテンツ作成者が定義した文字セットでありその内容は、上述の「高」の異体字など該当コンテンツデータでは重要ではあるが、「JIS X 2101」、「JIS X 2108」のいずれの文字セットにも含まれていない漢字を集めたものとする。
以下の説明では特筆しない限り、「標準文字セット」で「JIS X 2101」、「JIS X 2108」を意味する。標準文字の概念は、特定地域で多用される文字セットを、当該地域にてより少ない労力、操作で利用するためのものであり、その他の地域で、コンテンツ表示装置、コンテンツ作成装置、コンテンツ配布装置の使用を制限するものではない。
また、以下の説明で、「JIS X 2101」、「JIS X 2108」が標準文字セットとされているのは、日本国内での使用を前提にしたためであり、日本国以外の国や地域でも、その国や地域で使用頻度が高い別の文字セットを適宜標準文字セットとして定めれば以下の説明は該当する。
次いで、コンテンツ作成者は、文字セット内容情報メモリ409上に文字セット内容情報を作成して、外部記憶装置406にセーブする(ステップS502)。
ここでは、文字セット内容情報は、文字セットに含まれる文字のユニコードを16進数で1文字ごとに1行で書き込んだものとする。文字セット「CIRCLED_NUM」に対応する文字セット内容情報の例を図7に示す。文字セット内容情報701は、図5の矢印AとBで示すような○付きの数字1〜20に相当するユニコード2460から2473からなる。
文字セット「MISC_KANJI」に対応する文字セット内容情報の例を図8に示す。文字セット内容情報801は、「高」の異体字に相当するユニコード9AD9,「崎」の異体字に相当するユニコードFA11からなる。
一方、標準文字セットは、日本国内での使用を前提として作られるコンテンツでは使用頻度が高いと考えられるため、「JIS X 2101」、「JIS X 2108」に対応する文字セット内容情報がそれぞれ「jisx2101.lst」、「jisx2108.lst」という名称の読み取り専用ファイルで、外部記憶装置406に当初から保存されているものとする。これによって、文字セット内容情報を作成するコンテンツ作成者の労力が軽減される。
もちろん、標準文字セットについても、コンテンツ作成者が作成した文字セットと同様に、文字セット内容情報をコンテンツ作成者が作成して、外部記憶装置406に格納することを前提としてコンテンツ作成装置301を構成することも可能であり、本発明の範疇であることに変わりはない。
再び図5の例の説明に戻ると、<char_set>タグは、後述する、文字セット情報のうち、属性で、文字セット名を、属性でロケール識別情報を与えている。
ステップS502では、コンテンツ作成者は「CIRCLED_NUM」に対応する文字セット内容情報を「proprie1.lst」というファイル名で、外部記憶装置406に保存するものとする。同様に「MISC_KANJI」に対応する文字セット内容情報を「proprie2.lst」というファイル名で、外部記憶装置406に保存するものとする。次いでコンテンツ作成者は文字セット情報メモリ410上に文字セット情報を作成する(ステップS503)。
文字セット情報は、図9で示すような構造を持ったテキストデータとする。文字セット情報901の各行は、文字セットの名称を二重引用符で囲んだ文字列と、ステップS502で作成した文字セット内容情報のファイル名を二重引用符で囲んだ文字列、およびロケール識別情報を2重引用符で囲んだ文字列からなり、その間はカンマで区切られた、いわゆるCSV(Comma―Separated Variable)データとなっている。
ロケール識別情報は、前述の第2の課題で述べたような、同じ文字コードに、異なるグリフが対応する状況が該ロケール識別情報から判別しうるために設けられる。ここでは、ロケール識別情報として、ISO3166で定められた2文字の国名表記を用いるとする。これによれば例えば日本は「JP」、米国は「US」、スペインは「ES」と表される。この他の例として、ISO639で定められた言語コードなども適切に機能すると考えられる。その他のコードでも後に述べるコンテンツ表示装置305〜308、405の動作を定めておけば使用可能である。
標準文字セットの情報については、コンテンツ作成者が文字セット情報に明示的に記述しなくても、記述されていると見なされるように、コンテンツ作成装置301を構成することも考えられる。図10は、そのようなコンテンツ作成装置301に対応した文字セット情報の別の構成例である。図10の文字セット情報1001は、コンテンツ作成者が定義した文字セットに対応する情報のみを記載している。このような、標準文字セットについてはコンテンツ作成者が記載しなくても良いようにしておくことは、コンテンツ作成者の労力を軽減させ、コンテンツ作成時の誤りを防ぐ効果がある。
ここではロケール識別情報を文字セット情報に含めた例を考えたが、コンテンツ表示システムが使用される地域や言語が暗黙のうちに了解されているようなコンテンツ表示システムでは、これを文字セット情報に明示する必要は必ずしもない。
そのような構成に対応した文字セット情報の例を図11に示す。ここでは文字セット情報1101の各行は、文字セットの名称を二重引用符で囲んだ文字列と、ステップS502で作成した文字セット内容情報のファイル名を二重引用符で囲んだ文字列からなり、ロケール識別情報は含まれていない。このような構成では、後に述べるコンテンツ表示装置305〜308は、暗黙に特定の地域または言語を指していると仮定して動作することになる。
次いで、記述コンテンツデータが外部記憶装置406から記述コンテンツデータメモリ408にロードされる(ステップS504)。このとき、文字セット内容情報メモリ409、文字セット情報メモリ410にも、その内容が外部記憶装置406からロードされる。当初から外部記憶装置406にファイルとして存在している「jisx2101.lst」、「jisx2108.lst」に格納されている文字セット内容情報についても、文字セット内容情報メモリ409にロードされるとする。
次いで、変換部411が記述コンテンツデータを配布するための配布コンテンツデータに変換して外部記憶装置406にセーブする(ステップS505)。
ステップS505で行なわれる変換処理としては、記述コンテンツデータと配布コンテンツデータの形態、記述フォーマットデータと配布コンテンツデータの関係によって種々のものが考えられるが、その詳細は後述する。
CPU401は、ステップS505で変換に成功したかどうかを判断して(ステップS506)、成功していればステップS508に処理を進め、失敗した場合は、表示部402に表示されるメッセージに従いコンテンツ作成者が問題箇所を確認、修正して(ステップS507)、この後再びステップS505に戻る。
ステップS508に進んだ場合は、CPU401は、コンテンツ表示装置405に、外部記憶装置406にある配布コンテンツデータを入力して表示する(ステップS508)。
図12に、コンテンツ表示装置405の表示例を示す。なお、コンテンツ表示装置405の構成および動作は後述するコンテンツ表示装置305と同様である。コンテンツウインドウ1201に、配布コンテンツデータメモリ413の内容が表示されている。図5の記述コンテンツデータでは文字参照形式で書かれていた文字(「崎」の異体字と「高」の異体字)がそれぞれの字形に変換されて表示されているのに注意する。また図5の記述コンテンツデータでは<image>タグに対応していた部分が、画像として表示されている。スクロールバー1202はコンテンツ作成者が表示をスクロールしたい場合に用いるものである。EXITボタン1203が押されるとコンテンツ表示装置405は終了するが、ステップS508では用いられない。
コンテンツ表示装置405で正常に表示されていれば(ステップS509)、処理はステップS510に進み、そうでない場合は処理はS507に戻る。ステップS509における「正常に表示されている」とは、後述するコンテンツ表示装置305のステップS207を経由して処理が終了した場合とする。
補助入力部404から「OK」が入力されると(ステップS510)処理は終了し、それ以外の文字列が入力されると処理はS507に戻る。
ここで、変換部411の構成とステップS505における動作について説明する。図13を参照して、変換部411はコンテンツデータ解析部1301、文字コード検査部1302、変換部1303、アーカイバ1304、データ符号化部1305、エラーメッセージ出力部1306およびこれら各部を相互に接続するデータバス1307を有する。
ステップS505における変換部411の動作を図14のフローチャートに従い説明する。まず、コンテンツデータ解析部1301は、記述コンテンツデータメモリ408に格納されているコンテンツデータの本文データの開始タグと終了タグの対応が取れているかを検査する(ステップS1401)。対応が取れていれば処理はステップS1402に進む。充たしていなければ処理はステップS1408に進む。
次いで、コンテンツデータ解析部1301は、記述コンテンツデータメモリ408に格納されているコンテンツデータの開始タグと終了タグのタグの入れ子関係が正しいかどうかを検査する(ステップS1402)。正しければ処理はステップS1403に進む。正しくなければ処理はステップS1408に進む。
ステップS1401からステップS1402の処理は、入力されたXMLファイルが、ウェルフォームド(well−formed)であることを検証する、通常のXMLプロセッサで行なわれている処理であり、また本発明にとって本質的なことではないので、詳細説明は略す。
次いで、コンテンツデータ解析部1301は、記述コンテンツデータメモリ408に格納されているコンテンツデータに含まれるタグ、属性、属性値が規定通りであるかを文書型定義ファイルBOOK.DTDを用いて検査する(ステップS1403)。規定通りであれば、処理はステップS1404に進む。正しくなければ処理はステップS1408に進む。
これは、コンテンツデータが、検証済みXML文書(VALID XML DOCUMENT)であるかどうかを検査することである。これについても通常のXMLプロセッサで行なわれている処理であり、また本発明にとって本質的なことではないので、詳細には立ち入らない。
次いで、コンテンツデータ解析部1301は、記述コンテンツデータメモリ408に格納されているコンテンツデータの<char_set>タグのname属性と、locale属性が、文字セット情報メモリ410の内容と一致しているかどうかを調べる(ステップS1404)。一致していれば、処理はステップS1405に進む。正しくなければ処理はステップS1409に進む。
ここでは文字セット情報メモリ410の各行に含まれる文字セット名とロケール識別情報の組の集合が、コンテンツデータの<char_set>タグのname属性と、locale属性の組の集合と一致しているかどうかを検査する。
次いで、文字コード検査部1302は、記述コンテンツデータメモリ408に格納されているコンテンツ本文データで用いられている文字コードが、文字セット情報メモリ410から得られる、このコンテンツで使用される文字セットに含まれているかどうかを、各文字セットについて検査する(ステップS1405)。ステップS1405における、文字コード検査部1302の動作については後述する。文字コード検査部1302から0という終了コードが返れば処理はステップS1406に進み、1という終了コードが返れば処理はステップS1409に進む。
図15に文字コード検査部1302のブロック図を示す。文字コード検査部1302は、コントローラ3401、第1文字コードレジスタ3402、文字セット番号レジスタ3403、文字番号レジスタ3404、第2文字コードレジスタ3405、使用禁止領域テーブル3406およびこれらを相互に接続するデータバス3407を有する。
使用禁止領域テーブル3406は、65536個の整数値が格納されたテーブルであり、kという文字コードが用いられている文字コード体系(この場合はユニコード)で使用できない領域にあれば(0から数えて)k番目の要素に−1を、そうでなければ0が格納されている。ここでは、使用禁止領域テーブル3406の16進で0xFFFF番目、0xFFFE番目、0xFEFF番目および0xE000番目から0xF8FF番目の要素に−1が入っており、それ以外は0が入っているものとする。そのようなテーブルの構成例(部分)を図16に示す。要素4001は0xDFFE番目の要素であり、上記の使用禁止領域に含まれないので0が格納されている。要素4002は0xDFFF番目の要素であり、同様に0が格納されている。要素4003は0xE000番目の要素であり、上記の使用禁止領域に含まれるので−1が格納されている。要素4004は0xE001番目の要素であり、同様に−1が格納されている。これは、非文字(NON―CHARACTER)、PUA領域(Private Use Area)、BOM(Byte Order Mark)と呼ばれる領域に含まれる文字コードを使用禁止にしていることを意味する。
もちろん文字コード領域のどの部分を使用禁止にするかによってこのようなテーブルの内容は変わりうるものである。テーブル方式による判定は必須ではないが、文字コードを用いてテーブルにアクセスするだけで判定結果が得られるので、処理効率の高い判定が行なえ、また条件の改変も容易という利点があるので、値の種類の数が、テーブル化することが可能な範囲にある場合は、より好ましい。
図17のフローチャートに従い、ステップS1405における文字コード検査部1302の動作を説明する。まず、コントローラ3401は、コンテンツデータ解析部1301からコンテンツ本文データの文字コードを1文字分受け取って第1文字コードレジスタ3402に格納する(ステップS3501)。以下第1文字コードレジスタ3402の値をkで表すことがある。なお、ステップ1601と同様に、ステップS3501においても、コンテンツデータ解析部1301は、文字参照形式については、一文字として扱うとする。
コントローラ3401は、使用禁止領域文字テーブル3406のk番目の値を取り出して、それが使用可能領域を示す値にあるかどうかを判定して(ステップS3502)、使用可能領域にあればステップS3403に進み、使用禁止領域を示す値であればステップS3511に進む。
コントローラ3401は、文字セット番号レジスタ3403を0に初期化する(ステップS3503)。以下文字セット番号レジスタ3403の値をiで表す。
コントローラ3401は、文字番号レジスタ3404を0に初期化する(ステップS3504)。以下文字番号レジスタ3404の値をjで表す。
コントローラ3401は、文字セット情報メモリ410のi番目の文字セットの、j番目の文字の文字コードを文字セット内容情報メモリ409から取り出して、第2文字コードレジスタ3405に格納する(ステップS3505)。
コントローラ3401は、第1文字コードレジスタ3403と第2文字コードレジスタ3405の値が一致するかどうかを判定して(ステップS3506)、一致すればステップS3512に進み、一致しなければコントローラ3401は文字番号レジスタ3404をインクリメントする(ステップS3507)。
コントローラ3401は、文字番号レジスタ3404の値が、文字セットに含まれる文字数と一致するかどうかを判定して(ステップS3508)、一致すれば文字セット番号レジスタ3403をインクリメントし(ステップS3509)、一致しなければステップS3505に戻る。
コントローラ3401は、文字番号レジスタ3404の値が、文字セット情報メモリ410で記述されている文字セットの数と一致するかどうかを判定して(ステップS3510)、一致すれば1という終了コードを返して終了する(ステップS3511)が、一致しなければステップS3504に戻る。
ステップS3511に進んだ場合は、本文データに含まれる文字に、文字セット情報メモリ410に示されている文字セットのいずれにも含まれていないか、使用可能な領域にない文字が存在したことを示す。
ステップS3512に進んだ場合はコンテンツ本文データの最後の文字であるかどうかをコントローラ3401がコンテンツデータ解析部1301に問い合わせて、最後の文字であればステップS3513に進み、最後の文字でなければステップS3501に戻る。
ステップS3513に進んだ場合は、終了コードとして0を返す。これは、本文データに含まれる文字が全て使用可能な領域にあり、しかも文字セット情報メモリ410に示されている文字セットのいずれかに含まれていたことを示す。
ここで示した構成では、各文字セットを独立してコンテンツ本文データと比較しているので、文字セットが互いに重複しても問題が起きないという利点がある。サンプルコンテンツでは、4つの文字セットは特に重複がないものとして考えてきたが、たとえば文字セット「MISC_KANJI」に対応する文字セット内容情報が図18に示したようなものであった場合、「MISC_KANJI」と「JIS X 0208」はユニコード0x9AD8「高」について重複している。このような重複を許さないようにコンテンツ作成装置301を構成すると、コンテンツ作成者は、各文字セットに含まれる文字が何であるかを正確に知らなければコンテンツを作ることができないことになる。
また、既存の文字セットとは別の観点から文字の集合を定義したい場合、例えば、特定の部首を持った漢字だけを集めた文字セットを定義したい場合などは、既存の文字セットにそれぞれの文字が含まれているかどうかはコンテンツ作成者にとっては重要ではない。このようなことを考えると、文字セット間の重複が許されるようなコンテンツ作成装置301の構成は、実用的価値が高い。
なお、ここではステップS3504などにおいて文字セット情報メモリ410に記載された順番に各文字セットを取り出しているが、小さなiの値に標準文字セットを対応させることによって、第1文字コードレジスタ3402と第2文字コードレジスタ3405の値が少ない実行回数で一致する確率が高くなり、より高速な処理が行なえる。これは標準文字セットに含まれる文字が、標準文字セットの設定が適切であれば、コンテンツ本文データ内で用いられる確率が高いと考えられるためである。
また、ここでは、コンテンツ本文データから取り出した文字について、使用可能な領域にあるかどうかをステップS3502で判定しているが、各文字セットの各文字が使用可能な領域に入っていることを確認してから、コンテンツ本文データの各文字が各文字セットのいずれかに含まれているかを判定しても全く結果は同じである。文字セットを構成する文字数がコンテンツ本文データに含まれる文字数より十分小さい場合にはより効率が高い。
なお、ステップS3504からS3508で行なっている、文字セットに文字が属するかどうかを判定する処理を、ステップS3502と同じようにして、文字コードでアクセスできるテーブルを用いて行なうことも可能である。この場合、使用禁止領域テーブル3406と別に、同じデータ構造を持ったテーブルを持つように構成することも可能であるが、以下のようにすれば同じテーブルをこの目的にも兼用することができ、格納するメモリの容量を削減できる。すなわち、各文字コードkに対応する要素には、文字コードkで表される文字の属する文字セット番号を格納するものとする。使用禁止文字に対応する要素には、−1を格納しているので文字セットの番号と区別がつく。また、コンテンツ中のどの文字セットにも属さない文字に対応する要素には文字セット番号および−1のいずれとも区別がつく値を格納すれば良い。なお、複数の文字セットに属する文字に対応する要素には、そのいずれかの文字セットの番号を格納しておけば、「いずれかに属する」という判定には支障がない。
このようなテーブルの使用禁止文字以外の部分の初期化については、文字セット内容情報メモリ409、文字セット情報メモリ410を参照して行なっても良いし、対象となる文字セットが定まっているのであれば、あらかじめ作成したものを格納しておいても良い。
次いでアーカイバ1304は、コンテンツデータに含まれるファイルを1つのファイルにアーカイブ(archive)して外部記憶装置406にセーブする(ステップS1406)。具体的には、本文XMLファイル、<image>タグのfilename属性で示されている画像ファイル、<sound>タグのfilename属性で示されている音声ファイル、予め準備されたグリフデータファイルおよびBOOK.DTDを1つのファイルにアーカイブする処理である。アーカイブ後の各ファイルは、1つのファイルとして扱うことができ、復元処理(アンアーカイブ)を行なえば再び元通り別々のファイルとしてアクセスすることができる。
ここでグリフデータとは、コンテンツデータで用いられている文字セットに対応するグリフを示すデータである。サンプルコンテンツでは、「MISC_KANJI」に対応するグリフデータを格納したファイルがアーカイブされるとする。
ステップS1406でアーカイブされるグリフデータのデータ構造の例を図19に示す。グリフデータ3701は、文字セット名フィールド3702、ロケール識別情報フィールド3703、文字数フィールド3704、文字コードフィールド3705、グリフ3706、文字コードフィールド3707、およびグリフ3708を含む。文字セット名フィールド3702には文字セット名が文字列として格納されている。ロケール識別情報フィールド3703には、ロケール識別情報が文字列として格納されている。文字数フィールド3704には、グリフデータ3701に含まれるグリフの数が格納されている。文字コードフィールド3705および3707には文字セットの文字コードが格納されている。グリフ3706および3708は字形データそのものである。図19はいわば模式的な図であって、実際のグリフデータの格納方法は、画像データ、ベクトルデータなど、適切な周知の技術を用いるものとする。
以下のグリフデータ配布装置309から送信されるグリフデータも図19で示されるものと同じ形式とする。
後にコンテンツ表示装置305の説明で明らかになるように、一般性の低い(汎用的でない)文字セットはステップS1406でコンテンツデータにアーカイブしておく、すなわちコンテンツデータ自身にグリフデータを内蔵しておく方が有利である。逆に一般性の高い文字セット、すなわちコンテンツ表示装置305〜308、405またはグリフデータ配布装置309に存在する可能性の高い文字セットについては、グリフデータをコンテンツに内蔵する必要性は小さい。このような処理は、コンテンツ表示装置305〜308で、利用可能な文字セットがコンテンツ作成者には一般的には知り得ないことが前提となっている。
標準文字セットに対応するものも含めて、コンテンツデータで用いられているグリフデータを全てコンテンツに内蔵すれば、コンテンツ表示装置305〜308、405で利用可能なグリフデータに依存せずに常に表示可能なコンテンツデータが作成できる。しかし一方ではコンテンツデータのサイズはグリフデータを含むため大きくなる。
グリフデータをコンテンツデータに全く内蔵しない場合は、コンテンツ表示装置305〜308で表示可能かどうかはそのとき利用可能なグリフデータに全面的に依存するが、コンテンツデータのサイズを小さく抑えることが可能となり、配信に際してコスト面で有利となる。
また、ここでは、コンテンツデータに含まれるファイルをそのままアーカイブしているが、各ファイルを、後述するコンテンツ表示装置305での処理に都合が良いように別形式のデータに変換してからアーカイブしても差し支えない。もちろんこの場合は、コンテンツ表示装置305がそのような別形式のデータを解するように構成されている必要がある。例えば、記述コンテンツデータとは異なるエンコーディングを用いたデータに変換することが考えられる。図5のサンプルコンテンツでは、その第1行に指定されているようにUTF−8を用いているが、これをシフトJISにするなどである。このとき、エンコーディングの変換を行なう文字の範囲を、あらかじめ限定しておき、それに含まれない文字は、上述の文字参照形式で表現することも可能である。例えばシフトJISに変換する場合は、「JIS X 2101」および「JIS X 2108」に含まれない文字については、対応するユニコードを文字列で表した、文字参照形式で表現するのである。
このように、エンコーディングの変換を行なう対象を、変換先のエンコーディング方法で記述可能な文字セット、またはそのサブセットに限り、それ以外の文字は文字参照形式またはそれに準じる形式で表現することで、変換先のエンコーディング方法では記述できない文字も表現可能となる。
次いでデータ符号化部1305は、ステップS1406によって生成されたファイルを符号化して、外部記憶装置406に書き出して(ステップS1407)終了する。ここでは、データ符号化部1305では、ファイルをLZ77方式で圧縮する。データ符号化部1305で行なう符号化については、これに限られるものではない。例えば、他の圧縮方式を用いることは当然考えられるし、コンテンツの流通段階で、正当なユーザ以外に内容を取り出されたり、改ざんされることを防ぐために暗号化を行なうようにしてもよい。重要なのは、後述するコンテンツ表示装置305〜308で復号できることである。また符号化の必要がなければ、全く何の符号化を行なわずにそのまま出力してもよい。
ステップS1408に進んだ場合は、エラーメッセージ出力部1306が、コンテンツデータ解析部1301からの情報に基づいて、表示部402にエラーメッセージを出力して、終了する。ステップS1409に進んだ場合は、エラーメッセージ出力部1306が、文字コード検査部1302からの情報に基づいて、表示部402にエラーメッセージを出力して、終了する。
図20を参照してエラーメッセージ出力部1306は、エラーメッセージ生成部1501、文字列メモリ1502、文字参照形式生成部1503、エラーメッセージテーブル1504、エラーメッセージメモリ1505およびこれら各部を相互に通信可能に接続するデータバス1506を有する。
図21のフローチャートに従い、エラーメッセージ出力部1306のステップS1408における処理を説明する。まず、エラーメッセージ生成部1501は、問題が検出された箇所のコンテンツデータの部分文字列を、コンテンツデータ解析部1301から受け取って文字列メモリ1502に格納する(ステップS1601)。なお、コンテンツデータ解析部1301は、文字参照形式については一文字と扱うとする。たとえば、図5の例では、半角の「﨑」は一文字と扱われる。
図22に示すのは、開始タグと終了タグの対応が取れていないという問題の発生した箇所と対応するコンテンツデータの部分文字列の例である。このような文字列が文字列メモリ1502に格納される。
文字参照形式生成部1503は、文字列メモリ1502に格納されている文字列のうち、文字セット「JIS X 2101」、「JIS X 2108」に含まれない文字(以下「非標準文字」と呼ぶ)を、文字参照形式に置き換える(ステップS1602)。
なお、コンテンツ作成装置301で表示可能な文字セットは「JIS X 2101」、「JIS X 2108」を含んでいるが、全く一致しているわけではないので、コンテンツ作成装置301で表示可能な文字セットに含まれる文字でも、ステップS1602で、文字参照形式に置き換えられるものがあり得ることに注意する。ステップS1602では図22に示される文字列メモリ1502の内容は、図23のように置き換えられる。
エラーメッセージ生成部1501は、コンテンツデータ解析部1301から、問題の原因を識別するエラーコードを受け取り、エラーメッセージテーブル1504を参照して、エラーメッセージに変換してエラーメッセージメモリ1505に格納する(ステップS1603)。
図24を参照して、エラーメッセージテーブル1504は、メッセージ1901、1902・・・、1909がそれぞれ、エラーコード0、1、・・・、8に対応したエラーメッセージを示している。
図24で示したエラーメッセージテーブル1504の例にしたがえば、図23で示した例はエラーコード0に対応する。従って、0番のエラーコードに対応するエラーメッセージがエラーメッセージテーブル1504から取り出され、エラーメッセージメモリ1505に格納される。
なお、この例では、コンテンツデータ解析部1301から渡されるエラーコードは0から6の整数である。エラーメッセージテーブル1504のエラーコード7から8に対応するエラーメッセージは、後述するように文字コード検査部1302から出力されるエラーコードである。
次いでエラーメッセージ生成部1501は、エラーメッセージメモリ1505に格納されている文字列と、文字列メモリ1502に格納されている文字列を連結して表示部402にエラーメッセージとして出力する(ステップS1604)。例えば、図23で示した例は、図25で示すエラーメッセージとなる。
図26はエラーメッセージ出力部1306のステップS1409における処理のフローチャートである。大部分の処理は、エラーメッセージ出力部1306のステップS1408における処理と共通なので、相違点に絞って説明する。
エラーメッセージ生成部1501は、問題が検出された箇所のコンテンツデータの部分文字列を、文字コード検査部1302から受け取って文字列メモリ1502に格納する(ステップS2101)。次のステップS2102はステップS1602と同一の処理である。
次いで、エラーメッセージ生成部1501は、文字コード検査部1302から、問題の原因を識別するエラーコードを受け取り、エラーメッセージテーブル1504を参照して、エラーメッセージに変換してエラーメッセージメモリ1505に格納する(ステップS2103)。文字コード検査部1302からは7から8のエラーコードが整数値で渡されるとする。次のステップS2104はステップS1604と同一の処理である。
ここで、ステップS1602またはステップS2102で、エラーメッセージに含まれる非標準文字を文字参照形式に置き換えることの意義について述べる。
エラーメッセージに、コンテンツデータの一部分の内容を含めて表示することは、エラーの原因をよりコンテンツデータ作成者に分かりやすくするが、コンテンツデータに含まれる文字コードに制限がなければ、例えば、エラーメッセージをファイルにセーブして別のコンテンツ作成装置に移す場合に、一方のコンテンツ作成装置で表示可能な文字が他方のコンテンツ作成装置で表示可能とは限らないため、内容が正しく表示できないことが考えられる。このような状況を防ぐために、文字参照形式で書かれない文字は、標準文字に限るようにすることは有効である。

また、エラーメッセージを他のコンテンツ作成装置で表示するために、異なるエンコーディングの間での変換が必要な場合があるが、文字セットによっては、必ずしもそのような文字コード変換が行なえるとは限らない。たとえば、ユニコードでは定義されているが、対応するシフトJISコードが存在しないような文字は多数存在する。したがって、そのような文字を含むユニコードのエラーメッセージをシフトJISコードに変換して出力するためには、メッセージ内で直接記述する文字を限定する必要がある。
また、この実施の形態では、コンテンツ記述時に、コンテンツ作成装置301で表示可能な文字セットに含まれない文字については、文字参照形式で記述することでこのような文字がコンテンツ本文データに含まれるのを防いでいるため、コンテンツ作成装置301ではこの問題は起きないが、コンテンツ作成装置301でこのような構成を取らない場合は、エラーメッセージに出現する文字を、表示可能な文字セットまたはその部分集合に制限することは、コンテンツ作成装置301自身で表示できない文字をエラーメッセージに含まないようにすることを意味するため、より重要性が高い。
なお、ここではメッセージ内で直接記述する文字の範囲を標準文字としているが、コンテンツ作成装置301で表示可能な文字の範囲であれば、直接記述する文字の範囲を変えても機能する。
コンテンツ配布装置303は、コンテンツ作成装置301、302で作成された配布コンテンツデータを表示用の表示コンテンツデータに変換するとともに、コンテンツ表示装置305〜308のユーザに配布するための装置である。
図27を参照してコンテンツ配布装置303は、CPU2201、配布コンテンツデータメモリ2202、表示部2203、入力部2204、変換部2205、第2形式配布コンテンツデータメモリ2206、通信部2207およびこれら各部を通信可能に相互接続するデータバス2208を有する。通信部2207は通信回線310にも接続されている。配布コンテンツデータメモリ2202には、通信回線310を通じて送信された、コンテンツ作成装置301、302で作成された配布コンテンツデータが複数個格納されているものとする。
図28のフローチャートに従いコンテンツ配布装置303の動作を説明する。まず、CPU2201は配布コンテンツデータメモリ2202に格納された配布コンテンツデータのリストを表示部2203に表示する(ステップS2301)。表示リストを参照してユーザによる購入コンテンツの選択が入力部2204によって入力される(ステップS2302)。
次いで変換部2205は、選択された配布コンテンツデータを、配布コンテンツデータメモリ2202から取り出し、第2形式配布コンテンツデータに変換して、第2形式配布コンテンツデータメモリ2206に格納する(ステップS2303)。次いで、CPU2201は、第2形式配布コンテンツデータメモリ2206に格納された第2形式配布コンテンツデータを出力する(ステップS2304)。
ステップS2303で行なわれる変換処理については、コンテンツ表示システムにおいて、配布コンテンツデータと第2形式配布コンテンツデータとの関係をどのように定めるかに依存している。ここでは、第2形式配布コンテンツデータは、配布コンテンツデータに、コンテンツ配布装置303から出力される日時を示すデータを付加したものとする。
配布コンテンツデータと第2形式配布コンテンツデータとの関係としては多様なものが考えられる。例えば、配布コンテンツデータと第2形式配布コンテンツデータの内容を全く同じ内容とすればステップS2303における変換部2205の動作は単なるコピー操作となる。コンテンツ配布装置303を操作したユーザまたはコンテンツ表示装置305〜308の所有者のみが復号できる機能を持つような暗号化を、配布コンテンツデータに施したものを第2形式配布コンテンツデータとすることも可能である。
なお、コンテンツ配布装置303では課金処理を行なうことが商業目的での使用では実際的であるが、本発明にとって本質的な部分ではないので、説明は省略する。
コンテンツ表示装置305は、コンテンツ作成装置301〜302から出力された配布コンテンツデータおよびコンテンツ配布装置303〜304から出力された第2形式配布コンテンツデータのいずれも表示することのできる装置である。以下、特筆しない限り、「配布コンテンツデータ」は、コンテンツ作成装置301〜302から出力される配布コンテンツデータと、コンテンツ配布装置303〜304から出力された第2形式配布コンテンツデータの双方を意味する。
図29は、コンテンツ表示装置305のブロック図である。コンテンツ表示装置306〜308も同じ構成を持つ。
図29を参照してコンテンツ表示装置305は、CPU2401、外部記憶装置2402、配布コンテンツデータメモリ2403、変換部2404、表示コンテンツデータメモリ2405、コンテンツデータ解析部2406、通信部2407、文字セット処理部2408、表示部2409、アンアーカイバ2410およびこれら各部を相互に通信可能に接続するデータバス2411を有する。通信部2407は通信回線310も接続する。外部記憶装置2402には、配布コンテンツデータが格納されているとする。
図30のフローチャートに従い、コンテンツ表示装置305のコンテンツ再生時の動作を説明する。まず、CPU2401は、外部記憶装置2402に格納されている配布コンテンツデータを配布コンテンツデータメモリ2403にロードする(ステップS2501)。ここでは説明を簡潔にするため、外部記憶装置2402に格納されている配布コンテンツデータは1つとするが、もちろん、配布コンテンツデータメモリ2403に、複数の配布コンテンツデータを格納しておき、ユーザに選択させるようにしてもよい。
次いで、変換部2404が、配布コンテンツデータメモリ2403に格納されている配布コンテンツデータを表示コンテンツデータに変換して、表示コンテンツデータメモリ2405に格納する(ステップS2502)。
ここでは、変換部2404で行なわれる変換処理とは、対象となる配布コンテンツデータが第2形式配布コンテンツデータである場合は、コンテンツ作成装置301のデータ符号化部1305における処理とコンテンツ配布装置305の変換部2205による変換処理を合わせた変換の、逆の変換に相当する。それ以外の場合は、コンテンツ作成装置301のデータ符号化部1305における処理の逆の変換に相当する。
次いで、アンアーカイバ2410が、一つのファイルにまとめられた表示コンテンツデータを個々のファイルに分解(アンアーカイブ)する(ステップ2503)。これは、コンテンツ作成装置301のステップS1406の処理の逆の処理に相当する。
次いで、コンテンツデータ解析部2406が、コンテンツ本文の<char_set>タグのname属性の値と、locale属性の値を抽出して、文字セット処理部2408に送る(ステップS2504)。
文字セット処理部2408は、ステップS2504で得られた文字セットが、コンテンツ表示装置305で表示可能な文字セットであるかどうかを判定して(ステップS2505)、表示可能であればステップS2506に進み、表示可能でなければS2508に移る。具体的には文字セット処理部2408から0という終了コードが返ってくれば表示可能、1という終了コードが返ってくれば表示可能でないと判断する。ステップS2505における文字セット処理部2408の動作については後述する。
ステップS2506に進んだ場合は、コンテンツデータ解析部2406が、表示コンテンツデータメモリ2405に格納されている表示コンテンツデータを解釈して、表示部2409で表示する(ステップS2506)。ここでいう表示とは、<sound>タグのような音声データの記述では音声が再生されるなど、データの種類によって、テキストや画像の視覚的な表示よりも広い意味を指し得るものとする。その表示例は図12に示されている。この例では、XMLで記述されたコンテンツを、定められた解釈で画面上にして表示(レンダリング)しているが、本発明は特定のデータ構造やレンダリング方法に限定されない。
CPU2401はEXITボタン1203(図12参照)を押されたかどうかを判定して(ステップS2507)押されれば終了、そうでなければステップS2506に戻る。
ステップS2508に進んだ場合は、エラー処理部2209が、このコンテンツを表示することができないという意味のメッセージを表示して終了する。
図31を参照して文字セット処理部2408は、コントローラ2601、使用文字セットテーブル2602、文字セット番号レジスタ2603、文字セットテーブル2604、グリフデータメモリ2605、エラーメッセージテーブル2606およびこれら各部を相互に接続するデータバス2607を有する。表示可能文字セットテーブル2604およびグリフデータメモリ2605は不揮発性メモリとなっている。
表示可能文字セットテーブル2604には、グリフデータメモリ2605に対応するグリフのデータが存在する、つまりデータの追加なしにコンテンツ表示装置305で表示することが可能な文字セットの情報が、図32に例を示すフォーマットで格納されている。第1コラム2801には文字セットの名称が、第2コラム2802には対応するロケール識別情報が格納されている。図32の例では、コンテンツ表示装置305は、追加情報なしに、「JIS X 2101」の「JIS X 2108」の2つの文字セットを表示可能なことを示している。もちろん、このときはグリフデータメモリ2605に、この2つの文字セットのグリフデータが保持されているとする。
図33のフローチャートに従い、文字セット処理部2406のステップS2503の動作を説明する。まず、コントローラ2601は、ステップS2504でコンテンツデータ解析部2406から転送された情報を使用文字セットテーブル2602に格納する(ステップS2701)。使用文字セットテーブル2602は、表示可能文字セットテーブル2604と同じ構造をもっている。図34にサンプルコンテンツに対応する使用文字セットテーブル2602に格納されるデータの例を示す。第1コラム2901は文字セット名、第2コラム2902は対応するロケール識別情報を表す。
次いで、コントローラ2601は、文字セット番号レジスタ2603を0で初期化する(ステップS2702)。以下、文字セット番号レジスタ2603の値をiで表す。
次いで、コントローラ2601は、使用文字セットテーブル2602のi番目の文字セットのグリフデータがコンテンツに内蔵されているかどうかを判定する(ステップS2703)。内蔵されていれば処理はステップS2709に進む。内蔵されていなければ処理はステップS2704に進む。サンプルコンテンツで説明すると、使用文字セットテーブル2602の3番目の文字セットである「MISC_KANJI」を内蔵しているので、i=3のとき処理はステップS2709に進み、それ以外の値では処理はステップS2704に進む。
ステップS2704に進んだ場合は、コントローラ2601は、使用文字セットテーブル2602のi番目の文字セットが、表示可能文字セットテーブル2604に含まれているかどうかを判定する。含まれていれば処理はステップS2709に進み、含まれていなければ処理はステップS2705に進む。サンプルコンテンツでは、使用文字セットテーブル2602の0番目の文字セットである「JIS X 2101」と1番目の文字セットである「JIS X 2108」が、表示可能文字セットテーブル2604に含まれているのでi=0、1のとき処理はステップS2709に進み、それ以外の値では処理はステップS2705に進む。
ステップS2705では、コントローラ2601は通信部2407、通信回線310を介してグリフデータ配布装置309に、使用文字セットテーブル2602のi番目の文字セットに対応するグリフデータの送信をリクエストする。グリフデータ配布装置309は、グリフデータを保持しているサーバコンピュータであり、リクエストされたグリフデータを保持していれば、グリフデータをリクエスト元に送信し、保持していなければ、そのことを伝えるデータをリクエスト元に送信することとする。このようなグリフデータ配布装置309を実現することは周知の技術で可能なので詳細は略す。
コンテンツ表示装置305の説明に戻って、コントローラ2601は、リクエストしたグリフデータが取得できたかどうかをグリフデータ配布装置309から受信したデータで判定して(ステップS2706)、取得できていればステップS2707に進み、できていなければステップS2712に進む。
ステップS2707では、コントローラ2601は受信したデータをグリフデータメモリ2605に書き込む。次いで、コントローラ2601は、表示可能文字セットテーブル2604に、使用文字セットテーブル2602のi番目の文字セットの文字セット名とロケール識別情報を書き込む(ステップS2708)。次いでコントローラ2601は文字セット番号レジスタ2603の値をインクリメントする(ステップS2709)。次いで、コントローラ2601が文字セット番号レジスタ2603の値と、使用文字セットテーブル2602に含まれている文字セットの数が一致しているかどうかを判定して(ステップS2710)、一致していればステップS2711に進み、一致しなければステップS2703に戻る。
ステップS2711では、コントローラ2601は、0という値を終了コードとして返す。これは使用文字セットテーブル2602に記載されている文字セットが全て表示可能であることを意味する。サンプルコンテンツの場合、文字セット「CIRCLED_NUM」に対応するグリフデータがグリフデータ配布装置309から取得できたとすると、ステップS2711では、表示可能文字セットテーブル2604は図35に示す内容となっている。図32で示したものと比較すると、「CIRCLED_NUM」に対応する情報がステップS2708の処理によって加えられている。「MISC_KANJI」はサンプルコンテンツに内蔵されているので、これでサンプルコンテンツに含まれる文字セットは全て表示可能になっている。
ステップS2712では、コントローラ2601はエラーメッセージを出力する。エラーメッセージテーブル2606は、複数種類のロケール識別情報ごとに異なるエラーメッセージを格納したテーブルである。その例を図36に示す。第1コラム3101にはロケール識別情報を示す文字列が、第2コラム3102には対応するエラーメッセージが格納されている。ただし「DEFAULT」とロケール識別情報にあるのはデフォルトで出力されるエラーメッセ―ジを示す。
ステップS2712では、表示可能文字セットテーブル2604のi番目の文字セットが表示可能とならなかったことを意味するので、コントローラ2601は、対応するロケール識別情報に合わせたエラーメッセージを、エラーメッセージテーブル2606から取り出して、表示部2409に出力する。
例えば、i番目の文字セットに対応するロケール識別情報が「US」(米国)であれば英語のメッセージ「Some glyph data is missing」が、「ES」(スペイン)であればスペイン語のメッセージが同様に出力される。
エラーメッセージテーブル2606に該当するロケール識別情報がなければ、「DEFAULT」に対応するエラーメッセージが出力される。「DEFAULT」というロケール識別情報をエラーメッセージテーブル2606に用意したのは、全てのロケールに対応したエラーメッセージを用意することに伴う工数、必要となるメモリの容量などのコストを削減することが可能になるためである。
ここで述べたような、コンテンツデータのロケール識別情報を参照してコンテンツ表示装置305からメッセージを出力することの利点としては、コンテンツの主たる使用者と思われるユーザに合わせたメッセージが出力できることがある。例えば、スペイン語のコンテンツを表示したいニーズを持つユーザは、通常スペイン語をよく解すると考えられるが、日本語や英語を解するかどうかは分からない。そこで、コンテンツに含まれるロケール識別情報を元にメッセージを表示するように構成したのである。
ここでは主にエラー時に出力されるメッセージを取り扱っているが、それ以外の通常操作のメッセージについても、同様にコンテンツのロケール識別情報を参照して表示することの有効性は明らかである。
次いで、コントローラ2601は、1という値を終了コードとして返して(ステップS2713)終了する。
ここでメッセージの内容として、表示可能とならなかった文字セットの名称を表示することや、ロケール識別情報に合わせたメッセージを表示する際に、常に「DEFAULT」のロケール識別情報に対応したメッセージも並列して出力することなどのバリエーションが採用されてもよい。
また、コンテンツ表示装置305は、用意したエラーメッセージテーブル2606にあるエラーメッセージを表示するのに十分なグリフデータを持たない場合には、「DEFAULT」のロケール識別情報に対応したメッセージを出力するなどのバリエーションについても同様である。
また、ここでは、文字セット処理部2408は、コンテンツにグリフが内蔵されていない文字セットであるかをチェックして、内蔵されていないものについて、コンテンツ表示装置305で表示可能であるかをチェック、さらに表示可能でないことが分かったものについて、グリフ配布装置309にグリフデータアクセスするという手順を取っているが、この手順を入れ替えることも目的によっては適切である。たとえば、グリフデータの更新が頻繁に考えられ、更新されたデータの方が一般に内容がより適切と考えられる場合は、グリフ配布装置309にアクセスして、対応するグリフデータが受信できない場合のみ、コンテンツ表示装置305で現在表示可能な文字セットであるかどうかをチェックして、最後にコンテンツに内蔵されているかどうかをチェックするという手順も考えられる。もちろんこのようなバリエーションが採用されてもよい。
また、ここでは、コンテンツ表示装置305は、文字セット処理部2408によって配布コンテンツデータに含まれる文字セットのあるものが表示可能でない場合には、配布コンテンツデータの表示を中止しているが、このような場合も配布コンテンツデータの表示を続行するような構成とすることも考えられる。この場合、表示ができない文字セットに属する文字については、本来のフォントの代用となる文字を、たとえば「=」や空白を表示するなどの取り決めを行なっておけば良い。
<第2の実施の形態>
発明の第2の実施の形態は、第1の実施の形態と類似しているが、コンテンツデータに、メッセージを出力する際の言語を決定するためのロケール識別情報を格納する領域を、文字セット情報と独立して設けたものである。そのようなコンテンツデータの記述例を図37に示す。図中の<principal_locale>タグ3201が、図5で示したサンプルコンテンツに比べて新たに追加されたタグである。第1の実施の形態との動作の違いは以下の通りである。
第1の実施の形態のステップS2712において、コントローラ2601が、表示可能文字セットテーブル2604のi番目の文字セットに対応するロケール識別情報に対応するロケール識別情報の代わりに、<principal_locale>タグ3201の子供要素文字列をロケール識別情報として取り出し、それに対応するエラーメッセージを、エラーメッセージテーブル2606から取り出して、表示部2409に出力する。もちろん、<principal_locale>タグ3201を使用可能にするために、文書定義ファイルBOOK.DTDや、コンテンツデータ解析部1301、コンテンツデータ解析部2406などの変更は必要である。
なお、ここではXML形式で、ロケール識別情報を追加しているが、これは、XML形式のコンテンツデータを扱う例で説明しているためであり、これに限られるものではない。
ロケール識別情報の効果について付言すれば、ユニコードでは同じ文字コードが割り当てられながら、用いられる地域によって異なるグリフを持つ文字についても、含まれる文字セットのロケール識別情報が異なれば、区別して扱われるため、混同が生じない。例えば、ロケール識別情報に「JP」とある文字セットのグリフデータではユニコード0x76F4に図40で示されるグリフ、ロケール識別情報に中国を示す「CN」とある文字セットのグリフではユニコード0x76F4に図41で示されるグリフを対応させるように文字セットのグリフデータを作成すれば、同じ文字コードだからといって混同が起きることはない。
したがって、ユニコードに限らず、同じコードが異なるグリフに割り当てられる可能性のあるような文字コード体系で、文字セットを定義して使用する場合に効果を発揮する。
<第3の実施の形態>
第3の実施の形態は、第2の実施の形態におけるコンテンツ表示装置305から出力されるメッセージを、コンテンツデータに含まれるロケール識別情報に合わせて決定するという考え方を、コンテンツ作成装置301にまで広げたものである。
第2の実施の形態との違いは、ステップS1604にて、エラーメッセージ生成部1501が、エラーメッセージを生成する際に、<principal_locale>タグ3201の子供要素文字列が示すロケール識別情報に合わせてエラーメッセージテーブル1504を切り替えることである。図38を参照して本実施の形態3におけるエラーメッセージテーブルの概念を説明する。ロケール「JP」に対応した日本語によるエラーメッセージのテーブル3301以外に、他のロケール識別情報に対応した言語で書かれたエラーメッセージのテーブル3302、3303が用意されている。エラーメッセージ生成部1501は、ロケール識別情報に合わせてエラーメッセージテーブルを切り替える構成になっている。この場合もロケール識別情報が取り出せなかった場合や、想定外のロケール識別情報が取り出された場合に備えて、デフォルトのエラーメッセージテーブルを用意するとより好ましい。
上述した実施の形態によれば、コンテンツ作成者がニーズに従って文字セットを定義することを許しながら、配布コンテンツデータの文字コードが意図通りになっていることを保証するようにコンテンツ作成装置301を構成したので、より自由なコンテンツデータの作成が、安全に行なえるようになった。
また、実施の形態によれば、文字セット名と同時にロケール識別情報をも定義しうるように構成したので、ユニコードのような、国または地域によって異なるグリフに共通の文字コードが割り当てられる文字コード体系であっても、文字コードと合わせて提供されるロケール識別情報によって、各国語(地域語)のグリフは区別されるので、意図したものと異なるグリフで表示されるのを回避できる。
また、実施の形態によれば、扱うデータによって動的にシステムから表示されるメッセージの言語を変更するようにしたため、個々のユーザに合った言語でメッセージが表示され、より快適にコンテンツ表示システムを用いることができる。
また、実施の形態によれば、コンテンツ作成者が重複した文字をもつ文字セットを定義できるので、コンテンツ作成者は目的に応じてより自由に文字セットを定義してコンテンツ作成に用いることができる。
また、実施の形態によれば、文字参照形式またはそれに準じる形式を用いることで、コンテンツ作成装置301から出力されるメッセージに含まれる、コンテンツデータの内容に出現する文字を制限できるため、メッセージのエンコーディングの変換、複数のコンテンツ作成装置301でのメッセージの表示がより確実に行なえる。
また、実施の形態によれば、文字コードによってアクセスされるテーブルに基づき、コンテンツ内の各文字が使用可能な領域に属するかを判定するようにしたので、効率が高い処理が行え、また条件の改変も容易である。
また、実施の形態によれば、コンテンツ内の各文字が使用可能な領域に属するかを判定するテーブルを、各文字がいずれの文字セットに属するかを判定するテーブルと兼用するように構成したので、メモリ容量が節約できる。
また、実施の形態によれば、コンテンツ表示装置305で表示可能な文字とコンテンツ表示可能でない文字のいずれも文字参照形式またはそれに準じる形式で記述できるようにしたので、コンテンツ作成者は、ある文字がいずれに属するかをその時点で知らなくても、コンテンツデータの記述を継続することができる。
また、実施の形態によれば、記述コンテンツデータを別のエンコーディングを用いた配布コンテンツデータに変換する際に、エンコーディングの変換を行なう対象を、変換先のエンコーディング方法で記述可能な文字セット、またはそのサブセットに限り、それ以外の文字は文字参照形式またはそれに準じる形式で表現することで、変換先のエンコーディング方法では記述できない文字も表現可能となる。
上述の各実施の形態によれば、外部操作に従い作成された文字セットをコンテンツデータを記述するために指定することができるから、コンテンツ作成者は所望する文字セットを外部から操作して作成して、それを指定しながらコンテンツデータを作成できる。
また、記述されたコンテンツデータが表示されるとき、記述に用いられた文字セットそれぞれについては、コンテンツデータに予め含まれた対応の識別データに基づき特定された地域用グリフデータを参照して表示できる。それゆえに、コンテンツデータにより意図されるものとは異なるグリフで表示されるのを回避できる。
また、装置本体に内蔵していない文字セットに対応するグリフデータについては、外部から取得する手段を設けるようにしたので、広い範囲の言語、文字をを用いた記述を持ったコンテンツデータがコンテンツ表示装置で表示可能となる。
<第4の実施の形態>
以上説明したコンテンツ作成装置およびコンテンツ表示装置の処理機能は、プログラムで実現される。本実施の形態では、このプログラムはコンピュータで読取可能な記録媒体に格納される。
図39には第4の実施の形態に係るコンピュータのハードウェア構成が示されて、該構成は上述の各実施の形態に係るコンテンツ作成装置およびコンテンツ表示装置の構成に適用される。
図39を参照してコンピュータは、CRT(陰極線管)などからなるモニタ110、該コンピュータ自体を集中的に制御するためのCPU(中央処理装置の略)122、ROM(Read Only Memory)またはRAM(ランダムアクセスメモリの略)を含んで構成されるメモリ124、固定ディスク126、FD(フレキシブルディスク)132が着脱自在に装着されて、装着されたFD132をアクセスするFD駆動装置130、CD−ROM(Compact Disc Read Only Memory)142が着脱自在に装着されて、装着されたCD−ROM142をアクセスするCD−ROM駆動装置140、キーボード150、マウス160、ペンタブレット170、通信回線310と、該コンピュータとを通信接続するための通信インターフェィス180を含む。これらの各部はバスを介して接続される。
コンピュータには、カセット形式の磁気テープが着脱自在に装着されて磁気テープをアクセスする磁気テープ装置が設けられても良い。
上述の記録媒体は、図39に示されているコンピュータで処理が行なわれるために必要なメモリ、たとえばメモリ124がプログラムメディアであってもよいし、また外部記憶装置として図示のない磁気テープ装置およびCD−ROM装置駆動装置140などのプログラム読取装置が設けられ、そこに記憶媒体である磁気テープまたはCD−ROM142が挿入されることで読取可能なプログラムメディアであってもよい。いずれの場合においても、格納されているプログラムはCPU122がアクセスして実行させる構成であってもよいし、あるいはいずれの場合もプログラムが一旦読出されて、読出されたプログラムは、所定のプログラム記憶エリア、たとえばメモリ124のプログラム記憶エリアにロードされて、CPU122により読出されて実行される方式であってもよい。このロード用のプログラムは、予め当該情報処理装置に格納されているものとする。
ここで、上述したプログラムメディアはコンピュータ本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープなどのテープ系、フレキシブルディスクや固定ディスク126などの磁気ディスクやCD−ROM140/MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc)などの光ディスクのディスク系、ICカード(メモリカードを含む)/光カードなどのカード系、あるいはマスクROM、EPROM(Erasable and Programmable ROM)、EEPROM(Electrically EPROM)、フラッシュROMなどによる半導体メモリを含めた固定的にプログラムを担持する媒体であってもよい。
また、本実施の形態においては、通信回線310にインターネットを含む各種の通信ネットワークを適用できるから、これら通信ネットワークからプログラムがダウンロードされて流動的にプログラムを担持する媒体であってもよい。なお記録媒体に格納されている内容としてはプログラムに限定されず、データであってもよい。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明の第1の実施の形態であるコンテンツ表示システムの概略図である。 コンテンツ作成装置の構成例を示す図である。 ユニコード2460から2473、2160から2169で表される文字を示す図である。 コンテンツ作成装置301を用いて、コンテンツ作成者が配布コンテンツを作成する際のフローチャートである。 コンテンツの記述の1例を示す図である。 コンテンツの記述の他の例を示す図である。 文字セット「CIRCLED_NUM」に対応する文字セット内容情報の例を示す図である。 文字セット「MISC_KANJI」に対応する文字セット内容情報の例を示す図である。 文字セット情報の1例を示す図である。 文字セット情報の他の例を示す図である。 文字セット情報のさらに他の例を示す図である。 コンテンツ表示装置の表示例を示す図である。 変換部411の構成図である。 ステップS505における変換部411の動作を示すフローチャートである。 文字コード検査部1302のブロック図である。 使用禁止領域テーブルの構成を示す図である。 ステップS1405における文字コード検査部1302の動作を示すフローチャートである。 文字セット「MISC_KANJI」に対応する文字セット内容情報の一例を示す図である。 ステップS1406でアーカイブされるグリフデータのデータ構造例を示す図である。 エラーメッセージ出力部1306の構成図である。 エラーメッセージ出力部1306のステップS1408における処理フローチャートである。 開始タグと終了タグの対応が取れていないという問題の発生した箇所と対応するコンテンツデータの部分文字列の例を示す図である。 文字列メモリ1502の内容例を示す図である。 エラーメッセージテーブル1504の内容例を示す図である。 エラーメッセージの一例を示す図である。 エラーメッセージ出力部1306のステップS1409における処理のフローチャートである。 コンテンツ配布装置303の構成図である。 コンテンツ配布装置303の動作を説明するフローチャートである。 コンテンツ表示装置305のブロック図である。 コンテンツ表示装置305のコンテンツ再生時の動作を説明するフローチャートである。 文字セット処理部2408の構成図である。 コンテンツ表示装置305で表示することが可能な文字セットの情報例を示す図である。 文字セット処理部2406のステップS2503の動作を説明するフローチャートである。 サンプルコンテンツに対応する使用文字セットテーブル2602に格納されるデータの例を示す図である。 表示可能文字セットテーブル2604の内容例を示す図である。 エラーメッセージテーブル2606の内容例を示す図である。 コンテンツデータの記述例を示す図である。 実施の形態3におけるエラーメッセージテーブルの概念を説明する図である。 第4の実施の形態に係るコンピュータのハードウェア構成を示す図である。 従来の同一の文字コードに当てられる異なるグリフを説明する図である。 従来の同一の文字コードに当てられる異なるグリフを説明する図である。
符号の説明
301,302 コンテンツ作成装置、303,304,405 コンテンツ配布装置、305,306,307,308 コンテンツ表示装置、309 グリフデータ配布装置、409 文字セット内容情報メモリ、410 文字セット情報メモリ、411 変換部、413,2605 グリフデータメモリ、1301 コンテンツデータ解析部、1302 文字コード検査部、1306 エラーメッセージ出力部、1501 エラーメッセージ生成部、3406 使用禁止領域テーブル。

Claims (6)

  1. コンテンツデータを処理するデータ処理装置であって、
    前記コンテンツデータは想定される使用地域を識別するロケール識別情報を含み、
    前記データ処理装置は、
    前記コンテンツデータを入力する手段と、
    前記コンテンツデータを処理する処理手段と、
    使用言語の異なる1つ以上の地域それぞれ毎に、当該地域の使用言語で表されたメッセージを記憶するメッセージ記憶手段と、
    記ロケール識別情報により識別される前記使用地域に基づき前記メッセージ記憶手段から当該地域の使用言語で表された前記メッセージを取り出し、取り出したメッセージを出力するメッセージ出力手段とを備え、データ処理装置。
  2. コンテンツデータを処理するデータ処理装置であって、
    前記コンテンツデータは想定される使用地域を識別するロケール識別情報と、複数の文字コードセットのうちの前記コンテンツデータを記述するための1つ以上の文字コードセットを識別するための文字セット識別情報とを含み、
    前記データ処理装置は、
    前記コンテンツデータを入力する手段と、
    前記データ処理装置で処理可能な1つ以上の文字コードセットを識別する情報を記憶する文字セット情報記憶手段と、
    使用言語の異なる1つ以上の地域それぞれ毎に、当該地域の使用言語で表されたメッセージを記憶するメッセージ記憶手段と、
    入力された前記コンテンツデータの前記文字セット識別情報と、前記文字セット情報記憶手段の情報とを比較し、比較結果に基づき、当該コンテンツデータを記述するための前記文字コードセットが、処理可能な文字コードセットであるか否かを判定する判定手段と、
    前記判定手段により前記コンテンツデータを記述するための前記文字コードセットが、処理可能な文字コードセットではないと判定されたとき、前記ロケール識別情報により識別される前記使用地域に基づき前記メッセージ記憶手段から当該地域の使用言語で表されたメッセージを取り出し、取り出したメッセージを出力するメッセージ出力手段と、を備え、データ処理装置。
  3. プロセッサと、
    コンテンツデータを入力する手段と、
    使用言語の異なる1つ以上の地域それぞれ毎に、当該地域の使用言語で表されたメッセージを記憶するメッセージ記憶手段と、を備えるコンピュータにおけるデータ処理方法であって、
    前記コンテンツデータは想定される使用地域を識別するロケール識別情報を含み、
    前記データ処理方法は、
    入力された前記コンテンツデータを前記プロセッサによって処理するステップと、
    記プロセッサによって、前記ロケール識別情報により識別される前記使用地域に基づき前記メッセージ記憶手段から当該地域の使用言語で表された前記メッセージを取り出すステップと、
    前記取り出されたメッセージを、前記プロセッサによって外部に出力するステップと、を備え、データ処理方法。
  4. プロセッサと、
    コンテンツデータを入力する手段と、
    使用言語の異なる1つ以上の地域それぞれ毎に、当該地域の使用言語で表されたメッセージを記憶するメッセージ記憶手段と、
    前記プロセッサで処理可能な1つ以上の文字コードセットを識別する情報を記憶する文字セット情報記憶手段と、を備えるコンピュータにおけるデータ処理方法であって、
    前記コンテンツデータは想定される使用地域を識別するロケール識別情報と、複数の文字コードセットのうちの前記コンテンツデータを記述するための1つ以上の文字コードセットを識別するための文字セット識別情報とを含み、
    前記データ処理方法は、
    入力された前記コンテンツデータの前記文字セット識別情報と、前記文字セット情報記憶手段の情報とを比較し、比較結果に基づき、当該コンテンツデータを記述するための前記文字コードセットが、処理可能な文字コードセットであるか否かを判定するステップと、
    前記判定するステップにおいて前記コンテンツデータを記述するための前記文字コードセットが、処理可能な文字コードセットではないと判定されたとき、前記プロセッサが前記ロケール識別情報により識別される前記使用地域に基づき前記メッセージ記憶手段から当該地域の使用言語で表された前記メッセージを取り出すステップと、
    前記取り出されたメッセージを、前記プロセッサが外部に出力するステップと、を備え、データ処理方法。
  5. 請求項3に記載のデータ処理方法をコンピュータに実行させるためのプログラムを記録した機械読取可能な記録媒体。
  6. 請求項4に記載のデータ処理方法をコンピュータに実行させるためのプログラムを記録した機械読取可能な記録媒体。
JP2007202123A 2007-08-02 2007-08-02 データ処理装置 Expired - Lifetime JP4757241B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007202123A JP4757241B2 (ja) 2007-08-02 2007-08-02 データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007202123A JP4757241B2 (ja) 2007-08-02 2007-08-02 データ処理装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003070556A Division JP2004280435A (ja) 2003-03-14 2003-03-14 コンテンツ作成装置、コンテンツ表示装置およびデータ処理装置

Publications (2)

Publication Number Publication Date
JP2007293923A JP2007293923A (ja) 2007-11-08
JP4757241B2 true JP4757241B2 (ja) 2011-08-24

Family

ID=38764411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007202123A Expired - Lifetime JP4757241B2 (ja) 2007-08-02 2007-08-02 データ処理装置

Country Status (1)

Country Link
JP (1) JP4757241B2 (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01308650A (ja) * 1988-06-07 1989-12-13 Nec Corp 文字パターン発生器
JPH032079A (ja) * 1989-05-31 1991-01-08 Ricoh Co Ltd プリンタ
JP3747130B2 (ja) * 1998-12-22 2006-02-22 キヤノン株式会社 情報処理装置、メッセージ表示方法、インタフェース装置、及びコンピュータ読み取り可能なプログラムが格納された記憶媒体
JP2001060164A (ja) * 1999-05-18 2001-03-06 Hitachi Ltd データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体
JP3692885B2 (ja) * 2000-01-25 2005-09-07 日本電気株式会社 メッセージ表示装置
JP3658325B2 (ja) * 2001-01-17 2005-06-08 キヤノン株式会社 ネットワーク・インターフェース装置、デバイス端末装置、及びネットワーク・インターフェース装置の制御方法
JP4522031B2 (ja) * 2001-01-17 2010-08-11 キヤノン株式会社 通信制御装置、装置及び通知方法
JP2003067302A (ja) * 2001-08-28 2003-03-07 Hitachi Application Systems Kk 特殊文字を含むメールデータを表示可能な携帯電話端末及び特殊文字処理機能を備えた携帯電話端末

Also Published As

Publication number Publication date
JP2007293923A (ja) 2007-11-08

Similar Documents

Publication Publication Date Title
US11210456B2 (en) Method relating to preparation of a report
CN101322121B (zh) 处理非结构化数据的方法、系统、装置及文档库系统
US7493250B2 (en) System and method for distributing multilingual documents
CN1979478B (zh) 文档处理系统和文档处理方法
CN101599011A (zh) 文档处理系统和方法
US20080037789A1 (en) Document Processing Device, Document Reading Device, and Document Processing Method
WO2015009297A1 (en) Systems and methods for extracting table information from documents
Ferilli Automatic digital document processing and management: Problems, algorithms and techniques
CN1979511A (zh) 一种文档数据安全管理系统和方法
JPWO2008108061A1 (ja) 言語処理システム、言語処理方法、言語処理プログラムおよび記録媒体
US7900136B2 (en) Structured document processing apparatus and structured document processing method, and program
JP4757241B2 (ja) データ処理装置
CN100507913C (zh) 一种文档处理方法及系统
JP2004280435A (ja) コンテンツ作成装置、コンテンツ表示装置およびデータ処理装置
KR102053075B1 (ko) 전자 문서 편집 장치 및 이의 동작 방법
JP6897168B2 (ja) 情報処理装置及び情報処理プログラム
US8522133B2 (en) Incrementally tokenizing and/or parsing a style sheet
CN1979479B (zh) 文档处理系统和文档处理方法
KR102375561B1 (ko) 다국어 번역 기능을 지원하는 문서 파일 제공 서버 및 그 동작 방법
JP3124567B2 (ja) 文書処理装置及び方法
JPWO2010035405A1 (ja) 情報処理装置
JP5503920B2 (ja) 単語帳システム
KR20190138186A (ko) 전자 문서 편집 시스템 및 이의 동작 방법
Chawathe Tracking Changes in Healthcare Documents
JP2006065423A (ja) 申請データ作成処理プログラム及び申請データ作成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070802

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110524

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110531

R150 Certificate of patent or registration of utility model

Ref document number: 4757241

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140610

Year of fee payment: 3

EXPY Cancellation because of completion of term