JP2004280435A - コンテンツ作成装置、コンテンツ表示装置およびデータ処理装置 - Google Patents

コンテンツ作成装置、コンテンツ表示装置およびデータ処理装置 Download PDF

Info

Publication number
JP2004280435A
JP2004280435A JP2003070556A JP2003070556A JP2004280435A JP 2004280435 A JP2004280435 A JP 2004280435A JP 2003070556 A JP2003070556 A JP 2003070556A JP 2003070556 A JP2003070556 A JP 2003070556A JP 2004280435 A JP2004280435 A JP 2004280435A
Authority
JP
Japan
Prior art keywords
content
character
data
character set
content data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003070556A
Other languages
English (en)
Inventor
Hisafumi Saika
尚史 齋鹿
Keisuke Iwasaki
圭介 岩崎
Yuji Sawada
裕司 沢田
Kensaku Oji
謙作 蔭地
Tomoo Mitsutomi
智雄 光冨
Mikihiro Kadowaki
幹宏 門脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2003070556A priority Critical patent/JP2004280435A/ja
Priority to EP12003732A priority patent/EP2509003A2/en
Priority to PCT/JP2004/002993 priority patent/WO2004081810A1/ja
Priority to CNB2004800068884A priority patent/CN100430928C/zh
Priority to EP04718398A priority patent/EP1610229A4/en
Priority to CN2008101661167A priority patent/CN101388005B/zh
Publication of JP2004280435A publication Critical patent/JP2004280435A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】作成者が所望する文字セットを用いてコンテンツを作成する。
【解決手段】コンテンツデータ作成時に、記述コンテンツデータメモリ408の記述コンテンツデータに含まれる文字が、文字セット内容情報メモリ409と文字セット情報メモリ410で示される文字コードの全体集合の部分集合である文字セットに含まれていることを変換部411により解析・検査することで、コンテンツ作成者が意図しない文字がコンテンツに含まれることを防ぐ。また、コンテンツ表示装置は、記述コンテンツデータに含まれる文字セットの識別情報が、インストールされた外部フォントの文字セットの識別情報と一致するかどうか検査して表示可能な文字セットであるかどうかを判断することで、表示時の文字化けなどの問題を防ぐ。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、コンテンツ作成装置、コンテンツ表示装置およびデータ処理装置に関して、特に、コンテンツの文字を所望される態様で出力可能とするためのコンテンツ作成装置、コンテンツ表示装置およびデータ処理装置に関する。
【0002】
【従来の技術】
近年、ネットワーク化の進展、電子機器の技術向上に伴って、WWW(WorldWide Web)電子書籍に代表される、電子データからなるコンテンツは急速な発達を遂げている。
【0003】
このためには、文字のコード化は不可欠であり、様々なエンコーディング方法が提案され、実用化されている。たとえば、わが国で広く使われているシフトJISはその一例である。
【0004】
一方、文字の字形(グリフ)の集まり(文字セット)については、各国であるいは国際間で規格化が行なわれている。たとえば、わが国ではJIS X 0201、JIS X 0208:1997が代表的な規格として知られている。
【0005】
文字セット自体は、構成する文字の字体(グリフ)の集合として定義できるが、通常は文字セットを構成する各文字に文字コードが割り振られている。つまり、エンコーディング(文字を符号化する方法)も同時に定めていることになる。しかし、エンコーディングと文字セットは本来独立のものであり、例えば上記JIS X 0208を表現するエンコーディングとしては、いわゆるJISコード以外に例えばシフトJISエンコーディングが挙げられるし、ユニコードでも、対応のゆれの問題はあるものの、基本的には表現可能である。
【0006】
各国・地域ごとにこのような異なる文字セットは定義されており、それらを全て表現しうるマルチリンガルな(多国語の文字を含む)文字コード空間を定義することを目指した代表的な試みとしてユニコードが提唱され、実用化されつつある。また、このような文字セットの範囲外の文字の表現形態の同一性を保証するための技術も提案されている(たとえば、特許文献1参照)。
【0007】
【特許文献1】
特開2000−250897公報
【0008】
【発明が解決しようとする課題】
しかしながら、従来から提案されている技術には、次のような課題が残されていた。
【0009】
(第1の課題)
文字セットをコンテンツ作成者が定義して、それに合わせてコンテンツデータを作成するのが困難である。従来の技術のほとんどは、標準的な文字セットを所与のものとして、それに含まれない文字は少数か少なくとも出現頻度が低いため、例外的な処理を行なっても全体の効率に影響が少ないという前提に立っている。
【0010】
例えば、特許文献1には、標準的な文字セットの範囲外の文字コードを、文字セットに含まれる文字コードに置き換え、表示用のファイルを作成する際に、外部フォントを用いて、再度変換する技術が示されている。このような技術は、標準的な文字セットに関する前提が成り立たない状況では、効率的ではない。
【0011】
例えば、日本語の表示を前提とした端末と、韓国語の表示を前提とした端末では、互いに相手の言語を表示するのに必要かつ相手の言語で出現頻度が高い文字が表示できないことは珍しくないため、同じような考え方では例外的な処理が絶えず発生することになる。
【0012】
一方、表示できない言語に遭遇した場合に、必要なグリフなどの情報をあらかじめ端末にインストールさせる方法も、近年パーソナルコンピュータでは行なわれている。このように、動的に端末の表示能力を変化させていく方法は端末の使用者から見れば、進歩と言えるが、この方法では、そのコンテンツデータで外国語の文字が1文字必要なだけでも、その文字が含まれる外国語の他の(多くの場合は多数の)文字についてのグリフデータをインストールすることになり、効率がよくない。これはその外国語のどの文字がそのコンテンツデータの表示に必要なのかを判定する手段がないためである。このような事態を避けるためには、コンテンツ作成者が文字セットを定義できるようにすることが有効である。
【0013】
しかし、これが行なえるためには、コンテンツ作成時に、コンテンツデータに含まれている文字がコンテンツ作成者が指定した文字セットに含まれているかどうかが正しく検証される必要がある。
【0014】
作業ミスによって、コンテンツデータに含まれる文字が、意図した文字セットから外れていることはあり得ることであるが、これが放置されたまま配布コンテンツデータが作成されると、本来使用できない文字コードが含まれた配布コンテンツデータが作成されてしまうという結果をもたらす。しかし、コンテンツ作成者が定義した文字セットである以上、システムが自動的にそのようなチェックを行うことはこれまでは不可能であった。
【0015】
したがって、コンテンツ作成者がニーズに従って文字セットを定義することを許しながら、配布コンテンツの文字コードが意図通りになっていることを保証するようなコンテンツ表示システムは提案されていなかった。
【0016】
(第2の課題)
ユニコードでは、各国語で形状が同一と見なせるものは統合するという方針をとり、これに従って、日本語、中国語、韓国語で用いられる漢字についても統合(ハンユニフィケーション)を行なっている。
【0017】
理想的には文字コードを与えるだけで、各国語の全ての文字が指定できるようになるべきであるが、現実には、文字の使用者から見て異なる文字が、統合されている例が、図40および図41に示される。図40はユニコード0x76F4に対応する、日本語の文字「直」のグリフであり、図41は同一のユニコードで表される中国語の文字のグリフである。このような例があるため、各国語のコンテンツデータが混在する場合、配布コンテンツの想定される使用国または使用地域を識別する情報(ロケール識別情報)を何らかの形で与え、それに合わせたグリフで表示する必要が出てくる。
【0018】
しかし、これまで流通している文字セットの多くは、JIS X 0208:1997に代表されるように、対象となる特定の言語または地域が了解されていたため、このような補助識別情報を持たせる必要もなく、この問題は顕在化していなかった。
【0019】
しかし、コンテンツ作成者がマルチリンガルな文字コード空間上で文字セットを定義した場合、上に説明したハン・ユニフィケーションの影響で、コンテンツ作成者が意図した通りのグリフが、配布コンテンツデータを表示する端末では表示されないことがあり得る。これを解決するために、文字セットと合わせて上記の補助識別情報を提供する技術はこれまで存在していなかった。
【0020】
(第3の課題)
従来の情報機器では一般に、システムが表示するメッセージの言語はそのとき取り扱っているデータではなく、システムに依存している。例えば、スペイン語のコンテンツを表示したいニーズを持つユーザは、通常スペイン語をよく解すると考えられるが、日本語や英語を解するかどうかは分からない。
【0021】
しかし、従来はどの言語でメッセージを表示するかは、システムによって決められてきたため、例えば英語をベースとしたシステムである限りは英語でメッセージが出力されてきた。もちろん各国語のリソースを持ち、手動で切り替えることができるシステムは多く存在したが、扱うデータに合わせて自動的に適切な言語に切換えてメッセージを表示するようなシステムは提案されていなかった。
【0022】
それゆえにこの発明の目的は、作成者が所望する文字セットを用いてコンテンツを作成するコンテンツ作成装置を提供することである。
【0023】
この発明の他の目的は、コンテンツデータを該コンテンツデータの使用が想定される地域に合ったグリフを参照して表示できるコンテンツ表示装置を提供することである。
【0024】
この発明のさらに他の目的は、データが処理されるとき該データ処理が想定される地域で認識可能に、該データ処理に関するメッセージを出力するデータ処理装置を提供することである。
【0025】
【課題を解決するための手段】
この発明のある局面に従うコンテンツ作成装置は、文字コードの全体集合の部分集合である1つ以上の文字セットを指定するための文字セット指定手段と、記述されたコンテンツデータの内容に基づいて配布コンテンツデータを出力するためのコンテンツ出力手段と、コンテンツデータに含まれる文字がなす集合と、1つ以上の文字セットとの間の包含関係を検査して検査結果に関する情報を出力する検査手段とを備える。
【0026】
したがって、文字セットをコンテンツデータを記述するために指定することができるから、コンテンツ作成者は所望する文字セットを指定しながらコンテンツデータを作成できる。
【0027】
また、コンテンツデータの作成時にコンテンツデータの記述に用いている文字コードが、コンテンツ作成者が指定した文字セットに包含されているか否かを検査できる。それゆえに、コンテンツデータが文字コードが作成者の意図通りになっていることを保証できる。
【0028】
好ましくはコンテンツ作成装置は、1つ以上の文字セットに含まれる文字コードを指定する情報を入力するための文字セット内容情報入力手段をさらに備える。したがってコンテンツ作成者は所望する文字コードを特定する情報を入力することができる。
【0029】
好ましくはコンテンツ作成装置は、予め準備された、特定の文字セットに含まれる文字コードを特定する情報を記憶しておくデフォルト文字セット記憶手段をさらに備える。したがって、コンテンツ作成者は標準で用いられる文字セットの文字コードを特定する情報を入力する必要はないから、コンテンツ作成者の作業量を軽減できる。
【0030】
好ましくは検査手段は各文字セットに対応する文字セットの重複を許容する。したがってコンテンツ作成者は文字セットを作成するとき上述のような重複を回避するように注意を払わなくてよいから、文字セットの文字コードを特定する情報を入力する時のコンテンツ作成者の負担を軽くできる。
【0031】
好ましくは配布コンテンツデータには、文字セット指定手段により指定された1つ以上の文字セットを識別するための文字セット識別情報が含まれる。
【0032】
したがって、記述されて作成されたコンテンツデータが配布されるときは、配布コンテンツデータには、コンテンツ作成者が作成に際して指定した1つ以上の文字セットをそれぞれ識別する文字セット識別情報が含まれる。
【0033】
それゆえに、コンテンツデータの配布先においては、配布コンテンツデータの文字セット識別情報により、そこに指定されている文字セットを速やかに確認できる。
【0034】
好ましくは配布コンテンツデータには、文字セット指定手段により指定された1つ以上の文字セットに含まれる少なくとも1つ以上の文字コードに対応するグリフデータが含まれる。したがって、コンテンツデータを記述して作成するときには、該コンテンツデータのためのグリフデータを該コンテンツデータに含ませることができる。
【0035】
好ましくは配布コンテンツデータには、当該配布コンテンツデータの想定される使用地域を識別するロケール識別情報が含まれる。
【0036】
したがって、地域によって異なるグリフデータに共通の文字コードが割当てられる場合でも、コンテンツデータとともに配布されるロケール識別情報によって、各地域ためのグリフデータを区別できる。それゆえに、コンテンツデータの配布先で作成者が意図するものとは異なるグリフで表示されるのを回避できる。
【0037】
好ましくはロケール識別情報は、文字セット識別情報と対応付けられている。したがって、地域によって異なるグリフデータに対して共通の文字コードが割当てられる場合でも、文字セットと対応付けて提供されるロケール識別情報によって、該文字セットの配布地域のためのグリフデータを区別できる。
【0038】
好ましくは検査手段は、コンテンツデータを記述する各文字コードが文字コード全体集合における使用可能な文字コードであるか否かを判定する使用可能性判定手段を有する。
【0039】
したがって、コンテンツ作成時にはコンテンツデータを記述する各文字コードが使用可能か否か判定されるから、使用できない文字コードがコンテンツデータに含まれてしまうのを回避できる。
【0040】
上述の使用可能性判定手段は好ましくは、文字コード全体集合における各文字コードと、該文字文字コードが使用可能であるか否かを示す使用可否データとが対応付けて登録されたテーブルを有し、コンテンツデータを記述する各文字コードに基づいてテーブルを検索して、該文字コードに対応の使用可否データに基づいて判定する。
【0041】
したがって、コンテンツ作成時において、コンテンツデータを記述する各文字コードが使用可能か否かはテーブルを参照することで速やかに判定できる。
【0042】
好ましくはコンテンツ作成装置はコンテンツ作成者が記述したコンテンツデータを検査するコンテンツデータ検査手段と、コンテンツデータ検査手段の検査により問題点が発見された場合は、メッセージを出力するコンテンツ作成時メッセージ出力手段とをさらに備える。したがって、コンテンツ作成者は検査による問題点をメッセージを確認して知ることができる。
【0043】
好ましくはコンテンツ作成時メッセージ出力手段は、コンテンツデータの、問題点に関連する部分のデータをメッセージに含む。したがって、コンテンツ作成者は検査により発見された問題点となった部分のデータを特定しながらその問題を確認できる。
【0044】
好ましくはコンテンツ作成時メッセージ出力手段は、コンテンツデータの、問題点に関連する部分のデータをメッセージ出力する際に、予め定められた1つ以上の文字セットまたはその補集合に含まれる文字については、予め定められた別の文字セットを用いて表現する。
【0045】
好ましくはコンテンツ作成時メッセージ出力手段は、コンテンツデータの、問題点に関連する部分のデータをメッセージに含む際、予め定められた特定の文字セットまたはその補集合に含まれる文字については、その文字コードを示す文字列を含む文字列によって表現する。
【0046】
したがって、コンテンツ作成者はある文字がいずれの文字セットに属するかをその時点で知らなくても、コンテンツデータの記述を継続できる。
【0047】
この発明の他の局面に従うコンテンツ表示装置は、上述のコンテンツ作成装置によって出力された配布コンテンツデータまたはそれに基づいた情報を表示するコンテンツ表示装置であって、配布コンテンツデータに格納された文字セット識別情報によって識別される文字セットのグリフデータが利用可能であれば、当該文字セットを表示可能と判定する表示可能性判定手段を備え、各文字セットのいずれかが表示可能でないと判定された場合に、表示可能と判定された場合とは異なる動作を行なう。したがって、異なる動作が行なわれることで、配布コンテンツデータには利用可能でないグリフデータが参照されていることがわかる。
【0048】
好ましくは各文字セットのいずれかが表示可能でないと判定された場合に、配布コンテンツデータまたはそれに基づいた情報の表示を中止する。したがってグリフデータが特定できないままにコンテンツが表示されるのを回避できる。
【0049】
好ましくは各文字セットのいずれかが表示可能でないと判定された場合に、メッセージを出力するメッセージ出力手段をさらに備える。したがって出力メッセージを確認することでコンテンツ表示に必要なグリフデータが特定できなかったのを知ることができる。
【0050】
好ましくはメッセージ出力手段は、文字セットが表示可能でないと判定された場合に、ロケール識別情報の内容に応じてメッセージを変化させる。
【0051】
好ましくは文字セット識別情報で識別される1つ以上の文字セットのそれぞれに対応するグリフデータが当該コンテンツ表示装置に格納されていない場合に、対応するグリフデータを外部から取得する動作を開始する。したがって特定できなかったグリフデータを外部から取得できる。
【0052】
この発明の他の局面に従うデータ処理装置は、処理対象のデータを記憶するデータ記憶手段と、メッセージを出力するメッセージ出力手段とを備え、処理対象のデータは想定される使用地域を識別するロケール識別情報を含み、メッセージ出力手段は、ロケール識別情報の内容に応じて出力するメッセージを変化させる。したがってデータ処理時には地域が異なってもメッセージを地域毎に変化させることができる。
【0053】
この発明のさらなる他の局面に従うコンテンツ表示システムは、記述されたコンテンツデータを検査して、記述コンテンツデータに基づいた配布コンテンツデータを出力するコンテンツ作成手段と、配布コンテンツデータを受理して、配布コンテンツデータに基づく情報を表示するコンテンツ表示手段とを備え、コンテンツ作成手段は、文字コードの全体集合の部分集合であってコンテンツデータを記述するための文字セットの内容を指定する文字セット情報入力手段と、記述コンテンツデータに含まれる文字がなす集合と、文字セット情報入力手段により指定された文字セットの間との包含関係に関する情報を出力する手段とを有する。
【0054】
またコンテンツ作成方法が提供されてもよい。この方法は、文字コードの全体集合の部分集合である1つ以上の文字セットを指定するための文字セット指定ステップと、記述されたコンテンツデータの内容に基づいて配布コンテンツデータを出力するためのコンテンツ出力ステップと、コンテンツデータに含まれる文字がなす集合と、1つ以上の文字セットとの間の包含関係を検査して検査結果に関する情報を出力する検査ステップとを備える。
【0055】
上述のコンテンツ作成方法をコンピュータに実行させるためのプログラムが提供されてもよく、また該プログラムを記録したコンピュータ読取り可能な記録媒体が提供されてもよい。
【0056】
また、上述のコンテンツ作成方法によって出力された配布コンテンツデータまたはそれに基づいた情報を表示するコンテンツ表示方法が提供されてもよい。この表示方法は、配布コンテンツデータに格納された文字セット識別情報によって識別される文字セットのグリフデータが利用可能であれば、当該文字セットを表示可能と判定する表示可能性判定ステップを備え、各文字セットのいずれかが表示可能でないと判定された場合に、表示可能と判定された場合とは異なる動作を行なうことを特徴とする。
【0057】
上述のコンテンツ表示方法をコンピュータに実行させるためのプログラムが提供されてもよく、また該プログラムを記録したコンピュータ読取り可能な記録媒体が提供されてもよい。
【0058】
また、データ処理方法が提供されてもよい。このデータ処理方法は、処理対象のデータを記憶するデータ記憶ステップと、メッセージを出力するメッセージ出力ステップとを備え、処理対象のデータは想定される使用地域を識別するロケール識別情報を含み、メッセージ出力ステップは、ロケール識別情報の内容に応じて出力するメッセージを変化させる。出力されるメッセージはデータまたはデータ処理に関連した内容を示してよい。
【0059】
上述のデータ処理方法をコンピュータに実行させるためのプログラムが提供されてもよく、また該プログラムを記録したコンピュータ読取り可能な記録媒体が提供されてもよい。
【0060】
【発明の実施の形態】
以下、この発明の各実施の形態について説明する。以下の記述では、特記しない限り、「文字」は記号や数字も含むものとする。また「文字コード空間」は複数種類の文字セットの全体集合であり、各文字セットは文字コード空間の部分集合である。
【0061】
<第1の実施の形態>
図1は、本発明の第1の実施の形態であるコンテンツ表示システムの概略図である。複数のコンテンツ作成装置301〜302、複数のコンテンツ配布装置303〜304、複数のコンテンツ表示装置305〜309およびグリフデータ配布装置309からなる。これら装置は通信回線310を介して相互に通信する。説明を煩雑にするのを避けるため、グリフデータ配布装置は1台の場合を考えるが、複数台の場合の動作は以下から容易に理解しうる。このことも含め、図中の各装置の個数は本発明にとって本質的ではない。
【0062】
コンテンツ作成装置301の構成例を図2に示す。コンテンツ作成装置302も同一の構成を持つものとする。コンテンツ作成装置301は、CPU(Central processing Unit)401、表示部402、入力部403、補助入力部404、コンテンツ表示装置405、外部記憶装置406、通信部407、記述コンテンツデータメモリ408、文字セット内容メモリ409、文字セット情報メモリ410、変換部411、配布コンテンツデータメモリ412、グリフデータメモリ413、およびこれらを相互に通信接続するデータバス414を有する。通信装置406は通信回線310とも接続されている。
【0063】
表示部402としてはディスプレイおよび表示回路を、入力部403としてはキーボードを、補助入力部404としてはマウスを想定している。コンテンツ表示装置405は、後述するコンテンツ表示装置305と同一の構成、機能を持つものである。したがってコンテンツ表示装置405の表示は表示部402とは独立して行なわれることに注意されたい。
【0064】
すなわち、コンテンツ作成装置301はコンテンツ表示装置405を接続したパーソナルコンピュータおよびその上で動作するソフトウエアと極めて類似した構成を持っている。コンテンツ作成装置301で、表示部402に表示できる文字は、JIS X 2101に含まれる文字、JIS X 2108:1997に含まれる文字、および図3に示されるユニコード2460から2473、2160から2169で表される文字とする。コンテンツ作成装置301で、表示部402に表示できる文字からなる文字セットを、以下「コンテンツ作成装置301で表示可能な文字セット」と呼ぶ。また、以下では、コンテンツ表示装置で表示可能な文字セットに含まれる文字を、「コンテンツ表示装置で表示可能な文字」と呼ぶことがある。コンテンツ作成装置301で表示可能な文字セットは、コンテンツ表示装置305〜308、405で表示可能な文字とは必ずしも一致していない。これは特に、コンテンツ表示装置305〜308、405がコンテンツ作成装置301とは異なった種類のハードウェアで実現される場合には自然なことである。
【0065】
以下、コンテンツ作成者がデータを作成する際の細かい操作については、多くの場合、本発明にとって本質的ではないし、通常のパーソナルコンピュータからの類推で容易に理解しうるので、特に必要がない限りは詳細に立ち入らない。
【0066】
以下の例では、文字コード空間としては16ビットのユニコードを想定し、他の文字セットはその部分集合と考えるが、これはあくまでも一つの例であり、本発明の内容を限定するものではない。
【0067】
以下、特記しない限り、文字列は16ビットユニコードで内部表現されているとする。また、特に必要がない限り、説明を煩雑にしないためにファイル名を明示しない。以下「セーブ」とはメモリから外部記憶装置にファイルとして書き出すこと、「ロード」とは外部記憶装置からメモリにファイルの内容を読み出すことを意味する。
【0068】
図4は、コンテンツ作成装置301を用いて、コンテンツ作成者が配布コンテンツを作成する際のフローチャートである。以下これを用いて、コンテンツ作成装置301の動作を詳細に説明する。
【0069】
コンテンツ作成者は、記述コンテンツデータメモリ408内にコンテンツの記述を示す記述コンテンツデータを作成して、外部記憶装置406にセーブする(ステップS501)。ここで、記述コンテンツデータの形式はあらかじめ定義されたXMLの書式に従って図5のように記述されるとする。以下、この例を用いて作成したコンテンツデータを「サンプルコンテンツ」と呼び、これを用いて説明するが、本発明は、XMLで記述されたコンテンツデータに限定されるものではない。コンテンツ作成者は、表示部402に図5のように表示される記述コンテンツデータを入力部403、補助入力部404を用いて編集する。
【0070】
以下図5の<book>タグの子供要素(<book>と</book>に挟まれた部分)を「コンテンツ本文データ」と呼ぶことがある。
【0071】
図5の書式について、後に必要となる範囲で簡単に説明しておく。2行目のDOCTYPE宣言にあるように、このコンテンツ表示システムではBOOK.DTDという文書型定義(DTD)ファイルを用いる。この文書型定義ファイルは、このコンテンツ表示システムで扱われる全てのコンテンツで共通とする。
【0072】
<author>タグは著者名を表すタグであり、子供要素の文字列が著者名となっている。特に、<author>タグの子供要素にある「﨑」は、文字参照と呼ばれる形式であり、fa11というユニコードで表される文字を示している。これは、「崎」の異体字(JIS X 2108:1997に収録されている「崎」とは異なるグリフを持つ)を示す。コンテンツ作成者は、fa11というユニコードで表される文字のように、コンテンツ作成装置301で表示可能な文字セットに含まれない文字はこのような形式で入力するものとする。なお、後述するように、コンテンツ作成装置301で表示可能な文字についても文字参照形式で書くことを許容するものとする。
【0073】
<text>タグは本文を表すタグであり、子供要素の文字列が本文テキストである。特に、矢印AとBで示す○付きの文字(JIS X 2101、JISX 2108:1997にいずれも収録されていない)に注意する。
【0074】
<image>タグは本文とともに表示される画像を表すタグである。filename属性は表示される画像のファイル名を表す。<image>タグの子供要素である<caption>タグは、画像と同時に表示されるテキストを表すタグであり、その子供要素の文字列が表示されるテキストを表す。特に、<caption>タグの子供要素にある「髙」は、文字参照形式でユニコードで9ad9の文字を示している。これは、「高」の異体字(JIS X 2108:1997に収録されている「高」とは異なるグリフを持つ)を示す。このような書き方をしているのは、9ad9というユニコードを持った文字がコンテンツ作成装置301で表示可能な文字セットに含まれていないためである。記述例の中に含まれる画像のファイルもコンテンツ作成者が用意するものとする。
【0075】
<sound>タグは本文とともに再生される音声を表すタグであり、filename属性は再生される音声データのファイル名を表す。
【0076】
なお、図5の例では、コンテンツ作成装置301で表示可能な文字セットに含まれていない文字のみを文字参照形式で記述しているが、コンテンツ作成装置301で表示可能な文字セットに含まれる文字でも、文字参照形式で書くことをコンテンツ作成装置301では許している。図6の例では、2460、2461というユニコードで表現される○付きの数字が、コンテンツ作成装置301で表示可能な文字であるが、文字参照形式で記述されている。
【0077】
このような記述が可能なようにコンテンツ作成装置301を構成する利点は、ある文字がコンテンツ作成装置301で表示可能な文字であるか否かが不明な場合に、コンテンツ作成者が、その都度確認せずとも、文字参照形式で記述することで、記述が継続できることである。
【0078】
なお、ここでは、コンテンツ作成装置301で表示可能な文字セットに含まれない文字を表示可能な文字セットで表現する方法として、XMLで一般に用いられている形式を用いているが、XML形式でコンテンツを記述するか否かに関わらず、このような形式はここで用いた文字参照形式に限られるものではない。コンテンツ作成装置301で表示可能な文字セットに含まれない文字を、表示可能な文字セットに含まれる文字の組み合わせで一意的に表現する規則を与え、コンテンツ表示装置405で元の文字コードを復元することが可能な形式であれば、有効に機能する。また、以下では、このような表現を行なわないで文字を記述することを「文字を直接記述する」と表現することがある。
【0079】
この例では文字セットとして、「JIS X 2101」、「JIS X 2108」、「CIRCLED_NUM」および「MISC_KANJI」の4種類の文字セットを用いる。
【0080】
「JIS X 2101」は、名前の通り、JIS X 2101で定められた文字セットであり、通常はパーソナルコンピュータの世界で1バイトで表される英数字、記号、半角カタカナを含むものである。
【0081】
「JIS X 2108」は、JIS X 2108:1997で定められた文字セットであり、パーソナルコンピュータの世界ではJIS第1水準、第2水準に収録されている漢字、全角英数字、全角ひらがな、カタカナにほぼ該当する。
【0082】
「CIRCLED_NUM」は、名称も含めて、コンテンツ作成者が定義した文字セットであり、その内容は、図5の矢印AとBで示すような○付きの数字1、2、3、…、20を集めたものとする。
【0083】
「MISC_KANJI」も、名称も含めて、コンテンツ作成者が定義した文字セットでありその内容は、上述の「高」の異体字など該当コンテンツデータでは重要ではあるが、「JIS X 2101」、「JIS X 2108」のいずれの文字セットにも含まれていない漢字を集めたものとする。
【0084】
以下の説明では特筆しない限り、「標準文字セット」で「JIS X 2101」、「JIS X 2108」を意味する。標準文字の概念は、特定地域で多用される文字セットを、当該地域にてより少ない労力、操作で利用するためのものであり、その他の地域で、コンテンツ表示装置、コンテンツ作成装置、コンテンツ配布装置の使用を制限するものではない。
【0085】
また、以下の説明で、「JIS X 2101」、「JIS X 2108」が標準文字セットとされているのは、日本国内での使用を前提にしたためであり、日本国以外の国や地域でも、その国や地域で使用頻度が高い別の文字セットを適宜標準文字セットとして定めれば以下の説明は該当する。
【0086】
次いで、コンテンツ作成者は、文字セット内容情報メモリ409上に文字セット内容情報を作成して、外部記憶装置406にセーブする(ステップS502)。
ここでは、文字セット内容情報は、文字セットに含まれる文字のユニコードを16進数で1文字ごとに1行で書き込んだものとする。文字セット「CIRCLED_NUM」に対応する文字セット内容情報の例を図7に示す。文字セット内容情報701は、図5の矢印AとBで示すような○付きの数字1〜20に相当するユニコード2460から2473からなる。
【0087】
文字セット「MISC_KANJI」に対応する文字セット内容情報の例を図8に示す。文字セット内容情報801は、「高」の異体字に相当するユニコード9AD9,「崎」の異体字に相当するユニコードFA11からなる。
【0088】
一方、標準文字セットは、日本国内での使用を前提として作られるコンテンツでは使用頻度が高いと考えられるため、「JIS X 2101」、「JIS X 2108」に対応する文字セット内容情報がそれぞれ「jisx2101.lst」、「jisx2108.lst」という名称の読み取り専用ファイルで、外部記憶装置406に当初から保存されているものとする。これによって、文字セット内容情報を作成するコンテンツ作成者の労力が軽減される。
【0089】
もちろん、標準文字セットについても、コンテンツ作成者が作成した文字セットと同様に、文字セット内容情報をコンテンツ作成者が作成して、外部記憶装置406に格納することを前提としてコンテンツ作成装置301を構成することも可能であり、本発明の範疇であることに変わりはない。
【0090】
再び図5の例の説明に戻ると、<char_set>タグは、後述する、文字セット情報のうち、属性で、文字セット名を、属性でロケール識別情報を与えている。
【0091】
ステップS502では、コンテンツ作成者は「CIRCLED_NUM」に対応する文字セット内容情報を「proprie1.lst」というファイル名で、外部記憶装置406に保存するものとする。同様に「MISC_KANJI」に対応する文字セット内容情報を「proprie2.lst」というファイル名で、外部記憶装置406に保存するものとする。次いでコンテンツ作成者は文字セット情報メモリ410上に文字セット情報を作成する(ステップS503)。
【0092】
文字セット情報は、図9で示すような構造を持ったテキストデータとする。文字セット情報901の各行は、文字セットの名称を二重引用符で囲んだ文字列と、ステップS502で作成した文字セット内容情報のファイル名を二重引用符で囲んだ文字列、およびロケール識別情報を2重引用符で囲んだ文字列からなり、その間はカンマで区切られた、いわゆるCSV(Comma―Separated Variable)データとなっている。
【0093】
ロケール識別情報は、前述の第2の課題で述べたような、同じ文字コードに、異なるグリフが対応する状況が該ロケール識別情報から判別しうるために設けられる。ここでは、ロケール識別情報として、ISO3166で定められた2文字の国名表記を用いるとする。これによれば例えば日本は「JP」、米国は「US」、スペインは「ES」と表される。この他の例として、ISO639で定められた言語コードなども適切に機能すると考えられる。その他のコードでも後に述べるコンテンツ表示装置305〜308、405の動作を定めておけば使用可能である。
【0094】
標準文字セットの情報については、コンテンツ作成者が文字セット情報に明示的に記述しなくても、記述されていると見なされるように、コンテンツ作成装置301を構成することも考えられる。図10は、そのようなコンテンツ作成装置301に対応した文字セット情報の別の構成例である。図10の文字セット情報1001は、コンテンツ作成者が定義した文字セットに対応する情報のみを記載している。このような、標準文字セットについてはコンテンツ作成者が記載しなくても良いようにしておくことは、コンテンツ作成者の労力を軽減させ、コンテンツ作成時の誤りを防ぐ効果がある。
【0095】
ここではロケール識別情報を文字セット情報に含めた例を考えたが、コンテンツ表示システムが使用される地域や言語が暗黙のうちに了解されているようなコンテンツ表示システムでは、これを文字セット情報に明示する必要は必ずしもない。
【0096】
そのような構成に対応した文字セット情報の例を図11に示す。ここでは文字セット情報1101の各行は、文字セットの名称を二重引用符で囲んだ文字列と、ステップS502で作成した文字セット内容情報のファイル名を二重引用符で囲んだ文字列からなり、ロケール識別情報は含まれていない。このような構成では、後に述べるコンテンツ表示装置305〜308は、暗黙に特定の地域または言語を指していると仮定して動作することになる。
【0097】
次いで、記述コンテンツデータが外部記憶装置406から記述コンテンツデータメモリ408にロードされる(ステップS504)。このとき、文字セット内容情報メモリ409、文字セット情報メモリ410にも、その内容が外部記憶装置406からロードされる。当初から外部記憶装置406にファイルとして存在している「jisx2101.lst」、「jisx2108.lst」に格納されている文字セット内容情報についても、文字セット内容情報メモリ409にロードされるとする。
【0098】
次いで、変換部411が記述コンテンツデータを配布するための配布コンテンツデータに変換して外部記憶装置406にセーブする(ステップS505)。
【0099】
ステップS505で行なわれる変換処理としては、記述コンテンツデータと配布コンテンツデータの形態、記述フォーマットデータと配布コンテンツデータの関係によって種々のものが考えられるが、その詳細は後述する。
【0100】
CPU401は、ステップS505で変換に成功したかどうかを判断して(ステップS506)、成功していればステップS508に処理を進め、失敗した場合は、表示部402に表示されるメッセージに従いコンテンツ作成者が問題箇所を確認、修正して(ステップS507)、この後再びステップS505に戻る。
【0101】
ステップS508に進んだ場合は、CPU401は、コンテンツ表示装置405に、外部記憶装置406にある配布コンテンツデータを入力して表示する(ステップS508)。
【0102】
図12に、コンテンツ表示装置405の表示例を示す。なお、コンテンツ表示装置405の構成および動作は後述するコンテンツ表示装置305と同様である。コンテンツウインドウ1201に、配布コンテンツデータメモリ413の内容が表示されている。図5の記述コンテンツデータでは文字参照形式で書かれていた文字(「崎」の異体字と「高」の異体字)がそれぞれの字形に変換されて表示されているのに注意する。また図5の記述コンテンツデータでは<image>タグに対応していた部分が、画像として表示されている。スクロールバー1202はコンテンツ作成者が表示をスクロールしたい場合に用いるものである。EXITボタン1203が押されるとコンテンツ表示装置405は終了するが、ステップS508では用いられない。
【0103】
コンテンツ表示装置405で正常に表示されていれば(ステップS509)、処理はステップS510に進み、そうでない場合は処理はS507に戻る。ステップS509における「正常に表示されている」とは、後述するコンテンツ表示装置305のステップS207を経由して処理が終了した場合とする。
【0104】
補助入力部404から「OK」が入力されると(ステップS510)処理は終了し、それ以外の文字列が入力されると処理はS507に戻る。
【0105】
ここで、変換部411の構成とステップS505における動作について説明する。図13を参照して、変換部411はコンテンツデータ解析部1301、文字コード検査部1302、変換部1303、アーカイバ1304、データ符号化部1305、エラーメッセージ出力部1306およびこれら各部を相互に接続するデータバス1307を有する。
【0106】
ステップS505における変換部411の動作を図14のフローチャートに従い説明する。まず、コンテンツデータ解析部1301は、記述コンテンツデータメモリ408に格納されているコンテンツデータの本文データの開始タグと終了タグの対応が取れているかを検査する(ステップS1401)。対応が取れていれば処理はステップS1402に進む。充たしていなければ処理はステップS1408に進む。
【0107】
次いで、コンテンツデータ解析部1301は、記述コンテンツデータメモリ408に格納されているコンテンツデータの開始タグと終了タグのタグの入れ子関係が正しいかどうかを検査する(ステップS1402)。正しければ処理はステップS1403に進む。正しくなければ処理はステップS1408に進む。
【0108】
ステップS1401からステップS1402の処理は、入力されたXMLファイルが、ウェルフォームド(well−formed)であることを検証する、通常のXMLプロセッサで行なわれている処理であり、また本発明にとって本質的なことではないので、詳細説明は略す。
【0109】
次いで、コンテンツデータ解析部1301は、記述コンテンツデータメモリ408に格納されているコンテンツデータに含まれるタグ、属性、属性値が規定通りであるかを文書型定義ファイルBOOK.DTDを用いて検査する(ステップS1403)。規定通りであれば、処理はステップS1404に進む。正しくなければ処理はステップS1408に進む。
【0110】
これは、コンテンツデータが、検証済みXML文書(VALID XML DOCUMENT)であるかどうかを検査することである。これについても通常のXMLプロセッサで行なわれている処理であり、また本発明にとって本質的なことではないので、詳細には立ち入らない。
【0111】
次いで、コンテンツデータ解析部1301は、記述コンテンツデータメモリ408に格納されているコンテンツデータの<char_set>タグのname属性と、locale属性が、文字セット情報メモリ410の内容と一致しているかどうかを調べる(ステップS1404)。一致していれば、処理はステップS1405に進む。正しくなければ処理はステップS1409に進む。
【0112】
ここでは文字セット情報メモリ410の各行に含まれる文字セット名とロケール識別情報の組の集合が、コンテンツデータの<char_set>タグのname属性と、locale属性の組の集合と一致しているかどうかを検査する。
【0113】
次いで、文字コード検査部1302は、記述コンテンツデータメモリ408に格納されているコンテンツ本文データで用いられている文字コードが、文字セット情報メモリ410から得られる、このコンテンツで使用される文字セットに含まれているかどうかを、各文字セットについて検査する(ステップS1405)。ステップS1405における、文字コード検査部1302の動作については後述する。文字コード検査部1302から0という終了コードが返れば処理はステップS1406に進み、1という終了コードが返れば処理はステップS1409に進む。
【0114】
図15に文字コード検査部1302のブロック図を示す。文字コード検査部1302は、コントローラ3401、第1文字コードレジスタ3402、文字セット番号レジスタ3403、文字番号レジスタ3404、第2文字コードレジスタ3405、使用禁止領域テーブル3406およびこれらを相互に接続するデータバス3407を有する。
【0115】
使用禁止領域テーブル3406は、65536個の整数値が格納されたテーブルであり、kという文字コードが用いられている文字コード体系(この場合はユニコード)で使用できない領域にあれば(0から数えて)k番目の要素に−1を、そうでなければ0が格納されている。ここでは、使用禁止領域テーブル3406の16進で0xFFFF番目、0xFFFE番目、0xFEFF番目および0xE000番目から0xF8FF番目の要素に−1が入っており、それ以外は0が入っているものとする。そのようなテーブルの構成例(部分)を図16に示す。要素4001は0xDFFE番目の要素であり、上記の使用禁止領域に含まれないので0が格納されている。要素4002は0xDFFF番目の要素であり、同様に0が格納されている。要素4003は0xE000番目の要素であり、上記の使用禁止領域に含まれるので−1が格納されている。要素4004は0xE001番目の要素であり、同様に−1が格納されている。これは、非文字(NON―CHARACTER)、PUA領域(Private Use Area)、BOM(Byte Order Mark)と呼ばれる領域に含まれる文字コードを使用禁止にしていることを意味する。
【0116】
もちろん文字コード領域のどの部分を使用禁止にするかによってこのようなテーブルの内容は変わりうるものである。テーブル方式による判定は必須ではないが、文字コードを用いてテーブルにアクセスするだけで判定結果が得られるので、処理効率の高い判定が行なえ、また条件の改変も容易という利点があるので、値の種類の数が、テーブル化することが可能な範囲にある場合は、より好ましい。
【0117】
図17のフローチャートに従い、ステップS1405における文字コード検査部1302の動作を説明する。まず、コントローラ3401は、コンテンツデータ解析部1301からコンテンツ本文データの文字コードを1文字分受け取って第1文字コードレジスタ3402に格納する(ステップS3501)。以下第1文字コードレジスタ3402の値をkで表すことがある。なお、ステップ1601と同様に、ステップS3501においても、コンテンツデータ解析部1301は、文字参照形式については、一文字として扱うとする。
【0118】
コントローラ3401は、使用禁止文字テーブル3406のk番目の値を取り出して、それが使用可能領域を示す値にあるかどうかを判定して(ステップS3502)、使用可能領域にあればステップS3403に進み、使用禁止領域を示す値であればステップS3511に進む。
【0119】
コントローラ3401は、文字セット番号レジスタ3403を0に初期化する(ステップS3503)。以下文字セット番号レジスタ3403の値をiで表す。
コントローラ3401は、文字番号レジスタ3404を0に初期化する(ステップS3504)。以下文字番号レジスタ3404の値をjで表す。
【0120】
コントローラ3401は、文字セット情報メモリ410のi番目の文字セットの、j番目の文字の文字コードを文字セット内容情報メモリ409から取り出して、第2文字コードレジスタ3405に格納する(ステップS3505)。
【0121】
コントローラ3401は、第1文字コードレジスタ3403と第2文字コードレジスタ3405の値が一致するかどうかを判定して(ステップS3506)、一致すればステップS3512に進み、一致しなければコントローラ3401は文字番号レジスタ3404をインクリメントする(ステップS3507)。
【0122】
コントローラ3401は、文字番号レジスタ3404の値が、文字セットに含まれる文字数と一致するかどうかを判定して(ステップS3508)、一致すれば文字セット番号レジスタ3403をインクリメントし(ステップS3509)、一致しなければステップS3505に戻る。
【0123】
コントローラ3401は、文字番号レジスタ3404の値が、文字セット情報メモリ410で記述されている文字セットの数と一致するかどうかを判定して(ステップS3510)、一致すれば1という終了コードを返して終了する(ステップS3511)が、一致しなければステップS3504に戻る。
【0124】
ステップS3511に進んだ場合は、本文データに含まれる文字に、文字セット情報メモリ410に示されている文字セットのいずれにも含まれていないか、使用可能な領域にない文字が存在したことを示す。
【0125】
ステップS3512に進んだ場合はコンテンツ本文データの最後の文字であるかどうかをコントローラ3401がコンテンツデータ解析部1301に問い合わせて、最後の文字であればステップS3513に進み、最後の文字でなければステップS3501に戻る。
【0126】
ステップS3513に進んだ場合は、終了コードとして0を返す。これは、本文データに含まれる文字が全て使用可能な領域にあり、しかも文字セット情報メモリ410に示されている文字セットのいずれかに含まれていたことを示す。
【0127】
ここで示した構成では、各文字セットを独立してコンテンツ本文データと比較しているので、文字セットが互いに重複しても問題が起きないという利点がある。サンプルコンテンツでは、4つの文字セットは特に重複がないものとして考えてきたが、たとえば文字セット「MISC_KANJI」に対応する文字セット内容情報が図18に示したようなものであった場合、「MISC_KANJI」と「JIS X 0208」はユニコード0x9AD8「高」について重複している。このような重複を許さないようにコンテンツ作成装置301を構成すると、コンテンツ作成者は、各文字セットに含まれる文字が何であるかを正確に知らなければコンテンツを作ることができないことになる。
【0128】
また、既存の文字セットとは別の観点から文字の集合を定義したい場合、例えば、特定の部首を持った漢字だけを集めた文字セットを定義したい場合などは、既存の文字セットにそれぞれの文字が含まれているかどうかはコンテンツ作成者にとっては重要ではない。このようなことを考えると、文字セット間の重複が許されるようなコンテンツ作成装置301の構成は、実用的価値が高い。
【0129】
なお、ここではステップS3504などにおいて文字セット情報メモリ410に記載された順番に各文字セットを取り出しているが、小さなiの値に標準文字セットを対応させることによって、第1文字コードレジスタ3402と第2文字コードレジスタ3405の値が少ない実行回数で一致する確率が高くなり、より高速な処理が行なえる。これは標準文字セットに含まれる文字が、標準文字セットの設定が適切であれば、コンテンツ本文データ内で用いられる確率が高いと考えられるためである。
【0130】
また、ここでは、コンテンツ本文データから取り出した文字について、使用可能な領域にあるかどうかをステップS3502で判定しているが、各文字セットの各文字が使用可能な領域に入っていることを確認してから、コンテンツ本文データの各文字が各文字セットのいずれかに含まれているかを判定しても全く結果は同じである。文字セットを構成する文字数がコンテンツ本文データに含まれる文字数より十分小さい場合にはより効率が高い。
【0131】
なお、ステップS3504からS3508で行なっている、文字セットに文字が属するかどうかを判定する処理を、ステップS3502と同じようにして、文字コードでアクセスできるテーブルを用いて行なうことも可能である。この場合、使用禁止領域テーブル3406と別に、同じデータ構造を持ったテーブルを持つように構成することも可能であるが、以下のようにすれば同じテーブルをこの目的にも兼用することができ、格納するメモリの容量を削減できる。すなわち、各文字コードkに対応する要素には、文字コードkで表される文字の属する文字セット番号を格納するものとする。使用禁止文字に対応する要素には、−1を格納しているので文字セットの番号と区別がつく。また、コンテンツ中のどの文字セットにも属さない文字に対応する要素には文字セット番号および−1のいずれとも区別がつく値を格納すれば良い。なお、複数の文字セットに属する文字に対応する要素には、そのいずれかの文字セットの番号を格納しておけば、「いずれかに属する」という判定には支障がない。
【0132】
このようなテーブルの使用禁止文字以外の部分の初期化については、文字セット内容情報メモリ409、文字セット情報メモリ410を参照して行なっても良いし、対象となる文字セットが定まっているのであれば、あらかじめ作成したものを格納しておいても良い。
【0133】
次いでアーカイバ1304は、コンテンツデータに含まれるファイルを1つのファイルにアーカイブ(archive)して外部記憶装置406にセーブする(ステップS1406)。具体的には、本文XMLファイル、BOOK.DTD、<image>タグのfilename属性で示されている画像ファイル、<sound>タグのfilename属性で示されている音声ファイル、予め準備されたグリフデータファイルおよびBOOK.DTDを1つのファイルにアーカイブする処理である。アーカイブ後の各ファイルは、1つのファイルとして扱うことができ、復元処理(アンアーカイブ)を行なえば再び元通り別々のファイルとしてアクセスすることができる。
【0134】
ここでグリフデータとは、コンテンツデータで用いられている文字セットに対応するグリフを示すデータである。サンプルコンテンツでは、「MISC_KANJI」に対応するグリフデータを格納したファイルがアーカイブされるとする。
【0135】
ステップS1406でアーカイブされるグリフデータのデータ構造の例を図19に示す。グリフデータ3701は、文字セット名フィールド3702、ロケール識別情報フィールド3703、文字数フィールド3704、文字コードフィールド3705、グリフ3706、文字コードフィールド3707、およびグリフ3708を含む。文字セット名フィールド3702には文字セット名が文字列として格納されている。ロケール識別情報フィールド3703には、ロケール識別情報が文字列として格納されている。文字数フィールド3704には、グリフデータ3701に含まれるグリフの数が格納されている。文字コードフィールド3705および3707には文字セットの文字コードが格納されている。グリフ3706および3708は字形データそのものである。図19はいわば模式的な図であって、実際のグリフデータの格納方法は、画像データ、ベクトルデータなど、適切な周知の技術を用いるものとする。
【0136】
以下のグリフデータ配布装置309から送信されるグリフデータも図19で示されるものと同じ形式とする。
【0137】
後にコンテンツ表示装置305の説明で明らかになるように、一般性の低い(汎用的でない)文字セットはステップS1406でコンテンツデータにアーカイブしておく、すなわちコンテンツデータ自身にグリフデータを内蔵しておく方が有利である。逆に一般性の高い文字セット、すなわちコンテンツ表示装置305〜308、405またはグリフデータ配布装置309に存在する可能性の高い文字セットについては、グリフデータをコンテンツに内蔵する必要性は小さい。このような処理は、コンテンツ表示装置305〜308で、利用可能な文字セットがコンテンツ作成者には一般的には知り得ないことが前提となっている。
【0138】
標準文字セットに対応するものも含めて、コンテンツデータで用いられているグリフデータを全てコンテンツに内蔵すれば、コンテンツ表示装置305〜308、405で利用可能なグリフデータに依存せずに常に表示可能なコンテンツデータが作成できる。しかし一方ではコンテンツデータのサイズはグリフデータを含むため大きくなる。
【0139】
グリフデータをコンテンツデータに全く内蔵しない場合は、コンテンツ表示装置305〜308で表示可能かどうかはそのとき利用可能なグリフデータに全面的に依存するが、コンテンツデータのサイズを小さく抑えることが可能となり、配信に際してコスト面で有利となる。
【0140】
また、ここでは、コンテンツデータに含まれるファイルをそのままアーカイブしているが、各ファイルを、後述するコンテンツ表示装置305での処理に都合が良いように別形式のデータに変換してからアーカイブしても差し支えない。もちろんこの場合は、コンテンツ表示装置305がそのような別形式のデータを解するように構成されている必要がある。例えば、記述コンテンツデータとは異なるエンコーディングを用いたデータに変換することが考えられる。図5のサンプルコンテンツでは、その第1行に指定されているようにUTF−8を用いているが、これをシフトJISにするなどである。このとき、エンコーディングの変換を行なう文字の範囲を、あらかじめ限定しておき、それに含まれない文字は、上述の文字参照形式で表現することも可能である。例えばシフトJISに変換する場合は、「JIS X 2101」および「JIS X 2108」に含まれない文字については、対応するユニコードを文字列で表した、文字参照形式で表現するのである。
【0141】
このように、エンコーディングの変換を行なう対象を、変換先のエンコーディング方法で記述可能な文字セット、またはそのサブセットに限り、それ以外の文字は文字参照形式またはそれに準じる形式で表現することで、変換先のエンコーディング方法では記述できない文字も表現可能となる。
【0142】
次いでデータ符号化部1305は、ステップS1406によって生成されたファイルを符号化して、外部記憶装置406に書き出して(ステップS1407)終了する。ここでは、データ符号化部1305では、ファイルをLZ77方式で圧縮する。データ符号化部1305で行なう符号化については、これに限られるものではない。例えば、他の圧縮方式を用いることは当然考えられるし、コンテンツの流通段階で、正当なユーザ以外に内容を取り出されたり、改ざんされることを防ぐために暗号化を行なうようにしてもよい。重要なのは、後述するコンテンツ表示装置305〜308で復号できることである。また符号化の必要がなければ、全く何の符号化を行なわずにそのまま出力してもよい。
【0143】
ステップS1408に進んだ場合は、エラーメッセージ出力部1306が、コンテンツデータ解析部1301からの情報に基づいて、表示部402にエラーメッセージを出力して、終了する。ステップS1409に進んだ場合は、エラーメッセージ出力部1306が、文字コード検査部1302からの情報に基づいて、表示部402にエラーメッセージを出力して、終了する。
【0144】
図20を参照してエラーメッセージ出力部1306は、エラーメッセージ生成部1501、文字列メモリ1502、文字参照形式生成部1503、エラーメッセージテーブル1504、エラーメッセージメモリ1505およびこれら各部を相互に通信可能に接続するデータバス1506を有する。
【0145】
図21のフローチャートに従い、エラーメッセージ出力部1306のステップS1408における処理を説明する。まず、エラーメッセージ生成部1501は、問題が検出された箇所のコンテンツデータの部分文字列を、コンテンツデータ解析部1301から受け取って文字列メモリ1502に格納する(ステップS1601)。なお、コンテンツデータ解析部1301は、文字参照形式については一文字と扱うとする。たとえば、図5の例では、半角の「﨑」は一文字と扱われる。
【0146】
図22に示すのは、開始タグと終了タグの対応が取れていないという問題の発生した箇所と対応するコンテンツデータの部分文字列の例である。このような文字列が文字列メモリ1502に格納される。
【0147】
文字参照形式生成部1503は、文字列メモリ1502に格納されている文字列のうち、文字セット「JIS X 2101」、「JIS X 2108」に含まれない文字(以下「非標準文字」と呼ぶ)を、文字参照形式に置き換える(ステップS1602)。
【0148】
なお、コンテンツ作成装置301で表示可能な文字セットは「JIS X 2101」、「JIS X 2108」を含んでいるが、全く一致しているわけではないので、コンテンツ作成装置301で表示可能な文字セットに含まれる文字でも、ステップS1602で、文字参照形式に置き換えられるものがあり得ることに注意する。ステップS1602では図22に示される文字列メモリ1502の内容は、図23のように置き換えられる。
【0149】
エラーメッセージ生成部1501は、コンテンツデータ解析部1301から、問題の原因を識別するエラーコードを受け取り、エラーメッセージテーブル1504を参照して、エラーメッセージに変換してエラーメッセージメモリ1505に格納する(ステップS1603)。
【0150】
図24を参照して、エラーメッセージテーブル1504は、メッセージ1901、1902・・・、1909がそれぞれ、エラーコード0、1、・・・、8に対応したエラーメッセージを示している。
【0151】
図24で示したエラーメッセージテーブル1504の例にしたがえば、図23で示した例はエラーコード0に対応する。従って、0番のエラーコードに対応するエラーメッセージがエラーメッセージテーブル1504から取り出され、エラーメッセージメモリ1505に格納される。
【0152】
なお、この例では、コンテンツデータ解析部1301から渡されるエラーコードは0から6の整数である。エラーメッセージテーブル1504のエラーコード7から8に対応するエラーメッセージは、後述するように文字コード検査部1302から出力されるエラーコードである。
【0153】
次いでエラーメッセージ生成部1501は、エラーメッセージメモリ1505に格納されている文字列と、文字列メモリ1502に格納されている文字列を連結して表示部402にエラーメッセージとして出力する(ステップS1604)。例えば、図23で示した例は、図25で示すエラーメッセージとなる。
【0154】
図26はエラーメッセージ出力部1306のステップS1409における処理のフローチャートである。大部分の処理は、エラーメッセージ出力部1306のステップS1408における処理と共通なので、相違点に絞って説明する。
【0155】
エラーメッセージ生成部1501は、問題が検出された箇所のコンテンツデータの部分文字列を、文字コード検査部1302から受け取って文字列メモリ1502に格納する(ステップS2101)。次のステップS2102はステップS1602と同一の処理である。
【0156】
次いで、エラーメッセージ生成部1501は、文字コード検査部1302から、問題の原因を識別するエラーコードを受け取り、エラーメッセージテーブル1504を参照して、エラーメッセージに変換してエラーメッセージメモリ1505に格納する(ステップS2103)。文字コード検査部1302からは7から8のエラーコードが整数値で渡されるとする。次のステップS2104はステップS1604と同一の処理である。
【0157】
ここで、ステップS1602またはステップS2102で、エラーメッセージに含まれる非標準文字を文字参照形式に置き換えることの意義について述べる。エラーメッセージに、コンテンツデータの一部分の内容を含めて表示することは、エラーの原因をよりコンテンツデータ作成者に分かりやすくするが、コンテンツデータに含まれる文字コードに制限がなければ、例えば、エラーメッセージをファイルにセーブして別のコンテンツ作成装置に移す場合に、一方のコンテンツ作成装置で表示可能な文字が他方のコンテンツ作成装置で表示可能とは限らないため、内容が正しく表示できないことが考えられる。このような状況を防ぐために、文字参照形式で書かれない文字は、標準文字に限るようにすることは有効である。
【0158】
また、エラーメッセージを他のコンテンツ作成装置で表示するために、異なるエンコーディングの間での変換が必要な場合があるが、文字セットによっては、必ずしもそのような文字コード変換が行なえるとは限らない。たとえば、ユニコードでは定義されているが、対応するシフトJISコードが存在しないような文字は多数存在する。したがって、そのような文字を含むユニコードのエラーメッセージをシフトJISコードに変換して出力するためには、メッセージ内で直接記述する文字を限定する必要がある。
【0159】
また、この実施の形態では、コンテンツ記述時に、コンテンツ作成装置301で表示可能な文字セットに含まれない文字については、文字参照形式で記述することでこのような文字がコンテンツ本文データに含まれるのを防いでいるため、コンテンツ作成装置301ではこの問題は起きないが、コンテンツ作成装置301でこのような構成を取らない場合は、エラーメッセージに出現する文字を、表示可能な文字セットまたはその部分集合に制限することは、コンテンツ作成装置301自身で表示できない文字をエラーメッセージに含まないようにすることを意味するため、より重要性が高い。
【0160】
なお、ここではメッセージ内で直接記述する文字の範囲を標準文字としているが、コンテンツ作成装置301で表示可能な文字の範囲であれば、直接記述する文字の範囲を変えても機能する。
【0161】
コンテンツ配布装置303は、コンテンツ作成装置301、302で作成された配布コンテンツデータを表示用の表示コンテンツデータに変換するとともに、コンテンツ表示装置305〜308のユーザに配布するための装置である。
【0162】
図27を参照してコンテンツ配布装置303は、CPU2201、配布コンテンツデータメモリ2202、表示部2203、入力部2204、変換部2205、第2形式配布コンテンツデータメモリ2206、通信部2207およびこれら各部を通信可能に相互接続するデータバス2208を有する。通信部2207は通信回線310にも接続されている。配布コンテンツデータメモリ2202には、通信回線310を通じて送信された、コンテンツ作成装置301、302で作成された配布コンテンツデータが複数個格納されているものとする。
【0163】
図28のフローチャートに従いコンテンツ配布装置303の動作を説明する。まず、CPU2201は配布コンテンツデータメモリ2202に格納された配布コンテンツデータのリストを表示部2203に表示する(ステップS2301)。表示リストを参照してユーザによる購入コンテンツの選択が入力部2204によって入力される(ステップS2302)。
【0164】
次いで変換部2205は、選択された配布コンテンツデータを、配布コンテンツデータメモリ2202から取り出し、第2形式配布コンテンツデータに変換して、第2形式配布コンテンツデータメモリ2206に格納する(ステップS2303)。次いで、CPU2201は、第2形式配布コンテンツデータメモリ2206に格納された第2形式配布コンテンツデータを出力する(ステップS2304)。
【0165】
ステップS2303で行なわれる変換処理については、コンテンツ表示システムにおいて、配布コンテンツデータと第2形式配布コンテンツデータとの関係をどのように定めるかに依存している。ここでは、第2形式配布コンテンツデータは、配布コンテンツデータに、コンテンツ配布装置303から出力される日時を示すデータを付加したものとする。
【0166】
配布コンテンツデータと第2形式配布コンテンツデータとの関係としては多様なものが考えられる。例えば、配布コンテンツデータと第2形式配布コンテンツデータの内容を全く同じ内容とすればステップS2303における変換部2205の動作は単なるコピー操作となる。コンテンツ配布装置303を操作したユーザまたはコンテンツ表示装置305〜308の所有者のみが復号できる機能を持つような暗号化を、配布コンテンツデータに施したものを第2形式配布コンテンツデータとすることも可能である。
【0167】
なお、コンテンツ配布装置303では課金処理を行なうことが商業目的での使用では実際的であるが、本発明にとって本質的な部分ではないので、説明は省略する。
【0168】
コンテンツ表示装置305は、コンテンツ作成装置301〜302から出力された配布コンテンツデータおよびコンテンツ配布装置303〜304から出力された第2形式配布コンテンツデータのいずれも表示することのできる装置である。以下、特筆しない限り、「配布コンテンツデータ」は、コンテンツ作成装置301〜302から出力される配布コンテンツデータと、コンテンツ配布装置303〜304から出力された第2形式配布コンテンツデータの双方を意味する。
【0169】
図29は、コンテンツ表示装置305のブロック図である。コンテンツ表示装置306〜308も同じ構成を持つ。
【0170】
図29を参照してコンテンツ表示装置305は、CPU2401、外部記憶装置2402、配布コンテンツデータメモリ2403、変換部2404、表示コンテンツデータメモリ2405、コンテンツデータ解析部2406、通信部2407、文字セット処理部2408、表示部2409、アンアーカイバ2410およびこれら各部を相互に通信可能に接続するデータバス2411を有する。通信部2407は通信回線310も接続する。外部記憶装置2402には、配布コンテンツデータが格納されているとする。
【0171】
図30のフローチャートに従い、コンテンツ表示装置305のコンテンツ再生時の動作を説明する。まず、CPU2401は、外部記憶装置2402に格納されている配布コンテンツデータを配布コンテンツデータメモリ2403にロードする(ステップS2501)。ここでは説明を簡潔にするため、外部記憶装置2402に格納されている配布コンテンツデータは1つとするが、もちろん、配布コンテンツデータメモリ2403に、複数の配布コンテンツデータを格納しておき、ユーザに選択させるようにしてもよい。
【0172】
次いで、変換部2404が、配布コンテンツデータメモリ2403に格納されている配布コンテンツデータを表示コンテンツデータに変換して、表示コンテンツデータメモリ2405に格納する(ステップS2502)。
【0173】
ここでは、変換部2404で行なわれる変換処理とは、対象となる配布コンテンツデータが第2形式配布コンテンツデータである場合は、コンテンツ作成装置301のデータ符号化部1305における処理とコンテンツ配布装置305の変換部2205による変換処理を合わせた変換の、逆の変換に相当する。それ以外の場合は、コンテンツ作成装置301のデータ符号化部1305における処理の逆の変換に相当する。
【0174】
次いで、アンアーカイバ2410が、一つのファイルにまとめられた表示コンテンツデータを個々のファイルに分解(アンアーカイブ)する(ステップ2503)。これは、コンテンツ作成装置301のステップS1406の処理の逆の処理に相当する。
【0175】
次いで、コンテンツデータ解析部2406が、コンテンツ本文の<char_set>タグのname属性の値と、locale属性の値を抽出して、文字セット処理部2408に送る(ステップS2504)。
【0176】
文字セット処理部2408は、ステップS2504で得られた文字セットが、コンテンツ表示装置305で表示可能な文字セットであるかどうかを判定して(ステップS2505)、表示可能であればステップS2506に進み、表示可能でなければS2508に移る。具体的には文字セット処理部2408から0という終了コードが返ってくれば表示可能、1という終了コードが返ってくれば表示可能でないと判断する。ステップS2505における文字セット処理部2408の動作については後述する。
【0177】
ステップS2506に進んだ場合は、コンテンツデータ解析部2406が、表示コンテンツデータメモリ2405に格納されている表示コンテンツデータを解釈して、表示部2409で表示する(ステップS2506)。ここでいう表示とは、<sound>タグのような音声データの記述では音声が再生されるなど、データの種類によって、テキストや画像の視覚的な表示よりも広い意味を指し得るものとする。その表示例は図12に示されている。この例では、XMLで記述されたコンテンツを、定められた解釈で画面上にして表示(レンダリング)しているが、本発明は特定のデータ構造やレンダリング方法に限定されない。
【0178】
CPU2401はEXITボタン1203(図12参照)を押されたかどうかを判定して(ステップS2507)押されれば終了、そうでなければステップS2506に戻る。
【0179】
ステップS2508に進んだ場合は、エラー処理部2209が、このコンテンツを表示することができないという意味のメッセージを表示して終了する。
【0180】
図31を参照して文字セット処理部2408は、コントローラ2601、使用文字セットテーブル2602、文字セット番号レジスタ2603、文字セットテーブル2604、グリフデータメモリ2605、エラーメッセージテーブル2606およびこれら各部を相互に接続するデータバス2607を有する。表示可能文字セットテーブル2604およびグリフデータメモリ2605は不揮発性メモリとなっている。
【0181】
表示可能文字セットテーブル2604には、グリフデータメモリ2605に対応するグリフのデータが存在する、つまりデータの追加なしにコンテンツ表示装置305で表示することが可能な文字セットの情報が、図32に例を示すフォーマットで格納されている。第1コラム2801には文字セットの名称が、第2コラム2802には対応するロケール識別情報が格納されている。図32の例では、コンテンツ表示装置305は、追加情報なしに、「JIS X 2101」の「JIS X 2108」の2つの文字セットを表示可能なことを示している。もちろん、このときはグリフデータメモリ2605に、この2つの文字セットのグリフデータが保持されているとする。
【0182】
図33のフローチャートに従い、文字セット処理部2406のステップS2503の動作を説明する。まず、コントローラ2601は、ステップS2504でコンテンツデータ解析部2406から転送された情報を使用文字セットテーブル2602に格納する(ステップS2701)。使用文字セットテーブル2602は、表示可能文字セットテーブル2604と同じ構造をもっている。図34にサンプルコンテンツに対応する使用文字セットテーブル2602に格納されるデータの例を示す。第1コラム2901は文字セット名、第2コラム2902は対応するロケール識別情報を表す。
【0183】
次いで、コントローラ2601は、文字セット番号レジスタ2603を0で初期化する(ステップS2702)。以下、文字セット番号レジスタ2603の値をiで表す。
【0184】
次いで、コントローラ2601は、使用文字セットテーブル2602のi番目の文字セットのグリフデータがコンテンツに内蔵されているかどうかを判定する(ステップS2703)。内蔵されていれば処理はステップS2709に進む。内蔵されていなければ処理はステップS2704に進む。サンプルコンテンツで説明すると、使用文字セットテーブル2602の3番目の文字セットである「MISC_KANJI」を内蔵しているので、i=3のとき処理はステップS2709に進み、それ以外の値では処理はステップS2704に進む。
【0185】
ステップS2704に進んだ場合は、コントローラ2601は、使用文字セットテーブル2602のi番目の文字セットが、表示可能文字セットテーブル2604に含まれているかどうかを判定する。含まれていれば処理はステップS2709に進み、含まれていなければ処理はステップS2705に進む。サンプルコンテンツでは、使用文字セットテーブル2602の0番目の文字セットである「JIS X 2101」と1番目の文字セットである「JIS X 2108」が、表示可能文字セットテーブル2604に含まれているのでi=0、1のとき処理はステップS2709に進み、それ以外の値では処理はステップS2705に進む。
【0186】
ステップS2705では、コントローラ2601は通信部2407、通信回線310を介してグリフデータ配布装置309に、使用文字セットテーブル2602のi番目の文字セットに対応するグリフデータの送信をリクエストする。グリフデータ配布装置309は、グリフデータを保持しているサーバコンピュータであり、リクエストされたグリフデータを保持していれば、グリフデータをリクエスト元に送信し、保持していなければ、そのことを伝えるデータをリクエスト元に送信することとする。このようなグリフデータ配布装置309を実現することは周知の技術で可能なので詳細は略す。
【0187】
コンテンツ表示装置305の説明に戻って、コントローラ2601は、リクエストしたグリフデータが取得できたかどうかをグリフデータ配布装置309から受信したデータで判定して(ステップS2706)、取得できていればステップS2707に進み、できていなければステップS2712に進む。
【0188】
ステップS2707では、コントローラ2601は受信したデータをグリフデータメモリ2605に書き込む。次いで、コントローラ2601は、表示可能文字セットテーブル2604に、使用文字セットテーブル2602のi番目の文字セットの文字セット名とロケール識別情報を書き込む(ステップS2708)。次いでコントローラ2601は文字セット番号レジスタ2603の値をインクリメントする(ステップS2709)。次いで、コントローラ2601が文字セット番号レジスタ2603の値と、使用文字セットテーブル2602に含まれている文字セットの数が一致しているかどうかを判定して(ステップS2710)、一致していればステップS2711に進み、一致しなければステップS2703に戻る。
【0189】
ステップS2711では、コントローラ2601は、0という値を終了コードとして返す。これは使用文字セットテーブル2602に記載されている文字セットが全て表示可能であることを意味する。サンプルコンテンツの場合、文字セット「CIRCLED_NUM」に対応するグリフデータがグリフデータ配布装置309から取得できたとすると、ステップS2711では、表示可能文字セットテーブル2604は図35に示す内容となっている。図32で示したものと比較すると、「CIRCLED_NUM」に対応する情報がステップS2708の処理によって加えられている。「MISC_KANJI」はサンプルコンテンツに内蔵されているので、これでサンプルコンテンツに含まれる文字セットは全て表示可能になっている。
【0190】
ステップS2712では、コントローラ2601はエラーメッセージを出力する。エラーメッセージテーブル2606は、複数種類のロケール識別情報ごとに異なるエラーメッセージを格納したテーブルである。その例を図36に示す。第1コラム3101にはロケール識別情報を示す文字列が、第2コラム3102には対応するエラーメッセージが格納されている。ただし「DEFAULT」とロケール識別情報にあるのはデフォルトで出力されるエラーメッセ―ジを示す。
【0191】
ステップS2712では、表示可能文字セットテーブル2604のi番目の文字セットが表示可能とならなかったことを意味するので、コントローラ2601は、対応するロケール識別情報に合わせたエラーメッセージを、エラーメッセージテーブル2606から取り出して、表示部2409に出力する。
【0192】
例えば、i番目の文字セットに対応するロケール識別情報が「US」(米国)であれば英語のメッセージ「Some glyph data is missing」が、「ES」(スペイン)であればスペイン語のメッセージが同様に出力される。
【0193】
エラーメッセージテーブル2606に該当するロケール識別情報がなければ、「DEFAULT」に対応するエラーメッセージが出力される。「DEFAULT」というロケール識別情報をエラーメッセージテーブル2606に用意したのは、全てのロケールに対応したエラーメッセージを用意することに伴う工数、必要となるメモリの容量などのコストを削減することが可能になるためである。
【0194】
ここで述べたような、コンテンツデータのロケール識別情報を参照してコンテンツ表示装置305からメッセージを出力することの利点としては、コンテンツの主たる使用者と思われるユーザに合わせたメッセージが出力できることがある。例えば、スペイン語のコンテンツを表示したいニーズを持つユーザは、通常スペイン語をよく解すると考えられるが、日本語や英語を解するかどうかは分からない。そこで、コンテンツに含まれるロケール識別情報を元にメッセージを表示するように構成したのである。
【0195】
ここでは主にエラー時に出力されるメッセージを取り扱っているが、それ以外の通常操作のメッセージについても、同様にコンテンツのロケール識別情報を参照して表示することの有効性は明らかである。
【0196】
次いで、コントローラ2601は、1という値を終了コードとして返して(ステップS2713)終了する。
【0197】
ここでメッセージの内容として、表示可能とならなかった文字セットの名称を表示することや、ロケール識別情報に合わせたメッセージを表示する際に、常に「DEFAULT」のロケール識別情報に対応したメッセージも並列して出力することなどのバリエーションが採用されてもよい。
【0198】
また、コンテンツ表示装置305は、用意したエラーメッセージテーブル2606にあるエラーメッセージを表示するのに十分なグリフデータを持たない場合には、「DEFAULT」のロケール識別情報に対応したメッセージを出力するなどのバリエーションについても同様である。
【0199】
また、ここでは、文字セット処理部2408は、コンテンツにグリフが内蔵されていない文字セットであるかをチェックして、内蔵されていないものについて、コンテンツ表示装置305で表示可能であるかをチェック、さらに表示可能でないことが分かったものについて、グリフ配布装置309にグリフデータアクセスするという手順を取っているが、この手順を入れ替えることも目的によっては適切である。たとえば、グリフデータの更新が頻繁に考えられ、更新されたデータの方が一般に内容がより適切と考えられる場合は、グリフ配布装置309にアクセスして、対応するグリフデータが受信できない場合のみ、コンテンツ表示装置305で現在表示可能な文字セットであるかどうかをチェックして、最後にコンテンツに内蔵されているかどうかをチェックするという手順も考えられる。もちろんこのようなバリエーションが採用されてもよい。
【0200】
また、ここでは、コンテンツ表示装置305は、文字セット処理部2408によって配布コンテンツデータに含まれる文字セットのあるものが表示可能でない場合には、配布コンテンツデータの表示を中止しているが、このような場合も配布コンテンツデータの表示を続行するような構成とすることも考えられる。この場合、表示ができない文字セットに属する文字については、本来のフォントの代用となる文字を、たとえば「=」や空白を表示するなどの取り決めを行なっておけば良い。
【0201】
<第2の実施の形態>
発明の第2の実施の形態は、第1の実施の形態と類似しているが、コンテンツデータに、メッセージを出力する際の言語を決定するためのロケール識別情報を格納する領域を、文字セット情報と独立して設けたものである。そのようなコンテンツデータの記述例を図37に示す。図中の<principal_locale>タグ3201が、図5で示したサンプルコンテンツに比べて新たに追加されたタグである。第1の実施の形態との動作の違いは以下の通りである。
【0202】
第1の実施の形態のステップS2712において、コントローラ2601が、表示可能文字セットテーブル2604のi番目の文字セットに対応するロケール識別情報に対応するロケール識別情報の代わりに、<principal_locale>タグ3201の子供要素文字列をロケール識別情報として取り出し、それに対応するエラーメッセージを、エラーメッセージテーブル2606から取り出して、表示部2409に出力する。もちろん、<principal_locale>タグ3201を使用可能にするために、文書定義ファイルBOOK.DTDや、コンテンツデータ解析部1301、コンテンツデータ解析部2406などの変更は必要である。
【0203】
なお、ここではXML形式で、ロケール識別情報を追加しているが、これは、XML形式のコンテンツデータを扱う例で説明しているためであり、これに限られるものではない。
【0204】
ロケール識別情報の効果について付言すれば、ユニコードでは同じ文字コードが割り当てられながら、用いられる地域によって異なるグリフを持つ文字についても、含まれる文字セットのロケール識別情報が異なれば、区別して扱われるため、混同が生じない。例えば、ロケール識別情報に「JP」とある文字セットのグリフデータではユニコード0x76F4に図40で示されるグリフ、ロケール識別情報に中国を示す「CN」とある文字セットのグリフではユニコード0x76F4に図41で示されるグリフを対応させるように文字セットのグリフデータを作成すれば、同じ文字コードだからといって混同が起きることはない。
【0205】
したがって、ユニコードに限らず、同じコードが異なるグリフに割り当てられる可能性のあるような文字コード体系で、文字セットを定義して使用する場合に効果を発揮する。
【0206】
<第3の実施の形態>
第3の実施の形態は、第2の実施の形態におけるコンテンツ表示装置305から出力されるメッセージを、コンテンツデータに含まれるロケール識別情報に合わせて決定するという考え方を、コンテンツ作成装置301にまで広げたものである。
【0207】
第2の実施の形態との違いは、ステップS1604にて、エラーメッセージ生成部1501が、エラーメッセージを生成する際に、<principal_locale>タグ3201の子供要素文字列が示すロケール識別情報に合わせてエラーメッセージテーブル1504を切り替えることである。図38を参照して本実施の形態3におけるエラーメッセージテーブルの概念を説明する。ロケール「JP」に対応した日本語によるエラーメッセージのテーブル3301以外に、他のロケール識別情報に対応した言語で書かれたエラーメッセージのテーブル3302、3303が用意されている。エラーメッセージ生成部1501は、ロケール識別情報に合わせてエラーメッセージテーブルを切り替える構成になっている。この場合もロケール識別情報が取り出せなかった場合や、想定外のロケール識別情報が取り出された場合に備えて、デフォルトのエラーメッセージテーブルを用意するとより好ましい。
【0208】
上述した実施の形態によれば、コンテンツ作成者がニーズに従って文字セットを定義することを許しながら、配布コンテンツデータの文字コードが意図通りになっていることを保証するようにコンテンツ作成装置301を構成したので、より自由なコンテンツデータの作成が、安全に行なえるようになった。
【0209】
また、実施の形態によれば、文字セット名と同時にロケール識別情報をも定義しうるように構成したので、ユニコードのような、国または地域によって異なるグリフに共通の文字コードが割り当てられる文字コード体系であっても、文字コードと合わせて提供されるロケール識別情報によって、各国語(地域語)のグリフは区別されるので、意図したものと異なるグリフで表示されるのを回避できる。
【0210】
また、実施の形態によれば、扱うデータによって動的にシステムから表示されるメッセージの言語を変更するようにしたため、個々のユーザに合った言語でメッセージが表示され、より快適にコンテンツ表示システムを用いることができる。
【0211】
また、実施の形態によれば、コンテンツ作成者が重複した文字をもつ文字セットを定義できるので、コンテンツ作成者は目的に応じてより自由に文字セットを定義してコンテンツ作成に用いることができる。
【0212】
また、実施の形態によれば、文字参照形式またはそれに準じる形式を用いることで、コンテンツ作成装置301から出力されるメッセージに含まれる、コンテンツデータの内容に出現する文字を制限できるため、メッセージのエンコーディングの変換、複数のコンテンツ作成装置301でのメッセージの表示がより確実に行なえる。
【0213】
また、実施の形態によれば、文字コードによってアクセスされるテーブルに基づき、コンテンツ内の各文字が使用可能な領域に属するかを判定するようにしたので、効率が高い処理が行え、また条件の改変も容易である。
【0214】
また、実施の形態によれば、コンテンツ内の各文字が使用可能な領域に属するかを判定するテーブルを、各文字がいずれの文字セットに属するかを判定するテーブルと兼用するように構成したので、メモリ容量が節約できる。
【0215】
また、実施の形態によれば、コンテンツ表示装置305で表示可能な文字とコンテンツ表示可能でない文字のいずれも文字参照形式またはそれに準じる形式で記述できるようにしたので、コンテンツ作成者は、ある文字がいずれに属するかをその時点で知らなくても、コンテンツデータの記述を継続することができる。
【0216】
また、実施の形態によれば、記述コンテンツデータを別のエンコーディングを用いた配布コンテンツデータに変換する際に、エンコーディングの変換を行なう対象を、変換先のエンコーディング方法で記述可能な文字セット、またはそのサブセットに限り、それ以外の文字は文字参照形式またはそれに準じる形式で表現することで、変換先のエンコーディング方法では記述できない文字も表現可能となる。
【0217】
<第4の実施の形態>
以上説明したコンテンツ作成装置およびコンテンツ表示装置の処理機能は、プログラムで実現される。本実施の形態では、このプログラムはコンピュータで読取可能な記録媒体に格納される。
【0218】
図39には第4の実施の形態に係るコンピュータのハードウェア構成が示されて、該構成は上述の各実施の形態に係るコンテンツ作成装置およびコンテンツ表示装置の構成に適用される。
【0219】
図39を参照してコンピュータは、CRT(陰極線管)などからなるモニタ110、該コンピュータ自体を集中的に制御するためのCPU(中央処理装置の略)122、ROM(Read Only Memory)またはRAM(ランダムアクセスメモリの略)を含んで構成されるメモリ124、固定ディスク126、FD(フレキシブルディスク)132が着脱自在に装着されて、装着されたFD132をアクセスするFD駆動装置130、CD−ROM(Compact Disc Read Only Memory)142が着脱自在に装着されて、装着されたCD−ROM142をアクセスするCD−ROM駆動装置140、キーボード150、マウス160、ペンタブレット170、通信回線310と、該コンピュータとを通信接続するための通信インターフェィス180を含む。これらの各部はバスを介して接続される。
【0220】
コンピュータには、カセット形式の磁気テープが着脱自在に装着されて磁気テープをアクセスする磁気テープ装置が設けられても良い。
【0221】
上述の記録媒体は、図39に示されているコンピュータで処理が行なわれるために必要なメモリ、たとえばメモリ124がプログラムメディアであってもよいし、また外部記憶装置として図示のない磁気テープ装置およびCD−ROM装置駆動装置140などのプログラム読取装置が設けられ、そこに記憶媒体である磁気テープまたはCD−ROM142が挿入されることで読取可能なプログラムメディアであってもよい。いずれの場合においても、格納されているプログラムはCPU122がアクセスして実行させる構成であってもよいし、あるいはいずれの場合もプログラムが一旦読出されて、読出されたプログラムは、所定のプログラム記憶エリア、たとえばメモリ124のプログラム記憶エリアにロードされて、CPU122により読出されて実行される方式であってもよい。このロード用のプログラムは、予め当該情報処理装置に格納されているものとする。
【0222】
ここで、上述したプログラムメディアはコンピュータ本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープなどのテープ系、フレキシブルディスクや固定ディスク126などの磁気ディスクやCD−ROM140/MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc)などの光ディスクのディスク系、ICカード(メモリカードを含む)/光カードなどのカード系、あるいはマスクROM、EPROM(Erasable and Programmable ROM)、EEPROM(Electrically EPROM)、フラッシュROMなどによる半導体メモリを含めた固定的にプログラムを担持する媒体であってもよい。
【0223】
また、本実施の形態においては、通信回線310にインターネットを含む各種の通信ネットワークを適用できるから、これら通信ネットワークからプログラムがダウンロードされて流動的にプログラムを担持する媒体であってもよい。なお記録媒体に格納されている内容としてはプログラムに限定されず、データであってもよい。
【0224】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【0225】
【発明の効果】
発明によれば、外部操作に従い作成された文字セットをコンテンツデータを記述するために指定することができるから、コンテンツ作成者は所望する文字セットを外部から操作して作成して、それを指定しながらコンテンツデータを作成できる。
【0226】
また、記述されたコンテンツデータが表示されるとき、記述に用いられた文字セットそれぞれについては、コンテンツデータに予め含まれた対応の識別データに基づき特定された地域用グリフデータを参照して表示できる。それゆえに、コンテンツデータにより意図されるものとは異なるグリフで表示されるのを回避できる。
【0227】
また、データ処理時には地域が異なっても、データ処理に関連したメッセージを地域毎に認識可能な態様で出力できる。
【0228】
また、装置本体に内蔵していない文字セットに対応するグリフデータについては、外部から取得する手段を設けるようにしたので、広い範囲の言語、文字をを用いた記述を持ったコンテンツデータがコンテンツ表示装置で表示可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態であるコンテンツ表示システムの概略図である。
【図2】コンテンツ作成装置の構成例を示す図である。
【図3】ユニコード2460から2473、2160から2169で表される文字を示す図である。
【図4】コンテンツ作成装置301を用いて、コンテンツ作成者が配布コンテンツを作成する際のフローチャートである。
【図5】コンテンツの記述の1例を示す図である。
【図6】コンテンツの記述の他の例を示す図である。
【図7】文字セット「CIRCLED_NUM」に対応する文字セット内容情報の例を示す図である。
【図8】文字セット「MISC_KANJI」に対応する文字セット内容情報の例を示す図である。
【図9】文字セット情報の1例を示す図である。
【図10】文字セット情報の他の例を示す図である。
【図11】文字セット情報のさらに他の例を示す図である。
【図12】コンテンツ表示装置の表示例を示す図である。
【図13】変換部411の構成図である。
【図14】ステップS505における変換部411の動作を示すフローチャートである。
【図15】文字コード検査部1302のブロック図である。
【図16】使用禁止領域テーブルの構成を示す図である。
【図17】ステップS1405における文字コード検査部1302の動作を示すフローチャートである。
【図18】文字セット「MISC_KANJI」に対応する文字セット内容情報の一例を示す図である。
【図19】ステップS1406でアーカイブされるグリフデータのデータ構造例を示す図である。
【図20】エラーメッセージ出力部1306の構成図である。
【図21】エラーメッセージ出力部1306のステップS1408における処理フローチャートである。
【図22】開始タグと終了タグの対応が取れていないという問題の発生した箇所と対応するコンテンツデータの部分文字列の例を示す図である。
【図23】文字列メモリ1502の内容例を示す図である。
【図24】エラーメッセージテーブル1504の内容例を示す図である。
【図25】エラーメッセージの一例を示す図である。
【図26】エラーメッセージ出力部1306のステップS1409における処理のフローチャートである。
【図27】コンテンツ配布装置303の構成図である。
【図28】コンテンツ配布装置303の動作を説明するフローチャートである。
【図29】コンテンツ表示装置305のブロック図である。
【図30】コンテンツ表示装置305のコンテンツ再生時の動作を説明するフローチャートである。
【図31】文字セット処理部2408の構成図である。
【図32】コンテンツ表示装置305で表示することが可能な文字セットの情報例を示す図である。
【図33】文字セット処理部2406のステップS2503の動作を説明するフローチャートである。
【図34】サンプルコンテンツに対応する使用文字セットテーブル2602に格納されるデータの例を示す図である。
【図35】表示可能文字セットテーブル2604の内容例を示す図である。
【図36】エラーメッセージテーブル2606の内容例を示す図である。
【図37】コンテンツデータの記述例を示す図である。
【図38】実施の形態3におけるエラーメッセージテーブルの概念を説明する図である。
【図39】第4の実施の形態に係るコンピュータのハードウェア構成を示す図である。
【図40】従来の同一の文字コードに当てられる異なるグリフを説明する図である。
【図41】従来の同一の文字コードに当てられる異なるグリフを説明する図である。
【符号の説明】
301,302 コンテンツ作成装置、303,304,405 コンテンツ配布装置、305,306,307,308 コンテンツ表示装置、309 グリフデータ配布装置、409 文字セット内容情報メモリ、410 文字セット情報メモリ、411 変換部、413,2605 グリフデータメモリ、1301 コンテンツデータ解析部、1302 文字コード検査部、1306 エラーメッセージ出力部、1501 エラーメッセージ生成部、3406 使用禁止領域テーブル。

Claims (21)

  1. 文字コードの全体集合の部分集合である1つ以上の文字セットを指定するための文字セット指定手段と、
    記述されたコンテンツデータの内容に基づいて配布コンテンツデータを出力するためのコンテンツ出力手段と、
    コンテンツデータに含まれる文字がなす集合と、前記1つ以上の文字セットとの間の包含関係を検査して検査結果に関する情報を出力する検査手段とを備える、コンテンツ作成装置。
  2. 請求項1に記載のコンテンツ作成装置であって、
    前記1つ以上の文字セットに含まれる文字コードを指定する情報を入力するための文字セット内容情報入力手段をさらに備える。
  3. 請求項2に記載のコンテンツ作成装置であって、
    予め準備された、特定の前記文字セットに含まれる文字コードを特定する情報を記憶しておくデフォルト文字セット記憶手段をさらに備える。
  4. 請求項1から3のいずれか1項に記載のコンテンツ作成装置であって、
    前記検査手段は各文字セットに対応する文字セットの重複を許容することを特徴とする。
  5. 請求項1から4のいずれか1項に記載のコンテンツ作成装置であって、
    前記配布コンテンツデータには、前記文字セット指定手段により指定された前記1つ以上の文字セットを識別するための文字セット識別情報が含まれることを特徴とする。
  6. 請求項1から5のいずれか1項に記載のコンテンツ作成装置であって、
    前記配布コンテンツデータには、前記文字セット指定手段により指定された前記1つ以上の文字セットに含まれる少なくとも1つ以上の文字コードに対応するグリフデータが含まれることを特徴とする。
  7. 請求項5または6に記載のコンテンツ作成装置であって、
    前記配布コンテンツデータには、当該配布コンテンツデータの想定される使用地域を識別するロケール識別情報が含まれることを特徴とする。
  8. 請求項7に記載のコンテンツ作成装置であって、
    前記ロケール識別情報は、前記文字セット識別情報と対応付けられていることを特徴とする。
  9. 請求項1から8のいずれか1項に記載のコンテンツ作成装置であって、
    前記検査手段は、前記コンテンツデータを記述する各文字コードが文字コード全体集合における使用可能な文字コードであるか否かを判定する使用可能性判定手段を有することを特徴とする。
  10. 請求項9に記載のコンテンツ作成装置であって、
    前記使用可能性判定手段は、
    前記文字コード全体集合における各文字コードと、該文字コードが使用可能であるかを示す使用可否データとが対応付けて登録されたテーブルを有し、
    前記コンテンツデータを記述する各文字コードに基づいて前記テーブルを検索して、該文字コードに対応の前記使用可否データに基づいて判定することを特徴とする。
  11. 請求項1から10のいずれか1項に記載のコンテンツ作成装置であって、
    コンテンツ作成者が記述したコンテンツデータを検査するコンテンツデータ検査手段と、
    前記コンテンツデータ検査手段の検査により問題点が発見された場合は、メッセージを出力するコンテンツ作成時メッセージ出力手段とをさらに備えることを特徴とする。
  12. 請求項11に記載のコンテンツ作成装置であって、
    前記コンテンツ作成時メッセージ出力手段は、前記コンテンツデータの、問題点に関連する部分のデータをメッセージに含むことを特徴とする。
  13. 請求項12に記載のコンテンツ作成装置であって、
    前記コンテンツ作成時メッセージ出力手段は、前記コンテンツデータの、問題点に関連する部分のデータをメッセージ出力する際に、予め定められた1つ以上の文字セットまたはその補集合に含まれる文字については、予め定められた別の文字セットを用いて表現することを特徴とする。
  14. 請求項13に記載のコンテンツ作成装置であって、
    前記コンテンツ作成時メッセージ出力手段は、前記コンテンツデータの、問題点に関連する部分のデータをメッセージに含む際、予め定められた特定の文字セットまたはその補集合に含まれる文字については、その文字コードを示す文字列を含む文字列によって表現することを特徴とする。
  15. 請求項1から請求項14のいずれかに記載のコンテンツ作成装置によって出力された配布コンテンツデータまたはそれに基づいた情報を表示するコンテンツ表示装置であって、
    前記配布コンテンツデータに格納された文字セット識別情報によって識別される文字セットのグリフデータが利用可能であれば、当該文字セットを表示可能と判定する表示可能性判定手段を備え、
    前記各文字セットのいずれかが表示可能でないと判定された場合に、表示可能と判定された場合とは異なる動作を行なうことを特徴とする。
  16. 請求項15に記載のコンテンツ表示装置であって、
    前記各文字セットのいずれかが表示可能でないと判定された場合に、前記配布コンテンツデータまたはそれに基づいた情報の表示を中止することを特徴とする。
  17. 請求項15に記載のコンテンツ表示装置であって、
    前記各文字セットのいずれかが表示可能でないと判定された場合に、メッセージを出力するメッセージ出力手段をさらに備える。
  18. 請求項17に記載のコンテンツ表示装置であって、
    前記メッセージ出力手段は、前記文字セットが表示可能でないと判定された場合に、前記ロケール識別情報の内容に応じてメッセージを変化させることを特徴とする。
  19. 請求項15に記載のコンテンツ表示装置であって、
    前記文字セット識別情報で識別される前記1つ以上の文字セットのそれぞれに対応するグリフデータが当該コンテンツ表示装置に格納されていない場合に、対応するグリフデータを外部から取得する動作を開始することを特徴とする。
  20. 処理対象のデータを記憶するデータ記憶手段と、
    メッセージを出力するメッセージ出力手段とを備え、
    前記処理対象のデータは想定される使用地域を識別するロケール識別情報を含み、前記メッセージ出力手段は、前記ロケール識別情報の内容に応じて出力するメッセージを変化させることを特徴とする、データ処理装置。
  21. 記述されたコンテンツデータを検査して、前記記述コンテンツデータに基づいて配布コンテンツデータを出力するコンテンツ作成手段と、前記配布コンテンツデータを受理して、前記配布コンテンツデータに基づく情報を表示するコンテンツ表示手段とを備えて、
    前記コンテンツ作成手段は、前記文字コードの全体集合の部分集合であって前記コンテンツデータを記述するための文字セットの内容を指定する文字セット情報入力手段と、
    前記記述コンテンツデータに含まれる文字がなす集合と、前記文字セット情報入力手段により指定された前記文字セットの間との包含関係に関する情報を出力する手段とを有する、コンテンツ表示システム。
JP2003070556A 2003-03-14 2003-03-14 コンテンツ作成装置、コンテンツ表示装置およびデータ処理装置 Pending JP2004280435A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2003070556A JP2004280435A (ja) 2003-03-14 2003-03-14 コンテンツ作成装置、コンテンツ表示装置およびデータ処理装置
EP12003732A EP2509003A2 (en) 2003-03-14 2004-03-08 Content processing device and corresponding method, program and record medium
PCT/JP2004/002993 WO2004081810A1 (ja) 2003-03-14 2004-03-08 コンテンツ処理装置および方法
CNB2004800068884A CN100430928C (zh) 2003-03-14 2004-03-08 内容处理装置及方法
EP04718398A EP1610229A4 (en) 2003-03-14 2004-03-08 DEVICE AND METHOD FOR CONTINUOUS PROCESSING
CN2008101661167A CN101388005B (zh) 2003-03-14 2004-03-08 内容处理装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003070556A JP2004280435A (ja) 2003-03-14 2003-03-14 コンテンツ作成装置、コンテンツ表示装置およびデータ処理装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007202123A Division JP4757241B2 (ja) 2007-08-02 2007-08-02 データ処理装置

Publications (1)

Publication Number Publication Date
JP2004280435A true JP2004280435A (ja) 2004-10-07

Family

ID=32984659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003070556A Pending JP2004280435A (ja) 2003-03-14 2003-03-14 コンテンツ作成装置、コンテンツ表示装置およびデータ処理装置

Country Status (4)

Country Link
EP (2) EP2509003A2 (ja)
JP (1) JP2004280435A (ja)
CN (2) CN100430928C (ja)
WO (1) WO2004081810A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059481A (ja) * 2006-09-01 2008-03-13 Canon Inc ライセンス発行システム、ライセンス発行サーバ、及びそれらの制御方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114666082B (zh) * 2020-12-24 2023-09-26 上海擎感智能科技有限公司 登录方法、第一终端、第二终端、存储介质及登录系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04191966A (ja) * 1990-11-27 1992-07-10 Canon Inc 文字処理装置
JP2000250897A (ja) 1999-03-02 2000-09-14 Ntt Data Corp 外字管理方法及び装置、記録媒体
US6603478B1 (en) * 2000-04-21 2003-08-05 Dynalab, Inc. System, method and a computer readable medium for improving character access

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059481A (ja) * 2006-09-01 2008-03-13 Canon Inc ライセンス発行システム、ライセンス発行サーバ、及びそれらの制御方法

Also Published As

Publication number Publication date
EP1610229A1 (en) 2005-12-28
EP2509003A2 (en) 2012-10-10
CN101388005B (zh) 2011-09-28
WO2004081810A1 (ja) 2004-09-23
CN100430928C (zh) 2008-11-05
CN101388005A (zh) 2009-03-18
EP1610229A4 (en) 2011-07-20
CN1761957A (zh) 2006-04-19

Similar Documents

Publication Publication Date Title
CN100547590C (zh) 文档处理系统
US6801673B2 (en) Section extraction tool for PDF documents
CN1979478B (zh) 文档处理系统和文档处理方法
US7571465B2 (en) Information exchanging system, information communication terminal, information exchanging method, and computer product
JP2005517221A (ja) 多数の文字を扱うための効率的な照合要素構造
ES2717462T3 (es) Edición colaborativa
Ferilli Automatic digital document processing and management: Problems, algorithms and techniques
CN1979511A (zh) 一种文档数据安全管理系统和方法
US7900136B2 (en) Structured document processing apparatus and structured document processing method, and program
KR100762712B1 (ko) 규칙기반의 전자문서 변환방법 및 그 시스템
JP2004280435A (ja) コンテンツ作成装置、コンテンツ表示装置およびデータ処理装置
CN100507913C (zh) 一种文档处理方法及系统
JP4757241B2 (ja) データ処理装置
US7437714B1 (en) Category partitioning markup language and tools
US20080294645A1 (en) System, method and computer program product for EDI-to-EDI translations
CN1979479B (zh) 文档处理系统和文档处理方法
CN102043821B (zh) 一种显示文档的方法
KR20240054001A (ko) 프레젠테이션 문서 형식의 슬라이드를 워드 프로세서 문서 형식의 페이지로 자동 변환할 수 있는 전자 단말 장치 및 그 동작 방법
KR20240074249A (ko) 워드프로세서 문서 형식의 페이지를 프레젠테이션 문서 형식의 슬라이드로 자동 변환할 수 있는 전자 단말 장치 및 그 동작 방법
CN101982818A (zh) 一种文档处理的方法
CN116469510A (zh) 病理报告生成方法、装置、计算机设备和存储介质
JP2006065423A (ja) 申請データ作成処理プログラム及び申請データ作成装置
JP5503920B2 (ja) 単語帳システム
CN114581033A (zh) 政务审批业务快速开发方法和装置及设备
JP2006318124A (ja) 文書管理装置及びこれを用いた文書管理方法、並びに制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070416

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070605

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070802

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070823

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070914