JP4072691B2 - 文字情報変換装置および文字情報変換方法 - Google Patents

文字情報変換装置および文字情報変換方法 Download PDF

Info

Publication number
JP4072691B2
JP4072691B2 JP2004208029A JP2004208029A JP4072691B2 JP 4072691 B2 JP4072691 B2 JP 4072691B2 JP 2004208029 A JP2004208029 A JP 2004208029A JP 2004208029 A JP2004208029 A JP 2004208029A JP 4072691 B2 JP4072691 B2 JP 4072691B2
Authority
JP
Japan
Prior art keywords
character
code
code system
information
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004208029A
Other languages
English (en)
Other versions
JP2006031303A (ja
Inventor
一彦 前田
浩一郎 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2004208029A priority Critical patent/JP4072691B2/ja
Priority to US11/175,427 priority patent/US7274314B2/en
Priority to CNB2005100846054A priority patent/CN100375994C/zh
Publication of JP2006031303A publication Critical patent/JP2006031303A/ja
Application granted granted Critical
Publication of JP4072691B2 publication Critical patent/JP4072691B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Document Processing Apparatus (AREA)

Description

この発明は、例えば、シフトJISコードやISO8859−1コードなどの種々の異なるコード体系によって表現されるテキストデータ(文字情報)を出力すべき文字に変換する装置、方法に関する。
パーソナルコンピュータや、その他の各種の電子機器において、テキストデータを処理することが行われている。テキストデータのコード体系としては、大きく分けると、2バイト(16ビット)で1文字を表す2バイト系のコード体系と、1バイト(8ビット)で1文字を表す1バイト系のコード体系とが存在する。
例えば、パーソナルコンピュータのハードディスクに住所録などのデータベースを作成する場合、氏名や住所などの項目については、2バイト系のテキストデータを用いることも、1バイト系のテキストデータを用いることも可能な場合がある。このように、2バイト系のテキストデータと1バイト系のテキストデータが混在する場合、その項目のテキストデータが正しいか否かをチェックしたり、その項目のテキストデータを出力する文字に変換したりする場合には、その項目のテキストデータが2バイト系なのか1バイト系なのかを認識できなければならない。
そこで、後に記す特許文献1には、目的とする項目のテキストデータが2バイト系か、1バイト系かを識別し、目的とする項目のテキストデータのチェックを適正に行うことができるようにする技術が開示されている。この特許文献1に記載の技術を用いることによって、2バイト系のテキストデータと1バイト系のテキストデータとが混在する場合であっても、処理対象となる個々のテキストデータが2バイト系か1バイト系かを正確に識別し、適切に処理することができるようにされている。
特開平04−150112号公報
ところで、テキストデータは、通常、コード体系を示す属性情報と各文字に対応する文字コードとからなっており、属性情報を参照すれば、当該テキストデータの文字コードがどのようなコード体系のものかを識別することができ、それに応じた処理を行うことが可能である。
しかしながら、稀に属性情報が示すコード体系と文字コードのコード体系とが異なってしまうことが発生する場合があると考えられる。例えば、CDには、CDテキスト(CD-Text)と呼ばれる規格があり、このCDテキストにおいては、CDのリードインエリアのトラックに含まれるサブコードのR〜Wチャンネルに、例えば、タイトル、アーチスト名、作詞者名、作曲者名、編曲者名、メッセージなどの、そのCDについての付加的な情報をテキストデータ(文字情報)として記録することができる。
そして、個人で楽しむために、CDテキスト規格のCDに記録されている音楽データを、これに対応するテキストデータと一緒に、コピーしたりする場合において、用いるプログラムによっては、文字コードはそのまま持ってくるが、その文字コードに対応する属性情報を当該プログラムが主に処理するコード体系、例えば2バイト系のコード体系を示すものに自動的に変更してしまうものが存在すると考えられる。
この場合、コピーした文字コードが、1バイト系のものであった場合には、属性情報が示すコード体系と、文字コードの実際のコード体系とが異なってしまい、適切、かつ、迅速に、文字コードのチェックや文字コードが示す文字への変換(デコード)を行うことができなくなってしまう。
また、MP3(MPEG-1 Audio Layer-3)規格の音声データファイル(MP3ファイル)を、インターネットなどのネットワークを通じて購入して利用する場合もある。MP3ファイルの場合、ID3タグと呼ばれるフォーマットが用いられて、曲名や著作者、音楽ジャンルなどのテキストデータ(文字情報)を付加することができるようにされている。しかし、MP3のID3タグのバージョン1と呼ばれる規格の場合には、属性情報はなく、文字コードのコード体系は示されていない。
このため、ID3タグのバージョン1を用いたMP3ファイルの場合、これに付加されたテキストデータのコード体系が不明となり、適切、かつ、迅速に文字コードが示す文字への変換(デコード)や文字コードのチェックを行うことができなくなってしまう。
以上のことにかんがみ、属性情報と文字コードとからなるテキストデータを処理する場合に、属性情報が示すコード体系と文字コードの実際のコード体系とが異なる場合の不具合を是正し、テキストデータの文字コードをそのコード体系に応じた文字に適正に変換できるようにする装置、方法を提供することを目的とする。
上記課題を解決するため、請求項1に記載の発明の文字情報変換装置は、
コード体系を示す属性情報と前記コード体系の文字コードとからなる文字情報を処理して、前記文字コードを出力すべき文字に変換する文字情報変換装置であって、
通常用いられるべき第1及び第2のコード体系以外の文字コードをデコードする場合に用いるコード体系の設定入力を受け付ける受付手段と、
前記受付手段を通じて受け付けられた設定入力に応じたコード体系を示す情報を記憶保持する記憶手段と、
変換対象の文字情報の前記属性情報を参照するようにして、当該文字情報の前記文字コードのコード体系を判別する判別手段と、
前記判別手段において、判別不能ではないが、前記第1のコード体系ではないと判別された場合に、判別対象の当該文字情報の当該文字コードに、前記第2のコード体系において用いられることのない文字コードを含んでいるか否かを検出する検出手段と、
前記判別手段において、コード体系が判別不能である場合に、あるいは、前記検出手段において、前記第2のコード体系において用いられることのない文字コードを含んでいることが検出された場合に、前記記憶手段に記憶されている設定された前記コード体系を示す情報に基づいて前記文字コードを文字に変換する変換手段と
を備えることを特徴とする。
また、請求項2に記載の発明の文字情報変換装置は、請求項1に記載の文字情報変換装置であって、
前記第1のコード体系は、2バイトコード体系であり、前記第2のコード体系は、1バイトコード体系であることを特徴とする。
また、請求項3に記載の発明の文字情報変換装置は、請求項1に記載の文字情報変換装置であって、
前記第1のコード体系は、1バイトコード体系であり、前記第2のコード体系は、2バイトコード体系であることを特徴とする。
また、請求項4に記載の発明の文字情報変換装置は、請求項1に記載の文字情報変換装置であって、
前記第2のコード体系は、複数種類のものがあり、
前記検出手段、用いられる種類の前記第2のコード体系のそれぞれに応じて、用いられることのない文字コードを含んでいるか否かを検出することを特徴とする。
文字情報(テキストデータ)を構成する属性情報が示す文字コード体系と、前記属性情報に対応する文字コードが間違って記録された時に発生する文字化けを解消することができる。
以下、図を参照しながら、この発明による装置、方法の一実施の形態について説明する。以下に説明する実施の形態においては、CDテキスト規格のCDに記録されているデータを再生することが可能なディスク再生装置(CDプレーヤ)に、この発明による装置、方法を適用した場合を例にして説明する。
[ディスク再生装置の概要]
図1は、この実施の形態のディスク再生装置を説明するためのブロック図である。図1において、符号1は、このディスク再生装置に装填されたディスク記録媒体であるCDである。なお、以下においては、ディスク再生装置に装填されたCDをディスク1と記載する。
そして、図1に示すように、この実施の形態のディスク再生装置は、スピンドルモータ2、光ピックアップ部3、ドライバ4、RF回路(高周波信号処理回路)5、DSP(Digital Signal Processor)6、DRAM(Dynamic Random Access Memory)7、D/A(Digital/Analog)変換器8、制御部9、EEPROM(Electrically Erasable and Programmable ROM)10、表示装置11、キー操作部12を備えている。
スピンドルモータ2は、ディスクを回転駆動させるためのものである。光ピックアップ部3は、再生パワーのレーザ光をディスクに照射し、その反射光を受光することによりディスクに記録されているデータを読み出すものである。すなわち、光ピックアップ部3は、図示しないが、ディスクに照射するレーザ光の光源であるレーザダイオード、対物レンズ、ディスクに照射されたレーザ光の当該ディスクからの反射光を受光するフォトディテクタ等の光検出器、2軸アクチュエータを構成するフォーカスコイル、トラッキングコイル、光ピックアップ部3をディスクの半径方向に移動させるためのスレッドモータなどを備えたものである。
ドライバ4は、後述するDSP6からのサーボ制御信号や制御部9からの駆動制御信号に応じて、スピンドルモータ2、光ピックアップ部3のレーザダイオード、スレッドモータ、フォーカスコイル、トラッキングコイルのそれぞれを駆動させるドライブ信号を形成し、そのそれぞれに供給して駆動させるようにするものである。
RF回路5は、ディスクに照射されたレーザ光の当該ディスクからの反射光に応じた光ピックアップ部3からの電気信号に基づいて、再生信号(Pull−in信号)、フォーカスエラー信号FE、トラッキングエラー信号TEを生成し、これらをDSP6に供給する。
DSP6は、フォーカスエラー信号FEやトラッキングエラー信号TEに応じて、ドライバ4に供給するサーボ制御信号を生成して、これをドライバ4に供給したり、RF回路5からの再生信号をデコードするなどして、D/A変換器8に供給する再生信号(再生音声信号)を形成し、これをD/A変換器8に供給したりする処理を行う。
すなわち、DSP6は、RF回路5からの再生信号に施されている変調に応じた復調処理などを行って出力用の音声信号を形成するいわゆるCD信号処理や、フォーカスエラー信号FEやトラッキングエラー信号TEに応じて、ドライバ4に供給するサーボ制御信号を生成するサーボ制御処理を行うものである。なお、DRAM7は、再生時において、処理対象のデータを一時記憶するためのものである。
そして、DSP6からの再生音声信号の供給を受けるD/A変換器8は、デジタル信号であるDSP6からの再生音声信号をアナログ音声信号に変換し、これを増幅器(アンプ)などを通じてスピーカに供給される。これにより、ディスク1から読み出された再生音声信号に応じた音声が当該スピーカから放音される。
制御部9は、図示しないが、CPU、ROM、RAMがバスを通じて接続されて形成されたマイクロコンピュータであり、このディスク再生装置の各部を制御するものである。そして、制御部9には、図1に示したように、不揮発性メモリであるEEPROM10、表示装置11、キー操作部12が、接続されており、キー操作部12を通じて受け付けたユーザーからの操作入力に応じて、各部を制御し、再生、早送り、早戻し、一時停止、停止などの種々の制御を行うことができるようにしている。
ここで、EEPROM10は、このディスク再生装置の電源が落とされた後においても保持しておくべき各種の情報を記憶保持するものであり、種々の設定パラメータなどを記憶保持する。また、表示装置11は、この実施の形態においては、LCD(Liquid Crystal Display)であり、制御部9の制御により、状態情報や警告情報などの表示情報を表示するものである。
そして、キー操作部12を通じてユーザーからの再生指示を受け付けた場合には、制御部9は、ドライバ4を制御してスピンドルモータ2、光ピックアップ2の各部を駆動制御する。この場合、レーザを再生パワーで点灯し、ユーザーにより再生するように指定されたアドレスに光ピックアップ部3を移動させて、ディスクに記録されているデータの取り込み(読み取り)を行う。取り込まれたデータはRFIC5からDSP6を経由してDRAM8に一旦転送され、逐次DSP6から読み出され、D/A変換器8を通じてスピーカに供給され、再生するようにされる。
そして、この実施の形態のディスク再生装置においては、上述したように、CDテキスト規格のCDであるディスク1のリードインエリアに記録されているテキストデータを読み出して、この読み出したテキストデータに応じた文字情報を表示装置11の表示画面に表示することができるようにしている。
すなわち、光ピックアップ部3を通じてディスク1のリードインエリアから読み出されたテキストデータは、RF回路5、DSP6を通じて制御部9に供給され、ここで表示用の文字データに変換(デコード)されて表示装置11に供給され、表示装置11の表示画面にテキストデータの文字コードに応じた文字が表示するようにされる。
[いわゆる文字化けの発生について]
上述したように、光ピックアップ部3を通じてディスク1のリードインエリアから読み出されたテキストデータは、RF回路5、DSP6を通じて制御部9に供給され、ここで表示用の文字データに変換(デコード)されて表示装置11に供給するようにされるが、この実施の形態のディスク再生装置においては、その前に、制御部9において検査を行うようにしている。
テキストデータは、上述もしたように、属性情報と文字コードとからなっている。属性情報は、文字コードのコード体系を示すものである。この属性情報が示すコード体系と、文字コードの実際のコード体系とが異なることが稀に発生し、いわゆる文字化けを起こしてしまう可能性がある。このために、この実施の形態のディスク再生装置においては、テキストデータをデコードして文字情報に変換する前に、検査を行うようにしている。
ここで、文字化けの発生の一例について具体的に説明する。図2は、2バイト系の文字コード体系の1つであるシフトJISの文字マップ(文字変換テーブル)を説明するための図であり、図3は、1バイト系の文字コード体系の1つであるISO8859−1の文字マップ(文字変換テーブル)を説明するための図である。
シフトJISは2バイト系の文字コード体系であるので、図2において、図2Aに示すように、上位4ビット分(0h〜Fh)と下位4ビット分(0h〜Fh)の1バイト(8ビット)分のデータ(上位1バイト分のデータ)と、図2Bに示すように、上位4ビット分(0h〜Fh)と下位4ビット分(0h〜Fh)の1バイト(8ビット)分のデータ(下位1バイト分のデータ)との2バイト分のデータによって、1文字が表現される。
また、ISO8859−1は1バイト系の文字コード体系であるので、図3に示すように、上位4ビット分(0h〜Fh)と下位4ビット分(0h〜Fh)の1バイト(8ビット)分のデータによって、1文字が表現される。なお、0h、Fhのように、数字またはアルファベット大文字A〜Fの後のアルファベット小文字のhは、その直前の文字が16進数表現であることを示している(以下、この明細書において同じ。)
そして、日本語の場合には、多くの漢字を表現できなければならないのでシフトJISが用いられることが多く、英語やその他のヨーロッパ言語の場合にはISO8859−1が用いられる場合が多い。
図4は、シフトJISとISO8859−1との場合の文字表現の違いについて説明するための図である。2バイト系のコード体系のシフトJISを用いて、「会社」という日本語(漢字)を表現すると、図4(1)に示すように“89EF8ED0”となる。この場合、“89EF”の2バイト分のデータにより文字「会」が表され、“8ED0”の2バイト分のデータで文字「社」が表されることになる。
したがって、文字コード“89EF8ED0”を2バイト系のシフトJISの文字マップを用いて文字に変換すれば、正確に「会社」という文字に変換できる。しかし、文字コード“89EF8ED0”を誤って、1バイト系のコード体系のISO8859−1の文字マップとして変換しようとすると、図4(2)に示すように、文字コード“89”と“8E”には該当する文字はなく、文字コード“EF”と“D0”の場合には、見慣れない文字に変換されてしまう。
このように、テキストデータを構成する属性情報が示すコード体系と文字コードの実際のコード体系とが異なっていた場合には、いわゆる文字化けが発生し、アーチスト名、タイトル名などの重要な情報をユーザーが得られなくなってしまう。そこで、上述のように、制御部9において、テキストデータを文字に変換して表示装置11の表示画面に表示する前に、検査を実行するようにしているのである。
この実施の形態のディスク再生装置においては、変換しようとしているテキストデータの属性情報を確認し、これが2バイト系のコード体系であることを示している場合には、そのまま2バイト系のコード体系の文字マップを用いて文字変換を行うようにする。しかし、制御部9は、テキストデータの属性情報が、文字コードは1バイトコード(1バイト系)であることを示している場合には、供給されたテキストデータの文字コードを1バイトずつ調べ、1バイトコードに存在しないコード(値)が存在するか否かを調べる。
1バイトコードに存在しない値が検出された場合は、ユーザーに選択されているコード体系を用いてテキスト情報を変換する。すなわち、ユーザーによって予め決められたデコード方式を用いてテキストデータを表示情報(文字表示情報)に変換して(デコードして)、表示装置11にその表示情報を転送し、その表示情報に応じた文字を表示装置の表示画面に表示する。1バイトコードに存在しない値が検出されなかった場合は、テキストデータの属性情報が示すコード体系の文字マップにしたがって、テキストデータをデコードし、表示装置11に表示データを供給し、当該表示データに応じた文字を表示装置の表示画面に表示する。
このように、この実施の形態のディスク再生装置は、日本語表示を可能にするために、通常は文字コード体系として2バイト系のシフトJISを用いるものとし、文字に変換すべきテキストデータの属性情報がシフトJISでない場合に、ユーザーによって予め設定されたコード体系の文字マップを用いて、テキストデータの文字への変換を行うようにして、テキストデータの文字化け現象を最小限に抑えることができるようにしている。
[用いる文字コード体系の設定処理について]
次に、上述のように、CDテキスト規格のCDに記録されているテキストデータをデコードして、その文字情報を表示装置11の表示画面に表示可能なこの実施の形態のディスク再生装置に対してユーザーが行う、テキストデータを処理する場合に、そのテキストデータの属性情報が通常用いるようにされている文字コード体系と異なる場合に用いる文字コード体系の設定処理について、図5のフローチャートを参照しながら説明する。
図5に示す処理は、この実施の形態のディスク再生装置に対して、例えば、カレンダー機能の設定(現在日時や現在時刻の設定)、テキストデータの属性情報が通常用いるコード体系と異なる場合に用いるコード体系の設定などの、いわゆる基本設定(初期設定)を行う所定の操作を行った場合に、ディスク再生装置の制御部9において実行される。
まず、制御部9は、ROMに保持している表示情報に基づいてメニューを表示装置11の表示画面に表示し(ステップS101)、当該メニューから実行する処理対応する項目の選択入力を受け付ける(ステップS102)。そして、ユーザーからの選択入力を待ち(ステップS103)、選択入力を受け付けた場合には、コード体系の設定処理の実行のためのメニュー項目が選択されたか否かを判断する(ステップS104)。
ステップS104の判断処理において、コード体系の設定処理の実行のためのメニュー項目が選択されたと判断したときには、制御部9は、コード体系の選択入力、選択の中止指示入力、確定入力などのコード体系の選択についての一連の操作入力を受け付ける(ステップS105)。そして、制御部9は、コード体系の選択入力を中止指示入力を受け付けたか否かを判断し(ステップS106)、中止指示入力を受け付けていないと判断したときには、確定入力が行われたか否かを判断する(ステップS107)。
ステップS107の判断処理において、確定入力を受け付けていないと判断したときには、ステップS105からの処理を繰り返す。ステップS107の判断処理において、確定入力が行われたと判断したときには、ステップS105において受け付けたコード体系を示す情報を自己の不揮発性メモリ、この実施の形態においてはEEPROM10に設定し(ステップS108)、この図5に示す処理を終了する。
また、ステップS104の判断処理において、受け付けたメニュー項目の選択が、コード体系の設定処理のためのメニュー項目ではないと判断したときには、その選択されたメニュー項目に応じた処理を実行し(ステップS109)、この図5に示す処理を終了する。また、コード体系の選択入力を行うようにされた後に、ステップS106の判断処理において、中止指示入力を受け付けたと判断したときには、コード体系の設定を行うことなく、この図5に示す処理を終了する。
このように、この実施の形態のディスク再生装置は、ディスクに記録されたテキストデータの属性情報が、予め決められる通常用いるコード体系と異なっている場合に用いるようにするコード体系をユーザーが設定することができるようにしている。
なお、この実施の形態において、選択可能な文字コード体系としては、(1)Auto(自動設定)、(2)日本語(シフトJIS)、(3)韓国語(KSX1001)、(4)簡体字・中国本土(GB18030)、(5)繁体字・台湾(Big5)、(6)英語(ISO8859−1またはASCII)、(7)ロシア語(ISO8859−1)などが選択可能とされている。
また、上述の(1)Autoの場合には、いわゆる仕向け先(出荷先国)で用いられる言語に応じて予め決められるコード体系が自動的に設定するようにされる。すなわち、(1)Autoの場合に用いるコード体系を示す情報は、予め、例えばEEPROM10などに設定されており、これが、(1)Autoが選択された場合に、テキストデータの属性情報が示すコード体系が通常用いられるものと異なっている場合に用いるコード体系として設定されることになる。
[テキストデータデコード時の処理について]
次に、この実施の形態のディスク装置において行われるテキストデータのデコード処理について、図6のフローチャートを用いて具体的に説明する。図6は、この実施の形態のディスク再生装置に装填されたディスクに記録されているテキストデータを読み出してデコードする処理を説明するためのフローチャートであり、例えば、ディスクの装填時やユーザーから指示されたタイミングなどにおいて、主に制御部9において実行される処理である。
なお、この実施の形態のディスク再生装置は、主に日本向けに製造されたものであり、テキストデータについてはシフトJISが通常用いられているコード体系であるものとして処理するようにしているものとして説明する。
制御部9において、図6に示す処理が実行されると、まず、制御部9は、光ピックアップ部3、RF回路5、DSP6を通じて、自機に装填されたディスク1から読み出されたテキストデータを取得する(ステップS201)。そして、取得したテキストデータの属性情報を参照し、処理対象のテキストデータの文字コードのコード体系が不明か否かを判断する(ステップS202)。
ステップS202の判断処理において、処理対象のテキストデータの文字コードのコード体系は不明ではないと判断したときには、そのコード体系は1バイト系のコード体系か否かを判断する(ステップS203)。ここで、1バイト系か否かを判断するのは、この実施の形態のディスク再生装置で通常用いられる2バイト系のコード体系か否かを判断するのと等価である。
ステップS203の判断処理において、処理対象のテキストデータの属性情報が示すコード体系が1バイト系ではない(2バイト系である)と判断した場合には、テキストデータの文字コードはこのディスク再生装置において通常用いられる2バイト系の文字コードであると判断し、取得したテキストデータの属性情報(文字コード情報)にしたがって、テキストデータの文字コードを文字に変換し(デコードし)(ステップS204)、変換して得た文字(表示データ)を表示装置11に転送して、表示装置11の表示画面に文字を表示するようにして(ステップS208)、この図6に示す処理を終了する。
また、ステップS203の判断処理において、処理対象のテキストデータの属性情報が示すコード体系が1バイト系である(2バイト系ではない)と判断した場合には、当該処理対象のテキストデータの文字コードに1バイト系では使用されない文字コードを含んでいるか否かのチェック(検査)を行う(ステップS205)。
このステップS205のチェックにおいては、1バイト系のコード体系のそれぞれに応じたチェックを行う。具体的には、以下に示すように、
ASCII(ISO646)の場合:128(80h)〜255(FFh)
ISO8859−1の場合 :128(80h)〜159(9Fh)
JISX0201の場合 :128(80h)〜159(9Fh)、および、
224(E0h)〜255(FFh)
の各範囲の値は存在しない。
このように、1バイト系の各コード体系に応じて存在しない文字コードが存在するか否かをチェックするのがステップS205において行う処理である。
ステップS205においてのチェックに基づいて、処理対象の文字コードにそのコード体系に応じて存在しない文字コードが存在するか否かを判断し(ステップS206)、存在すると判断した場合には、処理対象のテキストデータの属性情報が示すコード体系と当該テキストデータの文字コードの実際のコード体系とは異なっていると判断し、通常用いられる2バイト系の文字コード以外の文字コードを処理する場合に用いるものとして図5に示した処理によりユーザーの選択によってEEPROM10に設定したコード体系の文字マップを用いて、文字コードの文字への変換(デコード)を行う(ステップS207)。
そして、ステップS207のデコード処理により得られた文字(表示データ)を表示装置10に転送して、文字を表示装置10の表示画面に表示するようにして(ステップS208)、この図6に示す処理を終了する。
また、ステップS206の判断処理において、処理対象の文字コードにそのコード体系に応じて存在しない文字コードが存在していないと判断したときには、処理対象のテキストデータの属性情報が示すコード体系と当該テキストデータの文字コードの実際のコード体系とは一致していると判断し、取得したテキストデータの属性情報(文字コード情報)にしたがって、テキストデータの文字コードを文字に変換し(デコードし)(ステップS204)、変換して得た文字(表示データ)を表示装置11に転送して、表示装置11の表示画面に文字を表示するようにして(ステップS208)、この図6に示す処理を終了する。
また、ステップS202の判断処理において、処理対象のテキストデータの文字コードのコード体系が不明であると判断した場合には、処理対象のテキストデータの文字コードのコード体系が通常用いられる2バイト系ではないと判断し、図5の処理によりEEPROM10に設定されているテキストデータの文字コードのコード体系を示す情報に応じたコード体系の文字マップを用いて、処理対象のテキストデータについてのデコード処理を実行し(ステップS207)する。
そして、ステップS207のデコード処理により得られた文字(表示データ)を表示装置10に転送して、文字を表示装置10の表示画面に表示するようにして(ステップS208)、この図6に示す処理を終了する。
このように、この実施の形態のディスク再生装置は、テキストデータを処理する場合に、その属性情報がないためにコード体系が不明であったり、テキストデータの属性情報が通常用いるべき2バイト系のコード体系でない1バイト系のコード体系を示している場合であって、テキストデータの属性情報が示すコード体系とテキストデータの文字コードの実際のコード体系とが異なっていいたりする場合には、処理対象の文字コードを予め設定したコード体系に応じた文字マップを用いて、テキストデータの文字コードのデコード処理を行うことができる。
これにより、処理対象のテキストデータの属性情報が示すコード体系と当該テキストデータの文字コードの実際のコード体系とが異なっている場合であっても、文字化けを発生させることを最小限度に止め、テキストデータを適正に文字に変換してこれをユーザーに提供することができるようにされる。
なお、上述もしたように、ユーザーが設定したコード体系に応じたデコードを行うようにするのは、図6に示したステップS205の検査により、1バイトコードに存在しない値が検出された時のみである。ユーザーが選択できるコード体系(デコード方法)は、上述もしたように、(1)Auto(自動設定)、(2)日本語(シフトJIS)、(3)韓国語(KSX1001)、(4)簡体字・中国本土(GB18030)、(5)繁体字・台湾(Big5)、(6)英語(ISO8859−1またはASCII)、(7)ロシア語(ISO8859−1)などである。
また、選択可能な文字コード体系は、仕向けを問わず、フルに実装することも、仕向けにあわせて限定して実装することも可能である。ここで、実装とは、選択可能なコード体系に応じた文字マップや変換に必要な処理プログラムなどの実装を意味する。
なお、ここでは、ディスク再生装置が、主に日本向けに製造されたものであり、テキストデータについてはシフトJISが通常用いられているコード体系であるものとして処理する場合を例にして説明したが、これに限るものではない。ISO8859−1などの1バイト系のコード体系を主に用いるディスク再生装置にも適用可能である。
この場合には、図6に示した処理のうち、ステップS203において、処理対象のテキストデータの属性情報が、2バイト系のコード体系か否かを判断するようにし、ステップS206の判断処理において、2バイト系のコード体系で用いられない文字コードを含んでいるか否かを判断するようにすればよい。
[テキストデータデコード時の処理の他の例について]
次に、この実施の形態のディスク装置において行われるテキストデータのデコード処理の他の例について、図7のフローチャートを用いて説明する。図6を用いて上述したテキストデータのデコード処理は、ディスク再生装置が通常は2バイト系のシフトJISを用いてテキストデータのデコードを行うものである場合の処理である。
しかし、テキストデータの属性情報が示すコード体系と、当該テキストデータの文字コードの実際のコード体系とが不一致になった多くの場合においては、属性情報が示すコード体系がヨーロッパ系の言語で用いられるISO8851−1を示すものに書き換わってしまう場合がもっとも多い。
そこで、ディスク再生装置においては、テキストデータのデコード処理において通常用いられるコード体系は、ISO8851−1以外のコード体系であるものとし、テキストデータの属性情報が示すコード体系が、ISO8851−1である場合には、テキストデータの属性情報が示すコード体系と、当該テキストデータの文字コードの実際のコード体系とが一致していない蓋然性が高いと想定した場合には、テキストデータのデコード処理を図7に示すように行うことができる。
図7に示す処理も、図6に示した処理と同様に、例えば、ディスクの装填時やユーザーから指示されたタイミングなどにおいて、主に制御部9において実行される処理である。そして、制御部9において、図7に示す処理が実行されると、まず、制御部9は、光ピックアップ部3、RF回路5、DSP6を通じて、自機に装填されたディスク1から読み出されたテキストデータを取得する(ステップS301)。そして、取得したテキストデータの属性情報を参照し、処理対象のテキストデータの文字コードのコード体系が不明か否かを判断する(ステップS302)。
ステップS302の判断処理において、処理対象のテキストデータの文字コードのコード体系は不明ではないと判断したときには、そのコード体系はISO8859−1であるか否かを判断する(ステップS303)。このステップS303の判断処理において、テキストデータの属性情報が示すコードオ体系が、ISO8859−1であるか否かを判断するのは、次の2つの理由による。
まず、第1に、この実施の形態のディスク再生装置でテキストデータのデコード時において通常用いられるコード体系は、ISO8859−1以外のコード体系であり、テキストデータの属性情報がISO8859−1か否かを判断する処理は、当該属性情報が示すコード体系がISO8859−1以外のコード体系か否かを判断するのと等価であるからである。
第2に、上述もしたように、テキストデータの属性情報が示すコード体系が、ISO8851−1である場合には、テキストデータの属性情報が示すコード体系と、当該テキストデータの文字コードの実際のコード体系とが一致していない蓋然性が高い場合が多いためである。
ステップS303の判断処理において、処理対象のテキストデータの属性情報がISO8859−1を示すものではないと判断したときには、テキストデータの属性情報が示すコード体系と当該テキストデータの文字コードの実際のコード体系とが異なっている蓋然性は低いので、取得したテキストデータの属性情報(文字コード情報)にしたがって、テキストデータの文字コードを文字に変換し(デコードし)(ステップS304)、変換して得た文字(表示データ)を表示装置11に転送して、表示装置11の表示画面に文字を表示するようにして(ステップS306)、この図7に示す処理を終了する。
ステップS302の判断処理において、処理対象のテキストデータの文字コードのコード体系が不明であると判断した場合、および、ステップS303の判断処理において、処理対象のテキストデータの属性情報がISO8859−1を示すものであると判断したと場合には、テキストデータの属性情報が示すコード体系と当該テキストデータの文字コードの実際のコード体系とが異なっている蓋然性が高い。このため、この場合には、通常用いられる文字コード以外の文字コードを処理する場合に用いるものとして図5に示した処理によりユーザーの選択によってEEPROM10に設定したコード体系の文字マップを用いて、文字コードの文字への変換(デコード)を行う(ステップS305)。
そして、ステップS305のデコード処理により得られた文字(表示データ)を表示装置10に転送して、文字を表示装置10の表示画面に表示するようにして(ステップS306)、この図7に示す処理を終了する。
このように、この図7に示したテキストデータのデコード処理の場合には、テキストデータのデコード時において、通常用いられる文字コードのコード体系がISO8859−1以外である場合には、テキストデータの属性情報が示すコード体系と、そのテキストデータの文字コードの実際のコード体系とが異なっている蓋然性が高い場合を確実に検出し、テキストデータのデコード処理を信頼性高く行うことができる。
なお、図7に示した処理においても、ステップS303の判断処理において、処理対象のテキストデータの属性情報が示すコード体系がISO8859−1であると判断した場合に、処理対象のテキストデータの文字コードにISO8859−1では用いられないコードが存在するか否かをチェックして、ISO8859−1では用いられないコードが存在しない場合には、ステップS304において、取得した属性情報(文字コード情報)に基づいて文字コードのデコードを行うようにし、ISO8859−1では用いられないコードが存在する場合には、ステップS305において、EEPROM10に設定されているコード体系にしたがってテキストデータのデコードを行うようにしてももちろんよい。
また、図6においては、通常用いられるコード体系が、ISO8859−1以外のコード体系である場合を例にしたが、通常用いられるコード体系が、シフトJIS以外の場合や、JISX0201以外の場合などにおいても、図6に示した処理を行うようにすることができる。この場合には、図7に示した処理のステップS303の判断処理において、処理対象のテキストデータの属性情報が、シフトJISか否かを判断するようにしたり、あるいは、図7に示した処理のステップS303の判断処理において、処理対象のテキストデータの属性情報が、JISX0201か否かを判断するようにしたりすればよい。
このように、テキストデータを文字に変換するデコード処理を行う場合に、テキストデータの属性情報が通常用いられるコード体系と異なるコード体系を示している場合に、予め選択して設定しておいたコード体系に応じて処理できるようにしておくことにより、テキストデータをいわゆる文字化けを生じさせることなく、信頼性高くデコード処理することができるようになる。
なお、上述した実施の形態においては、受付手段としての機能はキー操作部12が実現し、記憶手段としての機能はEEPROM10が実現し、判別手段および変換手段、また、検出手段としての機能は制御部9がその機能を実現するようにしている。
また、図5、図6、図7に示したフローチャートに応じたプログラムを作成し、制御部9のROMやEEPROM10に記憶し、これを必要なタイミングで実行することにより、この発明を実現することも可能である。
また、上述した実施の形態においては、CDテキスト規格のCDの再生装置にこの発明を適用する場合を例にして説明したが、これに限るものではない。記録媒体として、MD(Mini Disc(登録商標))を用いるMDの再生装置など、記録媒体に記録されたテキストデータをデコードして出力する機能を有する種々の再生装置、記録再生装置にこの発明を適用することができる。要は、属性情報と文字コードとからなる種々の文字コードをデコードする電子機器に適用することができる。
この発明の装置、方法の一実施の形態が適用されたディスク再生装置の一実施の形態を説明するためのブロック図である。 シフトJISの文字マップを説明するための図である。 ISO8859−1の文字マップを説明するための図である。 いわゆる文字化けの発生例について説明するための図である。 コード体系の設定処理について説明するためのフローチャートである。 テキストデータのデコード処理について説明するためのフローチャートである。 テキストデータのデコード処理の他の例について説明するためのフローチャートである。
符号の説明
1…ディスク、2…スピンドルモータ、3…光ピックアップ部、4…ドライバ、5…RF回路(高周波信号処理回路)、6…DSP、7…DRAM、8…D/A変換器、9…制御部、10…EEPROM、11…表示装置、12…キー操作部

Claims (8)

  1. コード体系を示す属性情報と前記コード体系の文字コードとからなる文字情報を処理して、前記文字コードを出力すべき文字に変換する文字情報変換装置であって、
    通常用いられるべき第1及び第2のコード体系以外の文字コードをデコードする場合に用いるコード体系の設定入力を受け付ける受付手段と、
    前記受付手段を通じて受け付けられた設定入力に応じたコード体系を示す情報を記憶保持する記憶手段と、
    変換対象の文字情報の前記属性情報を参照するようにして、当該文字情報の前記文字コードのコード体系を判別する判別手段と、
    前記判別手段において、判別不能ではないが、前記第1のコード体系ではないと判別された場合に、判別対象の当該文字情報の当該文字コードに、前記第2のコード体系において用いられることのない文字コードを含んでいるか否かを検出する検出手段と、
    前記判別手段において、コード体系が判別不能である場合に、あるいは、前記検出手段において、前記第2のコード体系において用いられることのない文字コードを含んでいることが検出された場合に、前記記憶手段に記憶されている設定された前記コード体系を示す情報に基づいて前記文字コードを文字に変換する変換手段と
    を備えることを特徴とする文字情報変換装置。
  2. 前記第1のコード体系は、2バイトコード体系であり、前記第2のコード体系は、1バイトコード体系であることを特徴とする請求項1に記載の文字情報変換装置。
  3. 前記第1のコード体系は、1バイトコード体系であり、前記第2のコード体系は、2バイトコード体系であることを特徴とする請求項1に記載の文字情報変換装置。
  4. 前記第2のコード体系は、複数種類のものがあり、
    前記検出手段、用いられる種類の前記第2のコード体系のそれぞれに応じて、用いられることのない文字コードを含んでいるか否かを検出することを特徴とする請求項1に記載の文字情報変換装置。
  5. コード体系を示す属性情報と前記コード体系の文字コードとからなる文字情報を処理して、前記文字コードを出力すべき文字に変換する文字情報変換装置で用いられる文字情報変換方法であって、
    前記文字情報変換装置は、コード体系の設定入力を受け付ける受付手段と、前記設定入力に応じたコード体系を示す情報を記憶する記憶手段と、前記記憶手段に前記コード体系を示す情報を書き込む書き込み手段と、記録媒体から文字情報を読み出す読み出し手段と、変換対象の文字情報の文字コードのコード体系を判別する判別手段と、前記変換対象の文字情報の文字コードに前記第2のコード体系において用いられることのない文字コードを含んでいるか否かを検出する検出手段と、文字コードを文字に変換する変換手段とを備えるものであり、
    前記受付手段により、通常用いられるべき第1及び第2のコード体系以外の文字コードをデコードする場合に用いるコード体系の設定入力を受け付ける受付工程と、
    前記書き込み手段により、前記受付工程において受け付けた前記設定入力に応じたコード体系を示す情報を前記記憶手段に記録する記憶工程と、
    前記読み出し手段により記録媒体から読み出された変換対象の文字情報の前記属性情報を参照するようにして、前記判別手段が当該文字情報の前記文字コードのコード体系を判別する判別工程と、
    前記判別工程において、判別不能ではないが、前記第1のコード体系ではないと判別された場合に、前記検出手段が、判別対象の当該文字情報の当該文字コードに、前記第2のコード体系において用いられることのない文字コードを含んでいるか否かを検出する検出工程と、
    前記判別工程において、コード体系が判別不能である場合に、あるいは、前記検出工程において、前記第2のコード体系において用いられることのない文字コードを含んでいることを検出した場合に、前記変換手段が、前記記憶手段に記憶されている設定された前記コード体系を示す情報に基づいて前記文字コードを文字に変換する変換工程と
    を備える文字情報変換方法。
  6. 前記第1のコード体系は、2バイトコード体系であり、前記第2のコード体系は、1バイトコード体系であることを特徴とする請求項5に記載の文字情報変換方法。
  7. 前記第1のコード体系は、1バイトコード体系であり、前記第2のコード体系は、2バイトコード体系であることを特徴とする請求項5に記載の文字情報変換方法。
  8. 前記第2のコード体系は、複数種類のものがあり、
    前記検出工程においては、前記検出手段により、用いられる種類の前記第2のコード体系のそれぞれに応じて、用いられることのない文字コードを含んでいるか否かを検出することを特徴とする請求項5に記載の文字情報変換方法。
JP2004208029A 2004-07-15 2004-07-15 文字情報変換装置および文字情報変換方法 Expired - Fee Related JP4072691B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004208029A JP4072691B2 (ja) 2004-07-15 2004-07-15 文字情報変換装置および文字情報変換方法
US11/175,427 US7274314B2 (en) 2004-07-15 2005-07-05 Character-information conversion apparatus and method for converting character information
CNB2005100846054A CN100375994C (zh) 2004-07-15 2005-07-15 字符信息转换设备及转换字符信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004208029A JP4072691B2 (ja) 2004-07-15 2004-07-15 文字情報変換装置および文字情報変換方法

Publications (2)

Publication Number Publication Date
JP2006031303A JP2006031303A (ja) 2006-02-02
JP4072691B2 true JP4072691B2 (ja) 2008-04-09

Family

ID=35897585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004208029A Expired - Fee Related JP4072691B2 (ja) 2004-07-15 2004-07-15 文字情報変換装置および文字情報変換方法

Country Status (3)

Country Link
US (1) US7274314B2 (ja)
JP (1) JP4072691B2 (ja)
CN (1) CN100375994C (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5391583B2 (ja) * 2008-05-29 2014-01-15 富士通株式会社 検索装置、生成装置、プログラム、検索方法および生成方法
JP4427597B1 (ja) * 2008-09-30 2010-03-10 株式会社東芝 デジタルテレビジョン放送受信装置
JP5446852B2 (ja) * 2009-12-25 2014-03-19 コニカミノルタ株式会社 印刷処理装置、印刷処理プログラム、および印刷処理方法
JP6476618B2 (ja) * 2014-07-07 2019-03-06 富士通株式会社 伸長方法、伸長プログラムおよび伸長装置
JP6491438B2 (ja) * 2014-08-29 2019-03-27 株式会社日立社会情報サービス マイグレーション支援装置
US9513978B2 (en) 2014-10-17 2016-12-06 International Business Machines Corporation Integrated support for application porting transparency and streamlined system migration in heterogeneous platform environments

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2918632B2 (ja) * 1990-06-11 1999-07-12 キヤノン株式会社 文字処理方法及び装置
JPH052576A (ja) 1991-06-24 1993-01-08 Fujitsu Ltd コード種別判定方法
JP3496965B2 (ja) * 1993-12-20 2004-02-16 富士通株式会社 文字コード変換装置
JPH07271777A (ja) * 1994-03-31 1995-10-20 Fujitsu Ltd 分散情報処理システムにおける文字コード管理方式
JPH11149284A (ja) * 1997-11-18 1999-06-02 Sharp Corp 文字パターン生成装置及び文字パターン生成装置制御プログラムを記憶した媒体
US6204782B1 (en) * 1998-09-25 2001-03-20 Apple Computer, Inc. Unicode conversion into multiple encodings
JP3917343B2 (ja) * 2000-02-25 2007-05-23 株式会社東芝 マルチプラットフォーム環境における文字コード変換方式および文字コード変換プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002041402A (ja) 2000-07-26 2002-02-08 Canon Inc 情報処理方法及び情報処理装置並びに記憶媒体
US7002581B2 (en) * 2000-12-19 2006-02-21 Fujitsu Limited Character information processing apparatus, character information processing method and storage medium
JP3793093B2 (ja) * 2002-01-21 2006-07-05 アルパイン株式会社 ディスクプレーヤ及びその記録内容情報表示方法
US6701320B1 (en) * 2002-04-24 2004-03-02 Bmc Software, Inc. System and method for determining a character encoding scheme
JP3789394B2 (ja) * 2002-06-06 2006-06-21 エヌイーシーシステムテクノロジー株式会社 文字データ生成装置及びその方法並びにプログラム
JP2004106255A (ja) 2002-09-17 2004-04-08 Ricoh Co Ltd 画像形成装置
JP2004127363A (ja) 2002-09-30 2004-04-22 Denon Ltd 情報記録媒体及び情報記録媒体再生装置
JP4308676B2 (ja) * 2003-01-24 2009-08-05 株式会社リコー 文字列処理装置,文字列処理方法および画像形成装置
US7215264B2 (en) * 2005-09-30 2007-05-08 Pixtel Media Technology (P)Ltd. Methods and systems for character conversion

Also Published As

Publication number Publication date
CN1722221A (zh) 2006-01-18
JP2006031303A (ja) 2006-02-02
CN100375994C (zh) 2008-03-19
US20060050977A1 (en) 2006-03-09
US7274314B2 (en) 2007-09-25

Similar Documents

Publication Publication Date Title
JP3899596B2 (ja) 再生装置および再生方法
US7274314B2 (en) Character-information conversion apparatus and method for converting character information
US6519676B1 (en) Method for reading a CD having CD-text data
JP4016167B2 (ja) 再生方法
KR100562182B1 (ko) 기록 매체에 기록된 문자 정보를 재생하는 장치 및 방법
KR100534051B1 (ko) 재생방법 및 기록매체
JP3793093B2 (ja) ディスクプレーヤ及びその記録内容情報表示方法
JP2008507796A (ja) データ担体のための識別データブロックを生成する装置及び方法
EP1703507A1 (en) Recording medium, recording apparatus, reproducing apparatus, recording method, and reproducing method
JP2007048390A (ja) コンテンツ情報表示装置
JP2003030846A (ja) 情報記録システムと情報記憶装置及び情報記録方法並びに情報記録媒体。
KR19990007151A (ko) 사용자의 모국어 디스플레이 기능을 갖는 재생 장치 및 디스플레이 방법
JP2000113644A (ja) 再生装置
JPH09106613A (ja) ディスク再生装置
JP3879748B2 (ja) 光ディスク装置および光ディスクマウント方法
JP2007287309A (ja) オーディオ信号再生装置及びオーディオ信号再生方法
JP2005166182A (ja) 光ディスク再生装置
JP2006048928A (ja) 情報記録システム及び情報記録方法
JP2007095289A (ja) 再生装置および再生方法
KR19980058045A (ko) 컴팩트디스크플레이어의 곡정보기억기능제어방법
KR20070096156A (ko) 가라오케 디스크 판별방법
JP2005243119A (ja) 再生装置および再生方法
JP2002358722A (ja) 記録再生装置、及びプログラム
JP2001006261A (ja) 記録再生装置
KR20000038160A (ko) 콤팩트 디스크 플레이어의 디스크 정보입력방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070502

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071010

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110201

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees