CN1722221A - 字符信息转换设备及转换字符信息的方法 - Google Patents

字符信息转换设备及转换字符信息的方法 Download PDF

Info

Publication number
CN1722221A
CN1722221A CNA2005100846054A CN200510084605A CN1722221A CN 1722221 A CN1722221 A CN 1722221A CN A2005100846054 A CNA2005100846054 A CN A2005100846054A CN 200510084605 A CN200510084605 A CN 200510084605A CN 1722221 A CN1722221 A CN 1722221A
Authority
CN
China
Prior art keywords
coded system
character
information
character code
different
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005100846054A
Other languages
English (en)
Other versions
CN100375994C (zh
Inventor
前田一彦
渡边浩一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1722221A publication Critical patent/CN1722221A/zh
Application granted granted Critical
Publication of CN100375994C publication Critical patent/CN100375994C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开一种字符信息转换设备,用于处理包括指示编码系统的属性信息和符合该编码系统的字符代码的字符信息,并且用于将字符代码转换成字符。该设备包括键操作单元、EEPROM以及控制单元。键操作单元指定应用于解码符合与通常所应用编码系统不同的编码系统的字符代码的编码系统。EEPROM存储指示与所接收输入对应的编码系统的信息。控制单元参考属性信息并确定字符代码符合哪个编码系统,当不能确定编码系统时或者当确定编码系统不同于通常所应用的编码系统时,基于存储在EEPRM中的信息将字符代码转换成字符。

Description

字符信息转换设备及转换字符信息的方法
相关申请的交叉引用
本发明包含与2004年7月15日在日本专利局提交的日本专利申请JP 2004-208029相关的主题,其全部内容在此引用作为参考。
技术领域
本发明涉及一种将由各种不同编码系统如Shift-JIS编码系统或ISO8859-1编码系统表示的文本数据(字符信息)转换成输出字符的设备及方法。
背景技术
个人计算机和各种其他电子设备被用来处理文本数据。一般地,文本数据基于两种编码系统:双字节编码系统,其中一个字符由两个字节(16位)数据表示;以及单字节编码系统,其中一个字符由一个字节(八位)数据表示。
例如,当在个人计算机的硬盘中创建地址数据库时,在某些情况下,或者单字节数据或者双字节数据可以用于输入关于项目如“名字”和“家庭地址”的数据。当单字节文本数据和双字节文本数据两者都存在时,必须确定对项目输入的文本数据是单字节文本数据还是双字节文本数据,以便检查文本数据的有效性并将文本数据转换成字符。
日本未经审查专利申请公开04-150112号公开一种确定与项目对应的文本数据是单字节文本数据还是双字节文本数据并适当地检查与项目对应的文本数据的技术。通过使用在该文献中描述的技术,与待处理项目对应的文本数据是单字节文本数据还是双字节文本数据被正确地确定,并且即使当单字节文本数据和双字节文本数据两者都存在时也适当地处理。
文本数据一般地包括指示编码系统的属性信息和与字符对应的字符代码。通过查阅属性信息,文本数据的编码系统可以被确定。这样,编码系统的适当处理可以被执行。
但是,在个别情况下,由属性信息指示的编码系统与字符代码的编码系统不同。例如,存在称为CD文本的光盘(CD)标准。通过遵照该标准,关于CD的附加信息如标题、艺术家名字、词作者名字,作曲者名字,编曲者名字,以及其他信息可以作为文本数据(字符信息)记录在包含于CD的读入区轨道中的子代码的R到W通道。
当音乐数据以及与记录于CD上的音乐数据对应并符合CD文本标准的文本数据拷贝为一组供个人使用时,依赖于所使用的应用程序,包含于文本数据中的字符代码可以直接拷贝,然而指示字符代码的编码系统的属性信息可能自动改变成由应用程序主要使用的编码系统如双字节编码系统。
如果这种改变当所复制的字符代码是基于单字节编码系统时发生,由属性信息指示的编码系统将不同于字符代码的实际编码系统。结果,正确并快速地检查字符代码以及将字符代码转换(解码)成字符将变得困难。
符合MP3标准的音频数据文件(MPEG-1 Audio Layer-3(MP3))文件可以通过网络如因特网购买。在MP3文件的情况下,称为ID3标签的格式用来将文本数据(字符信息)如音乐的标题、作曲者的名字以及音乐的流派添加到文件中。但是,称为MP3的版本1 ID3标签的标准不包括指示字符代码的编码系统的属性信息。
由于这个缘故,使用版本1 ID3标签添加到MP3文件的文本数据的编码系统是不知道的。因此,正确并快速地检查字符代码以及将字符代码转换(解码)成字符变得困难。
发明内容
考虑到上述问题,根据本发明的实施方案的设备及方法即使当由属性信息指示的编码系统不同于字符代码的实际编码系统时也可以根据编码系统正确地转换包含属性信息和字符代码的文本数据的字符代码。
一种根据本发明的实施方案的字符信息转换设备包括接收装置、存储装置、确定装置,以及转换装置。该字符信息转换设备用于处理包括指示编码系统的属性信息和符合该编码系统的字符代码的字符信息以及用于将字符代码转换成字符。接收装置用于接收指定当解码符合与通常所应用编码系统不同的编码系统的字符代码时所应用编码系统的输入。存储装置被配置以存储指示对应于通过接收装置接收的输入的编码系统的信息。确定装置被配置以参考待转换字符信息的属性信息并确定字符信息的字符代码符合哪个编码系统。转换装置被配置以当确定装置不能确定编码系统时或者当确定装置确定通过参考属性信息确定的编码系统不同于通常所应用的编码系统时,基于存储于存储装置中的信息将字符代码转换成字符。
根据依照本发明的实施方案的字符信息转换设备,指示当解码基于与通常所使用编码系统不同的编码系统的字符代码时所使用的编码系统的信息经由接收装置存储于存储装置中。当确定装置确定待转换字符信息的字符代码的编码系统是不知道的或者不同于通常所使用的编码系统时,转换装置基于存储于存储装置中指示编码系统的信息将字符信息的字符代码转换成字符。
这样,即使当字符代码的编码系统是不知道的或者不同于通常所使用的编码系统时,字符代码可以基于由用户选择的并预先存储的编码系统来处理。因此,指示字符信息的属性信息的编码系统不同于字符代码的实际编码系统的情况被检测以防止错乱字符的产生。
在根据本发明的实施方案的字符信息转换设备中,当确定装置确定由属性信息指示的编码系统不同于通常所应用的编码系统时,检测装置检测包含于字符信息中的字符代码是否包括不包含于与通常所使用编码系统不同的编码系统中的字符代码,并且当确定装置确定由属性信息指示的编码系统不同于通常所使用的编码系统时或者当检测装置检测到字符信息包括不包含于与通常所应用编码系统不同的编码系统中的字符代码时,转换装置基于存储于存储装置中的信息将字符代码转换成字符。
这样,当确定装置确定指示待转换字符信息的编码系统的属性信息不同于通常所使用的编码系统时,检测装置检测待转换字符信息的字符代码是否包括不使用的字符代码。如果这种字符代码被检测到,转换装置基于存储于存储装置中的指示编码系统的信息来转换字符信息的字符代码。
因此,由字符信息的属性信息指示的编码系统可靠地检测到指示字符信息的属性信息的编码系统不同于字符代码的实际编码系统的情况,以防止错乱字符的产生,从而字符信息被正确地解码。
在根据本发明的实施方案的字符信息转换设备中,通常所应用的编码系统是双字节编码系统,而与通常所应用的编码系统不同的编码系统是单字节编码系统。
这样,当待转换字符信息的字符代码的编码系统不是作为通常所使用编码系统的双字节编码系统时,单字节编码系统可以使用。而且,即使当字符代码基于单字节编码系统时,字符代码可以正确地转换。
在根据本发明的实施方案的字符信息转换设备中,通常所应用的编码系统是单字节编码系统,而与通常所应用的编码系统不同的编码系统是双字节编码系统。
这样,当待转换字符信息的字符代码的编码系统不是作为通常所使用编码系统的单字节编码系统时,双字节编码系统可以使用。而且,即使当字符代码基于双字节编码系统时,字符代码可以正确地转换。
由包含于字符信息(文本数据)中的属性信息指示的字符编码系统以及与属性信息对应的字符代码被错误地记录,错乱字符的产生可以被防止。
附图说明
图1是根据本发明的实施方案的光盘再现设备的框图;
图2说明Shift-JIS的字符映射表;
图3说明ISO8859-1的字符映射表;
图4说明所谓的‘错乱字符’的实例;
图5是说明指定编码系统的过程的流程图;
图6是说明文本数据的解码过程的流程图;以及
图7是说明文本数据的另一种解码过程的流程图。
具体实施方式
根据本发明的实施方案的设备及方法将在下面参考附图而描述。作为根据本发明的实施方案的设备,能够再现记录于CD上符合CD文本标准的数据的再现设备(CD播放机)将在下面描述。
[光盘再现设备的概述]
图1是光盘再现设备的框图。如图1中所示,CD即光盘1装载于光盘再现设备上。
图1中所示的光盘再现装置包括主轴马达2、光学拾信单元3、驱动器4、射频(RF)电路5、数字信号处理器(DSP)6、动态随机存取存储器(DRAM)7、数字/模拟(D/A)转换器8、控制单元9、电可擦除可编程只读存储器(EEPROM)10、显示设备11,以及键操作单元12。
主轴马达2旋转光盘1。光学拾信单元3将用作再现功率的激光束发射到光盘上并通过接收反射光束读出存储于光盘中的数据。更具体地,虽然没有在图中显示,光学拾信单元3包括作为发射到光盘上的激光束的来源的激光二极管、物镜、用于接收光盘处反射的激光束的光探测器如光电探测器、构成双轴启动器的聚焦线圈、跟踪线圈,以及在光盘的径向上移动光学拾信单元3的步进马达。
驱动器4根据从DSP 6发送的伺服控制信号或从控制单元9发送的驱动控制信号产生驱动信号,如下所述,并将驱动信号发送到主轴马达2、光学拾信单元3的激光二极管、步进马达、聚焦线圈以及跟踪线圈以驱动这些单元。
RF电路5响应于从光盘反射的激光束基于来自光学拾信单元3的电信号产生再现信号(拉入信号)、聚焦错误信号FE、跟踪错误信号TE并将这些产生信号提供到DSP 6。
DSP 6响应于聚焦错误信号FE和跟踪错误信号TE产生待提供给驱动器4的伺服控制信号。然后,通过提供伺服控制信号到驱动器4或者通过解码来自RF电路5的再现信号,DSP 6产生待提供给D/A转换器8的再现信号(再现音频信号)。然后,在DSP 6处产生的再现信号提供到D/A转换器8。
换句话说,DSP 6通过响应于发自RF电路5的再现信号上所执行的调制执行解调来执行CD信号处理以产生输出音频信号并响应于聚焦错误信号FE和跟踪错误信号TE执行伺服控制处理以产生待提供到驱动器4的伺服控制信号。DRAM 7是再现过程中用于存储待处理数据的临时存储器。
D/A转换器8接收来自DSP 6的再现音频信号,将该数字信号转换成模拟音频信号,并且经由放大器将该模拟信号提供到扬声器。这样,从光盘1中读出的与再现音频对应的音频通过扬声器再现。
控制单元9是经由总线连接到图中没有显示的中央处理单元(CPU)、ROM及RAM的微型机算计。控制单元9控制光盘再现设备的每个单元。如图1中所示,作为非易失性存储器的EEPROM 10、显示设备11及键操作单元12连接到控制单元9。响应于通过键操作单元12的用户输入的操作,控制单元9执行单元的各种控制,例如‘播放’、‘快进’、‘快倒’、‘暂停’,以及‘停止’。
EEPROM 10存储各种类型的信息,即使在光盘再现设备的电源被关闭之后。EEPROM 10存储各种设置参数。根据该实施方案的显示设备11是液晶显示器(LCD)并在控制单元9的控制下显示信息如条件信息和警报信息。
当控制单元9通过键操作单元12接收来自用户的再现命令时,控制单元9控制驱动器4驱动主轴马达2和光学拾信单元3。在这种情况下,激光由再现功率照射,光学拾信单元3移动到由用户指定用以再现的地址,并且记录于光盘中的数据被读出。读出数据从RF电路5经由DSP 6临时发送到DRAM 7。然后,数据从DSP 6中按顺序读出并经由D/A转换器8提供到扬声器以再现。
如上所述,根据该实施方案的光盘再现设备读出记录于光盘1的读入区中的文本数据,根据该实施方案光盘是符合CD文本标准的CD。然后,与读出文本数据对应的字符信息显示在显示设备11的屏幕上。
经由光学拾信单元3从光盘1的读入区中读出的文本数据经由RF电路5和DSP 6提供到控制单元9。文本数据在控制单元9处被转换(解码)成供显示的字符信息并提供到显示设备11。与文本数据的字符代码对应的字符显示在显示设备11的屏幕上。
[错乱字符的产生]
如上所述,经由光学拾信单元3从光盘1的读入区中读出的文本数据经由RF电路5和DSP 6提供到控制单元9。文本数据在控制单元9处被转换(解码)成供显示的字符数据并提供到显示设备11。在该过程之前,根据该实施方案的光盘再现设备在控制单元9处执行检验。
如上所述,文本数据包括属性信息和字符代码。属性信息指示字符代码的编码系统。在个别情况下,由属性信息指示的编码系统可能不同于字符代码的实际编码系统,导致错乱字符的产生。由于这个缘故,在根据该实施方案的光盘再现设备中,文本数据在解码并转换成字符信息之前被检验。
错乱字符的产生的示范过程将在下面详细描述。图2说明Shift-JIS的字符映射表(字符转换表),它是双字节字符编码系统。图3说明ISO8859-1的字符映射表(字符转换表),它是单字节字符编码系统。
因为Shift-JIS是双字节字符编码系统,一个字符由两个字节数据表示:一个字节(8位)数据(即高阶字节数据)包括4位高阶数据(0h~Fh)和4位低阶数据(0h~Fh),如图2A中所示,以及一个字节(8位)数据(即低阶字节数据)包括4位高阶数据(0h~Fh)和4位低阶数据(0h~Fh),如图2B中所示。
因为ISO8859-1是单字节字符编码系统,一个字符由包括4位高阶数据(0h~Fh)和4位低阶数据(0h~Fh)的1字节(8位)数据表示,如图3中所示。和数字或大写字母表字母A~F一起出现的字符‘h’如‘0h’和‘Fh’指示位于字符‘h’前面的字符代表十六进制数(这种十六进制表示将在本文献各处使用)。
因为许多日语汉字字符在日文中使用,Shift-JIS经常使用。对于英语和其他欧洲语言,ISO8859-1经常使用。
图4说明根据Shift-JIS和ISO8859-1的字符表示中的差异。使用Shift-JIS双字节编码系统,日文汉字字符‘会社’表示为‘89EF8ED0’,如图4中所示。在该情况下,两个字节数据‘89EF’代表日文汉字字符‘会’,而两个字节数据‘8ED0’代表日文汉字字符‘社’。
因此,当字符代码‘89EF8ED0’使用Shift-JIS双字节编码系统来转换成字符时,字符代码正确地转换成日文汉字字符‘会社’。但是,如果字符代码‘89EF8ED0’基于单字节编码系统ISO8859-1的字符映射表而转换时,字符代码‘89’和‘8E’将不被转换,因为没有与字符代码‘89,和‘8E’对应的字符,如图4中所示,而字符代码‘EF’和‘D0’对应于不熟悉的字符。
因此,当由包含于文本数据中的属性信息指示的编码系统不同于字符代码的实际字符编码系统时,错乱字符将产生。结果,用户将不能够获得重要信息如艺术家的名字及标题。因此,如上所述,在文本数据转换成字符并在显示设备11的屏幕上显示之前,在控制单元9处执行检验。
当待转换文本数据通过检查文本数据的属性信息被确定基于双字节编码系统时,根据该实施方案的光盘再现设备使用双字节编码系统的字符映射表来执行字符转换。如果文本数据的属性信息指示文本数据包括单字节字符代码(基于单字节编码系统),控制单元9每次一个字节地检查所提供文本数据的字符代码,以确定是否有不包括于单字节编码系统中的代码(值)。
当不包含于单字节编码系统中的值被检测到时,文本数据使用由用户选择的编码系统来转换。更具体地说,文本数据使用由用户指定的解码方法来转换(解码)成显示信息(字符显示信息),显示信息发送到显示设备11,并且与显示信息对应的字符在显示设备11上显示。如果所有值包含于单字节编码系统中,文本数据根据由属性信息指示的编码系统的字符映射表来解码,显示数据被提供到显示设备11,并且与显示数据对应的字符在显示设备11的屏幕上显示。
如上所述,根据该实施方案的光盘再现设备通常使用Shift-JIS双字节编码系统显示日文文本。但是,当待转换成字符的文本数据的属性信息不指示Shift-JIF编码系统时,光盘再现设备使用由用户预先选择的编码系统的字符映射表来将文本数据转换成字符。这样,错乱字符的产生可以达到最小。
[设置字符编码系统的过程]
接下来,当由待处理文本数据的属性信息指示的字符编码系统不同于通常所应用的字符编码系统时用户指定在能够解码存储于符合CD文本标准的CD上的文本数据并将解码的字符信息显示在显示设备11的屏幕上的光盘再现设备中应用的字符编码系统的过程将在下面参考图5中所说明的流程图来描述。
图5中所说明的过程在光盘再现设备的控制单元9中执行,当例如指定基本设置(初始设置)如指定日历功能(设置当前时间和日期)和指定当由文本数据的属性信息指示的编码系统不同于通常所应用的编码系统时所应用的编码系统的预先确定操作被执行时。
首先,控制单元9基于存储于ROM中的显示信息在显示设备11的屏幕上显示菜单(步骤S101)并准备接收由用户从菜单中选择的、与待执行过程对应的项目的输入(步骤S102)。然后,控制单元9等待用户选择输入的项目(步骤S103)。当接收到输入时,控制单元9确定与指定编码系统的过程对应的菜单项是否已被选择(步骤S104)。
如果在步骤S104中控制单元9确定与指定编码系统的过程对应的菜单项已被选择,那么控制单元9接收被执行以指定编码系统的一系列操作的输入,例如选择编码系统、取消所选择的编码系统以及完成编码系统选择(步骤S105)。控制单元9确定取消所选编码系统的输入是否已接收到(步骤S106)。如果控制单元9确定取消还没有接收到,那么确定选定输入是否已完成(步骤S107)。
如果在步骤S107中控制单元9确定选定输入还没有完成,过程返回到步骤S105。如果在步骤S107中控制单元9确定所选编码系统已完成,在步骤S105中接收的、指示编码系统的信息被存储在根据该实施方案是EEPROM 10的控制单元9的非易失性存储器中(步骤S108)。然后,图5中所说明的过程完成。
如果在步骤S104中控制单元9确定所选菜单项不是与指定编码系统的过程对应的菜单项,与所选菜单项对应的过程将被执行(步骤S109)。然后,图5中所说明的过程完成。如果在步骤S106中控制单元9确定所选编码系统在选定编码系统的输入已接收之后所选编码系统已被取消。然后,图5中所示的过程完成。
因此,当由存储于光盘中的文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统时所应用的编码系统可以根据该实施方案由光盘再现设备的用户指定。
根据该实施方案,可以由用户选择的字符编码系统包括下面的字符编码系统:1)自动(自动设置);2)日文(Shift-JIF);3)韩文(KSX1001);4)在中国大陆使用的简体中文字符(GB18030);5)在台湾使用的繁体中文字符(Big5);6)英文(ISO8859-1或ASCII);和7)俄语(ISO8859-1)。
如果‘自动’被选择,编码系统自动设置成与光盘再现设备的目的地(即光盘再现设备所运往的国家)所使用语言对应的预先确定的编码系统。换句话说,指示当‘自动’被选择时所应用编码系统的信息例如存储在EEPROM 10中。当‘自动’被选择时,由存储于EEPROM 10中的信息指示的编码系统设置为当由文本数据的属性信息指示的编码系统不同于通常应用的编码系统时所应用的编码系统。
[在文本数据的解码过程中执行的处理]
接下来,在根据本发明的实施方案的光盘再现设备处执行的文本数据的解码过程将参考图6中所说明的流程图详细地描述。图6说明读出装载于光盘再现设备上的光盘中所存储的文本数据并解码该文本数据的过程的流程图。例如,该过程主要在控制单元9处执行,当光盘装载到光盘再现设备上或者当用户指示过程被执行时。
根据该实施方案的光盘再现设备主要制造来供日文中使用,并且Shift-JIS是通常应用于处理文本数据的字符编码系统。
当图6中所说明的过程在控制单元9处执行时,控制单元9经由光学拾信单元3、RF电路5和DSP 6从装载于光盘再现设备上的光盘1中读出文本数据(步骤S201)。然后,控制单元9参考包含于读出文本数据中的属性信息并确定文本数据的字符编码系统是已知的还是未知的(步骤S202)。
如果在步骤S202中控制单元9确定文本数据的字符编码系统是已知的,那么控制单元9确定编码系统是否为单字节编码系统(步骤S203)。确定编码系统是否为单字节编码系统等价于确定通常应用于光盘再现设备的编码系统是否为双字节编码系统。
如果在步骤S203中由包含于文本数据中的属性信息指示的编码系统不是单字节编码系统(即它是双字节编码系统),控制单元9确定文本数据基于通常应用于光盘再现设备的双字节编码系统,然后文本数据根据由读出文本数据的属性信息指示的字符编码系统(字符代码信息)转换(解码)成字符(步骤S204)。转换所获得的字符(显示数据)被发送到显示设备11,以便在显示设备11的屏幕上显示(步骤S208)。然后,在图6中所说明的过程完成。
如果在步骤S203中控制单元9确定由文本数据的属性信息指示的编码系统是单字节编码系统(即它不是双字节编码系统),控制单元9检查文本数据中不包含于单字节系统中的字符代码(步骤S205)。
在步骤S205中,控制单元9根据所应用的单字节编码系统的类型检查文本数据。更具体地说,下面所指示的值范围的字符不存在于下面的编码系统中:
ASCII(ISO646),128(80h)~255(FFh)
ISO8859-1,128(80h)~159(9Fh)
JISX0201,128(80h)~159(9Fh)以及224(E0h)~255(FFh)
如上所述,在步骤S205中控制单元9根据单字节编码系统的类型检查文本数据中不包含于编码系统中的字符代码。
基于步骤S205的检查结果,控制单元9确定不符合单字节编码系统的字符代码是否存在(步骤S206)。如果控制单元9确定这种不符合的字符代码存在,控制单元9进一步确定由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统。然后,文本数据基于由用户选择的并存储于EEPROM 10中的编码系统的字符映射表转换(解码)成字符,如图5中所说明(步骤S207)。由用户选择的编码系统是应用于处理基于与通常所应用双字节编码系统不同的编码系统的字符代码的编码系统。
由步骤S207中的解码过程获得的字符(显示数据)发送到显示设备11,以便在显示设备11的屏幕上显示(步骤S208)。然后,图6中所说明的过程完成。
如果在步骤S206中控制单元9确定待处理的文本数据字符代码不包括不存在于单字节编码系统中的字符代码,控制单元9确定由包含于待处理文本数据中的属性信息指示的编码系统匹配文本数据的字符代码的实际编码系统。然后,文本数据的字符代码基于由读出文本数据的属性信息(字符代码信息)指示的编码系统转换(解码)成字符(步骤S204)。转换所获得的字符(显示数据)发送到显示设备11以便在显示设备11的屏幕上显示(步骤S208)。然后,图6中所说明的过程完成。
如果在步骤S202中待处理文本数据的字符代码的编码系统被确定为未知,控制单元9确定文本数据的字符代码基于与通常所应用双字节编码系统不同的编码系统。然后。文本数据基于存储于EEPROM 10中的编码系统的字符映射表来解码,如图5中所说明的(步骤S207)。
随后,由步骤S207的解码过程获得的字符(显示数据)发送到显示设备11,以便在显示设备11的屏幕上显示(步骤S208)。然后,图6中所说明的过程完成。
如上所述,当待处理文本数据的编码因属性信息丢失而未知时或者当文本数据的字符代码的实际编码系统不匹配由属性信息指示的、不是光盘再现设备通常所使用的双字节编码系统的单字节编码系统时,根据该实施方案的光盘再现设备能够使用预先指定的编码系统的字符映射表来解码文本数据的字符代码。
这样,即使当由待处理文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统时,错乱字符的产生可以达到最少并且文本数据正确地转换成字符并呈现给用户。
如上所述,根据用户所指定编码系统的文本数据的解码仅当在文本数据在图6中所示的步骤S205中检查时不存在于单字节代码中的值(字符代码)被检测到时执行。如上面所列出的,可以由用户选择的编码系统(解码方法)是:1)自动(自动设置);2)日文(Shift-JIS);3)韩文(KSX1001);4)在中国大陆使用的简体中文(GB18030);5)在台湾使用的繁体中文(Big5);6)英文(ISO8859-1或ASCII);以及7)俄文(ISO8859-1)。
光盘再现设备可以包括可由用户选择的全部字符编码系统或者可以取决于目的地而包括有限数目的字符编码系统。在这里,“包括编码系统”意思是“包括转换所需的字符映射表和处理程序”。
在上面,光盘再现设备主要制造来供日文中使用,因此Shift-JIS设置为通常应用于转换文本数据的编码系统。但是,根据本发明的光盘再现设备不是限制性的,因此单字节编码系统如ISO8859-1可以设置为通常所应用的编码系统。
如果单字节编码系统设置为通常所应用的编码系统,图6中所示的过程的步骤S203被改变,使得控制单元9确定待处理文本数据的属性信息是否指示双字节编码系统。然后,在步骤S206中控制单元9确定在双字节编码系统中不使用的字符代码是否包含于文本数据中。
[文本数据的另一种解码过程]
接下来,由根据本发明的实施方案的光盘再现设备执行的文本数据的另一种解码过程将参考图7中所说明的流程图来描述。上面参考图6而描述的文本数据的解码过程用于当Shift-JIS双字节编码系统设置为光盘再现设备的通常所应用编码系统时解码文本数据。
但是,在大多数情况下,当由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统时,由属性信息指示的编码系统已由用于欧洲语言的ISO8859-1改写。
由于这个缘故,图7中所说明的文本数据的解码过程当通常应用于解码文本数据的编码系统不同于ISO8859-1并且由文本数据的属性信息指示的编码系统是ISO8859-1时以及当很可能出现由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统时在光盘再现设备中执行。
类似于图6中所说明的过程,图7中所说明的过程当光盘被装载时或者当由用于指示时主要在控制单元9中执行。当图7中所说明的过程在控制单元9中执行时,控制单元9经由光学拾信单元3、RF电路5和DSP 6从装载于光盘再现设备上的光盘1中读出文本数据(步骤S301)。然后,控制单元9参考包含于读出文本数据中的属性信息并确定文本数据的字符代码的编码系统是已知的还是未知的(步骤S302)。
如果在步骤S302中控制单元9确定待处理文本数据的字符代码的编码系统是已知的,控制单元9进一步确定编码系统是否为ISO8859-1(步骤S303)。有两个原因在步骤S303中确定由文本数据的属性信息指示的编码系统是否为ISO8859-1。
第一个原因是在根据该实施方案的光盘再现设备中通常应用于解码文本数据的编码系统是不同于ISO8859-1的编码系统,因此确定由文本数据的属性信息指示的编码系统是否为ISO8859-1等价于确定由属性信息指示的编码系统是否为不同于ISO8859-1的编码系统。
第二个原因是,如上所述,如果由文本数据的属性信息指示的编码系统是ISO8859-1,有很高的可能性由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统。
如果在步骤S303中控制单元9确定待处理文本数据的属性信息不指示ISO8859-1,由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统的可能性低。因此,文本数据的字符代码基于文本数据的属性信息(字符代码信息)转换(解码)成字符(步骤S304)。然后,转换所获得的字符(显示数据)发送到显示设备11以便在显示设备11的屏幕上显示(步骤S306)。然后,图7中所说明的过程完成。
如果在步骤S302中控制单元9确定待处理文本数据的字符代码的编码系统是未知的,并且在步骤S303中确定待处理文本数据的属性信息指示ISO8859-1,有很高可能性是由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统。因此,在这种情况下,存储于EEPROM 10中的编码系统的字符映射表根据图5中所说明的过程应用于将字符代码转换(解码)成字符。编码系统是与解码过程中通常应用的字符编码系统不同的字符编码系统并且由用户指定(步骤S305)。
由步骤S305中的解码过程获得的字符(显示数据)发送到显示设备11,以便在显示设备11的屏幕上显示(步骤S306)。然后,图7中所说明的处理完成。
如上所述,根据图7中所说明的文本数据的解码过程,当通常应用于字符代码的编码系统是不同于ISO8859-1的编码系统时,通过检查何时很可能出现由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统,文本数据可以高度可靠地解码。
如果在图7中所说明的过程的步骤S303中控制单元9确定由文本数据的属性信息指示的编码系统是ISO8859-1,那么控制单元9进一步检查文本数据的字符代码是否包括ISO8859-1中使用的字符代码。如果这种字符代码不被包括,字符代码可以基于在步骤S304中获得的属性信息(字符代码信息)来解码,反之,如果这种字符代码被包括,文本数据可以基于在步骤S305中存储于EEPROM 10中的编码系统来解码。
图6说明通常所应用的编码系统是不同于ISO8859-1的编码系统的情况。但是,对于通常所应用编码系统是不同于Shift-JIS或JISX0201的编码系统的情况,图6中所说明的过程也可以执行。在这种情况下,在图7中的步骤S303,控制单元9分别确定文本数据的属性信息是Shift-JIS还是JISX0201。
如上所述,当执行将文本数据转换成字符的解码过程时,通过基于当由文本数据的属性信息指示的编码系统是与通常所应用编码系统不同的编码系统时所选择应用的编码系统执行解码过程,文本数据可以高度可靠地解码并且错乱字符的产生可以防止。
在根据上述实施方案的光盘再现设备中,接收装置的功能由键操作单元12实现,存储装置的功能由EEPROM 10实现,并且确定装置、转换装置和检测装置的功能由控制单元9实现。
本发明的实施方案也可以通过制作与图5,6和7中说明的流程图对应的程序、将该程序存储于控制单元9的ROM和EEPROM 10中,以及当需要时执行该程序来实现。
在上面的描述中,根据本发明的实施方案的光盘再现设备是符合CD文本标准的CD再现设备。但是,光盘再现设备可以包括各种类型的再现设备,以及能够解码存储于存储媒介如使用MD作为存储媒介的Mini DiscTM(MD)中的文本数据并输出解码后数据的记录和再现设备。换句话说,本发明的实施方案可以在任何类型的电子设备中使用,以便解码包括属性信息和字符代码的各种字符代码。
本领域技术人员应当理解,各种修改、组合、子组合及更改可以在附加权利要求或其等价物的范围内取决于设计需求和其他因素而发生。

Claims (9)

1.一种字符信息转换设备,用于处理包括指示编码系统的属性信息和符合该编码系统的字符代码的字符信息,并且用于将字符代码转换成输出字符,该设备包括:
接收装置,用于接收指定当解码符合与通常所应用编码系统不同的编码系统的字符代码时所应用编码系统的输入;
存储装置,用于存储指示对应于通过接收装置接收的输入的编码系统的信息;
确定装置,用于通过参考待转换字符信息的属性信息确定字符信息的字符代码符合哪个编码系统;以及
转换装置,用于当确定装置不能确定编码系统时或者当确定装置确定通过参考属性信息确定的编码系统不同于通常所应用的编码系统时,基于存储于存储装置中的信息将字符代码转换成字符。
2.根据权利要求1的字符信息转换设备,还包括:
检测装置,用于当确定装置确定由属性信息指示的编码系统不同于通常所应用的编码系统时,检测包含于字符信息中的字符代码是否包括不包含于与通常所应用编码系统不同的编码系统中的字符代码,以及
其中,当确定装置确定由属性信息指示的编码系统不同于通常所应用的编码系统时以及当检测装置检测到字符信息包括不包含于与通常所应用编码系统不同的编码系统中的字符代码时,转换装置基于存储于存储装置中的信息将字符代码转换成字符。
3.根据权利要求1和2中的一个的字符信息转换设备,其中通常所应用的编码系统是双字节编码系统而与通常所应用编码系统不同的编码系统是单字节编码系统。
4.根据权利要求1和2中的一个的字符信息转换设备,其中通常所应用的编码系统是单字节编码系统而与通常所应用编码系统不同的编码系统是双字节编码系统。
5.一种用于处理包括指示编码系统的属性信息和符合该编码系统的字符代码的字符信息并将字符代码转换成输出字符的方法,该方法包括步骤:
通过接收指定当解码符合与通常所应用编码系统不同的编码系统的字符代码时所应用编码系统的输入,存储指示与所接收输入对应的编码系统的信息;
参考待转换字符信息的属性信息确定字符信息的字符代码符合哪个编码系统;以及
当编码系统不能在确定步骤中确定时或者当在确定步骤中确定由属性信息指示的编码系统不同于通常所应用的编码系统时,基于存储于存储装置中的信息将字符代码转换成字符。
6.根据权利要求5的方法,还包括步骤:
当在确定步骤中确定属性信息中指示的编码系统不同于通常所应用的编码系统时,检测包含于字符信息中的字符代码是否包括不包含于与通常所应用编码系统不同的编码系统中的字符代码,
其中,当在确定步骤中确定由属性信息指示的编码系统不同于通常所应用的编码系统时以及当在检测步骤中检测到包含于字符信息中的字符代码包括不包含于与通常所应用编码系统不同的编码系统中的字符代码时,字符代码在转换步骤中基于存储于存储装置中的信息转换成字符。
7.根据权利要求5和6中的一个的方法,其中通常所应用的编码系统是双字节编码系统而与通常所应用编码系统不同的编码系统是单字节编码系统。
8.根据权利要求5和6中的一个的方法,其中通常所应用的编码系统是单字节编码系统而与通常所应用编码系统不同的编码系统是双字节编码系统。
9.一种字符信息转换设备,用于处理包括指示编码系统的属性信息和符合该编码系统的字符代码的字符信息,并且用于将字符代码转换成输出字符,该设备包括:
接收单元,用于接收指定当解码符合与通常所应用编码系统不同的编码系统的字符代码时所应用的编码系统的输入;
存储单元,用于存储指示对应于通过接收单元接收的输入的编码系统的信息;
确定单元,用于通过参考待转换字符信息的属性信息确定字符信息的字符代码符合哪个编码系统;以及
转换单元,用于当确定单元不能确定编码系统时或者当确定单元确定通过参考属性信息确定的编码系统不同于通常所应用的编码系统时,基于存储于存储单元中的信息将字符代码转换成字符。
CNB2005100846054A 2004-07-15 2005-07-15 字符信息转换设备及转换字符信息的方法 Expired - Fee Related CN100375994C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004208029 2004-07-15
JP2004208029A JP4072691B2 (ja) 2004-07-15 2004-07-15 文字情報変換装置および文字情報変換方法

Publications (2)

Publication Number Publication Date
CN1722221A true CN1722221A (zh) 2006-01-18
CN100375994C CN100375994C (zh) 2008-03-19

Family

ID=35897585

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100846054A Expired - Fee Related CN100375994C (zh) 2004-07-15 2005-07-15 字符信息转换设备及转换字符信息的方法

Country Status (3)

Country Link
US (1) US7274314B2 (zh)
JP (1) JP4072691B2 (zh)
CN (1) CN100375994C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105282554A (zh) * 2014-07-07 2016-01-27 富士通株式会社 解码方法及解码装置
CN106663020A (zh) * 2014-08-29 2017-05-10 日立公共系统有限公司 迁移支持装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5391583B2 (ja) * 2008-05-29 2014-01-15 富士通株式会社 検索装置、生成装置、プログラム、検索方法および生成方法
JP4427597B1 (ja) * 2008-09-30 2010-03-10 株式会社東芝 デジタルテレビジョン放送受信装置
JP5446852B2 (ja) * 2009-12-25 2014-03-19 コニカミノルタ株式会社 印刷処理装置、印刷処理プログラム、および印刷処理方法
US9513978B2 (en) 2014-10-17 2016-12-06 International Business Machines Corporation Integrated support for application porting transparency and streamlined system migration in heterogeneous platform environments

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2918632B2 (ja) * 1990-06-11 1999-07-12 キヤノン株式会社 文字処理方法及び装置
JPH052576A (ja) 1991-06-24 1993-01-08 Fujitsu Ltd コード種別判定方法
JP3496965B2 (ja) * 1993-12-20 2004-02-16 富士通株式会社 文字コード変換装置
JPH07271777A (ja) * 1994-03-31 1995-10-20 Fujitsu Ltd 分散情報処理システムにおける文字コード管理方式
JPH11149284A (ja) * 1997-11-18 1999-06-02 Sharp Corp 文字パターン生成装置及び文字パターン生成装置制御プログラムを記憶した媒体
US6204782B1 (en) * 1998-09-25 2001-03-20 Apple Computer, Inc. Unicode conversion into multiple encodings
JP3917343B2 (ja) * 2000-02-25 2007-05-23 株式会社東芝 マルチプラットフォーム環境における文字コード変換方式および文字コード変換プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002041402A (ja) 2000-07-26 2002-02-08 Canon Inc 情報処理方法及び情報処理装置並びに記憶媒体
US7002581B2 (en) * 2000-12-19 2006-02-21 Fujitsu Limited Character information processing apparatus, character information processing method and storage medium
JP3793093B2 (ja) 2002-01-21 2006-07-05 アルパイン株式会社 ディスクプレーヤ及びその記録内容情報表示方法
US6701320B1 (en) * 2002-04-24 2004-03-02 Bmc Software, Inc. System and method for determining a character encoding scheme
JP3789394B2 (ja) * 2002-06-06 2006-06-21 エヌイーシーシステムテクノロジー株式会社 文字データ生成装置及びその方法並びにプログラム
JP2004106255A (ja) 2002-09-17 2004-04-08 Ricoh Co Ltd 画像形成装置
JP2004127363A (ja) 2002-09-30 2004-04-22 Denon Ltd 情報記録媒体及び情報記録媒体再生装置
JP4308676B2 (ja) * 2003-01-24 2009-08-05 株式会社リコー 文字列処理装置,文字列処理方法および画像形成装置
US7215264B2 (en) * 2005-09-30 2007-05-08 Pixtel Media Technology (P)Ltd. Methods and systems for character conversion

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105282554A (zh) * 2014-07-07 2016-01-27 富士通株式会社 解码方法及解码装置
CN105282554B (zh) * 2014-07-07 2019-01-15 富士通株式会社 解码方法及解码装置
CN106663020A (zh) * 2014-08-29 2017-05-10 日立公共系统有限公司 迁移支持装置
CN106663020B (zh) * 2014-08-29 2020-05-01 日立社会信息服务有限公司 迁移支持装置

Also Published As

Publication number Publication date
US20060050977A1 (en) 2006-03-09
JP4072691B2 (ja) 2008-04-09
JP2006031303A (ja) 2006-02-02
US7274314B2 (en) 2007-09-25
CN100375994C (zh) 2008-03-19

Similar Documents

Publication Publication Date Title
CN2622777Y (zh) 电子音乐装置
CN1127729C (zh) 自动指定与用户对应的语言的再现装置及其方法
CN1722221A (zh) 字符信息转换设备及转换字符信息的方法
MXPA04002235A (es) Metodo y aparato para crear una lista de reproduccion con indice en un reproductor de datos de audio.
CN1873811A (zh) 数据记录和/或再现装置及方法、数据传输系统及方法
CN1237765A (zh) 记录媒体、记录设备和再生设备
CN1825461A (zh) 文件管理设备和方法、及其程序、和记录介质
CN1287665A (zh) 版权保护系统中的数据转换装置和方法
CN1862489A (zh) 实现应用程序本地化规则的创作
CN101044574A (zh) 注释时间线文件的方法
CN1447939A (zh) 文件管理方法
CN1131311A (zh) 多分区光盘的大规模生产
CN1685419A (zh) 数据记录介质、数据记录方法、数据处理设备、数据发送方法和数据发送设备、数据传输方法和数据传输设备,以及数据发送系统和数据通信系统
US7239585B2 (en) Information recording apparatus and method, information reproducing apparatus and method, information recording program and information reproducing program, recording medium and information recording medium
CN1339799A (zh) 记录和/或再现方法和设备
CN1680900A (zh) 许可创建装置、许可创建方法和计算机程序
CN1728263A (zh) 内容记录介质,获得重放许可信息的方法,内容重放方法和装置
CN1265385C (zh) 记录方法
CN1107954C (zh) 用于再生录制在录音媒体上的字符信息的装置和方法
JP2007249155A (ja) メディアファイル管理方法及びメディア再生装置
CN1726558A (zh) 用于在数字音频播放器中标记和显示歌曲的方法
CN1158655C (zh) 再现方法
CN1653545A (zh) 记录方法、记录装置和记录介质
CN1476565A (zh) 信息处理系统、信息处理装置和信息处理方法
KR20050114410A (ko) 미디어 파일 이동 방법, 장치 및 그 방법을 수행하기 위한 프로그램이 저장된 저장매체

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080319