CN100375994C - 字符信息转换设备及转换字符信息的方法 - Google Patents
字符信息转换设备及转换字符信息的方法 Download PDFInfo
- Publication number
- CN100375994C CN100375994C CNB2005100846054A CN200510084605A CN100375994C CN 100375994 C CN100375994 C CN 100375994C CN B2005100846054 A CNB2005100846054 A CN B2005100846054A CN 200510084605 A CN200510084605 A CN 200510084605A CN 100375994 C CN100375994 C CN 100375994C
- Authority
- CN
- China
- Prior art keywords
- coded system
- character
- information
- character code
- different
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Controls And Circuits For Display Device (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开一种字符信息转换设备,用于处理包括指示编码系统的属性信息和符合该编码系统的字符代码的字符信息,并且用于将字符代码转换成字符。该设备包括键操作单元、EEPROM以及控制单元。键操作单元指定应用于解码符合与通常所应用编码系统不同的编码系统的字符代码的编码系统。EEPROM存储指示与所接收输入对应的编码系统的信息。控制单元参考属性信息并确定字符代码符合哪个编码系统,当不能确定编码系统时或者当确定编码系统不同于通常所应用的编码系统时,基于存储在EEPRM中的信息将字符代码转换成字符。
Description
相关申请的交叉引用
本发明包含与2004年7月15日在日本专利局提交的日本专利申请JP2004-208029相关的主题,其全部内容在此引用作为参考。
技术领域
本发明涉及一种将由各种不同编码系统如Shift-JIS编码系统或ISO8859-1编码系统表示的文本数据(字符信息)转换成输出字符的设备及方法。
背景技术
个人计算机和各种其他电子设备被用来处理文本数据。一般地,文本数据基于两种编码系统:双字节编码系统,其中一个字符由两个字节(16位)数据表示;以及单字节编码系统,其中一个字符由一个字节(八位)数据表示。
例如,当在个人计算机的硬盘中创建地址数据库时,在某些情况下,或者单字节数据或者双字节数据可以用于输入关于项目如“名字”和“家庭地址”的数据。当单字节文本数据和双字节文本数据两者都存在时,必须确定对项目输入的文本数据是单字节文本数据还是双字节文本数据,以便检查文本数据的有效性并将文本数据转换成字符。
日本未经审查专利申请公开04-150112号公开一种确定与项目对应的文本数据是单字节文本数据还是双字节文本数据并适当地检查与项目对应的文本数据的技术。通过使用在该文献中描述的技术,与待处理项目对应的文本数据是单字节文本数据还是双字节文本数据被正确地确定,并且即使当单字节文本数据和双字节文本数据两者都存在时也适当地处理。
文本数据一般地包括指示编码系统的属性信息和与字符对应的字符代码。通过查阅属性信息,文本数据的编码系统可以被确定。这样,编码系统的适当处理可以被执行。
但是,在个别情况下,由属性信息指示的编码系统与字符代码的编码系统不同。例如,存在称为CD文本的光盘(CD)标准。通过遵照该标准,关于CD的附加信息如标题、艺术家名字、词作者名字,作曲者名字,编曲者名字,以及其他信息可以作为文本数据(字符信息)记录在包含于CD的读入区轨道中的子代码的R到W通道。
当音乐数据以及与记录于CD上的音乐数据对应并符合CD文本标准的文本数据拷贝为一组供个人使用时,依赖于所使用的应用程序,包含于文本数据中的字符代码可以直接拷贝,然而指示字符代码的编码系统的属性信息可能自动改变成由应用程序主要使用的编码系统如双字节编码系统。
如果这种改变当所复制的字符代码是基于单字节编码系统时发生,由属性信息指示的编码系统将不同于字符代码的实际编码系统。结果,正确并快速地检查字符代码以及将字符代码转换(解码)成字符将变得困难。
符合MP3标准的音频数据文件(MPEG-1 Audio Layer-3(MP3))文件可以通过网络如因特网购买。在MP3文件的情况下,称为ID3标签的格式用来将文本数据(字符信息)如音乐的标题、作曲者的名字以及音乐的流派添加到文件中。但是,称为MP3的版本1 ID3标签的标准不包括指示字符代码的编码系统的属性信息。
由于这个缘故,使用版本1 ID3标签添加到MP3文件的文本数据的编码系统是不知道的。因此,正确并快速地检查字符代码以及将字符代码转换(解码)成字符变得困难。
发明内容
考虑到上述问题,根据本发明的实施方案的设备及方法即使当由属性信息指示的编码系统不同于字符代码的实际编码系统时也可以根据编码系统正确地转换包含属性信息和字符代码的文本数据的字符代码。
一种根据本发明的实施方案的字符信息转换设备包括接收装置、存储装置、确定装置,以及转换装置。该字符信息转换设备用于处理包括指示编码系统的属性信息和符合该编码系统的字符代码的字符信息以及用于将字符代码转换成字符。接收装置用于接收指定当解码符合与通常所应用编码系统不同的编码系统的字符代码时所应用编码系统的输入。存储装置被配置以存储指示对应于通过接收装置接收的输入的编码系统的信息。确定装置被配置以参考待转换字符信息的属性信息并确定字符信息的字符代码符合哪个编码系统。转换装置被配置以当确定装置不能确定编码系统时或者当确定装置确定通过参考属性信息确定的编码系统不同于通常所应用的编码系统时,基于存储于存储装置中的信息将字符代码转换成字符。
根据依照本发明的实施方案的字符信息转换设备,指示当解码基于与通常所使用编码系统不同的编码系统的字符代码时所使用的编码系统的信息经由接收装置存储于存储装置中。当确定装置确定待转换字符信息的字符代码的编码系统是不知道的或者不同于通常所使用的编码系统时,转换装置基于存储于存储装置中指示编码系统的信息将字符信息的字符代码转换成字符。
这样,即使当字符代码的编码系统是不知道的或者不同于通常所使用的编码系统时,字符代码可以基于由用户选择的并预先存储的编码系统来处理。因此,指示字符信息的属性信息的编码系统不同于字符代码的实际编码系统的情况被检测以防止错乱字符的产生。
在根据本发明的实施方案的字符信息转换设备中,当确定装置确定由属性信息指示的编码系统不同于通常所应用的编码系统时,检测装置检测包含于字符信息中的字符代码是否包括不包含于与通常所使用编码系统不同的编码系统中的字符代码,并且当确定装置确定由属性信息指示的编码系统不同于通常所使用的编码系统时或者当检测装置检测到字符信息包括不包含于与通常所应用编码系统不同的编码系统中的字符代码时,转换装置基于存储于存储装置中的信息将字符代码转换成字符。
这样,当确定装置确定指示待转换字符信息的编码系统的属性信息不同于通常所使用的编码系统时,检测装置检测待转换字符信息的字符代码是否包括不使用的字符代码。如果这种字符代码被检测到,转换装置基于存储于存储装置中的指示编码系统的信息来转换字符信息的字符代码。
因此,由字符信息的属性信息指示的编码系统可靠地检测到指示字符信息的属性信息的编码系统不同于字符代码的实际编码系统的情况,以防止错乱字符的产生,从而字符信息被正确地解码。
在根据本发明的实施方案的字符信息转换设备中,通常所应用的编码系统是双字节编码系统,而与通常所应用的编码系统不同的编码系统是单字节编码系统。
这样,当待转换字符信息的字符代码的编码系统不是作为通常所使用编码系统的双字节编码系统时,单字节编码系统可以使用。而且,即使当字符代码基于单字节编码系统时,字符代码可以正确地转换。
在根据本发明的实施方案的字符信息转换设备中,通常所应用的编码系统是单字节编码系统,而与通常所应用的编码系统不同的编码系统是双字节编码系统。
这样,当待转换字符信息的字符代码的编码系统不是作为通常所使用编码系统的单字节编码系统时,双字节编码系统可以使用。而且,即使当字符代码基于双字节编码系统时,字符代码可以正确地转换。
由包含于字符信息(文本数据)中的属性信息指示的字符编码系统以及与属性信息对应的字符代码被错误地记录,错乱字符的产生可以被防止。
附图说明
图1是根据本发明的实施方案的光盘再现设备的框图;
图2说明Shift-JIS的字符映射表;
图3说明ISO8859-1的字符映射表;
图4说明所谓的‘错乱字符’的实例;
图5是说明指定编码系统的过程的流程图;
图6是说明文本数据的解码过程的流程图;以及
图7是说明文本数据的另一种解码过程的流程图。
具体实施方式
根据本发明的实施方案的设备及方法将在下面参考附图而描述。作为根据本发明的实施方案的设备,能够再现记录于CD上符合CD文本标准的数据的再现设备(CD播放机)将在下面描述。
[光盘再现设备的概述]
图1是光盘再现设备的框图。如图1中所示,CD即光盘1装载于光盘再现设备上。
图1中所示的光盘再现装置包括主轴马达2、光学拾信单元3、驱动器4、射频(RF)电路5、数字信号处理器(DSP)6、动态随机存取存储器(DRAM)7、数字/模拟(D/A)转换器8、控制单元9、电可擦除可编程只读存储器(EEPROM)10、显示设备11,以及键操作单元12。
主轴马达2旋转光盘1.光学拾信单元3将用作再现功率的激光束发射到光盘上并通过接收反射光束读出存储于光盘中的数据。更具体地,虽然没有在图中显示,光学拾信单元3包括作为发射到光盘上的激光束的来源的激光二极管、物镜、用于接收光盘处反射的激光束的光探测器如光电探测器、构成双轴启动器的聚焦线圈、跟踪线圈,以及在光盘的径向上移动光学拾信单元3的步进马达。
驱动器4根据从DSP6发送的伺服控制信号或从控制单元9发送的驱动控制信号产生驱动信号,如下所述,并将驱动信号发送到主轴马达2、光学拾信单元3的激光二极管、步进马达、聚焦线圈以及跟踪线圈以驱动这些单元。
RF电路5响应于从光盘反射的激光束基于来自光学拾信单元3的电信号产生再现信号(拉入信号)、聚焦错误信号FE、跟踪错误信号TE并将这些产生信号提供到DSP6。
DSP6响应于聚焦错误信号FE和跟踪错误信号TE产生待提供给驱动器4的伺服控制信号。然后,通过提供伺服控制信号到驱动器4或者通过解码来自RF电路5的再现信号,DSP6产生待提供给D/A转换器8的再现信号(再现音频信号)。然后,在DSP6处产生的再现信号提供到D/A转换器8。
换句话说,DSP6通过响应于发自RF电路5的再现信号上所执行的调制执行解调来执行CD信号处理以产生输出音频信号并响应于聚焦错误信号FE和跟踪错误信号TE执行伺服控制处理以产生待提供到驱动器4的伺服控制信号。DRAM7是再现过程中用于存储待处理数据的临时存储器。
D/A转换器8接收来自DSP6的再现音频信号,将该数字信号转换成模拟音频信号,并且经由放大器将该模拟信号提供到扬声器。这样,从光盘1中读出的与再现音频对应的音频通过扬声器再现。
控制单元9是经由总线连接到图中没有显示的中央处理单元(CPU)、ROM及RAM的微型机算计。控制单元9控制光盘再现设备的每个单元。如图1中所示,作为非易失性存储器的EEPROM 10、显示设备11及键操作单元12连接到控制单元9。响应于通过键操作单元12的用户输入的操作,控制单元9执行单元的各种控制,例如‘播放’、‘快进’、‘快倒’、‘暂停’,以及‘停止’。
EEPROM10存储各种类型的信息,即使在光盘再现设备的电源被关闭之后。EEPROM10存储各种设置参数。根据该实施方案的显示设备11是液晶显示器(LCD)并在控制单元9的控制下显示信息如条件信息和警报信息。
当控制单元9通过键操作单元12接收来自用户的再现命令时,控制单元9控制驱动器4驱动主轴马达2和光学拾信单元3。在这种情况下,激光由再现功率照射,光学拾信单元3移动到由用户指定用以再现的地址,并且记录于光盘中的数据被读出。读出数据从RF电路5经由DSP6 临时发送到DRAM7。然后,数据从DSP6中按顺序读出并经由D/A转换器8提供到扬声器以再现。
如上所述,根据该实施方案的光盘再现设备读出记录于光盘1的读入区中的文本数据,根据该实施方案光盘是符合CD文本标准的CD。然后,与读出文本数据对应的字符信息显示在显示设备11的屏幕上。
经由光学拾信单元3从光盘1的读入区中读出的文本数据经由RF电路5和DSP6提供到控制单元9。文本数据在控制单元9处被转换(解码)成供显示的字符信息并提供到显示设备11。与文本数据的字符代码对应的字符显示在显示设备11的屏幕上。
[错乱字符的产生]
如上所述,经由光学拾信单元3从光盘1的读入区中读出的文本数据经由RF电路5和DSP6提供到控制单元9。文本数据在控制单元9处被转换(解码)成供显示的字符数据并提供到显示设备11。在该过程之前,根据该实施方案的光盘再现设备在控制单元9处执行检验。
如上所述,文本数据包括属性信息和字符代码。属性信息指示字符代码的编码系统。在个别情况下,由属性信息指示的编码系统可能不同于字符代码的实际编码系统,导致错乱字符的产生。由于这个缘故,在根据该实施方案的光盘再现设备中,文本数据在解码并转换成字符信息之前被检验。
错乱字符的产生的示范过程将在下面详细描述。图2说明Shift-JIS的字符映射表(字符转换表),它是双字节字符编码系统。图3说明ISO8859-1的字符映射表(字符转换表),它是单字节字符编码系统。
因为Shift-JIS是双字节字符编码系统,一个字符由两个字节数据表示:一个字节(8位)数据(即高阶字节数据)包括4位高阶数据(Oh~Fh)和4位低阶数据(Oh~Fh),如图2A中所示,以及一个字节(8位)数据(即低阶字节数据)包括4位高阶数据(Oh~Fh)和4位低阶数据(Oh~Fh),如图2B中所示。
因为ISO8859-1是单字节字符编码系统,一个字符由包括4位高阶数据(Oh~Fh)和4位低阶数据(Oh~Fh)的1字节(8位)数据表示,如图3中所示。和数字或大写字母表字母A~F一起出现的字符‘h’如‘Oh’和‘Fh’指示位于字符‘h’前面的字符代表十六进制数(这种十六进制表示将在本文献各处使用)。
因为许多日语汉字字符在日文中使用,Shift-JIS经常使用。对于英语和其他欧洲语言,ISO8859-1经常使用。
图4说明根据Shift-J-IS和ISO8859-1的字符表示中的差异。使用Shift-JIS双字节编码系统, 日文汉字字符‘会社’表示为‘89EF8ED0’,如图4中所示。在该情况下,两个字节数据‘89EF’代表日文汉字字符‘会’,而两个字节数据‘8ED0’代表日文汉字字符‘社’。
因此,当字符代码‘89EF8ED0’使用Shift-JIS双字节编码系统来转换成字符时,字符代码正确地转换成日文汉字字符‘会社’。但是,如果字符代码‘89EF8ED0’基于单字节编码系统ISO8859-1的字符映射表而转换时,字符代码‘89’和‘8E’将不被转换,因为没有与字符代码‘89’和‘8E’对应的字符,如图4中所示,而字符代码‘EF’和‘D0’对应于不熟悉的字符。
因此,当由包含于文本数据中的属性信息指示的编码系统不同于字符代码的实际字符编码系统时,错乱字符将产生。结果,用户将不能够获得重要信息如艺术家的名字及标题。因此,如上所述,在文本数据转换成字符并在显示设备11的屏幕上显示之前,在控制单元9处执行检验。
当待转换文本数据通过检查文本数据的属性信息被确定基于双字节编码系统时,根据该实施方案的光盘再现设备使用双字节编码系统的字符映射表来执行字符转换。如果文本数据的属性信息指示文本数据包括单字节字符代码(基于单字节编码系统),控制单元9每次一个字节地检查所提供文本数据的字符代码,以确定是否有不包括于单字节编码系统中的代码(值)。
当不包含于单字节编码系统中的值被检测到时,文本数据使用由用户选择的编码系统来转换。更具体地说,文本数据使用由用户指定的解码方法来转换(解码)成显示信息(字符显示信息),显示信息发送到显示设备11,并且与显示信息对应的字符在显示设备11上显示。如果所有值包含于单字节编码系统中,文本数据根据由属性信息指示的编码系统的字符映射表来解码,显示数据被提供到显示设备11,并且与显示数据对应的字符在显示设备11的屏幕上显示。
如上所述,根据该实施方案的光盘再现设备通常使用Shift-JIS双字节编码系统显示日文文本。但是,当待转换成字符的文本数据的属性信息不指示Shift-JIF编码系统时,光盘再现设备使用由用户预先选择的编码系统的字符映射表来将文本数据转换成字符。这样,错乱字符的产生可以达到最小。
[设置字符编码系统的过程]
接下来,当由待处理文本数据的属性信息指示的字符编码系统不同于通常所应用的字符编码系统时用户指定在能够解码存储于符合CD文本标准的CD上的文本数据并将解码的字符信息显示在显示设备11的屏幕上的光盘再现设备中应用的字符编码系统的过程将在下面参考图5中所说明的流程图来描述。
图5中所说明的过程在光盘再现设备的控制单元9中执行,当例如指定基本设置(初始设置)如指定日历功能(设置当前时间和日期)和指定当由文本数据的属性信息指示的编码系统不同于通常所应用的编码系统时所应用的编码系统的预先确定操作被执行时。
首先,控制单元9基于存储于ROM中的显示信息在显示设备11的屏幕上显示菜单(步骤S101)并准备接收由用户从菜单中选择的、与待执行过程对应的项目的输入(步骤S102)。然后,控制单元9等待用户选择输入的项目(步骤S103)。当接收到输入时,控制单元9确定与指定编码系统的过程对应的菜单项是否已被选择(步骤S104)。
如果在步骤S104中控制单元9确定与指定编码系统的过程对应的菜单项已被选择,那么控制单元9接收被执行以指定编码系统的一系列操作的输入,例如选择编码系统、取消所选择的编码系统以及完成编码系统选择(步骤S105)。控制单元9确定取消所选编码系统的输入是否已接收到(步骤S106)。如果控制单元9确定取消还没有接收到,那么确定选定输入是否已完成(步骤S107)。
如果在步骤S107中控制单元9确定选定输入还没有完成,过程返回到步骤S105。如果在步骤S107中控制单元9确定所选编码系统已完成,在步骤S105中接收的、指示编码系统的信息被存储在根据该实施方案是EEPROM10的控制单元9的非易失性存储器中(步骤S108)。然后,图5中所说明的过程完成。
如果在步骤S104中控制单元9确定所选菜单项不是与指定编码系统的过程对应的菜单项,与所选菜单项对应的过程将被执行(步骤S109)。然后,图5中所说明的过程完成。如果在步骤S106中控制单元9确定所选编码系统在选定编码系统的输入已接收之后所选编码系统已被取消。然后,图5中所示的过程b完成。
因此,当由存储于光盘中的文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统时所应用的编码系统可以根据该实施方案由光盘再现设备的用户指定。
根据该实施方案,可以由用户选择的字符编码系统包括下面的字符编码系统:1)自动(自动设置);2)日文(Shift-JIF);3)韩文(KSX1001);4)在中国大陆使用的简体中文字符(GB18030);5)在台湾使用的繁体中文字符(Big5);6)英文(ISO8859-1或ASCII);和7)俄语(ISO8859-1)。
如果‘自动’被选择,编码系统自动设置成与光盘再现设备的目的地(即光盘再现设备所运往的国家)所使用语言对应的预先确定的编码系统。换句话说,指示当‘自动’被选择时所应用编码系统的信息例如存储在EEPROM10中。当‘自动’被选择时,由存储于EEPROM10中的信息指示的编码系统设置为当由文本数据的属性信息指示的编码系统不同于通常应用的编码系统时所应用的编码系统。
[在文本数据的解码过程中执行的处理]
接下来,在根据本发明的实施方案的光盘再现设备处执行的文本数据的解码过程将参考图6中所说明的流程图详细地描述。图6说明读出装载于光盘再现设备上的光盘中所存储的文本数据并解码该文本数据的过程的流程图。例如,该过程主要在控制单元9处执行,当光盘装载到光盘再现设备上或者当用户指示过程被执行时。
根据该实施方案的光盘再现设备主要制造来供日文中使用,并且Shift-JIS是通常应用于处理文本数据的字符编码系统。
当图6中所说明的过程在控制单元9处执行时,控制单元9经由光学拾信单元3、RF电路5和DSP6从装载于光盘再现设备上的光盘1中读出文本数据(步骤S201)。然后,控制单元9参考包含于读出文本数据中的属性信息并确定文本数据的字符编码系统是已知的还是未知的(步骤S202)。
如果在步骤S202中控制单元9确定文本数据的字符编码系统是已知的,那么控制单元9确定编码系统是否为单字节编码系统(步骤S203)。确定编码系统是否为单字节编码系统等价于确定通常应用于光盘再现设备的编码系统是否为双字节编码系统。
如果在步骤S203中由包含于文本数据中的属性信息指示的编码系统不是单字节编码系统(即它是双字节编码系统),控制单元9确定文本数据基于通常应用于光盘再现设备的双字节编码系统,然后文本数据根据由读出文本数据的属性信息指示的字符编码系统(字符代码信息)转换(解码)成字符(步骤S204)。转换所获得的字符(显示数据)被发送到显示设备11,以便在显示设备11的屏幕上显示(步骤S208)。然后,在图6中所说明的过程完成。
如果在步骤S203中控制单元9确定由文本数据的属性信息指示的编码系统是单字节编码系统(即它不是双字节编码系统),控制单元9检查文本数据中不包含于单字节系统中的字符代码(步骤S205)。
在步骤S205中,控制单元9根据所应用的单字节编码系统的类型检查文本数据。更具体地说,下面所指示的值范围的字符不存在于下面的编码系统中:
ASCII(ISO646),128(80h)~255(FFh)
ISO8859-1,128(80h)~159(9Fh)
JISX0201,128(80h)~159(9Fh)以及224(E0h)~255(FFh)
如上所述,在步骤S205中控制单元9根据单字节编码系统的类型检查文本数据中不包含于编码系统中的字符代码。
基于步骤S205的检查结果,控制单元9确定不符合单字节编码系统的字符代码是否存在(步骤S206)。如果控制单元9确定这种不符合的字符代码存在,控制单元9进一步确定由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统。然后,文本数据基于由用户选择的并存储于EEPROM10中的编码系统的字符映射表转换(解码)成字符,如图5中所说明(步骤S207)。由用户选择的编码系统是应用于处理基于与通常所应用双字节编码系统不同的编码系统的字符代码的编码系统。
由步骤S207中的解码过程获得的字符(显示数据)发送到显示设备11,以便在显示设备11的屏幕上显示(步骤S208)。然后,图6中所说明的过程完成。
如果在步骤S206中控制单元9确定待处理的文本数据字符代码不包括不存在于单字节编码系统中的字符代码,控制单元9确定由包含于待处理文本数据中的属性信息指示的编码系统匹配文本数据的字符代码的实际编码系统。然后,文本数据的字符代码基于由读出文本数据的属性信息(字符代码信息)指示的编码系统转换(解码)成字符(步骤S204)。转换所获得的字符(显示数据)发送到显示设备11以便在显示设备11的屏幕上显示(步骤S208)。然后,图6中所说明的过程完成。
如果在步骤S202中待处理文本数据的字符代码的编码系统被确定为未知,控制单元9确定文本数据的字符代码基于与通常所应用双字节编码系统不同的编码系统。然后。文本数据基于存储于EEPROM10中的编码系统的字符映射表来解码,如图5中所说明的(步骤S207)。
随后,由步骤S207的解码过程获得的字符(显示数据)发送到显示设备11,以便在显示设备11的屏幕上显示(步骤S208)。然后,图6中所说明的过程完成。
如上所述,当待处理文本数据的编码因属性信息丢失而未知时或者当文本数据的字符代码的实际编码系统不匹配由属性信息指示的、不是光盘再现设备通常所使用的双字节编码系统的单字节编码系统时,根据该实施方案的光盘再现设备能够使用预先指定的编码系统的字符映射表来解码文本数据的字符代码。
这样,即使当由待处理文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统时,错乱字符的产生可以达到最少并且文本数据正确地转换成字符并呈现给用户。
如上所述,根据用户所指定编码系统的文本数据的解码仅当在文本数据在图6中所示的步骤S205中检查时不存在于单字节代码中的值(字符代码)被检测到时执行。如上面所列出的,可以由用户选择的编码系统(解码方法)是:1)自动(自动设置);2)日文(Shift-JIS);3)韩文(KSX1001);4)在中国大陆使用的简体中文(GB18030);5)在台湾使用的繁体中文(Big5);6)英文(ISO8859-1或ASCII);以及7)俄文(ISO8859-1)。
光盘再现设备可以包括可由用户选择的全部字符编码系统或者可以取决于目的地而包括有限数目的字符编码系统。在这里,“包括编码系统”意思是“包括转换所需的字符映射表和处理程序”。
在上面,光盘再现设备主要制造来供日文中使用,因此Shift-JIS设置为通常应用于转换文本数据的编码系统。但是,根据本发明的光盘再现设备不是限制性的,因此单字节编码系统如ISO8859-1可以设置为通常所应用的编码系统。
如果单字节编码系统设置为通常所应用的编码系统,图6中所示的过程的步骤S203被改变,使得控制单元9确定待处理文本数据的属性信息是否指示双字节编码系统。然后,在步骤S206中控制单元9确定在双字节编码系统中不使用的字符代码是否包含于文本数据中。
[文本数据的另一种解码过程]
接下来,由根据本发明的实施方案的光盘再现设备执行的文本数据的另一种解码过程将参考图7中所说明的流程图来描述。上面参考图6而描述的文本数据的解码过程用于当Shift-JIS双字节编码系统设置为光盘再现设备的通常所应用编码系统时解码文本数据。
但是,在大多数情况下,当由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统时,由属性信息指示的编码系统已由用于欧洲语言的ISO8859-1改写。
由于这个缘故,图7中所说明的文本数据的解码过程当通常应用于解码文本数据的编码系统不同于ISO8859-1并且由文本数据的属性信息指示的编码系统是ISO8859-1时以及当很可能出现由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统时在光盘再现设备中执行。
类似于图6中所说明的过程,图7中所说明的过程当光盘被装载时或者当由用于指示时主要在控制单元9中执行。当图7中所说明的过程在控制单元9中执行时,控制单元9经由光学拾信单元3、RF电路5和DSP6从装载于光盘再现设备上的光盘1中读出文本数据(步骤S301)。然后,控制单元9参考包含于读出文本数据中的属性信息并确定文本数据的字符代码的编码系统是已知的还是未知的(步骤S302)。
如果在步骤S302中控制单元9确定待处理文本数据的字符代码的编码系统是已知的,控制单元9进一步确定编码系统是否为ISO8859-1(步骤S303)。有两个原因在步骤S303中确定由文本数据的属性信息指示的编码系统是否为ISO8859-1。
第一个原因是在根据该实施方案的光盘再现设备中通常应用于解码文本数据的编码系统是不同于ISO8859-1的编码系统,因此确定由文本数据的属性信息指示的编码系统是否为ISO8859-1等价于确定由属性信息指示的编码系统是否为不同于ISO8859-1的编码系统。
第二个原因是,如上所述,如果由文本数据的属性信息指示的编码系统是ISO8859-1,有很高的可能性由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统。
如果在步骤S303中控制单元9确定待处理文本数据的属性信息不指示ISO8859-1,由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统的可能性低。因此,文本数据的字符代码基于文本数据的属性信息(字符代码信息)转换(解码)成字符(步骤S304)。然后,转换所获得的字符(显示数据)发送到显示设备11以便在显示设备11的屏幕上显示(步骤S306)。然后,图7中所说明的过程完成。
如果在步骤S302中控制单元9确定待处理文本数据的字符代码的编码系统是未知的,并且在步骤S303中确定待处理文本数据的属性信息指示ISO8859-1,有很高可能性是由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统。因此,在这种情况下,存储于EEPROM10中的编码系统的字符映射表根据图5中所说明的过程应用于将字符代码转换(解码)成字符。编码系统是与解码过程中通常应用的字符编码系统不同的字符编码系统并且由用户指定(步骤S305)。
由步骤S305中的解码过程获得的字符(显示数据)发送到显示设备11,以便在显示设备11的屏幕上显示(步骤S306)。然后,图7中所说明的处理完成。
如上所述,根据图7中所说明的文本数据的解码过程,当通常应用于字符代码的编码系统是不同于ISO8859-1的编码系统时,通过检查何时很可能出现由文本数据的属性信息指示的编码系统不同于文本数据的字符代码的实际编码系统,文本数据可以高度可靠地解码。
如果在图7中所说明的过程的步骤S303中控制单元9确定由文本数据的属性信息指示的编码系统是ISO8859-1,那么控制单元9进一步检查文本数据的字符代码是否包括ISO8859-1中使用的字符代码。如果这种字符代码不被包括,字符代码可以基于在步骤S304中获得的属性信息(字符代码信息)来解码,反之,如果这种字符代码被包括,文本数据可以基于在步骤S305中存储于EEPROM10中的编码系统来解码。
图6说明通常所应用的编码系统是不同于ISO8859-1的编码系统的情况。但是,对于通常所应用编码系统是不同于Shift-JIS或JISX0201的编码系统的情况,图6中所说明的过程也可以执行。在这种情况下,在图7中的步骤S303,控制单元9分别确定文本数据的属性信息是Shift-JIS还是JISXO201。
如上所述,当执行将文本数据转换成字符的解码过程时,通过基于当由文本数据的属性信息指示的编码系统是与通常所应用编码系统不同的编码系统时所选择应用的编码系统执行解码过程,文本数据可以高度可靠地解码并且错乱字符的产生可以防止。
在根据上述实施方案的光盘再现设备中,接收装置的功能由键操作单元12实现,存储装置的功能由EEPROM10实现,并且确定装置、转换装置和检测装置的功能由控制单元9实现。
本发明的实施方案也可以通过制作与图5,6和7中说明的流程图对应的程序、将该程序存储于控制单元9的ROM和EEPROM10中,以及当需要时执行该程序来实现。
在上面的描述中,根据本发明的实施方案的光盘再现设备是符合CD文本标准的CD再现设备。但是,光盘再现设备可以包括各种类型的再现设备,以及能够解码存储于存储媒介如使用MD作为存储媒介的Mini DiscTM(MD)中的文本数据并输出解码后数据的记录和再现设备。换句话说,本发明的实施方案可以在任何类型的电子设备中使用,以便解码包括属性信息和字符代码的各种字符代码。
本领域技术人员应当理解,各种修改、组合、子组合及更改可以在附加权利要求或其等价物的范围内取决于设计需求和其他因素而发生。
Claims (9)
1.一种字符信息转换设备,用于处理包括指示编码系统的属性信息和符合该编码系统的字符代码的字符信息,并且用于将字符代码转换成输出字符,该设备包括:
接收装置,用于接收指定当解码符合与通常所应用编码系统不同的编码系统的字符代码时所应用编码系统的输入;
存储装置,用于存储指示对应于通过接收装置接收的输入的编码系统的信息;
确定装置,用于通过参考待转换字符信息的属性信息确定字符信息的字符代码符合哪个编码系统;以及
转换装置,用于当确定装置不能确定编码系统时或者当确定装置确定通过参考属性信息确定的编码系统不同于通常所应用的编码系统时,基于存储于存储装置中的信息将字符代码转换成字符。
2.根据权利要求1的字符信息转换设备,还包括:
检测装置,用于当确定装置确定由属性信息指示的编码系统不同于通常所应用的编码系统时,检测包含于字符信息中的字符代码是否包括不包含于与通常所应用编码系统不同的编码系统中的字符代码,以及
其中,当确定装置确定由属性信息指示的编码系统不同于通常所应用的编码系统时以及当检测装置检测到字符信息包括不包含于与通常所应用编码系统不同的编码系统中的字符代码时,转换装置基于存储于存储装置中的信息将字符代码转换成字符。
3.根据权利要求1和2中的一个的字符信息转换设备,其中通常所应用的编码系统是双字节编码系统而与通常所应用编码系统不同的编码系统是单字节编码系统。
4.根据权利要求1和2中的一个的字符信息转换设备,其中通常所应用的编码系统是单字节编码系统而与通常所应用编码系统不同的编码系统是双字节编码系统。
5.一种用于处理包括指示编码系统的属性信息和符合该编码系统的字符代码的字符信息并将字符代码转换成输出字符的方法,该方法包括步骤:
存储步骤,通过接收指定当解码符合与通常所应用编码系统不同的编码系统的字符代码时所应用编码系统的输入,存储指示与所接收输入对应的编码系统的信息;
确定步骤,参考待转换字符信息的属性信息确定字符信息的字符代码符合哪个编码系统;以及
转换步骤,当编码系统不能在确定步骤中确定时或者当在确定步骤中确定由属性信息指示的编码系统不同于通常所应用的编码系统时,基于存储于存储装置中的信息将字符代码转换成字符。
6.根据权利要求5的方法,还包括步骤:
检测步骤,当在确定步骤中确定属性信息中指示的编码系统不同于通常所应用的编码系统时,检测包含于字符信息中的字符代码是否包括不包含于与通常所应用编码系统不同的编码系统中的字符代码,
其中,当在确定步骤中确定由属性信息指示的编码系统不同于通常所应用的编码系统时以及当在检测步骤中检测到包含于字符信息中的字符代码包括不包含于与通常所应用编码系统不同的编码系统中的字符代码时,字符代码在转换步骤中基于在存储步骤中存储的信息转换成字符。
7.根据权利要求5和6中的一个的方法,其中通常所应用的编码系统是双字节编码系统而与通常所应用编码系统不同的编码系统是单字节编码系统。
8.根据权利要求5和6中的一个的方法,其中通常所应用的编码系统是单字节编码系统而与通常所应用编码系统不同的编码系统是双字节编码系统。
9.一种字符信息转换设备,用于处理包括指示编码系统的属性信息和符合该编码系统的字符代码的字符信息,并且用于将字符代码转换成输出字符,该设备包括:
接收单元,用于接收指定当解码符合与通常所应用编码系统不同的编码系统的字符代码时所应用的编码系统的输入;
存储单元,用于存储指示对应于通过接收单元接收的输入的编码系统的信息;
确定单元,用于通过参考待转换字符信息的属性信息确定字符信息的字符代码符合哪个编码系统;以及
转换单元,用于当确定单元不能确定编码系统时或者当确定单元确定通过参考属性信息确定的编码系统不同于通常所应用的编码系统时,基于存储于存储单元中的信息将字符代码转换成字符。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004208029A JP4072691B2 (ja) | 2004-07-15 | 2004-07-15 | 文字情報変換装置および文字情報変換方法 |
JP2004208029 | 2004-07-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1722221A CN1722221A (zh) | 2006-01-18 |
CN100375994C true CN100375994C (zh) | 2008-03-19 |
Family
ID=35897585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100846054A Expired - Fee Related CN100375994C (zh) | 2004-07-15 | 2005-07-15 | 字符信息转换设备及转换字符信息的方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7274314B2 (zh) |
JP (1) | JP4072691B2 (zh) |
CN (1) | CN100375994C (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5391583B2 (ja) * | 2008-05-29 | 2014-01-15 | 富士通株式会社 | 検索装置、生成装置、プログラム、検索方法および生成方法 |
JP4427597B1 (ja) * | 2008-09-30 | 2010-03-10 | 株式会社東芝 | デジタルテレビジョン放送受信装置 |
JP5446852B2 (ja) * | 2009-12-25 | 2014-03-19 | コニカミノルタ株式会社 | 印刷処理装置、印刷処理プログラム、および印刷処理方法 |
JP6476618B2 (ja) * | 2014-07-07 | 2019-03-06 | 富士通株式会社 | 伸長方法、伸長プログラムおよび伸長装置 |
JP6491438B2 (ja) * | 2014-08-29 | 2019-03-27 | 株式会社日立社会情報サービス | マイグレーション支援装置 |
US9513978B2 (en) | 2014-10-17 | 2016-12-06 | International Business Machines Corporation | Integrated support for application porting transparency and streamlined system migration in heterogeneous platform environments |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002041402A (ja) * | 2000-07-26 | 2002-02-08 | Canon Inc | 情報処理方法及び情報処理装置並びに記憶媒体 |
US20030147317A1 (en) * | 2002-01-21 | 2003-08-07 | Kouichi Uno | Disc player and recorded-content information display method for the same |
JP2004012751A (ja) * | 2002-06-06 | 2004-01-15 | Nec Corp | 文字データ生成装置及びその方法並びにプログラム |
JP2004127363A (ja) * | 2002-09-30 | 2004-04-22 | Denon Ltd | 情報記録媒体及び情報記録媒体再生装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2918632B2 (ja) * | 1990-06-11 | 1999-07-12 | キヤノン株式会社 | 文字処理方法及び装置 |
JPH052576A (ja) | 1991-06-24 | 1993-01-08 | Fujitsu Ltd | コード種別判定方法 |
JP3496965B2 (ja) * | 1993-12-20 | 2004-02-16 | 富士通株式会社 | 文字コード変換装置 |
JPH07271777A (ja) * | 1994-03-31 | 1995-10-20 | Fujitsu Ltd | 分散情報処理システムにおける文字コード管理方式 |
JPH11149284A (ja) * | 1997-11-18 | 1999-06-02 | Sharp Corp | 文字パターン生成装置及び文字パターン生成装置制御プログラムを記憶した媒体 |
US6204782B1 (en) * | 1998-09-25 | 2001-03-20 | Apple Computer, Inc. | Unicode conversion into multiple encodings |
JP3917343B2 (ja) * | 2000-02-25 | 2007-05-23 | 株式会社東芝 | マルチプラットフォーム環境における文字コード変換方式および文字コード変換プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7002581B2 (en) * | 2000-12-19 | 2006-02-21 | Fujitsu Limited | Character information processing apparatus, character information processing method and storage medium |
US6701320B1 (en) * | 2002-04-24 | 2004-03-02 | Bmc Software, Inc. | System and method for determining a character encoding scheme |
JP2004106255A (ja) | 2002-09-17 | 2004-04-08 | Ricoh Co Ltd | 画像形成装置 |
JP4308676B2 (ja) * | 2003-01-24 | 2009-08-05 | 株式会社リコー | 文字列処理装置,文字列処理方法および画像形成装置 |
US7215264B2 (en) * | 2005-09-30 | 2007-05-08 | Pixtel Media Technology (P)Ltd. | Methods and systems for character conversion |
-
2004
- 2004-07-15 JP JP2004208029A patent/JP4072691B2/ja not_active Expired - Fee Related
-
2005
- 2005-07-05 US US11/175,427 patent/US7274314B2/en not_active Expired - Fee Related
- 2005-07-15 CN CNB2005100846054A patent/CN100375994C/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002041402A (ja) * | 2000-07-26 | 2002-02-08 | Canon Inc | 情報処理方法及び情報処理装置並びに記憶媒体 |
US20030147317A1 (en) * | 2002-01-21 | 2003-08-07 | Kouichi Uno | Disc player and recorded-content information display method for the same |
JP2004012751A (ja) * | 2002-06-06 | 2004-01-15 | Nec Corp | 文字データ生成装置及びその方法並びにプログラム |
JP2004127363A (ja) * | 2002-09-30 | 2004-04-22 | Denon Ltd | 情報記録媒体及び情報記録媒体再生装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4072691B2 (ja) | 2008-04-09 |
US20060050977A1 (en) | 2006-03-09 |
US7274314B2 (en) | 2007-09-25 |
CN1722221A (zh) | 2006-01-18 |
JP2006031303A (ja) | 2006-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10991032B2 (en) | Information communication terminal, information distribution apparatus, information distribution system, content management method, broadcast reception method, information distribution method, programs and storage medium | |
US9715893B2 (en) | Recording apparatus, server apparatus, recording method, program and storage medium | |
KR100643871B1 (ko) | 기록 장치 | |
CN100375994C (zh) | 字符信息转换设备及转换字符信息的方法 | |
CN101067955B (zh) | 内容列表显示方法及装置、内容选择和处理方法及装置 | |
MXPA04002233A (es) | Extension de formato de archivo m3u para soportar una interfaz de usuario y tareas de navegacion en un reproductor digital de audio. | |
MXPA04002235A (es) | Metodo y aparato para crear una lista de reproduccion con indice en un reproductor de datos de audio. | |
US8407467B2 (en) | Ubiquitous audio reproducing and servicing method and apparatus | |
US7765198B2 (en) | Data processing apparatus, data processing method, and data processing system | |
JP2002330395A (ja) | デジタル信号処理装置、デジタル信号処理方法、情報センターおよび配信システム | |
JP2007172244A (ja) | コンテンツ管理システム、コンテンツ記録再生装置、関連情報取得用プログラム、及び、関連情報取得装置 | |
US20030179668A1 (en) | Information recording apparatus, information recording method, information recording program and information recording medium | |
JP2005166131A (ja) | 再生装置及び制御プログラム並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080319 |