CN1166003A - 外部字符管理器 - Google Patents

外部字符管理器 Download PDF

Info

Publication number
CN1166003A
CN1166003A CN96114526A CN96114526A CN1166003A CN 1166003 A CN1166003 A CN 1166003A CN 96114526 A CN96114526 A CN 96114526A CN 96114526 A CN96114526 A CN 96114526A CN 1166003 A CN1166003 A CN 1166003A
Authority
CN
China
Prior art keywords
character
outside character
outside
management
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN96114526A
Other languages
English (en)
Other versions
CN1101027C (zh
Inventor
大石勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN1166003A publication Critical patent/CN1166003A/zh
Application granted granted Critical
Publication of CN1101027C publication Critical patent/CN1101027C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本发明的外部字符管理器用于在由多个平台组成的分布式系统中统一地管理外部字符。在进行字符记录或取出时,如果分布主系统或其编码系统不同于外部字符管理编码系统,编码转换器将根据字符编码转换表把外部字符编码转换成对应的编码,并将转换后的外部字符存入外部字符管理文件存储器中或分布者的外部字符文件中。外部字符转换器进行数据格式或大小的转换并将转换后的数据记录在外部字符管理文件存储器中,外部字符编辑器则允许编辑存储外部字符管理文件。

Description

外部字符管理器
本发明涉及一种外部字符管理器,具体地说是一种统一管理使用不同编码系统的多平台外部字符的外部字符管理器。
传统上,已有一种在通过网络互连的不同平台上运行的多个信息处理器的分布式系统,并且在现存的环境中,在这种分布式系统中不同的平台使用各自不同的字符编码系统。例如,大型计算机使用JEF(日文处理扩展功能)编码系统,诸如UNIX(用于获得X/Open有限公司许可的在美国和其它国家的注册商标)的工作站使用EUC(扩展的UNIX编码)系统,在个人计算机中使用最多的是移位JIS编码系统。这些编码系统的不同之处在于字符的字符编码如何赋予字符,其中每一个字符可以用1个、2个或3个字节来表示。不论那种情况,编码系统都具有一个包括标准字符集的JIS区,如一个非汉字字符集,一个一级JIS汉字字符集和一个二级JIS汉字字符集。但是对于公司管理的用户信息或政府部门管理的人名信息,在这种情况中自然会有大量的字符不在标准字符集之中。对于这样的字符和非标准字符或诸如用作公司标记的图形,备有一个外部字符区以便允许用户自由地定义和记录外部字符,以备后用,并且通过使用不同平台定义的外部字符,非JIS汉字字符和各种标记可在使用不同编码的平台上显示或打印出来。
对于标准字符集中的字符,每一种编码系统在字符和它们的字符编码之间均为有序的对应,因此,只要使用的是标准字符集,字符就可能会根据预先确定的转换规则进行编码转换,这样的字符即可为不同的系统所共用。另一方面,对于外部字符,如果分布式系统是由多个使用不同编码系统的平台组成,由一种编码系统定义的外部字符必须由分布式系统中所用的所有编码系统用类似的方法加以定义。这样,当分布式系统某处建立的新的外部字符时,只要所用的编码系统相同,它的字符编码就可以直接调用。但是,对于使用不同编码系统的一个系统,一个已建立的外部字符必须在该系统分配的外部字符区中加以记录,并且,要准确地使用这个外部字符,必须对其进行编码转换。
例如,在传统的系统中,如未审查日本公开专利第7-271777号所揭示的系统,当一个字符串从一个平台发往另一个使用不同编码系统的平台时,字符的字形从一个字形文件中读出,从赋予这些字符字形的字符编码到接收方的字符编码的编码转换通过一个编码转换表进行,并将转换后的字符编码发出。这样,外部字符即可在使用不同编码的系统间一致地调用了。
传统上,准备用于使用不同编码系统的多个平台的外部字符被分布到各个平台,并且还进行了这些外部字符的编码转换。但是,用于显示和打印的字形的转换是根据分布者的系统使用的编码系统的格式和大小机械地进行的,因此,一般而言,转换后的字符的质量是很差的。例如,当点阵字符形从一种大小转换或另一种大小,为改变大小位元被机械地增加或减少,因此,在某些情况下,取决于字符字形,转换会产生异常的字形结果。为此要求分布者检查转换后的字符质量,这意味着,在每一个分布者系统中,转换后的外部字符必须显示或打印出来,以确定其质量。
如果在分布者系统中试打印或显示的结果中,发现某些外部字符需要重新调整,这时必须启动系统的外部字符编辑程序,通过编程序对这些外部字符重新调整。由于各个系统操作外部字符编辑程序的方法各有所异,所以负责管理外部字符的人员必须常握所有系统的外部字符编辑程序的操作方法。
因此,根据传统的步骤,在系统安装时,一并引入外部字符不会出现特别的麻烦,但是将外部字符新加入已存在的系统时,必须顾及所有的系统,即使是仅仅增加几个字符,也会出现当操作环境有所变化时不能有效地进行处理这一问题。
本发明的目的在于提供一种外部字符管理器,减少掌握当前使用的系统的外部字符编辑程序的操作的需要,并且允许在一个地点统一地管理所有系统的外部字符。
为了达到上述目的,本发明提供了一个与采用网络的分布式系统相连的外部字符管理器,其中分布式系统由多个通过网络互连的计算机系统组成,这些计算机系统使用不同大小的字符,赋予相应字符的字符编码也不相同。外部字符管理器包括有:用于读出存储在分布主外部字符文件中的外部字符和记录这个外部字符的外部字符记录器;用于将外部字符记录器记录的外部字符存储于外部字符管理文件的外部字符管理文件存储器,用于取出存储在外部字符管理文件存储器中的外部字符和将取出的外部字符存储到分布者外部字符文件中的外部字符取出器;具有字符编码转换表并与外部字符记录器或外部字符取出器相关联的,在分布主系统或分布者系统使用不同的编码系统时,根据字符编码转换表进行外部字符编码转换的编码转换器;用于根据编码系统的管理要求更新字符编码转换表的编码转换表更新器;用于取出存储在外部字符管理文件存储器中的外部字符,将取出的外部字符转换成数据格式不同或大小不同的外部字符,并将转换后的外部字符存储在外部字符管理文件存储器中的外部字符转换器,用于在外部字符转换器执行转换过程中进行外部字符的数据格式或大小转换的数据格式转换器,和用于编辑记录于外部字符管理文件存储器中的外部字符的外部字符编辑器。
从下面的描述中,以及通过举例说明本发明最佳实现方法的附图中可以明显地发现本发明的上述和其它目的、特色和优点。
图1是根据本发明的外部字符管理器的理论性结构框图;
图2是通过举例给出的分布式系统的结构框图;
图3是外部字符管理器工作过程的概要框图;
图4是记录外部字符时操作流程的流程图;
图5是获取外部字符时操作流程的流程图;
图6是转换外部字符时操作流程的流程图;
图7是编辑外部字符时操作流程的流程图;
图8是外部字符管理数据库的数据结构框图;
图9是外部字符分布文件的数据结构框图;
首先,参照附图解释本发明的概要。
图1是根据本发明的外部字符管理器的理论性结构框图。
本发明的外部字符管理器尤其适用于多计算机系统组成的分布式系统,这些计算机系统通过网络互连,它们使用的字符大小不同,赋予各自字符的字符编码也不相同。外部字符管理器包括有外部字符记录器2,该记录器用于读出存储在分布主外部字符文件1中的外部字符,其中外部字符文件1分布在网络上或作为存储介质,记录器还用于外部字符的记录;外部字符管理文件存储器,用于将外部字符记录器2记录的外部字符存储到外部字符管理文件中;外部字符取出器5,用于取出存储在外部字符管理文件中的外部字符,并将取出的外部字符存放分布者外部字符文件4;编码转换器6,该转换器具有字符转换表6a,用于在外部字符记录器2或外部字符取出器5要求进行转换时字符编码转换表6a进行外部字符编码的转换;编码转换有更新器7,用于更新字符编码转换表6a;外部字符转换器8,用于将存储在外部字符管理文件中的外部字符转换成数据格式不同或大小不同的外部字符,并将转换后的外部字符记录在另一个外部字符管理文件中;数据格式转换器9,用于在外部字符转换器8进行的转换过程中进行数据格式或大小的转换;和外部字符编辑器10,用于编辑记录在外部字符管理文件存储器中的外部字符。
在具有上述结构的外部字符管理器中,当外部字符记录器2记录外部字符时,将对分布主的外部字符文件1进行分析以确定分布主系统的外部字符管理编码系统。如果分布主外部字符文件1的外部字符管理编码系统不同于存储于外部字符管理文件存储器3中的外部字符管理文件,分布主的外部字符文件1的外部字符编码将由编码转换器6转换成与外部字符管理文件对应的编码,并将转换后的外部字符编码存储到一个新的外部字符管理文件中,然后这个文件将记录在外部字符管理文件存储器3中。
当外部字符取出器5从一个外部字符管理文件中将外部字符取到分布者的外部字符文件4中时,首先要检查外部字符管理文件的外部字符编码系统是否与分布者的外部字符文件4的相一致。如果发送方的外部字符管理编码与接收方的不一样,外部字符管理文件中的外部字符编码将由编码转换器6转换成与分布者外部字符文件4对应的编码,并且转换后的外部字符编码将存储在分布者的外部字符文件4中。
例如,如果在分布式系统中增加一个要使用的编码系统,编码转换表更新器7将增加一个关联表,这个关联表用于将要加入的编码系统的字符编码与管理系统中已有的编码系统的字符编码关联起来,作为编码转换器6的字符编码转换表6a。
当外部字符转换器8将记录于外部字符管理文件存储器3中的外部字符管理文件的外部字符转换成不同格式或不同大小的将存储于另一个外部字符管理文件中的外部字符时,将对这两个独立的文件进行检查,以确定它们中的外部字符的数据格式和大小。数据格式转换器9将从外部字符管理文件存储器3中取出的外部字符数据转换成数据格式和字符大小为所要求的外部字符数据,转换后的数据存储到另一个外部字符管理文件中,然后这个文件记录在外部字符管理文件存储器3中。
外部字符编辑器10具有一个能够处理多种不同数据格式的外部字符编辑程序。当要编辑记录在外部字符管理文件存储器3中的一个外部字符时,外部字符编辑器10检查存储这个外部字符的外部字符管理文件,以确定数据格式和字符大小,并启动外部字符编辑程序,根据已确定的条件对外部字符进行必要的调整或修改,最后将编辑后的外部字符存储在原有的外部字符管理文件中。
现在将通过网络互连的多个计算机系统组成的分布式系统中的一个实现方法的例子,来介绍本发明的具体实现方法。
图2是一个这种分布式系统的结构的例子。
图2所示的分布式系统包括:一个大型机11,一个工作站(WS)12和一个个人计算机(PC)13,它们通过网络14互连在一起。大型机11有一个与之相连的字符编码管理区11a,该区使用(比方说)JEF编码作为字符编码系统。工作站12也有一个与之相连的字符编码管理区12a,它使用(比方说)EUC编码作为自己的字符编码系统。个人计算机13有一个与之相连的字符编码管理区13a和一个软盘驱动器(FDD)13b,字符编码管理区13a使用(比方说)Shift JIS编码作为字符编码系统。此外,网络14中连有一个通用计算机15。这个通用计算机15有一个中央处理器(CPU)15a和一个内存15b,并且连有包括一个硬盘16、一个CD-ROM驱动器17和4个软盘驱动器(FDD)18的外部存储器,由此组成了一个外部字符管理器。
管理外部字符的外部字符管理程序最初存储在分布式存储介质中,如CD-ROM 17a或软盘18a。例如,假定外部字符管理程序存储在CD-ROM 17a中,它从CD-ROM 17a中读出,并安装在硬盘16中,这样外部字符管理程序16a就可以使用了。硬盘16中还存储有操作系统(OS)16b和外部字符文件16c。
存储在硬盘16中的外部字符管理程序16a根据需要部分地或全部地加载到通用计算机的内存15b中,并得到运行。这个外部字符管理程序16a是在操作系统16b的控制下运行的,并且由操作系统提供的功能(程序)根据需要可以得以调用和执行。
这个分布式系统中使用的各种字符编码系统的外部字符,即,JEF编码系统、EUC编码系统和Shift JIS编码系统中的外部字符,统一由外部字符管理程序16a管理。外部字符管理程序能够记录、取出、转换和编辑外部字符。在这种情况下,被认为在外部字符管理器的管理下最行之有效的、所期望的编码系统可由用户事先确定为管理编码系统。在下面的叙述中,假定JEF编码系统定义为外部字符管理器的管理编码系统。外部字符的记录和取出不但可由作为外部字符管理器的通用计算机15提出请求,也可以由分布式系统的终端提出请求,如通过网络由工作站12提出。在这种情况下,外部字符的分布是以存储介质的形式进行的,如CD-ROM17a、软盘18a、或图中没有给出的半导体内存、或通过网络14。在图2中所示的例子中,分布主的外部字符文件由CD-ROM17a或软盘18a提供。例如,如果外部字符存储在软盘18a中,由外部字符管理器取出的外部字符,其数据内容经检查后,通过个人计算机13的软盘驱动器13b,存储在字符编码管理区13a中。
下面介绍当中央处理器15a将外部字符管理程序16a加载到通用计算机15的内存15b中并运行时,外部字符管理器工作的概貌。
图3是外部字符管理器工作过程的概要框图。
外部字符管理器包括有一个外部字符统一管理区21,一个外部字符管理数据库22,一个外部字符管理文件组23,针对外部字符管理文件组23的文件访问功能24,编码转换功能25和数据格式转换功能26,一个与编码转换功能25相关的外部字符编码转换表27,和一个管理编码系统设置区30。
外部字符全面管理区21是整个外部字符管理器的控制区,该区通过外部字符管理数据库22管理外部字符管理文件组23,并控制外部字符的记录、取出、转换和编辑,控制编码转换表更新我29对外部字符编码表27的更新,和管理编码系统设置区30对管理编码系统的设置。文件访问功能24用于打开、关闭、读出和写入外部字符管理文件组23中的外部字符管理文件。编码转换功能25在不同的编码系统之间进行外部字符的转换中,当有必要记录或取出外部字符时,将根据外部字符编码转换表27,执行从非JEF编码的编码系统转换成JEF编码的编码转换,或从JEF编码转换成目标字符编码系统,其中JEF编码是管理编码系统。数据格式转换功能26在外部字符转换时执行数据格式间的转换。
外部字符管理文件组23由多个外部字符管理文件组成,这些文件是为字符的每一种字体,如Mincho和Gothic,为每一种数据格式,如点阵、向量和TrueType,以及字符的每一种大小而建立的文件。当外部字符管理器管理下的外部字符通过这里没有给出的显示器展现给用户时,外部字符全面管理区21通过树形结构显示外部字符,在树形结构中,外部字符根据字体、格式和大小进行分类。外部字符编辑程序28可以处理任何数据格式,例如包括点阵、向量和TrueType,并且具有不同数据格式间的数据转换功能。此外,用户可以不必关心数据是什么格式而直接编辑外部字符。例如,在编辑向量格式的外部字符时,外部字符可以以点阵格式进行编辑,在此情况下,当编辑完成时,编辑后的外部字符转换成向量格式并存储在相应的外部字符管理文件中。
当记录外部字符时,外部字符管理器执行一系列的操作,其中包括读由分布主系统提供的外部字符分布文件31;如果分布主系统使用的不是JEF编码,通过编码转换功能25将外部字符编码转换成JEF编码;和通过文件访问功能24写外部字符管理文件;由此完成外部字符的记录。
当取出已记录的外部字符时,通过文件访问功能24读原始外部字符管理文件,如果目标编码系统不是JEF编码,通过编码转换功能25将外部字符编码由JEF编码转换成目标字符编码系统,并且这些外部字符被存作外部字符分布文件32,然后这个文件被发送或通过网络被传输到分布者的系统中。在本例中,由于字符的字体,大小和数据格式已被检查,完整的字符被简单地取出,无需进行数据格式的转换。
当已记录的外部字符转换成不同数据格式或大小的外部字符时,通过文件访问功能24读作为转换源的外部字符管理文件,并通过数据格式转换功能26执行转换成目标数据格式的转换。在本情况中,由于使用的是相同的JEF编码,所以无需进行编码转换,并且外部字符通过文件访问功能24以目标数据格式写入。当由用户发出指令执行这种外部字符的转换时,外部字符管理文件组23以树形结构显示在显示器的屏幕上,其显示方式使得已记录的外部字符可以与潜在的要记录的外部字符区分开来,并且通过指点设备,如鼠标器,拖曳已记录的外部字符的字符串指示并在潜在的外部字符的字符串指示上放下,于是开始外部字符的转换。
外部字符编辑程序28通过文件访问功能24读已记录的外部字符管理文件,以便编辑外部字符。在编辑结束时,编辑程序28通过文件访问功能24将编辑后的结果写入原来的外部字符管理文件中。外部字符编辑程序28可以以下方式启动。首先当外部字符管理文件组23以树形结构显示在显示器屏幕上时,用指点设备双击表示已记录的外部字符大小的字符串,显示出指定大小的外部字符列表。然后,双击列表中的一个目标外部字符,于是便启动了外部字符编辑程序28。
现在将详细介绍外部字符管理器所执行的一系列操作,其中包括外部字符的记录、取出、转换和编辑。
图4是一个记录外部字符时操作流的流程图。
当一个外部字符分布文件中的外部字符记录为外部字符管理文件时,首先进行初始化记录外部字符的数据项(步骤S1)。进行初始化数据项有两种方法,根据记录外部字符的请求是由外部字符管理器直接提出的还是通过网络由其它系统提出的,可选择其中的一种。在初始化数据项时,存储要记录的外部字符所在的文件的文件名,即,外部字符分布文件的文件名,并且记录目标信息被指定为输入信息。要记录的字体、大小和数据格式被指定作为记录目标信息。如果没有指定记录目标信息,则使用包括在文件中的缺省信息。这样就检查了作为初始化数据项的输入信息的有效性,例如,做出输入信息是否正确的确定(步骤S2),然后打开外部字符分布文件(步骤S3),并读出外部字符分布文件的头信息(步骤S4)。对读出的头信息进行分析以确定分布字符的个数,分布主系统中使用的编码系统,和外部字符的数据格式和大小(步骤S5)。然后打开在初始化数据项时由记录目标信息指定的外部字符管理文件(步骤S6)。
接着,执行一个循环操作以确定循环执行的次数是否等于分布字符的个数(步骤7)。由于作为头信息的分析结果分布字符的个数是已知的,因此该步骤确定循环操作已执行的次数是否等于已知的分布字符的个数。当循环操作已执行的次数尚不等于字符的个数时,要记录的外部字符数据逐字符从外部字符分布文件中取出(步骤S8)。
然后确定外部字符分布文件的编码系统是否不同于要记录的外部字符管理文件的管理编码系统。如果外部字符分布文件的编码系统不同于外部字符管理文件的管理编码系统,则执行编码转换,以得到管理编码系统中相应编码(步骤S10);另一方面,如果两个编码系统相同,外部字符分布文件的编码系统是什么编码则使用什么编码。例如,如果管理编码系统是JEF编码系统而外部字符分布文件的编码系统是EUC系统,那么EUC系统则被转换为相应的JEF编码系统的编码。然后外部字符被记录在外部字符管理文件中(步骤S11)。当步骤S7到步骤S11的操作重复执行的次数等于字符的个数时,执行终止操作,如关闭文件(步骤S12)。
图5是取出外部字符时的操作流程图。
当外部字符从外部字符管理文件取到外部字符分布文件中时,首先执行的是初始化取出外部字符的数据项(步骤S21)。执行数据项的初始化有两种方法,根据取出外部字符的请求是由外部字符管理器直接提出还是通过网络由其它系统提出,可以选择其中的一种方法。在初始化数据项时,输入要取出的外部字符的字体、大小和数据格式这些取信息作为输入信息。此外,要存入取出的外部字符的外部字符分布文件的名称,分布者系统的编码系统,和要取出的字符编码的范围也被指定作为输入信息。接着由用户检查输入信息的有效性,例如,检查取出请求时由用户输入的或通过网络送出的输入信息中的字符串的准确性(步骤S22)。然后根据输入信息标识要打开的外部字符管理文件(步骤S23)。这个外部字符管理文件通过作为取信息而输入的字体、大小和数据格式而得到标识。然后,要从中取出外部字符的外部字符管理文件被打开(步骤S24),在其中要存放外部字符的外部字符分布文件也被打开(步骤S25)。
接着执行一个循环操作,以确定已进行的循环次数是否等于要取出的字符的个数(步骤S26)。要取出字符的个数在作为要取出的字符编码的范围的输入信息中已经指定,因此,根据此信息可以确定要取出的字符的个数。然后要确定的是外部字符管理文件的管理编码系统是否不同于分布者系统的编码系统(步骤S27)。如果外部字符管理文件的管理编码系统与分布者系统的编码系统彼此不同,则根据分布者系统的编码系统进行编码转换,以得到管理编码系统中相应的编码(步骤S28);另一方面,如果两个编码系统相同,管理编码系统是什么编码则使用什么编码。例如,如果管理编码系统是JEF编码系统而分布者系统的编码系统是Shift JIS编码系统,则进行编码的转换,因为使用的编码系统互不相同。在这种情况下,要取出的字符编码的范围,根据分布者系统的编码系统,已由Shift JIS编码所指定;因此,根据Shift JIS编码系统所表示的字符编码的指定范围中的每一编码,可以获得管理JEF编码系统中对应的编码。然后,外部字符数据从外部字符管理文件中取出(步骤S29),并且外部字符通过与分布者系统的编码的编码对应存储在外部字符分布文件中(步骤S30)。
当从步骤S26到步骤S34的操作重复执行的次数等于要取出字符的个数时,外部字符分布文件的头信息得以设置(步骤S31)。头信息包括关于存储字符个数的信息。由于从外部字符管理文件实际取出的外部字符的个数与先前由要取出的字符编码所指定的字符的个数不同,所以在外部字符实际存储到外部字符分布文件中后再设置头信息。最后执行的是终止操作,如关闭文件(步骤S32)。
图6是在转换外部字符时的操作流流程图。
当某个外部字符管理文件中的外部字符的数据格式或大小进行了转换并将转换后的外部字符存作另一个不同的外部字符管理文件时,首先,取出信息,转换目标信息,和要转换的字符编码的范围被指定为输入信息,对于每一个取出信息和转换目标信息,关于外部字符的字体、大小和数据格式的信息都可被指定。对于要转换的字符编码的范围,可以通过范围的设置而指定一个单一的字符或指定多个字符。接着是检查输入信息的有效性,例如,检查输入信息中字符串的准确性(步骤S41)。当用户发出指令进行外部字符的转换时,这里有一个较好的方法,在这种方法中有关字体、大小和数据结构信息在显示时以字符串的形式出现在屏幕上的树形结构中,使用鼠标器拖曳代表转换源的字符串并将其放到代表转换结果的字符串上,由此输入了进行外部字符转换的必要信息。此外可以在菜单中选择菜单项“转换”,以显示一个对话框,通过这个对话框可以输入必要的信息。
然后,根据输入信息,分别标识作为转换源和转换结果的外部字符管理文件(步骤S42)。这些作为转换源和转换结果的外部字符管理文件可由作为取出信息和转换目标信息输入的字体、大小和数据格式进行标识。接着打开作为转换源的外部字符管理文件(步骤S43),再打开作为转换结果的外部字符管理文件(步骤S44)。
下一步执行的是一个循环操作,确定循环已执行的次数是否等于要转换的字符的个数(步骤S45)。要转换字符的个数已由输入信息的要转换的字符编码的范围指定,根据这个信息可以确定要转换的字符的个数。在此之后,外部字符数据从作为转换源的外部字符管理文件中取出(步骤S46),取出的外部字符转换为指定的字体、大小或数据格式(步骤S47),并且转换后的外部字符存储在作为转换结果的外部字符管理文件中(步骤S48)。在转换外部字符的过程中,由于所有的管理文件都是由同一管理编码系统管理的,所以不需要编码的转换。当步骤S45到步骤S48的操作重复执行的次数等于要转换的字符的个数时,执行终止操作,如关闭文件(步骤S49)。
图7是在编辑外部字符时的操作流流程图。
当使用具有处理多种不同数据格式能力的外部字符编辑程序编辑外部字符时,首先取出用于指定要取出的外部字符管理文件的信息,如字体、大小和数据格式,并且要编辑的编码被指定为输入信息。在这种情况下,例如,当外部字符以树形结果显示在屏幕上时,用指点设备双击表示目标外部字符大小的字符串,由此表达这个外部字符的信息在内部指定为输入信息的取出信息。接着,检查输入信息的有效性(步骤S51),并根据输入信息,标识要取出的外部字符管理文件(步骤S52)。在外部字符以树形结构显示在屏幕上的情况中,当用指点设备双击表示目标外部字符大小的字符串时,要取出的外部字符管理文件也能够在内部得到标识。此后,打开已标识的要取出的外部字符管理文件(步骤S53),并读出要编辑的外部字符(步骤S54)。此时,指定大小的外部字符列表以编码数字的顺序显示在屏幕上,双击列表中的目标外部字符便启动了外部字符编辑程序(步骤S55)。在此情况中,确定了取出的外部字符管理文件的数据格式,启动了外部字符编辑程序并以已确定的格式进行编辑的方式运行。例如,如果数据的格式是向量格式,外部字符编辑程序以向量格式进行编辑的方式启动。当编辑结束时,编辑后的外部字符存储到原先的外部字符管理文件中(步骤S56),并且关闭外部字符管理文件(步骤S57)。
图8是外部字符管理数据库的数据结构框图。
外部字符管理器通过外部字符管理数据库管理外部字符管理文件。外部字符管理数据库具有,例如,包括由总管理信息表41和42,一个字体表43,数据格式表44和大小信息表45组成的树形结构。
在表41中设置了外部字符管理文件的个数,外部字符管理编码系统,和到表42的偏移。外部字符管理文件的个数是指存储在外部字符管理文件组中的外部字符文件的个数,外部字符管理编码系统保留了管理编码系统的字符串,信息例如,JEF编码系统就是由用户通过编码系统设置器预先设置的。
在表42中,设置了字体的个数和字体表的偏移。例如,如果已经记录了两种字体“Mincho”和“Gothic”,那么字体的个数将被为“2”。
在字体表43中,对于每一种字体都设置了一组信息,其中包括字体标识符,字体名,格式的个数和数据格式表的偏移。以Mincho字体为例,“a0”设置为该字体的标识符,字符串“Mincho”设置为该字体的名称。如果该字体有三种数据格式,例如点阵、向量和True Type,格式的个数将设置为“3”。
在数据格式表44中,对于每一种数据格式都设置了一组信息,其中包括格式标识符,格式名称,大小的个数和大小信息表的偏移。以点阵这种数据格式为例,“b0”设置为该格式的标识符,“dot”设置为该格式的名称,该格式有几种不同的大小,大小的个数就设置为n。
在大小信息表45中,对每一种大小都设置了一组信息,如大小的标识符,竖向大小,横向大小,竖向字母的大小和横向字母的大小。以竖向大小乘横向大小为“30×30”、竖向字母大小乘横向字母大小为“ 28×28”为例,“c0”设置为该大小的标识符。对于其它大小,“c1”设置为……。
字体表43中的字体标识符,数据格式表44中的格式标识符,和大小信息表45中的大小标识符用作标识外部字符管理文件的文件名信息。例如,文件名“a0b0c0”表示一个外部字符管理文件,该文件含有大小为“30×30(28×28)”,格式为点阵,字体为Mincho的外部字符数据。当记录后的外部字符以树形结构显示在屏幕上时,可以看到字体名“ Mincho”,格式名“dot”,和大小“30×30(18×28)”。
图9是外部字符分布文件的数据结构框图。
要分布的外部字符分布文件由头信息区51和外部字符数据区52组成。头信息区包括的信息有分布主系统的编码系统名长度,分布主系统的编码系统名,字体名长度,字体名,竖向大小,横向大小,字母竖向大小,字母横向大小,外部字符格式类型,和外部字符的个数。外部字符数据区52由对应于每一个外部字符编码的组信息组成,每一个组信息由外部字符编码,外部字符数据长度和外部字符数据组成。
以分布主系统的编码系统是JEF为例,头信息区51中的分布主系统的编码系统名长度为“3”,这是因为JEF是由三个单字节字母组成,分布主系统的编码系统名为“JEF”。如果所用的字体是Mincho,那么字体名长度为“4”,这是因为Mincho,在用Kanji(汉字)字符书写时,是由两个双字节字符(对应于四个单字节字符)组成的,该字体名为“Mincho”(用Kanji字符)。对于外部字符格式类型,输入的是表示点阵,向量或TrueType的格式。信息外部字符个数表示在外部字符数据区52中存入的外部字符的个数。
在上述的实现方法中,根据本发明外部字符管理器应用于在日本使用的Kanji字符的处理,但是也可以应用于其他字符的处理。例如,本发明可以应用于7/8字位的字符系统(例如,ISO/IEC 646:1991,ANSI×3.4-1986(ASCII))或应用于用16字位或更多的字位表示一个字符的系统(例如,ISO/IEC 10646-11993的UCS-2)。
如前所述,本发明包括外部字符记录器,外部字符管理文件存储器,外部字符取出器,数据格式转换器,编码转换器,外部字符转换器和外部字符编辑器。
因此,一旦用户将一种特别的编码系统设置为外部字符管理编码系统,当使用具有转换外部字符编码能力的编码转换器输入或输出外部字符时,它们可以转换成管理编码系统或转换成外部字符要输出的那个系统所使用的编码系统,由此多个系统的外部字符可以通过管理编码系统集成在一起并得到统一的管理。数据格式转换器可以进行多种不同的外部字符数据格式间的转换,所以当通过转换生成外部字符时,转换后的外部字符的质量可在系统中得到确认。这样,与传统的系统不同的是,转换后的外部字符不需要在每一系统上试着打印出或显示出,以认可要确认的转换后的外部字符的质量,因而节省了分布者一方进行确认的劳力。
另外还提供有具有处理多种不同外部字符数据格式能力的外部字符编辑器。因此外部字符可以集中地编辑,并且没有必需掌握各个系统的外部字符编辑程序的操作,也没有必要使用不同的外部字符编辑程序编辑外部字符,由此节省了与生成多部字符相关的劳力。
进一步而言,在分布式系统中,由于减少了与确认外部字符质量有关的劳力和与编辑外部字符有关的劳力,可以快速地处理外部字符环境的变化,提高系统操作的效率。
即使不设置管理编码系统,并由各自系统的编码系统管理外部字符管理文件,也可以得以类似于上述的优点,当转换外部字符时,不但数据格式和大小,而且字符编码也可以转换。但是在这种情况下用于不同系统的同一种数据格式被认为是不同的数据格式。
上文所述仅仅是对本发明原理的说明。此外对于该技术领域内的熟练人员可轻易地发现大量的修改和改进,不要把本发明一成不变地局限于这里给出的和描述的构造和应用,所以,所有适当的修改和与其相当的改动均认为属于在权利要求和与其相当的声明所述的本发明的范畴之内。

Claims (6)

1.一种通过网络与分布式系统相连外部字符管理器,所述分布式系统包括通过网络互连的多计算机系统,这些系统使的字符大小不同,赋予各自字符的字符编码也不相同,上述外部字符管理器包括:
用于读出存储在分布主的外部字符文件中的外部字符并记录这些外部字符的外部字符记录器;
用于在外部字符管理文件中存储由外部字符记录器记录了的外部字符的外部字符管理文件存储器;
用于取出由外部字符管理文件存储器存储的外部字符,并将取出的外部字符存储到分布者的外部字符文件的外部字符取出器;
具有字符编码表并与外部字符记录器或外部字符取出器相关联,在分布主系统或分布者系统使用不同的编码系统时,用于根据字符编码转换表进行外部字符编码的转换的编码转换器;
用于根据编码系统的管理要求更新字符编码转换表的编码转换表更新器;
用于取出存储在外部字符管理文件存储器中的外部字符,将取出的外部字符转换成数据格式不同或大小不同的外部字符,并将转换后的外部字符存入外部字符管理文件存储器中的外部字符转换器;
用于在外部字符转换器执行转换的过程中执行外部字符的数据格式或大小的转换的数据格式转换器;和
用于编辑记录在外部字符管理文件存储器中的外部字符的外部字符编辑器。
2.根据权利要求1的外部字符管理器,包括有:用于将用户认为能够有效地管理外部字符的所期望的编码系统设置为记录在外部字符管理文件存储器中的外部字符管理文件的管理编码系统的管理编码系统设置器。
3.一种在分布式系统中管理外部字符的外部字符管理方法,其中所述分布式系统由通过网络互连并使用不同大小的字符及不同的赋予相应字符的字符编码的多个计算机系统组成,该外部字符管理方法包括:
事先指定某个编码系统作为管理编码系统以允许在一个单一地点实现集中管理,并且
当分布主系统的编码系统不同于管理编码系统时,将分布主系统所用的编码系统的外部字符编码转换成管理编码系统的外部字符编码,或当分布者系统的编码系统不同于管理编码系统时,为了进行分布将管理编码系统的外部字符编码转换成分布者系统所用的编码系统的外部字符编码。
4.一种计算机可读的介质,该介质存储由中央处理器为进行下述操作而执行的计算机程序:
读出存储于分布主的外部字符文件中的外部字符,如果读出的外部字符的编码系统不同于管理编码系统将读出的外部字符转换成管理编码系统的外部字符编码,并记录读出的或转换后的外部字符;
取出已记录的外部字符,如果分布者系统的编码系统不同于管理编码系统将取出的外部字符转换成分布者系统中使用的编码系统的外部字符编码,并将取出的或转换后的外部字符存储于分布者的外部字符文件中;
读出记录的外部字符,将读出的外部字符转换成不同数据格式或不同大小的外部字符,并将转换后的外部字符存作另一个字符;和
编辑已记录的外部字符的编辑操作。
5.一种存储着能将通用计算机作为外部字符管理器来操作的计算机程序的介质,包括:用于读出存储于分布主外部字符文件中的外部字符并记录该外部字符的外部字符记录器;用于将外部字符记录器记录的外部字符存入外部字符管理文件的外部字符管理文件存储器;用于取出存储于外部字符管理文件存储器中的外部字符,并将取出的外部字符存入分布者的外部字符文件中的外部字符取出器;与外部字符记录器或外部字符取出器相关联,当分布主系统或分布者系统的编码系统不同于管理编码系统时用于外部字符编码的转换的编码转换器;用于取出存储于外部字符管理文件存储器中的外部字符,将取出的外部字符转换成不同数据格式或不同大小的外部字符,并将转换后的外部字符存于外部字符管理文件存储器中的外部字符转换器;用于在外部字符转换器执行转换操作时,进行外部字符的数据格式或大小的转换的数据格式转换器;用于编辑记录于外部字符管理文件存储器中的外部字符的外部字符编辑器。
6.一种能将通用计算机用作外部字符管理器来操作的计算机程序,包括:用于读出存储于分布主外部字符文件中的外部字符并记录该外部字符的外部字符记录器;用于将外部字符记录器记录的外部字符存入外部字符管理文件的外部字符管理文件存储器;用于取出存储于外部字符管理文件存储器中的外部字符,并将取出的外部字符存入分布者的外部字符文件中的外部字符取出器;与外部字符记录器或外部字符取出器相关联,当分布主系统或分布者系统的编码系统不同于管理编码时用于外部字符编码的转换的编码转换器;用于取出存储于外部字符管理文件存储器中的外部字符,将取出的外部字符转换成不同数据格式或不同大小的外部字符,并将转换后的外部字符存于外部字符管理文件存储器中的外部字符转换器;用于在外部字符转换器执行转换操作时,进行外部字符的数据格式或大小的转换的数据格式转换器;用于编码记录于外部字符管理文件存储器中的外部字符的外部字符编辑器。
CN96114526A 1996-05-16 1996-11-08 外部字符管理器 Expired - Fee Related CN1101027C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP121218/96 1996-05-16
JP12121896 1996-05-16
JP121218/1996 1996-05-16

Publications (2)

Publication Number Publication Date
CN1166003A true CN1166003A (zh) 1997-11-26
CN1101027C CN1101027C (zh) 2003-02-05

Family

ID=14805818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96114526A Expired - Fee Related CN1101027C (zh) 1996-05-16 1996-11-08 外部字符管理器

Country Status (2)

Country Link
US (1) US5890184A (zh)
CN (1) CN1101027C (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10301924A (ja) * 1997-04-25 1998-11-13 Fujitsu Ltd 業務別外字処理装置
US6938073B1 (en) * 1997-11-14 2005-08-30 Yahoo! Inc. Method and apparatus for re-formatting web pages
JP2000066656A (ja) * 1998-08-25 2000-03-03 Fujitsu Ltd 動的文書の特殊文字処理システムおよび特殊文字処理プログラムを記録した記録媒体
JP3382572B2 (ja) * 1999-04-13 2003-03-04 キヤノン株式会社 文字列情報出力装置、文字列情報出力システム、文字列情報出力方法、文字列情報記録装置、文字列情報記録方法および記憶媒体
US7107325B1 (en) * 1999-11-15 2006-09-12 Insweb Corporation System and method for optimizing and processing electronic pages in multiple languages
US6711637B2 (en) * 2000-01-11 2004-03-23 Canon Kabushiki Kaisha Communication apparatus, image processing apparatus, communication system, communication method, image processing method and storage medium
JP2001242850A (ja) * 2000-02-25 2001-09-07 Fujitsu Ltd 文字処理装置、文字処理システム、及び文字処理方法並びに記録媒体
JP3917343B2 (ja) * 2000-02-25 2007-05-23 株式会社東芝 マルチプラットフォーム環境における文字コード変換方式および文字コード変換プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4873554B2 (ja) * 2006-12-25 2012-02-08 株式会社リコー 画像配信装置および画像配信方法
US8085271B2 (en) * 2007-06-08 2011-12-27 Apple Inc. System and method for dilation for glyph rendering
CN104424192A (zh) * 2013-08-20 2015-03-18 北大方正集团有限公司 形成多字型字库、通过该字库显示不同字型的方法及装置
US9172395B2 (en) * 2013-11-16 2015-10-27 International Business Machines Corporation Generating an ICONV module in real time

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114558A (ja) * 1993-10-19 1995-05-02 Fujitsu Ltd 漢字変換訂正処理方式
JP2703496B2 (ja) * 1994-01-26 1998-01-26 インターナショナル・ビジネス・マシーンズ・コーポレイション かな漢字変換システムのカスタマイズ方法及びかな漢字変換システム
JPH07271777A (ja) * 1994-03-31 1995-10-20 Fujitsu Ltd 分散情報処理システムにおける文字コード管理方式

Also Published As

Publication number Publication date
CN1101027C (zh) 2003-02-05
US5890184A (en) 1999-03-30

Similar Documents

Publication Publication Date Title
KR100372585B1 (ko) 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체
CN1276375C (zh) 用于显示和选择层次数据库段和字段的系统和方法
CN1101027C (zh) 外部字符管理器
US7103596B2 (en) Data sort method, data sort apparatus, and data sort program
US6219831B1 (en) Device and method for converting computer programming languages
US6954898B1 (en) Method of standardizing character information in electronic documents
CN1159665C (zh) 创建定制数据库的方法和设备
WO2006136055A1 (fr) Procédé d'exploration de données texte
CN1877531A (zh) 一种嵌入式编译体系扫描器的实现方法
CN1248115C (zh) 通用测试报告的实现方法
CN1103962C (zh) 源代码变换方法
CN1253343A (zh) 将设计信息扩展到软件产品中的方法和装置
CN1371043A (zh) 数码操作系统
CA2307359C (en) Method, system and computer program product for optimization of single byte character processing employed within a multibyte character encoding scheme
JP3251203B2 (ja) Jclプログラム変換装置、jclプログラム変換方法、および、記録媒体
CN1549157A (zh) 文档浏览控制系统及方法
CN113971044A (zh) 组件文档生成方法、装置、设备及可读存储介质
Calabretto et al. The philological workstation bambi (better access to manuscripts and browsing of images)
CN1834891A (zh) 用于处理表单的信息处理装置和方法
CN1167999C (zh) 将超媒体文件转换为语音的方法
JP4338231B2 (ja) 外字管理装置および外字管理を行うコンピュータプログラムを記憶したコンピュータ可読媒体
CN115375272A (zh) 一种数字化劳动力政务办公的处理方法
Policy et al. National Science Foundation
Lee et al. Feature extraction based design retrieval
CN117270844A (zh) 一种基于树状神经网络机器学习的代码片段功能描述方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20030205

Termination date: 20101108