CN1097244C - 多国语文件处理装置 - Google Patents
多国语文件处理装置 Download PDFInfo
- Publication number
- CN1097244C CN1097244C CN95119230A CN95119230A CN1097244C CN 1097244 C CN1097244 C CN 1097244C CN 95119230 A CN95119230 A CN 95119230A CN 95119230 A CN95119230 A CN 95119230A CN 1097244 C CN1097244 C CN 1097244C
- Authority
- CN
- China
- Prior art keywords
- code
- language
- text
- input
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
可以将一种语言用的字处理机用于其它种语言。根据已经输入的语言标志,读入要处理的语言文字输入程序。将已经输入的文字代码分解成本文代码和语言指示代码。对已经分解的本文代码和语言指示代码同时进行编辑处理。由语言指示代码和本文代码合成与其对应的文字代码。把该对应的字形输出。
Description
本发明涉及多国语文件处理装置,尤其涉及中文和日文兼用的多国语文件处理装置。
今后,在新开发的文件处理装置处理多国语时,作为文字代码,采用对应多国语代码系列(例如:Unicode标准或ISO10646)的情况可能会多了。但是,对应多国语代码系列只是最近才形成标准。因此,原来的文件处理装置,无论是市售的日文字处理机和中文字处理机,还是今后将要开发、销售的改良品都不采用这种标准的多国语代码系列,而采用一般知道的先有方式的代码系列。那么,先有的文字代码系列,例如有:用1字节表现半角的英文、数字的ASCII代码系列,用2字节表现日文文字的JIS代码系列、SHIFT JIS代码系列,以及用2字节表现中文文字的BIG5代码系列、IBM5550代码系列。
除此以外,在输入多国语的场合,文件处理装置为了不必反复从辅助存储器中读取文字处理程序,就必须备有输入各种语言的设备。在这方面,它已形成按照应处理的语言种类,迅速、高效率读取文字处理程序的结构和方式。
作为先有的这种多国语信息处理装置例如有特开平1-213744号公报中发表的。这种装置是借鉴于即使作成多国语文件,实际上一种特定的语言占据了作成文件的大部分,其它语言不仅少,而且其种类也受到限制的情况而开发的。
下面,说明该装置。
图10是结构图。在此图中,100是语言处理信息存储单元,该单元将各国语言的文字输入程序存储在辅助存储媒体(例如硬盘)中。101是系统语言处理信息管理单元,该单元临时存储2个国家语言的文字输入程序。102是语言处理信息登记单元,该单元在语言处理信息存储单元100中进行检索,并将各国语言的文字输入程序存储到系统语言处理信息管理单元101中。103是使用语言存储单元,该单元存储表示系统语言处理管理单元中存储的文字输入程序是哪国语言的识别信息(语言指示信息)和最后登记的语言指示信息,即隐含语言指示信息。104是语言指示信息登记单元,该单元对语言处理信息登记单元102输出语言指示信息,在语言处理信息存储单元100内进行文字输入程序的检索,将检索得出的文字输入程序登记在系统语言处理信息管理单元102中,与此同时将语言指示信息登记在使用语言存储单元103中。105是使各国语言混合起来进行文字输入的本文编辑单元。106是输入语言指示信息的语言指示信息输入单元。
下面以英文和日文混合的文件输入为例,说明先有例子的工作流程。
假设首先进行了英文输入。语言处理信息登记单元102在语言处理信息存储单元100中进行检索,取出英文文字输入程序,并存储在系统语言处理信息管理单元101中。语言指示信息登记单元104将已经输入的识别信息(由于是英文,所以为“E”)登记在使用语言存储单元103中。在这种场合,由于只登记了英文,所以,最后表示登记内容的隐含语言指示信息是英文。这样,英文的文件就成了要作成的对象。然后,假设文字输入者(文件作成人)想要输入日文。从语言指示信息输入单元106把用来识别出日文的语言指示信息(由于是日文,所以为“J”)重新输入。
语言指示信息登记单元104由于已经输入的语言识别信息为J,所以,把该语言指示信息输出到语言处理信息登记单元102中,在指示更新系统语言处理信息的同时,将语言指示信息J追加登记在使用语言存储单元103中。这样,就在使用语言存储单元103中存储了E和J这2个语言指示信息。还有,在最后的登记中,作为J的隐含语言指示信息也登记了(所以,后面输入的是日语文件)。
同时,语言处理信息登记单元102根据已经指示的语言指示信息,从语言处理信息存储单元100中检索并读出日文文字输入程序,并将它存储在系统语言处理信息管理单元101中。其结果是,系统语言处理信息管理单元101中存储了英文文字输入程序和日文文字输入程序。
如果根据上述那种先有的多国语信息处理装置,就可以减少从辅助存储媒体中反复读写文字输入程序的次数。因此,可以提高多国语信息处理的效率。
但是,如果要将上述先有的文件处理装置挪用于中文处理装置的话,就会产生下面那样的问题:
第1,日文虽然与中文一样,都是2字节系列,但是,所使用的字数大约只有7000个。所以,一般有13比特就足够了,而且,剩下的3比特(具体地讲,就是上位字节以及下位字节的MSB等),例如,除了表示字体是粗字或空格等属性外,还用于其它用途。另一方面,中文字为13053字,不到日文字的2倍。所以,日文和中文不能使用共同的文字代码结构。然而,文件处理装置中的应用程序(如编辑软件)与文字代码的结构有关。具体地讲,日文应用程序将表示上述属性的比特用于编辑,而在中文中则不能。而且,这意味着在中文和日文中不能共享应用程序。所以,如果原封不动地同时处理中文和日文,这种多国语文件处理装置则是不可能的(如果仅记为参考,那么,当前的日文字处理机之所以能够处理英文,是由于英文使用的文字非常少,故此,代码体系也不重复)。
第2,先有的装置只是存储输入时使用的文字的语言种类,在处理作成中的文件时还不能存储该语言的种类,所以,在输出用日文描述的中文入门书等多国语混合的文件时,发生了各种困难。
第3,先有的装置对中文和日文使用不同的文字代码结构,所以,在挪用文件装置时,产生了各种次要的问题。例如,在将日文字处理机作为中文字处理机使用时,反过来,将中文字处理机作为日文字处理机使用时,必须重新作成与住址名录、录影象程序、图形程序、直排打印等相关的应用程序。
所以,需要许多的工时(虽然也取决于内容,约12人月、2000~3000工时)、资源及经费等。
为了解决上述课题,权利要求1的发明特征在于:具有由标准键盘等构成的输入单元、文字代码结构表、由内部存储器(ROM)等构成的语言处理存储单元、输入语言处理单元、输入代码分解单元、本文代码和语言指示代码的存储单元、编辑处理单元、输出代码合成单元、文字字形存储单元和文字输出控制单元,
输入单元的标准键盘输入语言标志和读音符号;
文字代码结构表具有对日文文字分配了一个代码平面、对中文文字至少分配了2个代码平面的文字代码栏,根据代码平面和文字代码栏的指定,决定日文或中文两者之一及该语言的文字;
语言处理存储单元的内部存储器存储将已经输入的读音符号(包括多个读符号)变换为该中文文字(包括多文字及文章,并且不局限于汉字)的中文文字代码的输入程序和将已经输入的读音符号变换为该日文文字(包括混有假名的语句)的日文文字输入程序(预先存储、可利用的状态);
输入语言处理单元根据已经由输入单元输入的语言标志,判断从语言处理存储单元中读入的是中文文字输入程序和日文文字输入程序两者中的哪一方,读入该方的程序,并使用该读入的程序将已输入的读音符号变换成与该语言对应的文字代码;
输入代码分解单元把输入语言处理单元变换产生的文字代码分解(一种变换,包括根据语言,文字代码不变的状态)为指定在文字代码结构表上文字代码栏(文字代码)的位置(与代码平面对照指定文字)的本文代码和指定代码平面的语言指示代码;
文本代码和语言指示代码的存储单元存储已由输入代码分解单元分解的本文代码和语言指示代码;
编辑处理单元在进行插入、删除、文字属性变换等文件编辑时,与该编辑相关的各单元可以同时处理本文代码和语言指示代码存储单元中存储的本文代码和语言指示代码;
输出代码合成单元根据本文代码和语言指示代码存储单元中存储的本文代码和语言指示代码,把输入读符号中的该中文文字代码号或日文文字代码合成号;
文字字形存储单元通过把已经登记在文字代码结构表中的中文文字及日文文字的字形(字母等)与该语言的文字代码号对应起来,然后予以输出;
文字输出控制单元在输出编辑处理单元所处理的文件时,根据输出代码合成单元的合成结果,从文字字体存储单元中取出对应的中文文字或日文文字的字体后,根据编辑处理结果输出到打印单元及显示单元上。
权利要求2的发明特征在于:文字代码结构表具有日文的文字代码栏;输入代码分解单元具有把输入语言处理单元变换产生的文字代码分解为语言指示代码和日文文字代码的输入代码日文代码分解器;本文代码和语言指示代码的存储单元具有将日文文字代码作为本文代码存储的日文文字代码存储器。
权利要求3的发明特征在于:具有输入单元、文字代码结构表、语言处理存储单元、输入语言处理单元、输入代码分解单元、本文代码和语言指示代码的存储单元、编辑处理单元、输出代码合成单元、文字字形存储单元和文字输出控制单元,
输入单元输入语言标志和读音符号;
文字代码结构表具有根据该国语言的文字数目对多国语言分配了至少一个代码平面(Code Plane)的文字代码栏,根据代码平面和文字代码栏的指定,决定各国语言的种类及其文字;
语言处理存储单元存储把与文字代码结构表对应的各国语言用的、并且已输入的读音符号变换成与该国语言对应的文字代码的各国语言用的多种文字输入程序(读音符号即文字,在变成英语等时,实际上也有不需要的,所以,该输入程序包括实际上没有以及兼用这两种情况);
输入语言处理单元根据输入单元输入的语言标志,从语言处理存储单元中读入该国语言用的文字输入程序,使用该程度将已输入的读音符号变换为与已输入的国语对应的文字代码;
输入代码分解单元把输入语言处理单元变换(如前面所述,也包括实质未变换的场合)产生的文字代码分解为指定在文字代码结构表上文字代码栏的位置的本文代码和指定代码平面的语言指示代码;
文本代码和语言指示代码的存储单元存储已由输入代码分解单元分解的本文代码和语言指示代码;
编辑处理单元在进行插入、删除、文字属性变换等文件编辑时,与该编辑相关的各单元可以同时处理文本代码和语言指示代码存储单元中存储的本文代码和语言指示代码;
输出代码合成单元根据本文代码和语言指示代码存储单元中存储的本文代码和语言指示代码,把输入语言标志中与该语言读音符号对应的文字代码号合成;
文字字形存储单元通过把在文字代码结构表中的与该代码平面和文字栏对应登录的多种语言各种文字的字形与该语言的文字代码对应起来,然后予以输出;
文字输出控制单元在输出编辑处理单元所处理的文件时,根据输出代码合成单元的合成结果,从文字字形存储单元中取出对应的该国语言的文字字形并根据编辑处理结果进行输出。
根据上述构成,权利要求1的发明中,由用户从输入单元输入打算作成的文件等的语言标志和读音符号。文件代码结构表在文字代码栏中对日文文字分配一个代码平面,对中国文字至少分配2个代码平面,通过代码平面和文字代码栏的指示,就能决定文字。(若是中文,只要指定文字代码栏的位置或序号就可对应多个文字)语言处理存储单元事先存储把从输入单元输入的读符号应该变换成该中文或日文文字代码的中文文字输入程序和日文文字输入程序。输入语言处理单元根据由输入单元输入的语言标志,判断从语言处理存储单元中读入的是中文文字输入程序和日文文字输入程序中的哪一种,使用该读入的程序将已输入的读符号及构成语句的文字读符号变换为该语言的文字代码。输入代码分解单元把输入语言处理单元变换产生的文字代码分解为指定构成文件等特定文字的文字代码栏位置(对应文字的代码因语言不同未必一一对应)的本文代码和指定代码平面的语言指示代码。本文代码和语言指示代码的存储单元存储已由输入代码分解单元分解的本文代码和语言指示代码。此时也有把多种文字的文字代码汇总变换以后存储的情况。编辑处理单元在进行插入、删除、文字属性变换等文件编辑时,在与该编辑相关的各单元可以同时处理本文代码和语言指示代码存储单元中存储的本文代码和语言指示代码。输出代码合成单元根据本文代码和语言指示代码存储单元中存储的本文代码和语言指示代码,把输入的读音符号该中文文字或日文文字的代码号合成。文字字形存储单元具有文字字体ROM等,通过把在文字代码结构表中与代码平面和文字栏对应登录的中文文字代码号和日文文字代码号的字形与该语言的文字代码对应起来,然后予以输出。文字输出控制单元在输出编辑处理单元所处理的文件时,根据输出代码合成单元的合成结果,从文字字体存储单元中取出,并输出对应的中文文字或日文文字的字形。
权利要求2的发明中:文字代码结构表具有日文的文字代码栏。在输入代码分解单元中的输入代码日文代码分解器把输入语言处理单元变换产生的文字代码分解为语言指示代码和日文文字代码。本文代码和语言指示代码存储单元中的日文文字代码存储器将日文文字代码作为本文代码存储。中文使用中文用的至少二个代码平面,而对照此,挪用日文的文字代码栏进行处理。
权利要求项3的发明中:从输入单元输入语言标志和读音符号。文字代码结构表具有根据该国语言的文字数目对多国语言分配了至少一个代码平面(Code Plane)的文字代码栏,根据代码平面和文字代码栏的指定,可以决定各国语言的种类及其文字。语言处理存储单元存储把与文字代码结构表对应的各国语言用的、并且将已输入的读符号变换成与该国语言对应文字代码的各国语言用的多种文字输入程序。输入语言处理单元根据输入单元输入的语言标志,从语言处理存储单元中读入该(包括兼用的)文字输入程序,将已输入的读音符号变换为该国语言对应的文字代码。输入代码分解单元把上述输入语言处理单元变换产生的文字代码分解为指定在文字代码结构表上文字代码栏位置的本文代码和指定代码平面的语言指示代码。本文代码和语言指示代码的存储单元把输入代码分解单元分解了的本文代码和语言指示代码变换成单独文字或单词及文章中的文字之后存储起来。编辑处理单元在进行插入、删除、文字属性变换等文件编辑时,与该编辑相关的各单元可以同时处理本文代码和语言指示代码存储单元中存储的本文代码和语言指示代码。输出代码合成单元把从文本代码和语言指示代码存储单元中存储的本文代码和语言指示代码输入的语言标志中该语言的与相同读符号对应的文字的文字代码号合成。字形存储单元把通过事先存储和使用字形生成程序在文字代码结构表上登记的多种语言的各种文字的字形与该语言的文字代码号对应起来,就能够输出。文字输出控制单元在输出编辑处理单元所处理的文件时,根据输出代码合成单元的合成结果,从文字字形存储单元中取出对应的该国语言的文字字形并根据编辑结果进行输出。
图1是本发明一个实施例的结构图;
图2是上述实施例中输入语言处理单元的工作流程图;
图3是上述实施例中输入代码分解单元的工作流程图;
图4是上述实施例中编辑处理单元的工作流程图;
图5是上述实施例中输出代码合成单元的工作流程图;
图6是表示上述实施例中中文文字、日文文字代码平面内容的图;
图7是上述实施例中本文代码和语言指示代码的存储单元内存储的、已输入的文字语言指示代码;
图8是上述实施例中处理例的输出结果;
图9是表示上述实施例中语言标志和语言代码的图;
图10是先有的多国语文件处理装置的结构图;
图11是一般日文字处理机的结构图;
图12是扩展的语言标志和语言代码一例的概念图。
实施例
在说明实施例以前,首先解释本说明书的术语用法。
(1) 日文和中文的名词等原则上不存在单数与复数的区别。所以,在本说明书中写为“文字”、“文字代码”的场合,只要没有特别注释“文字串”、“一个文字”,那么既有单数的场合,也有复数的场合。进一步讲,“存储文字的本文代码和语言指示代码”、“指定文字代码栏文字的本文代码和指定代码平面”等文章中的“文字”也是包含“文章”、“文件”或者“构成文章的各种文字”、“文件中的各种文字”的概念。
(2)“读音符号”是不限于中文的字音符号等,而是也包括“字母”、“假名”等“表音文字”及“音素文字”等的概念,“文字”不限定于“汉字那样的表音文字”,也包括“。”等记号,“假名”以及由多个汉字组成的“成语”等。
(3)“读音符号”和“文字”间的对应关系也像汉字“海”对应假名“うみ”“かい”那样不局限于1对1的关系。
下面说明作为本发明前提的技术。
(1)要想用日文字处理机实现显示、打印中文文字的输出等,就需要进行某种程度的改装、附加装备等。具体地讲,按照字形驱动程序,参照文字代码,把所需字形合成(台湾Dyna字形的处理方式)或者采用存储字根(radical)的组合方式的方法(所需存储器是上述方法之半),按照字形生成程序,生成各种各样的字形(台湾文鼎字形处理方式)等。
(2)具有发挥从读音符号对应的文字中选择输入者所要的文字的功能、或学习功能等所需的构成单元等。
但是,这些都与本发明的宗旨无关,所以,省略其说明。
下面,根据实施例说明本发明。
图11是一般日文字处理机的结构图,通过对本字处理机进行必要的最小限度的改造和附加设备,就能发挥与本发明有关的作用效果。在此图中,111是输入读音符号或编码功能符号的输入单元。112是存储日文文字输入程序和英文文字输入程序的语言处理存储单元。113是参照已经输入的代码种类,由语言处理存储单元选择了输入程序后,将读音符号变换为日文文字代码的输入语言处理单元。115是进行文件编辑的编辑处理单元。116是存储当前制作编辑中文件上文字代码及游标位置的文字代码存储单元。117是根据文字代码取出对应的字形后,将已取出的字形向输出单元118输出的文字输出控制单元。118是输出文字的输出单元,具有打印机、CRT等。
下面将以上的日文字处理机作为可以处理日文和中文的多国语字处理机,以其所发挥的功能为例,说明本发明的基本思想。
为了使字处理机中各种语言的文字代码结构一致,下面,说明IBM5550代码中表示中文文字代码的结构。
如图6所示,在上面的基础上将中文的文字代码划分为2个代码平面(CP1栏)。这里之所以划分为2个代码平面是由于正如前面所述的那样,中文使用了大约是日文2倍的文字。在本图中,横轴(b2)给出的是文字代码中的下位字节,纵轴(b1)给出的是文字代码的上位字节。再者,表内的各位置的数值表示与日文SHIFT JIS对应的JIS代码的文字代码。还有,CP1和CP2表示中文文字代码的上位字节是在平面1(CP1栏)和平面2(CP2栏)中指定的。
也就是说,在将日文的JIS代码作为文字代码采用时,当出现用16进制表现的文字代码2121和语言代码100(由图9示出)时,表示该文字相当于日文JIS代码系列中的2121代码。但是,当语言代码为010时,表示该文字是相当于中文文字代码平面2(CP2栏)上D040(D表示以16进制表示的13)代码的文字。
同样,当语言代码为001时,表示该文字是中文文字代码平面1(CP1栏)上的8140代码。
由以上看出,根据日语字处理机的编辑程序,该文字代码完全是日文JIS代码本身。但是,通过使用代码平面,尽管文字代码是日语的JIS代码,但是,可以特定中文文字,进而可以将已输入的读符号变换为中文文字等。所以,日语的文件编辑程序即使不作修改,也能够使用。或者,也易于进行新程序的编制、变换等。
下面,图1示出与本发明有关的、能够处理日文和中文的多国语文件处理装置实施例的结构。在本图中,11是输入单元。12是输入语言处理单元。13是输入代码分解单元。14是编辑处理单元。15是输出代码合成单元。16是本文代码和语言指示代码的存储单元。17是输出单元。18是文字输出控制单元。19是语言处理存储单元。
下面说明各单元的作用、结构等。
输入单元11具有键盘等。语言处理存储单元19存储日文文字、英文文字、中文文字等三种文字输入程序。输入语言处理单元12参照由输入单元11输入的语言标志,从语言处理存储单元19读入对应的文字输入程序后,将已输入的读符号变换为文字代码。输入代码分解单元13根据中文文字代码平面和日文文字代码平面间的关系,将文字代码分解为语言指示代码和本文代码。编辑处理单元14参照文本代码和语言指示代码的存储单元16进行编辑处理。本文代码和语言指示代码的存储单元16存储制作中主文件的本文代码、对应的语言指示代码和指定输入中文字位置的游标位置。输出代码合成单元15根据中文文字代码平面和日文文字代码平面的关系,参照语言指示代码,把从本文代码和语言指示代码输入的语言文字的文字代码合成。文字输出控制单元18参照语言指示代码,利用输出代码取出对应的字形,向输出单元17输出。输出单元17具有监视器和打印机等,输出其字形。
图2示出本实施例中输入语言处理单元12的工作流程。
下面参照本图说明其工作。
(S21)由输入单元11输入语言标志和读音符号。
(S22)判断语言标志是否为汉字语言。如果是汉字语言,就进行到(S23)。如果不是汉字语言,就进行到(S25)。
(S23)参照语言标志,从语言处理存储单元19中读入对应的文字输入程序。上述文字输入程序例如日文假名变换程序、汉字变换程序等。
(S24)将已输入的读音符号变换为文字之后进入(S25)。
(S25)输出语言标志和文字后,结束处理。还有,在上述(S22)中,如果不是汉字语言,就直接进入(S25),输出语言标志和文字串后,结束处理。
图3示出本实施例中输入代码分解单元13的工作流程。
下面参照本图说明其工作。
(S31)由输入语言处理单元12输入语言标志和文字之后,进行到(S32)。
(S32)参照语言标志,选择对应的分解程序,然后进入(S33)。
(S33)判断语言标志是否是编辑功能符号。如果是编辑功能符号,就结束其处理。如果不是编辑功能符号,就进行到(S34)。
(S34)从已输入的文字代码中取出一个文字的文字代码。
(S35)将上述取出的文字代码分解为语言指示代码和文本代码。
(S36)判断有无还未处理的文字代码。如果有,就返回到上述(S34)。如果没有,就进行到(S37)。
(S37)输出本文代码和语言指示代码后,结束处理。
图4示出本实施例中编辑处理单元14的工作流程。
下面参照本图说明其工作。
(S41)由输入代码分解单元13输入语言标志、本文代码、文言指示代码。
(S42)从本文代码和语言指示代码的存储单元16中读入编辑中文件的文件代码、与其对应的语言指示代码、表示成为当前编辑对象的文字位置的游标位置。
(S43)判断语言标志是否是编辑功能符号。如果是编辑功能符号,就进行到(S45)。如果不是编辑功能符号,就进行到(S44)。
(S44)参照游标位置,分别将已输入的本文代码和语言指示代码插入在编辑中的本文代码和与其对应的语言指示代码内,然后进行到(S46)。
(S45)根据功能符号的指示,参照编辑功能和游标位置,对编辑中的文件进行编辑处理。
(S46)将编辑中的文件内的本文代码和与其对应的语言指示代码存储在本文代码和语言指示代码的存储单元16后,进入(S47)。
(S47)将要输出的本文代码及其语言指示代码输出到输出单元。
图5是本实施例中输出代码合成单元15的工作流程。
下面说明本图所示的工作。
(S51)由编辑处理单元14输入本文代码和与其对应的语言指示代码。
(S52)取出一个文字中的本文代码和与其对应的语言指示代码。
(S53)参照语言代码,选择文字代码合成程序。
(S54)根据上述合成程序,将文字中的本文代码变换成文字代码。置换原文字中的本文代码。
(S55)判断有无还未处理的本文代码。如果还有,就返回到上述(S52);如果没有,就进行到(S57)。
(S56)输出文字代码和与其对应的语言指示代码后,结束处理。
关于像以上那样构成的本实施例多国语文件处理装置,下面说明其工作。
最初,本装置的各单元全部设定为初始状态。
由输入单元11将『da4Iu4cceng1“ruan3ti3”uei2』读音符号和语言标志LC=1(如图9(b)所示那样,这指的是,输入者意图的文字是中文繁体字的1)输入到语言处理单元12上。
根据上述LC的值「1」,从语言处理存储单元19中读入中文繁体字的汉字变换程序。
上述汉字变换程序将上述读符号变换为『大陸稱″軟體″為』的文字代码。
在输入代码分解单元13中,参照上述语言标志LC和文字代码,将文字代码分解为语言指示代码LPS={001,001,001,001,001,001,001,001}和本文代码TCS={374b,5674…}。
将由上述输入代码分解单元13输出的本文代码TCS和语言指示代码LPS送到编辑处理单元14。在编辑处理单元14中,由于此时的本文代码和语言指示代码的存储单元16中未存储任何内容,所以,直接将上述LPS和TCS的值存储在本文代码和语言指示代码存储单元16中。这时,游标位置在本文的文末。所以,为了将变换结果输出到监视器,输出上述LPS和TCS。
在输出代码合成单元15中,参照由编辑处理单元14输出的语言指示代码和本文代码,根据语言指示代码,选择适当的合成程序,由本文代码合成文字代码。
在文字输出控制单元18中,参照文字代码和与其对应的语言代码,取出适当的字体,输出到输出单元17。由输出单元17将取出的字体在监视器上显示出来。
接着由输入单元100,把表示中文简体字的语言标志「2」输出到输入语言处理单元12上。此时,语言标志LC的值被更新成为2,并且,读音符号的内容也变成『”ruan3jian4”』。
此时,在输入语言处理单元12中,通过参照语言标志,从语言处理存储单元19中读入中文简体字的汉字变换程序。
上述汉字变换程序将已输入的读音符号变换为“软件”的文字代码串。
在输入代码分解单元13中,在参照语言标志,将文字代码分解为语言指示代码LPS={011,011,011,011}和文本代码TCS={6624,706f,5880,6624}以后,将上述LPS和TCS送到编辑处理单元14。
在编辑处理单元14中,由于已经输入的语言标志不是编辑功能符号,所以,要参照本文代码和语言指示代码的存储器16中的本文代码,语言指示代码和游标位置,将上述本文代码、语言指示代码存储到本文代码和语言指示代码的存储器16中。此时,本文代码和语言指示代码的存储器16中的语言指示代码为『001,001,001,001,001,001,001,001,001,001,001,001』(图7中所示的开头12个),本文代码为374b,5674,…,6624,706f,5880,6624。
接着,在输出代码合成单元15中,由编辑处理单元14输出的本文代码、语言指示代码合成文字代码。
在文字输出控制单元18中,根据上述文字代码和与其对应的语言代码,分别取出简体字繁体字后,输出到输出单元17。此时,监视器上显示『大陸稱″軟體″為“软件”〕』的文字。如果用日文及英文(半角)输入相同意思的文件,在输出单元17(监视器)上显示的话,就成为图8所示的那样。此时的本文代码和语言指示代码存储单元中的语言指示代码的内容示于图7。
在本图中,示出把3个0和1组合构成的合计为41个语言指示代码。并且,最初的8个「001」表示「大」,「”」等中文繁体字(图9中的「繁体字1)。后面的4个「011」表示「件」等中文简体字。后面的5个「00」表示「,」,「日」等中文繁体字。后面的8个「100」表示「”」,「ソ」等日文文字。后面的5个「001」表示「,」,「英」等中文繁体字。后面的10个「000」表示「”」,「S」等英文文字(ASCII)。最后的一个「001」表示中文繁体字「。」
由以上说明可知,可将日文字处理机作为中文字处理机使用,进而也可以作为多国语文件处理装置使用。
以上根据实施例说明了本发明,但是,不言而喻,本发明不限于上述实施例。也就是说,本发明还包括以下内容。
(1)语言代码的比特数可根据处理对象的语言数目适当增减。
(2)关于代码平面的指定,可以根据处理对象的语言种类变更。
(3)由于语言指示代码是由0和1构成的数据,所以,可另项归纳,但是,要在保持文字间对应关系的基础上存储到磁盘上等,此时,例如采用以霍夫曼(Hoffman)等方法压缩的技术。
(4)关于输入代码的分解和输出代码的合成,可以不参照表,而是使用计算公式进行。
(5)如图12所示,稍微扩展语言代码和语言标志,就能同时处理中文、日文、英文、朝鲜文、阿拉伯语、欧洲系语言(英、德、俄等语言因文字字数少,完全可以放在日文文字代码栏中)。
或者,使代码平面1、2、3对应于英文、德文、俄文,也挪用到使用英文、德文文字的德语、俄语。
还有,在英文数字的场合,由于读音符号就是该语言形成的文字,所以,文字输入程序实际上是不需要的。
(6)由于制造等原因,可以把本发明的一个必不可少的构成要素(主要条件、部分)在物理上、机械上作为多个部件等,反过来,可将多个构成要素进行一体化,或者适当地将它们组合起来。
(7)改造现有的字处理机等,或者把新程序包括进去,作为具有本发明的功能的多国语文件处理装置。
(8)输出可以输出到存储媒体及外部通信线路上。同样,输入也可由存储媒体及外部通信线路来完成。
(9)日文文件为主,为了便于那些还未那样平凡使用中文文件的制作,只要没有特别指示,就按日文处理。
(10)其他在不改变本发明宗旨的范围内进行的变形有,用语言标志和读音来代替在实施例中还未使用的“隐含语言指示信息”等。
〔发明效果〕
像上面说明的那样,与本发明有关的多国语文件处理装置完全解除了先有的问题点。具体地讲,得到了以下效果。
(1)既便是不使用多国语对应代码系列的文件处理装置,也容易作为多国语文件处理装置使用。例如,虽然应用程序中的信息多少作一些修改,但是,可以大部分原封不动地利用其代码结构和应用程序,所以,可将日文字处理机作为处理日文和中文双方的字处理机。
(2)不需要重新制作相关编辑程序。所以,任何一种语言的文件处理装置,都可以迅速、高效率地作为多国语文件处理装置。例如,在上述日文处理机也处理中文的场合,由于分解程序、合成程序等能够挪用,所需的工时减少约1/3。
(3)通过使用语言代码平面,各种语言的代码结构可以相同。所以,便于将来系统扩展、改进时的软件开发。
由于以上效果,本发明的实用效果非常大。
Claims (3)
1.一种中文和日文兼用的文件处理装置,其特征在于:具有输入单元、文字代码结构表、语言处理存储单元、输入语言处理单元、输入代码分解单元、本文代码和语言指示代码的存储单元、编辑处理单元、输出代码合成单元、文字字形存储单元和文字输出控制单元;
输入单元输入语言标志和读音符号;
文字代码结构表具有对日文文字分配了一个代码平面
对中文文字至少分配了2个代码平面的文字代码栏,根据代码平面和文字代码栏的指定,决定日文或中文两者之一及其语言的文字;
语言处理存储单元存储将已经输入的读音符号变换为该中文的文字代码的中文文字输入程序和将已经输入的读音符号变换为该日文文字的日文文字输入程序;
输入语言处理单元根据已经由所述输入单元输入的语言标志,根据所述语言处理存储单元中读入的是中文文字输入程序和日文文字输入程序两者中的哪一方,读入该方的程序,并使用该读入的程序将已经输入的读音符号变换成与该语言对应的文字代码;
输入代码分解单元把所述输入语言处理单元变换产生的文字代码分解为指定在所述文字代码结构表上文字代码栏位置的本文代码和指定代码平面的语言指示代码;
本文代码和语言指示代码的存储单元存储已由所述输入代码分解单元分解的本文代码和语言指示代码;
编辑处理单元在进行插入、删除、文字属性变换等文件编辑时,与该编辑相关的各单元可以同时处理所述本文代码和语言指示代码存储单元中存储的本文代码和语言指示代码;
输出代码合成单元根据所述本文代码和语言指示代码存储单元中存储的本文代码和语言指示代码,把输入读音符号中的该中文文字代码号或日文文字代码号合成;
文字字形存储单元通过把已经登记在所述文字代码结构表中的与代码平面和文字代码栏对应的中文文字及日文文字的字形与该语言文字的代码号对应起来,然后予以输出;
文字输出控制单元根据所述输出代码合成单元的合成结果,从所述文字字形存储单元中取出对应的中文文字或日文文字的字形并根据编辑结果进行输出。
2.按权利要求1所述的中文和日文兼用的文件处理装置,其特征在于:
所述文字代码结构表具有日文文字代码栏;
所述输入代码分解单元具有把输入语言处理单元变换产生的文字代码分解为语言指示代码和日文文字代码的输入代码日文代码分解器;
所述本文代码和语言指示代码的存储单元具有将日文文字代码作为本文代码存储的日文文字代码存储器。
3.一种多国文件处理装置,其特征在于,具有输入单元、文字代码结构表、语言处理存储单元、输入语言处理单元、输入代码分解单元、本文代码和语言指示代码的存储单元、编辑处理单元、输出代码合成单元、文字字形存储单元和文字输出控制单元;
输入单元输入语言标志和读音符号;
文字代码结构表具有根据该国语言的文字数目对于多国语,分配了至少一个代码平面的文字代码栏,根据代码平面和文字代码栏间的指定,决定各国语言的种类及其文字;
语言处理存储单元存储把与所述文字代码结构表对应的各国语言用的、并且已输入的读音符号变换成与该国语言对应的文字代码的各国语言用的多种文字输入程序;
输入语言处理单元根据所述输入单元输入的语言标志,从所述语言处理存储单元中读入该国语言用的文字输入程序,将已输入的读音符号变换为该国语言对应的文字代码;
输入代码分解单元把所述输入语言处理单元的变换产生的文字代码分解为指定在所述文字代码结构表上文字代码栏的位置的本文代码和指定代码平面的语言指示代码;
本文代码和语言指示代码的存储单元存储已由输入代码分解单元分解的本文代码和语言指示代码;
编辑处理单元在进行插入、删除、文字属性变换等文件编辑时,与该编辑相关的各单元可以同时处理所述本文代码和语言指示代码存储单元中存储的本文代码和语言指示代码;
输出代码合成单元根据所述本文代码和语言指示代码存储单元中存储的本文代码和语言指示代码,把与已输入语言标志中与该语言相同的读音符号对应的文字的代码号合成;
字形存储单元通过把在所述文字代码结构表中的与该代码平面与文字栏对应登录的多种语言各种文字的字形与该语言的文字代码号对应起来,然后予以输出;
文字输出控制单元根据所述输出代码合成单元的合成结果,从所述文字字形存储单元中取出对应的该国语言的文字字形并根据编辑处理结果进行输出。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP277898/94 | 1994-11-11 | ||
JP6277898A JPH08137885A (ja) | 1994-11-11 | 1994-11-11 | 多国語文書処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1153355A CN1153355A (zh) | 1997-07-02 |
CN1097244C true CN1097244C (zh) | 2002-12-25 |
Family
ID=17589833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN95119230A Expired - Fee Related CN1097244C (zh) | 1994-11-11 | 1995-11-10 | 多国语文件处理装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPH08137885A (zh) |
CN (1) | CN1097244C (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103995602B8 (zh) * | 2014-06-11 | 2023-04-14 | 陶佳宏 | 一种证件信息录入输出和纠错的方法 |
-
1994
- 1994-11-11 JP JP6277898A patent/JPH08137885A/ja active Pending
-
1995
- 1995-11-10 CN CN95119230A patent/CN1097244C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08137885A (ja) | 1996-05-31 |
CN1153355A (zh) | 1997-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1030114C (zh) | 汉语发音符号/汉字变换装置及方法 | |
CN1095137C (zh) | 字典检索装置 | |
US6934909B2 (en) | Identifying logical elements by modifying a source document using marker attribute values | |
US20050216828A1 (en) | Patent annotator | |
US20060080361A1 (en) | Document information processing apparatus, document information processing method, and document information processing program | |
CN1993692A (zh) | 字符显示系统 | |
CN1838148A (zh) | 电子设备和记录介质 | |
CN1108572C (zh) | 汉语和日语的双向机械翻译机 | |
CN1097244C (zh) | 多国语文件处理装置 | |
US5261103A (en) | Method of and system for compiling source program | |
CN1110939C (zh) | 具有打印控制的信息处理设备和方法 | |
CN1084500C (zh) | 汉字变换装置 | |
CN1731389A (zh) | 盲汉对照编辑排版系统及编辑排版方法 | |
CN1084900C (zh) | 中文汉字的检索方式 | |
CN1174365C (zh) | 手写文字字库 | |
Sinha | Computer Processing of Indian Languages and Scripts—Potentialities & Problems | |
CN1047678C (zh) | 电子汉日辞典编辑检索装置 | |
CN1167999C (zh) | 将超媒体文件转换为语音的方法 | |
McMahon | The role of journals in maintaining data integrity: checking of crystal structure data in acta crystallographica | |
CN1359079A (zh) | 超大型汉字信息处理装置及方法 | |
CN1101732A (zh) | 汉字变换学习装置 | |
CN1123818C (zh) | 电拼汉字计算机输入法、所用键盘及其中文内码 | |
JP3847869B2 (ja) | 文字列変換装置及び方法 | |
CN1147809C (zh) | 可以省略声调符号的汉字变换装置 | |
CN1228565A (zh) | 电脑文档自动检错、改错装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |