CN101796573B - 显示装置、字符序列的显示方法、多个字符序列的排序方法 - Google Patents

显示装置、字符序列的显示方法、多个字符序列的排序方法 Download PDF

Info

Publication number
CN101796573B
CN101796573B CN200880104992.5A CN200880104992A CN101796573B CN 101796573 B CN101796573 B CN 101796573B CN 200880104992 A CN200880104992 A CN 200880104992A CN 101796573 B CN101796573 B CN 101796573B
Authority
CN
China
Prior art keywords
character
language
peculiar
character string
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200880104992.5A
Other languages
English (en)
Other versions
CN101796573A (zh
Inventor
吴自彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Innovations Co ltd Hong Kong
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN101796573A publication Critical patent/CN101796573A/zh
Application granted granted Critical
Publication of CN101796573B publication Critical patent/CN101796573B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本发明在于提供一种即使在以统一码表示的字符序列中含有根据每种语言而不同的字符的情况下也能正确地进行字形的显示以及按笔画数的排序的电子设备。为此,电子设备包括:字形保存装置(12),该字形保存装置(12)保存通过统一码描述的字符的在多个语言中的字形信息;以及辨别装置(7),该辨别装置(7)从由通过统一码描述的字符构成的字符序列中提取一个字符,辨别所提取的一个字符是否为只包含在特定语言中的语言特有字符,如果提取的一个字符是语言特有字符,则确定字符序列所属的语言是语言特有字符所属的语言。

Description

显示装置、字符序列的显示方法、多个字符序列的排序方法
技术领域
本发明涉及在便携式电子设备中显示和排序字符的方法,尤其涉及在便携式电话等电子设备中显示和排序通过统一码描述的字符的方法。
背景技术
当通过计算机等电子设备处理世界各国所使用的各种语言时,对各种语言采用不同的编码方式(字符码)。例如在日文中有JIS(ISO-2022-JP)、Shift_JIS、EUC-JP等字符码。在中文中代表性的有GB2312(简体字)、Big5(繁体字)等字符码,在韩语中代表性的有KSC5601等字符码。随着计算机能够以许多种语言使用,字符码的种类飞跃增加,当前仅具代表性的就有100种以上的字符码。
由于不同语言(字符码)之间不具有兼容性,因此在不同地域之间发送/接收电子邮件等字符信息时,有时字符不被正确显示。因此,在诸如美国微软公司的Windows(注册商标)系列等这样的用于个人计算机(PC)的操作系统(OS)中,备有用于对应到多种语言的模块,通过利用该模块能够正确地显示字符。然而,诸如便携式电话机、PDA、音乐播放器等这样的小型电子设备由于存储容量、运算能力有限,难以通过以上相同的方法对应到多个语言。
为了解决不同语言(字符码)之间的兼容性,设计出了可用单一的字符码处理多种语言的字符的统一码(Unicode,美国商标)。目前,统一码作为世界通用的编码方式而被广泛使用。统一码是由分配给多种不同语言中的每种语言的字符码和共同分配给各语言的字符码组成的综合码。通过利用统一码编码字符小型,即使在不同的地域之间也能够显示字符信息而不会发生乱码等问题。
然而在统一码中,为语言之间重复的字符、意思或构造相似的字符分配了相同的字符码。因此会发生同一字符码被分配给虽然根据每种语言而为笔画数和字形不同的字符但相似的汉字的情形。
图5是示出对于根据每种语言而不同的字符在统一码中被分配同一字符码的字符例的图。例如,图5的(A)示出了日文汉字“突”、和繁体中文以及简体中文中与其对应的汉字。在日文、繁体中文、简体中文中,这些汉字的笔画数以及字形分别不同。更具体地说,日文汉字“突”的笔画数比繁体中文或简体中文中与其对应的汉字少一画。但是在统一码中,对这些汉字均分配了同一字符码(U+0x7A81)。
此外,图5的(B)示出了日文汉字“滑”、和繁体中文中与其对应的汉字。在日文和繁体中文中,这些汉字的笔画数以及字形分别不同。更具体地说,日文汉字“滑”的笔画数比简体中文中与其对应的汉字多一画。但是在统一码中,对这些汉字均分配了同一字符码(U+0x6ED1)。
当尽管根据每种语言而为不同的字符但被分配了同一字符码时,例如即使要显示以统一码表示的中文的电子邮件或网站,在日文OS下,诸如上述的“突”、“滑”等这样的字符也会被以日文字形显示,因此有时无法按照用中文撰写电子邮件或网站的撰写者的意图进行显示。此外,当将包含这些字符的字符序列按笔画数进行了排序时,由于在日文和中文中这些字符的笔画数不同,因此排序后的结果有时会不同。
作为解决该问题的方法,在专利文献1中公开了基于在字符序列中出现每种语言特有的字符的频率来辨别字符序列所使用的语言的技术。此外,在专利文献2中公开了根据通过字体(font)识别信息确定的字形来显示以统一码表示的字符序列的技术。在专利文献3中公开了根据通过字形(glyph)转换数据确定的字形来显示以统一码表示的字符序列的技术。
专利文献1:JP2006-92223A
专利文献2:JP2000-227790A
专利文献3:JP11-232276A
发明内容
但是,在上述的专利文献1的技术中,需要对构成字符序列的所有字符识别是否为各种语言特有的字符并求出该字符序列中各种语言出现的频率。因此如果字数很多,则存在所述辨别处理需要大量的计算量和时间的问题。尤其在上述那样的小型电子设备中难以进行这样的处理。
另一方面,在专利文献2和3的技术中公开了如下技术:字符序列数据具有字体识别信息(font类型)或字形(glyph)转换数据等追加信息,通过这些数据确定字符序列中使用的语言,并根据对应于该语言的字形来显示字符序列。通过该技术,能够正确地根据语言而不同的字形的显示以及按笔画数的排序。但是,由于具有追加信息,电子邮件或网站等的数据量将变大。
本发明的目的在于,提供一种即使在以统一码表示的字符序列中含有根据每种语言而不同的字符的情况下也不依靠追加信息并且能够以在小型电子设备中可处理的适度的计算量正确地进行字形的显示以及按笔画数的排序的电子设备、字符序列的显示方法和排序方法、以及字符序列显示/排序程序。
为了达到上述目的,本发明涉及的电子设备的特征在于,包括:字形保存装置,该字形保存装置保存通过统一码描述的字符的在多个语言中的字形信息;以及辨别装置,该辨别装置从由通过统一码描述的字符构成的字符序列中提取一个字符,辨别提取的一个字符是否为只包含在特定语言中的语言特有字符,如果提取的一个字符是语言特有字符,则确定字符序列所属的语言是语言特有字符所属的语言。
为了达到上述目的,本发明涉及的字符序列的显示方法是在电子设备中显示通过统一码描述的字符序列的方法,其中所述电子设备包括字形保存装置、辨别装置以及显示装置,所述字符序列的显示方法的特征在于:辨别装置提供字符序列;然后辨别装置提取包含在字符序列中的任一个字符;然后辨别装置辨别提取的一个字符是否为只包含在特定语言中的语言特有字符;当提取的一个字符是语言特有字符时,辨别装置确定字符序列所属的语言是语言特有字符所属的语言;然后显示装置通过所确定的语言的保存在字形保持装置中的字形来显示字符序列。
为了达到上述目的,本发明涉及的字符序列的排序方法是在电子设备中对通过统一码描述的多个字符序列进行排序的方法,其中所述电子设备包括:保存多个语言中的字形信息和笔画数信息的字形保存装置;辨别装置;以及排序装置,所述字符序列的排序方法的特征在于:辨别装置提供多个字符序列;然后辨别装置将多个字符序列中的任一字符序列中所包含的字符一个字符一个字符地提取;然后辨别装置辨别提取的一个字符是否为只包含在特定语言中的语言特有字符;当提取的一个字符是语言特有字符时,辨别装置确定字符序列所属的语言是语言特有字符所属的语言;然后排序装置根据语言特有字符所属的语言中的笔画数信息来辨别多个字符序列的笔画数;然后排序装置基于笔画数来对多个字符序列进行排序。
为了达到上述目的,本发明涉及的字符序列显示程序的特征在于,使得包括保存多个语言中的字形信息的字形保存装置和显示装置的电子设备所具有的计算机执行以下处理:提取包含在通过统一码描述的字符序列中的任一个字符;辨别提取的一个字符是否为只包含在特定语言中的语言特有字符;当提取的一个字符是所述语言特有字符时,确定字符序列所属的语言是语言特有字符所属的语言;以及使显示装置通过所确定的语言的保存在字形保持装置中的字形来显示字符序列。
为了达到上述目的,本发明涉及的字符序列排序程序的特征在于,使得包括保存多个语言中的字形信息和笔画数信息的字形保存装置的电子设备所具有的计算机执行以下处理:将通过统一码描述的多个字符序列中的任一字符序列中所包含的字符一个字符一个字符地提取;辨别提取的一个字符是否为只包含在特定语言中的语言特有字符;当提取的一个字符是语言特有字符时,确定字符序列所属的语言是语言特有字符所属的语言;根据语言特有字符所属的语言中的笔画数信息来辨别多个字符序列的笔画数;以及基于笔画数来对多个字符序列进行排序。
发明效果
如上所述,本发明被构成为:对于包含在由通过统一码描述的字符构成的字符序列中的字符,一个字符一个字符地辨别是否为语言特有字符,当包含语言特有字符时确定该字符序列所属的语言是语言特有字符所属的 语言,因此能够不依靠追加信息、并且以在小型电子设备中可处理的适度的计算量辨别字符序列所属的语言。由此可提供能够以小的处理能力有效地对以统一码表示的字符序列进行操作的空前优异的电了设备、字符序列的显示方法和排序方法、以及字符序列显示/排序程序。
附图说明
图1是示出根据本发明实施方式的小型电子设备的一个构成例的框图;
图2是示出由图1中示出的语言识别处理部执行的用于识别字符序列中使用的语言的处理的流程图;
图3是示出由图1中示出的语言判定处理部执行的用于显示字符序列的处理的流程图;
图4是示出由图1中示出的语言判定处理部执行的对多个字符序列进行排序的处理的流程图;
图5是示出对于根据每种语言而不同的字符在统一码中分配了同一字符码的字符例的图。
标号说明
1便携式电话终端
2中央处理装置
3主控制部
4无线通信部
5操作输入处理部
6语言判定处理部(显示装置、排序装置)
7语言识别处理部(辨别装置)
8字符小型保存处理部
9用户指定保存处理部(语言保持装置)
10显示处理部
11存储器部(存储装置)
12统一码转换表(字形保存装置)
13LCD
14无线模块
15操作部
具体实施方式
以下,基于附图对本发明的实施方式进行说明。
图1是示出根据本发明实施方式的小型电子设备的一个构成例的框图。作为本发明实施方式中的小型电子设备的一个示例的便携式电话终端1包括:中央处理装置2、存储器部11、LCD 13、无线模块14、操作部15。在中央处理装置2中,由MPU和RAM构成的主控制部3实现无线通信部4、操作输入处理部5、语言判定处理部6、语言识别处理部7、字符信息保持的处理部8、用户指定保存处理部9、以及显示处理部10的每个功能。
无线通信部4控制无线模块14,从而在与地球站(图中没有示出)之间建立无线语音通信和无线数据通信。主控制部3控制无线模块4进行数据通信,经由互联网等下载电子邮件或网页等数据,并经由字符信息保存处理部8保存到存储器部11中。此外,主控制部3经由操作输入处理部5接受由用户在操作部15上进行的键输入,并通过上述各处理部进行处理。并且,主控制部3将各个处理结果经由显示处理部10显示在LCD(Liquid Crystal Display,液晶显示器)13上。
存储器部11包括统一码转换表12。统一码转换表12是保存有码赋值(code assign)的数据库,该码赋值用于将以统一码表示的字符对应到每种语言。更具体来说,统一码转换表12中包括以统一码表示的日文、繁体中文、简体中文、韩文、香港中文等字符的字形和笔画数、以及有关每个字符是否为后述的语言特有字符的信息。
通过用户经操作部15以及操作输入处理部5进行的操作输入,字符信息保存处理部8经由存储器部11读出存储在存储器部11中的电子邮件或网页等数据。此时,语言识别处理部7识别邮件或网页中所使用的语言。
语言判定处理部6基于语言识别处理部7的识别结果来辨别字符序列中所使用的语言。此外,语言判定处理部6还进行确定该字符序列的被辨别出的语言的字形的笔画数并基于确定的笔画数进行排序的处理。此外,语言判定处理部6从统一码转换表12中读出与该识别结果对应的字形,并根据该字形将该字符序列和排序处理结果经由显示处理部10显示在LCD 13上。
用户指定保存处理部9是将由用户预先选择为默认设定语言的语言的种类保存为用户指定语言的存储器。当语言识别处理部7未能识别出语言时,预先保存在用户指定保存处理部9中的默认设定语言作为辨别结果被输出。
在本实施方式中,以统一码表示的各种语言的字符大致分为“语言特有字符”和“通用字符”。语言特有字符是指只在一种语言中使用的字符。通用字符是指被两种以上语言共同使用的字符。如上所述,统一码转换表12中保存了每个字符是否为语言特有字符。
例如,日文的平假名和片假名、韩文的韩文字(hangeul)等是典型的语言特有字符。汉字中只有在中文中使用的字符是典型的语言特有字符,在日文和韩文中也可使用的汉字是通用字符。图5中例示的字形根据语言而不同的字符也属于通用字符。
图2是示出由图1中示出的语言识别处理部执行的用于识别字符序列中使用的语言的处理的流程图。在语言识别处理部7开始处理之后(S21),首先定义变量I=1(步骤S22)。语言识别处理部7提取判定对象字符序列的第I字符,并给予统一码转换表12的数据来识别所提取的第I字符是否为语言特有字符(步骤S23)。如果第I字符为语言特有字符,则语言识别处理部7进入步骤S26,向语言判定处理部6输出使用语言=该语言特有字符所属的语言的判定结果,并结束处理(步骤S28)。
如果在步骤S23中识别出第I字符不是语言特有字符则语言识别处理部7辨别变量I是否与判定对象字符序列的长度相等(步骤S24)。如果不相等,则语言识别处理部7将I的值增加1(步骤S25),并重复执行步骤S23的处理。即,如图2所示,语言识别处理部7从语言特有字符的第 1字符起顺次识别是否为语言特有字符,并且只要有一个字符为语言特有字符,就识别为该语言特有字符所属的语言即为使用语言。
当语言识别处理部7在步骤24中辨别出变量I与判定对象字符序列的长度相等时,意味着即便从判定对象字符序列的第1字符起顺次重复执行步骤S23的步骤直到最后的字符,也不存在相当于语言特有字符的字符。此时,语言识别处理部7将处理移入步骤S27中,读取保存在用户指定保存处理9中的用户指定语言,向语言判定处理部6输出使用语言=用户指定语言的判定结果,并结束处理(步骤S28)。
图3是示出由图1中示出的语言判定处理部6执行的用于显示字符序列的处理的流程图。语言判定处理部6开始处理(S31),并从字符信息保存处理部8得到显示对象字符序列时(步骤S32),通过语言识别处理部7来对该字符序列进行语言识别处理(步骤S33)。语言识别处理部7通过图2所示的处理,向语言判定处理部6输出使用语言。语言判定处理部6基于判定出的使用语言来将该字符序列显示在LCD 13上并结束处理(步骤S34~35)。
图4是示出由图1中示出的语言判定处理部6执行的对多个字符序列进行排序的处理的流程图。语言判定处理部6开始处理(S41),并从字符信息保存处理部8得到K个排序对象字符序列(K为2以上的自然数)时(步骤S42),首先定义变量j=1(步骤S43),并通过语言识别处理部7来对第j个字符序列进行语言识别处理(步骤S44)。语言识别处理部7通过图2所示的处理,向语言判定处理部6输出使用语言。语言判定处理部6基于判定出的使用语言中的字形来确定第j个字符序列的笔画数(步骤S45)。
接着,语言判定处理部6辨别变量j是否与排序对象字符序列的个数k相等(步骤S46),如果不相等,则将处理移入步骤S47中,将j的值增加1,并重复执行步骤S44~S45的处理,即,语言判定处理部6对所提供的所有k个排序对象字符序列识别使用语言并确定笔画数。如果在步骤S46中变量j等于k,则由于所有排序对象字符序列的笔画数均已确定,因此进入步骤S48,基于确定的笔画数来对排序对象字符序列进行排序,将 排序的结果显示在LCD 13上并结束处理(步骤S49)。
在图2~图4中进行说明的流程图所涉及的各个步骤的动作内容可被构成为作为在便携式电话终端1事先具有的计算机中运行的程序来执行。此外,在图2~图4中是从对象字符序列的第1字符起顺次识别是否为语言特有字符的,但既可以从对象字符序列的最后字符起顺次识别是否为语言特有字符,也可以对从对象字符序列中随机抽取的字符进行识别。所述程序被记录在记录介质中来进行商业交易。
如上所述,本实施方式中的辨别使用语言的处理并不像上述专利文献1那样对显示对象字符序列的所有字符识别是否为语言特有字符并求总数。而是只要有一个字符为语言特有字符,就识别为该语言特有字符所属的语言即为使用语言。从而,在存储容量和运算能力有限的便携式电子设备中也能够以适度的计算量进行使用语言的辨别处理。并且,不像上述专利文献2和3那样需要显示对象字符序列之外的追加信息,因此也不会导致电子邮件或网页等的数据量增大。
另一方面,在图2所示的本实施方式中的使用语言的辨别处理中,不能否认如果1个字符序列中含有多个语言的语言特有字符则会做出错误的辨别处理的可能性。由于在小型电子设备中使用的电子邮件或网页等文件容量通常小于在PC等中使用的文件容量,因此在一个文件中包含多个语言的语言特有字符的可能性低于PC的场合。因此,大部分的情况下,利用本实施方式的辨处理是没有问题的。
即使那样,也优选如下:当做出了错误的辨别结果从而以错误的字形显示了字符时,使得用户能够通过利用上述的用户指定保存处理部9等来任意切换使用语言以显示电子邮件或网页。
以上,基于附图所示的特定的实施方式对本发明进行了说明,但本发明不限定于附图所示的实施方式,只要能够获得本发明的效果,不用说也能够采用迄今已知的任何构成。
以上,参考实施方式(以及实施例)对本申请的发明进行了说明,但本申请的发明不限定于上述实施方式(以及实施例)。本申请的发明的构成或详细内容可以在本申请发明的框架内进行本领域的普通技术人员可理 解的各种变更。
本申请要求以2007年8月30日申请的日本申请特愿2007-224894为基础的优先权,并将其全部公开内容合并于此。
产业上的实用性
可用于显示通过统一码描述的字符的电子设备。尤其适于诸如便携式电话机、PDA、音乐播放器等这样的小型电子设备。

Claims (9)

1.一种显示装置,所述显示装置用于显示通过统一码描述的字符序列,所述显示装置的特征在于,包括:
用于提取包含在所述字符序列中的任一个字符的装置;
用于辨别所述提取的一个字符是否为只包含在特定语言中的语言特有字符的装置;以及
当所述提取的一个字符是所述语言特有字符时确定所述字符序列所属的语言是所述语言特有字符所属的语言的装置,
所述显示装置将多个字符序列根据每个所述字符序列所属的语言中的所述笔画数来排序,并将所述排序的结果进行显示。
2.如权利要求1所述的显示装置,其特征在于,通过所述确定的语言的字形来显示所述字符序列。
3.如权利要求1所述的显示装置,其特征在于,如果所述提取的一个字符不是所述语言特有字符,则从所述字符序列中提取另一个字符来重复执行辨别该字符是否为只包含在特定语言中的语言特有字符的动作,如果在所述字符序列中只要包含一个所述语言特有字符,就确定所述字符序列所属的语言是所述语言特有字符所属的语言。
4.如权利要求3所述的显示装置,其特征在于,从所述字符序列的起始第1字符起顺次进行是否为所述语言特有字符的辨别。
5.如权利要求4所述的显示装置,其特征在于,
所述显示装置还具有用于保持用户预先指定的语言的语言保持装置,
当判断出所述字符序列中不包含所述语言特有字符时,根据保持在语言保持装置中的语言中的字形来显示所述字符序列。
6.一种显示方法,用于显示通过统一码描述的字符序列,所述显示方法的特征在于,
提取包含在所述字符序列中的任一个字符,
辨别所述提取的一个字符是否为只包含在特定语言中的语言特有字符,并且
当所述提取的一个字符是所述语言特有字符时,确定所述字符序列所属的语言是所述语言特有字符所属的语言,
将多个字符序列根据每个所述字符序列所属的语言中的笔画数来排序,并将所述排序的结果进行显示。
7.如权利要求6所述的显示方法,其特征在于,通过所述确定的语言的字形来显示所述字符序列。
8.如权利要求7所述的显示方法,其特征在于,当所述提取的一个字符不是所述语言特有字符时,从所述字符序列中提取另一个字符来重复执行辨别该字符是否为只包含在特定语言中的语言特有字符的动作,
如果在所述字符序列中只要包含一个所述语言特有字符,就确定所述字符序列所属的语言是所述语言特有字符所属的语言。
9.一种排序方法,用于对通过统一码描述的多个字符序列进行排序,所述排序方法的特征在于,
将所述多个字符序列中的任一字符序列中所包含的字符一个字符一个字符地提取,
辨别所述提取的一个字符是否为只包含在特定语言中的语言特有字符,
当所述提取的一个字符是所述语言特有字符时,确定所述字符序列所属的语言是所述语言特有字符所属的语言,
根据所述语言特有字符所属的语言中的笔画数信息来辨别所述多个字符序列的笔画数,并且
基于所述笔画数来对所述多个字符序列进行排序。
CN200880104992.5A 2007-08-30 2008-08-27 显示装置、字符序列的显示方法、多个字符序列的排序方法 Expired - Fee Related CN101796573B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007224894 2007-08-30
JP2007-224894 2007-08-30
PCT/JP2008/065302 WO2009028555A1 (ja) 2007-08-30 2008-08-27 電子機器、文字列の表示方法、複数文字列のソート方法、および文字列表示/ソートプログラム

Publications (2)

Publication Number Publication Date
CN101796573A CN101796573A (zh) 2010-08-04
CN101796573B true CN101796573B (zh) 2014-08-06

Family

ID=40387272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880104992.5A Expired - Fee Related CN101796573B (zh) 2007-08-30 2008-08-27 显示装置、字符序列的显示方法、多个字符序列的排序方法

Country Status (3)

Country Link
JP (2) JPWO2009028555A1 (zh)
CN (1) CN101796573B (zh)
WO (1) WO2009028555A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2372987B1 (en) * 2010-04-02 2013-07-17 Research In Motion Limited Solving character display ambiguities
EP2445181B1 (en) 2010-10-21 2015-07-01 BlackBerry Limited Displaying characters and images based on support
CN104704510B (zh) * 2012-10-10 2018-08-31 摩托罗拉解决方案公司 识别在文档中使用的语言并且基于识别的语言执行ocr识别的方法和装置
CN103810279B (zh) * 2014-02-18 2018-09-14 天津松下汽车电子开发有限公司 一种混合字段的排序方法及装置
JP6489810B2 (ja) * 2014-11-28 2019-03-27 キヤノン株式会社 画像形成装置及び画像形成装置の制御方法
JP6536829B2 (ja) * 2016-08-30 2019-07-03 京セラドキュメントソリューションズ株式会社 画像形成装置および文字描画プログラム
JP6536828B2 (ja) * 2016-08-30 2019-07-03 京セラドキュメントソリューションズ株式会社 画像形成装置および文字描画プログラム
JP6781905B1 (ja) * 2019-07-26 2020-11-11 株式会社Fronteo 情報処理装置、自然言語処理システム、制御方法、および制御プログラム
JP2021022386A (ja) * 2020-09-16 2021-02-18 株式会社Fronteo 情報処理装置、自然言語処理システム、制御方法、および制御プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005182772A (ja) * 2003-11-28 2005-07-07 Sharp Corp 文字認識装置、プログラムおよび記録媒体
JP2007172387A (ja) * 2005-12-22 2007-07-05 Olympus Imaging Corp 文字処理装置、文字処理プログラム、文字処理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01233550A (ja) * 1988-03-15 1989-09-19 Fujitsu Ltd 中国語の表示方式
JPH08255159A (ja) * 1995-03-15 1996-10-01 Toshiba Corp 文字列予測方法,文字列予測装置,仮名漢字変換方法,仮名漢字変換装置及び文書作成装置
JPH11232276A (ja) * 1998-02-17 1999-08-27 Canon Inc 文字処理装置と文字データの処理方法、及び記憶媒体
JP2000227790A (ja) * 1999-02-04 2000-08-15 Digital Electronics Corp 表示装置、および、そのプログラムが記録された記録媒体
JP3732785B2 (ja) * 2002-01-31 2006-01-11 株式会社一穂社 漢字検索装置、漢字検索方法、そのプログラム、及びそのプログラムを記録した記録媒体
JP4104000B2 (ja) * 2003-05-20 2008-06-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、制御方法、プログラム、及びプログラム記録媒体
JP2006092223A (ja) * 2004-09-24 2006-04-06 Sharp Corp 携帯通信端末及び多言語表示制御方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005182772A (ja) * 2003-11-28 2005-07-07 Sharp Corp 文字認識装置、プログラムおよび記録媒体
JP2007172387A (ja) * 2005-12-22 2007-07-05 Olympus Imaging Corp 文字処理装置、文字処理プログラム、文字処理方法

Also Published As

Publication number Publication date
JP6122800B2 (ja) 2017-04-26
JP2014160252A (ja) 2014-09-04
WO2009028555A1 (ja) 2009-03-05
CN101796573A (zh) 2010-08-04
JPWO2009028555A1 (ja) 2010-12-02

Similar Documents

Publication Publication Date Title
CN101796573B (zh) 显示装置、字符序列的显示方法、多个字符序列的排序方法
CN101256462B (zh) 基于全混合联想库的手写输入方法和装置
CN100587660C (zh) 一种手写字符预测识别的方法和装置
CN102455845A (zh) 一种文字输入方法和装置
CN111339268A (zh) 实体词识别方法和装置
CN111611799B (zh) 基于字典和序列标注模型实体属性抽取方法、系统及设备
CN110610180A (zh) 错别字词识别集的生成方法、装置、设备及存储介质
CN109299233A (zh) 文本数据处理方法、装置、计算机设备及存储介质
CN111339166A (zh) 基于词库的匹配推荐方法、电子装置及存储介质
CN113918031A (zh) 使用子字符信息进行中文标点恢复的系统和方法
CN113886708A (zh) 基于用户信息的产品推荐方法、装置、设备及存储介质
US20070283255A1 (en) Character Display Method
US20120091203A1 (en) Method of encoding and decoding text on a matrix code symbol
CN101465905B (zh) 邮件地址搜寻系统及方法
CN113887202A (zh) 文本纠错方法、装置、计算机设备及存储介质
CN110110777A (zh) 图像处理方法和训练方法、以及装置、介质和计算设备
CN113935880A (zh) 政策推荐方法、装置、设备及存储介质
CN112989043A (zh) 指代消解方法、装置、电子设备及可读存储介质
CN110222340B (zh) 书籍人物姓名识别模型的训练方法、电子设备及存储介质
CN110503378A (zh) 一种bom标准化方法、系统及电子设备和存储介质
CN114943306A (zh) 意图分类方法、装置、设备及存储介质
CN114692603A (zh) 基于crf的敏感数据识别方法、系统、装置及介质
CN100390783C (zh) 进行格变换的方法和系统
CN105373598B (zh) 作弊站点识别方法及装置
CN113343652A (zh) 文本处理方法、装置、设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: LENOVO INNOVATION CO., LTD. (HONGKONG)

Free format text: FORMER OWNER: NEC CORP.

Effective date: 20141210

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; TO: HONG KONG, CHINA

TR01 Transfer of patent right

Effective date of registration: 20141210

Address after: Hongkong, China

Patentee after: LENOVO INNOVATIONS Co.,Ltd.(HONG KONG)

Address before: Tokyo, Japan

Patentee before: NEC Corp.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140806

Termination date: 20170827