CN104424166B - 文本处理装置和文本显示系统 - Google Patents

文本处理装置和文本显示系统 Download PDF

Info

Publication number
CN104424166B
CN104424166B CN201410419596.9A CN201410419596A CN104424166B CN 104424166 B CN104424166 B CN 104424166B CN 201410419596 A CN201410419596 A CN 201410419596A CN 104424166 B CN104424166 B CN 104424166B
Authority
CN
China
Prior art keywords
word
text
dictionary
extracted
environmental information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410419596.9A
Other languages
English (en)
Other versions
CN104424166A (zh
Inventor
鲤沼敦
手塚俊行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of CN104424166A publication Critical patent/CN104424166A/zh
Application granted granted Critical
Publication of CN104424166B publication Critical patent/CN104424166B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种文本处理装置和文本显示系统。该文本处理装置包括:被配置为获取环境信息的环境信息获取单元;被配置为获取文本的文本获取单元;被配置为从文本中提取单词的单词提取单元;以及连接指示单元,其被配置为使用被访问的字典,根据环境信息获取单元获取的环境信息而将从文本中提取出的单词转换为经过转换的单词,并且与从文本中提取的单词一起指示所述经过转换的单词。

Description

文本处理装置和文本显示系统
技术领域
本公开总体上涉及用于处理本文的文本处理装置。
背景技术
着眼于降低信息处理装置和显示装置的价格,正在开发使用显示装置提供信息的技术。例如,在城市中使用了数字引导标示显示器,来显示商店信息和商品信息。此外,在车站,LED显示器和液晶显示器被用来显示诸如操作状态、出发时间和警告的信息。进一步地,使用显示装置显示例如新闻和广告变成了惯例。
然而,传统的显示装置并没有被特别改造得适于广大范围的人观察,并且通过显示装置显示的文本可能不必然地被每个观众读到/理解。考虑到这种不便,公开了涉及通过改变本文中特定词语和表达来改善文本的可理解性/易读性的技术(例如见日本特开专利公开No.2011-227849)。日本特开专利公开No.2011-227849公开了一种文本转换装置,其考虑到读者的阅读理解能力并且将汉字字符(中文字符)转换为假名字符或者根据需要改变文本的措辞。
然而,在日本特开专利公开No.2011-227849中描述的文本转换装置,在显示用于目标读者的经过调整的文本的同时,其他读者不能阅读/理解该文本。
图1示出了在日本特开专利公开No.2011-227849中公开的,通过文本转换装置执行的示例性的文本转换。在图示的例子中,为原始文本“莫尔斯被激怒了”(Melos wasinfuriated)154a准备好了包含不同表达的两组不同的部分文本数据154b和154C。部分文本数据154b例如包含可以被从5级到7级的读者阅读和理解的表达。部分文本数据154c包含例如可以被4级或者以下的读者阅读和理解的表达。因此,在显示部分文本数据154b的同时,4级或者以下的读者可能不能阅读/理解该文本的内容。
考虑到上述问题,本发明的一个方面涉及提供能够生成可以被多个读者阅读/理解的文本的文本处理装置。
发明内容
根据本发明的一个实施例,提供了一种文本处理装置,其包括:用于获取环境信息的环境信息获取单元;用于获取文本的文本获取单元;用于从文本中提取单词的单词提取单元;以及共同显示单元,用于通过根据环境信息获取单元所获取的环境信息而访问的字典,对于从所述文本中提取出的单词进行转换,并且与从所述文本中提取的单词共同显示转换后的单词。
根据本发明的一个方面,可以提供能够生成多个读者可以阅读/理解的文本的文本处理装置。
附图说明
图1示出了根据在先技术的示例性文本转换;
图2A-2B示出了根据本发明一个实施例的文本处理装置执行的示例性文本转换;
图3A-3E示出了根据本发明实施例的文本处理装置和文本显示系统的示例性配置;
图4示出了文本处理装置的示例性硬件配置;
图5示出了文本处理装置执行的文本转换的总体概览;
图6是示出文本处理装置的示例性功能配置的方框图;
图7示出了形态分析单元执行的形态分析的例子;
图8示出了环境字典、平假名字典、表达字典和片假名字典的例子;
图9示出了重要词典的例子和外语字典的例子;
图10是环境字典和外语字典之间的示例性关联;
图11是示出文本处理装置的示例性处理操作的流程图;
图12是示出图11中示出的文本优化步骤的示例性详细操作的流程图;
图13是示出平假名转换过程的示例性处理步骤的流程图;
图14是示出教育汉字转换过程的示例性处理步骤的流程图;
图15是示出英文转换过程的示例性处理步骤的流程图;
图16是示出中文转换过程的示例性处理步骤的流程图;
图17是示出表达转换过程的示例性处理步骤的流程图;
图18是示出为了连续执行表达转换和平假名转换的示例性处理步骤的流程图;
图19是示出为了多次执行外文转换的示例性处理步骤的流程图;以及
图20A-20G示出了原始文本和经过转换的文本的显示例子。
具体实施方式
以下,参考附图描述本发明的实施例。
图2A示出了可以被用于根据本发明实施例的文本处理装置的示例性转换方法。当前实施例的文本处理装置主要使用以下三种方法转换单词:
1.以平假名/片假名字符显示难的汉字字符
2.将难的表达转换为更简单的表达
3.以外语显示重要的单词
通过使用以上的转换方法1和2,每个单词的意思可以被例如更年轻的年龄组理解。此外,通过使用以上的转换方法3,例如外国人可能能够理解经过转换的单词。
图2B示出通过当前实施例的文本处理装置转换的文本的例子。在当前的例子中,假设在以下指示的原始文本已经被准备好将预期被日本成年人观看。
コリー社は、お客様のワークスタイル·イノベーションを実現するITソリューションをご提供いたします。(“光理提供IT解决方案来实现工作风格和顾客的创新。”)
如果儿童也是将要通过显示装置显示的原始文本的潜在读者,那么文本处理可能如下方式转换原始文本:
コリー社(しゃ)は、お客様(おきゃくさま)の仕事の内容·新しい技術(しごとのないよう·あたらしいぎじゅつ)を作る(つくる)お仕事(しごと)をご提供(ていきょう)いたします。
如果美国人也是将要通过显示装置显示的原始文本的潜在读者,那么文本处理装置可能如下方式转换原始文本:
コリー社(Cory)は、お客様(customer)のワークスタイル·イノベーション(workstyle and innovation)を実現する(realize)ITソリューション(solution)をご提供(provide)いたします。
亦即,当前实施例的文本处理装置根据文本的潜在读者将原始文本中的单词转换为另一个单词并且与原始单词一起显示经过转换的单词。通过与原始单词一起显示经过转换的单词,不仅日本成年人,还有其他可能阅读文本的潜在的目标读者(例如外国人,孩子)可以能够同时阅读/理解文本。
在以下说明中,被期待阅读原始文本的目标读者被称为“主要目标”,并且除了主要目标以外的读者被称为“潜在目标”。此外,将文本处理装置的用户用来指定潜在目标的信息称为“环境信息”。在当前例子中,将主要目标假定为日本成年人,但是例如该主要目标可以根据诸如将要显示文本的地点的各种环境因素而改变。潜在目标可以例如是儿童、小学生、中学生和/或外国人。
[配置]
图3A-3E示出了根据本发明实施例的文本处理装置和文本显示系统的示例性配置。图3A示出了独立的PC(个人计算机)作为根据本发明实施例的文本处理装置100的主要部件。文本处理装置100根据用户输入的或者从外部获取的环境信息将单词转换为另一个单词,并且产生包括经过转换的单词的经过转换的文本以及文本的原始单词。文本处理装置100在被合并在文本处理装置100中的内置显示装置上显示经过转换的文本。
注意,文本处理装置100可以是任何信息处理装置,例如包括PC、智能电话、平板PC、PDA(个人数字助理)和诸如打印机或者多功能外围设备的图像形成装置。
图3B示出了文本显示系统700的示例性配置,其包括彼此连接的文本处理装置100和显示器200。文本处理装置100和显示器200可以例如经由诸如HDMI(高清晰多媒体接口;注册商标)的视频电缆150相互连接。如同图3A中的,文本处理装置100生成经过转换的文本并且在显示器200上显示该经过转换的文本。
图3C示出了文本显示系统700的另一个示例性配置。在图3C中示出的文本显示系统700中,文本处理装置100和终端300经由网络400相互连接,并且显示器200被连接到该终端300。终端300可以例如是诸如PC的信息处理装置。如同在图3A中,文本处理装置100生成经过转换的文本并且将该经过转换的文本发送给终端300。终端300接收经过转换的文本并且在显示器200上显示该经过转换的文本。注意,网络400可以例如是局域网(LAN)、广域网(WAN)、诸如移动电话网络的公用电话线路或者他们的组合。
图3D示出了文本显示系统700的另一个示例性配置。在图3D中所示的文本显示系统700中,PC 500和文本处理装置100经由网络400相互连接。此外,显示器200被连接到PC500。在这个实施例中,PC 500作为服务器,其将原始文本和环境信息发送给文本处理装置100,并且文本处理装置100生成经过转换的文本并且将其经过转换的文本发送给PC 500。接着,PC 500在显示器200上显示接收到的经过转换的文本。注意,根据当前实施例的文本显示系统700可以例如是基于云的系统或者客户端-服务器系统。
图3E示出了文本显示系统700的另一个示例性配置。在图3E中,PC 500和文本处理装置100经由网络400相互连接。显示器200被连接到文本处理装置100。在这个实施例中,PC500将原始文本和环境信息发送给文本处理装置100,并且文本处理装置100生成经过转换的文本。文本处理装置100随后在显示器200上显示经过转换的文本。注意,当前实施例的文本显示系统700可以是远程操作类型的文本显示系统。
如同可以理解的,文本处理装置100和文本显示系统700可以被布置为各种形式和配置。注意,可以在本发明的范围内以多种方式改善和修改根据本发明实施例的文本处理装置100。以下,根据图3B中示出的实施例的文本处理装置100被主要描述为代表性的例子。
图4是示出文本处理装置100的示例性硬件配置的方框图。图4中示出的文本处理装置100包括通过总线相互连接的CPU 101、RAM 102、ROM 103、存储介质加载单元104、显示器I/F 105、网卡106、输入单元107和HDD 108。例如,CPU 101通过阅读并且执行OS(操作系统)和存储在HDD 108中的各种程序执行各种功能,并且控制文本处理装置100的总体处理操作。
RAM 102作为工作存储器(主存储器),临时存储CPU 101执行程序所需的数据。例如,ROM 103存储用于启动OS或者BIOS(基本输入输出系统)的程序和设置文件。
存储介质110可以被加载在存储介质加载单元104中/卸载到存储介质加载单元104以外。存储介质加载单元104读取存储在存储介质110中的程序,并且将读出的程序存储在HDD 108中。例如,存储介质加载单元104还可以将存储在HDD 108中的数据写到存储介质110上。存储介质110可以例如是USB存储器、SD存储卡、DVD-ROM或者CD-ROM。
例如,输入单元107可以包括键盘、鼠标、触屏、触摸板和声音输入设备中的至少一个。输入单元107从使用文本处理装置100的用户接收各种操作命令。
HDD 108可以例如是诸如SSD(固态驱动器)的非易失性存储器,并且存储例如以下描述的OS、各种程序和文件、以及各种字典。注意,例如,HDD108可以被嵌入在文本处理装置100中,或者HDD 108可以被布置在可以通过文本处理装置100访问的网络上。
显示I/F 105被连接到内置显示装置和显示器200,并且显示I/F 105被配置为在内置显示装置和显示器200上显示经过转换的文本。显示器200可以例如是一般的显示设备,诸如液晶显示器、等离子显示器或者有机场致发光显示器。
网卡106是用于与网络400建立连接的通信设备。例如,网卡106可以是以太网(注册商标)卡。
注意,通过将程序存储在存储介质110中并且将该程序加载到文本处理装置100,或者将该程序从服务器(未显示)下载到文本处理装置100,可以分发相关的程序。此外,例如程序可以被压缩用于以可执行的形式安装或者分布。
注意,此外,文本处理装置100、终端300和PC 500可以具有与图4中所示的相同的硬件配置。因此,省略对终端300和PC 500的硬件配置的详细说明。
[文本转换概览]
图5示出了通过当前实施例的文本处理装置100执行的文本转换的总体概览。文本处理装置100主要执行以下两个过程来响应按下显示器S/W(开关)。
(i)环境信息输入/获取
(ii)单词/表达转换
在环境信息输入/获取处理中,从外部传送或者输入环境信息。注意,可以与环境信息一起输入/获取原始文本,或者在输入/获取环境信息之前/之后输入/获取原始文本。
在单词/表达转换处理中,可以使用以下描述的段字典21、词典22、平假名字典26、外文字典23和表达字典24(例如用于日本孩子、用于美国孩子等等)执行单词/表达转换。然而,注意,在单词/表达转换过程中使用的字典不局限于这些字典。
·段字典:被用来执行对原始文本的形态分析的字典
·词典:包含原始文本的形态分析所使用的常用词的字典
·平假名字典:用于将平假名转换为汉字的字典
·外文字典:用于将日文转换为外文的字典
·表达字典:用于将难的单词或者汉字转换为更简单的表达的字典;日文
表达字典包括日文的更简单的表达,而英语表达字典(例如用于美国人)包括英语的更简单的表达
可以通过环境信息指定将用于单词/表达转换过程的字典。文本处理装置100通过将原始文本分解为多个单词(发言的多个独立部分)来对原始文本执行形态分析,并且使用与环境信息相关联的字典(例如平假名字典、外文字典和表达字典中的至少一个)将原始文本中的单词转换为另一个单词。随后,文本处理装置100通过指示经过转换的单词和文本中的原始单词来生成经过转换的文本。例如,以这种方法,可以生成不仅原始文本的主要目标读者可以理解,而且通过环境信息指定的潜在目标读者也可以理解的经过转换的文本。
[功能和数据库]
图6是示出文本处理装置100的示例性功能配置的方框图。在图6中,文本处理装置100包括环境设置单元11、形态分析单元12、文本优化单元13和图像变换单元14。例如可以通过CPU 101执行存储在HDD 108中的相关程序并且与各种硬件组件协作来实现这些功能元件。
环境设置单元11是环境信息获取单元的示例性实施例。环境设置单元11从输入单元107接收环境信息。如下所述,例如,环境信息可以指定潜在目标本身,或者通过指定显示器200的地点间接地指定潜在目标。
·指定潜在目标本身的环境信息:小学生、中学生、中国人、美国人等等
·通过地点间接指定潜在目标的环境信息:小学、医院等等
例如,环境设置单元11可以显示一个或多个预先注册的潜在目标或者地点并且从操作输入单元107的用户接受对潜在目标或者地点的选择。替选地,例如,代替接受用户选择,环境设置单元11可以直接接收潜在目标或者地点的输入。例如,在任何一种情况下,环境设置单元11可以接受环境信息作为文件。
注意,代替独立地接收环境信息设置,环境设置单元11例如可以与原始文本一起接收环境信息。在这种情况下,例如用户可以以预先指定的形式在原始文本的开头部分附加上环境信息的识别信息或者环境信息。
形态分析单元12是文本获取单元和单词提取单元的示例性实施例。形态分析单元12使用段字典21和词典22对原始文本执行形态分析,并且将原始文本划分成多个片段。可以例如通过逗号(“,”)、空格(“”)或者冒号(“:”)分隔开原始文本的多个片段。例如可以经由输入单元107输入原始文本。亦即,例如,用户可以使用键盘、鼠标或者扩音器输入原始文本。例如,还可以从外部作为文件传送原始文本。亦即,例如,文本处理装置100可以经由网卡106从外部PC接收原始文本(例如存储为文本文件)。此外,例如可以预先将原始文本存储在HDD 108或者存储介质110中,并且文本处理装置100可以从HDD 108或者存储介质110中读出原始文本。
文本优化单元13是连接指示单元的示例性实施例。文本优化单元13根据环境信息使用诸如外文字典23和/或表达字典24的相关字典生成经过转换的文本。例如,如果环境信息是“中国人”,则文本优化单元13可以使用外文字典23来寻找原始文本中的单词的对应的中文单词并且将对应的中文单词与文本的原始单词一起显示。此外,例如如果环境信息是“儿童”,则文本优化单元13可以使用表达字典14来将原始文本的单词与更简单的表达一起显示。此外,例如如果环境信息是“小学生”,则文本优化单元13可以与原始文本中包括的汉字一起显示平假名。
图像转换单元14光栅化经过转换的文本数据来产生位图数据并且在显示器200上显示位图数据。
[形态分析]
图7示出了形态分析单元12执行的示例性形态分析。形态分析包括将文本分开为有意义的单词并且使用字典确定每个单词的词性。然而,注意,当前实施例中的形态分析,只要形态分析单元12可以提取每个单词并且将原始文本拆分为独立单词,就不一定需要确定每个单词的词性。
段字典21在其中注册有小品词和标点符号。例如,可以在段字典21中注册诸如“に”、“は”、“の”、“です”的小品词和诸如“、”、“。”、“·”和“”(空格)的标点符号。因为小品词经常出现在片段的末尾,所以例如可以基于文本中包括的小品词将文本分成多个片段,并且可以做出单词或者表达是否被归入每个片段的确定。
此外,单词被注册在词典22中。词典22可以具有以日文注册在其中的常用词。例如,从典型的日文字典提取出的单词可以被归入词典22。例如,词典22可以包括诸如名词、专有名词、动词、片假名单词和简单的英语单词的单词。
形态分析单元12搜索已经被划分为片段的原始文本来检测被注册在词典22中的单词,并且将原始文本分解为独立的单词。亦即,可以使用段字典21将原始文本分成词素以将原始文本划分为多个片段,并且使用词典22进一步将片段划分为独立的单词。
例如,可以对如下读出的原始文本执行形态分析:“コリー社は、お客様のワークスタイル·イノベーションを実現するITソリューションをご提供いたします。”。注意,在以下指示的第一形态分析结果中,通过逗号(“,”)分隔词素,并且在以下指示的第二形态分析结果中,通过三角形(“△”)分隔词素。
1.コリー社,は,お客様,の,ワークスタイル,·,イノベーション,を,実現,する,IT,ソリューション,を,ご提供,いたします。
2.コリー社△は、△お客様△の△ワークスタイル△·△イノベーション△を△実現△する△IT△ソリューション△を△ご提供△いたします。
注意,可以执行的形态分析不局限于以上所述的。在其他的例子中,可以使用通用形态分析引擎来执行形态分析。此外,代替使文本处理装置100执行形态分析,例如可以使用外部服务来执行形态分析。在这种情况下,例如,文本处理装置100可以将原始文本发送给连接到网络的服务器并且从该服务器获取形态分析结果。
[经过转换的文本的产生]
图8用示意图示出了环境字典31、平假名字典26、表达字典24和片假名字典27的示例性数据结构。环境字典31存储各种形式的环境信息。如上所述,环境信息例如可以指定对应于显示装置的显示器200的潜在目标或者地点。各种单词被注册在平假名字典26、表达字典24和片假名字典27中。注意,在这些字典中注册的单词是本发明的字典注册单词的例子。
在环境字典31中注册的环境信息与一个或多个字典相关联。文本优化单元13基于关联性选择相关的字典,并且使用所选择的字典将原始文本中包括的单词转换为另一个单词。
例如,在图8中,环境信息“儿童”与平假名字典26、表达字典24和片假名字典27相关联。在环境字典31的环境信息与数字n(n≥2)个字典相关联的情况下,文本优化单元13可以相对于原始文本中包括的单词执行多次转换。然而,注意,不是原始文本的每个单词都必须使用字典被转换为另一单词,并且用户还可以能够在输入环境信息时指定选项设置。例如,用户可以指定希望的转换(例如选择平假名字典26、表达字典24或者片假名字典27),或者指定两个或者更多转换的组合。
平假名字典26在其中注册常用汉字单词(例如在词典22中注册的单词)的标音法(读假名)。注意,虽然未示出,例如可能有用于小学孩子的平假名字典26和用于中学孩子的单独的平假名字典26。
相似的,片假名字典27在其中注册常用汉字单词的标音法。虽然未示出,例如有可能存在用于小学孩子的片假名字典27和用于中学孩子的单独的片假名字典27。
表达字典24在其中注册常用词的简单且容易理解的表达。虽然未示出,例如可能存在用于小学孩子的表达字典24和用于中学孩子的单独的表达字典24。此外,例如可能存在用于外文的表达字典24。
此外,一些环境信息可以与重要词典32和外文字典23相关联。亦即,在图8中,环境信息“中国人”、“韩国人”和“美国人”与重要词典32和外文字典23相关联。基于外文字典23将注册在重要词典32中的单词转换(翻译)为对应的外文单词。例如,当环境信息是“中国人”时,使用中文字典322(以下描述)将与重要词典32中注册的重要单词对应的原始文本中的单词转换为中文单词。注意,当环境信息是“韩国人”或者“美国人”时,重要单词被类似地转换为对应的外文单词。
图9示出了重要词典32的例子和外文字典23的例子。重要词典32包括可能对于能够让外国人理解文本意思而言很重要的单词。亦即,用于能够让外国人理解文本内容的关键词被注册在重要词典32中。通过保持重要单词的列表,例如可以生成容易理解的经过转换的文本而不需要将原始文本中的每个单词转换为对应的外文单词。
如果原始文本包括注册在重要词典32中的单词,那么文本优化单元13使用与环境信息相关联的外文字典23将这个单词转换为对应的外文单词。外文字典23的例子包括英文字典321、中文字典322和韩文字典323。然而,注意,外文字典23不局限于以上所述的,而是例如还可以包括诸如法文字典和俄文字典的其他外文字典。
注意,在一些情形下,可以使用多个外文字典23转换一个原始文本。例如,在潜在目标包括美国人和中国人的情况下,可以使用英语字典321将单词转换为英语,并且可以与原始文本的单词一起显示英语单词。此外,例如可以使用中文字典322将单词转换为中文,并且可以与原始文本的单词和对应的英语单词一起显示中文单词。
注意,唯一的(不重复的)键(数字)被分配给在重要词典32中注册的每个单词。类似地,键被分配给在外文字典23中注册的每个单词。在重要词典32和外文字典23中注册的单词通过这种键彼此相关联。因此,文本优化单元13可以依靠分配给重要词典32中的单词的键,并且从外文字典23中为具有相同键的单词读出对应的外文单词。
注意,键不限于是数字,而是例如可以是用于明确识别重要词典32和外文字典23中注册的每个单词的任何识别信息,诸如字母、符号或者字符。
图10示出了在环境字典31和外文字典23之间的另一个示例性关联。注意,可以使用外文字典23将重要词典32中注册的单词翻译为外文来能让外国人理解文本。然而,外国人的阅读能力可能例如取决于外国人的年龄。亦即,外国人可能是例如范围从儿童、青年到成年人的各种年龄组中的任一个。因此,在当前的例子中,为了能够基于与重要词典32相关联的环境信息启动最佳的翻译,提供了与多项环境信息相关联的外文字典23。例如,多项环境信息可以是与重要词典32相关联的环境信息和指定潜在目标的环境信息的组合,诸如“中国人”和“小学生”或者“中国人”和“中学生”。
在图10中示出的例子中,用于小学生/中学生的中文字典3221、用于小学生/中学生的韩文字典3231和用于小学生/中学生的英语字典3211与环境信息的不同组合相关联。以这种方法,例如可以根据潜在目标来启动最佳翻译。
在这种情况下,例如,用户可以根据所提供的外文字典23的类型输入多项环境信息(例如“中国人”和“小学生”)。
注意,环境信息的组合不限于指定潜在目标的环境信息的组合,而是还可以是指定潜在目标的环境信息和指定地点的环境信息的组合。例如,用于小学生/中学生的中文字典3221可以与环境信息的组合“中文”和“学校”相关联。以这种方法,可以启动将中国的小学/中学孩子作为潜在目标的最佳翻译。
此外,虽然未示出,例如,环境信息“日本人”可以与重要词典32相关联,并且医院字典(未显示)可以与环境信息的组合“日本人”和“医院”相关联。在这种情况下,可以根据医院字典转换与在医院使用的特定单词相对应的原始文本中的单词,以此使得在显示器200上显示的经过转换的文本可以被日本读者容易地理解。
此外,在一些情形下,例如,三项或更多项的环境信息(诸如“中国人”、“小学生”和“医院”)可以与特定的外文字典23相关联。亦即,通过增加字典的类型,可以另外指定潜在的目标,并且可以启动相关单词的适当转换。另一方面,例如,当用户相信很难以缩小潜在目标时,用户可以限制环境信息输入的数量(例如即使可以输入“中国人”和“小学生”的情况下,也仅仅键入“中国人”),以此使得可以启动适合于更宽的潜在目标的转换。
[操作]
图11是示出文本处理装置100的示例性处理操作的流程图。
在步骤S100中,环境设置单元11接收环境信息的输入。注意,当潜在目标固定时,可以预先建立环境信息。
注意,在一些实施例中,用户可以与原始文本一起建立环境信息。例如,用户可以如下方式建立环境信息和原始文本:
儿童:コリー社は、お客様のワークスタイル·イノベーションを実現するITソリューションをご提供いたします。
在另一个例子中,用户可以如下方式建立环境信息的识别信息:
02:コリー社は、お客様のワークスタイル·イノベーションを実現するITソリューションをご提供いたします。
注意,在上述例子中,“02”对应于环境信息的识别信息。
以如上方式建立环境信息,在潜在目标频繁地实时变化的情况下是有利的。例如,在图3E中示出的实施例中,PC 500可以重复地将原始文本发送给文本处理装置100,并且文本处理装置100可以实时地显示接收到的原始文本。通过在原始文本的开头附上环境信息,文本处理装置100可以始终在开始获取环境信息,并且根据获取的环境信息来转换环境信息之后的原始文本。例如,以这种方法,文本处理装置100可以能够实时显示根据潜在目标而被最优化的经过转换的文本。
在步骤S200中,形态分析单元12接收原始文本的输入,并且形态分析单元12对接收到的原始文本执行形态分析。
在步骤S300中,文本优化单元13从被分成独立单词的原始文本中生成经过转换的文本。注意,以下详细地描述这个过程。
在步骤S400中,图像转换单元14将经过转换的文本转为图像。亦即,例如,图像转换单元14光栅化经过转换的文本并且将其转换为诸如位图数据的目视数据。
在步骤S500中,文本处理装置100在显示器200上显示经过转换的文本。
在步骤S600中,文本处理装置100确定是否仍然存在将要处理和显示的文本。注意,预定的特种代码,诸如或者“Eof”被附加到原始文本的结尾,如以下例子中所示的。
コリー社は、お客様のワークスタイル·イノベーションを実現するITソリューションをご提供いたします。
在以上例子中,文本处理装置100一旦检测到附加在原始文本结尾的特种代码就结束过程。
图12是示出步骤S300的示例性详细操作的流程图。
首先,文本优化单元13确定环境信息是否与重要词典32相关联(S301)。
如果环境信息与重要词典32相关联(S301,是),则文本优化单元13使用与环境信息相关联的字典将原始文本中包括的重要单词转换为对应的单词(S302)。例如,在环境信息是“美国人”的情况下,重要单词被转换为英语;在环境信息是“中国人”的情况下,重要单词被转换为中文;并且在环境信息是“中国人”和“小学生”的组合的情况下,重要单词被转换为用于小学孩子的中文。
如果环境信息不与重要词典32相关联(S301,否),那么文本优化单元13使用与环境信息相关联的字典转换原始文本中的单词(S303)。如果多个字典与环境信息相关联,那么可以使用与环境信息相关联的字典中的每一个字典转换单词。如果仅仅一种转换被指定为选项设置,仅仅执行该指定的转换。例如,如果仅仅平假名转换被指定作为选项设置,仅仅可以执行平假名转换。如果平假名转换和表达转换都被指定作为选项设置,那么可以执行表达转换,随后执行平假名转换。注意,例如可以向字典分配优先级顺序来确定将要执行的转换的顺序。以这种方法,例如,可以在执行平假名转换之前对单词执行表达转换。另外,例如,可以将选项设置建立得使得在使用表达字典24将单词转换为对应的表达之后,使用外文字典23将表达转换为外文。
图13是示出用于执行平假名转换过程的示例性处理步骤的流程图。文本优化单元13将单词索引递增1(S1101)。注意,原始文本被分解为词素,并且从原始文本的开头部分开始向词素分配连续的数字(单词索引)。在开始图13的过程之前,将单词索引设置成缺省值。
文本优化单元13确定单词索引的对应单词是否是汉字(S1102)。注意,例如,可以基于在汉字区域中是否包括对应的字符代码来确定单词是否为汉字。
如果单词不是汉字(S1102,否),那么过程返回到步骤S1101,因为不需要执行平假名转换。
如果单词是汉字(S1102,是),那么文本优化单元13将单词转换为平假名(S1103)。亦即,文本优化单元13基于原始文本的单词的字符代码来搜索平假名字典26并且为单词获取对应的平假名字符。
随后,文本优化单元13将获取的平假名字符插入在原始文本的单词之后(S1104)。以这种方法,可以与作为汉字的原始单词一起指示平假名字符。
随后,文本优化单元13确定转换过程是否已经执行到了原始文本的最后一个单词(S1105)。如果转换过程还没有达到原始文本的最后一个单词,那么从步骤S1101开始重复转换过程。如果转换过程已经完成到最后一个单词,那么结束平假名转换过程。
例如,以下描述将单词“お客”(顾客)转换为平假名的情况。用于单词“お客”的字符代码(UTF-16)是“304a,5ba2”。如果这个单词的汉字字符“客”被转换为对应的平假名字符“きゃく”,那么用于该平假名字符“きゃく”的字符代码是“304d,3083,304f”。因此,如果在单词“お客”之后指示平假名字符“きゃく”,那么对应的字符代码可以如下。注意,虽然将通过字符代码实际代表括号“()”,但是在以下例子中,括号“()”被保留。
お客(きゃく)=304a,5ba2,(304d,3083,304f)
图14是示出用于执行教育汉字(“教学汉字”)转换的示例性处理步骤的流程图。教育汉字是指在日本的六年小学教育过程中教导的汉字字符(总共1006个)。因此,如果潜在目标(环境信息)是至少在中学,那么将不需要将教育汉字转换为平假名。
文本优化单元13将单词索引递增1(S2101)。注意,原始文本被分解为词素,并且从原始文本的开头部分开始向词素分配连续的数字(单词索引)。在开始图14的过程之前,将单词索引设置成缺省值。
文本优化单元13确定单词索引的对应单词是否是教育汉字字符(S2102)。注意,可以基于单词的字符代码是否对应于1006个教育汉字字符的字符代码之一来确定单词是否对应于教育汉字字符。
如果单词对应于教育汉字字符(S2102,是),那么过程返回到步骤S2101,因为不需要执行平假名转换。
如果单词不对应于教育汉字字符(S2102,否),那么文本优化单元13将该单词转换为平假名,因为中学生不能阅读/理解该单词(S2103)。亦即,文本优化单元13基于原始文本的单词的字符代码来搜索平假名字典26,并且为单词获取对应的平假名字符。
随后,文本优化单元13将平假名字符插入在原始文本的单词之后(S2104)。以这种方法,可以与作为汉字的原始单词一起指示平假名字符。
随后,文本优化单元13确定转换过程是否已经执行到了原始文本的最后一个单词(S2105)。如果转换过程还没有达到最后一个单词,那么从步骤S2101开始重复转换过程,并且如果转换过程已经达到最后一个单词,那么结束教育汉字转换过程。
例如,以下描述将汉字单词“微”(细小的)转换为平假名的情况。单词“微”不是教育汉字字符并且因此被转换为平假名。用于单词“微”的字符代码是“5fae”。如果单词“微”被转换为对应的平假名字符“び”,那么用于该平假名字符“び”的字符代码是“3073”。因此,如果在汉字单词“微”之后指示平假名字符“び”,那么对应的字符代码可以如下。注意,虽然将通过字符代码实际代表括号“()”,但是在以下例子中,括号“()”被保留。
微(び)=5fae(3073)
图15是示出用于执行英语转换的示例性处理步骤的流程图。在这个例子中,假设环境信息与重要词典32相关联。
文本优化单元13将单词索引递增1(S3101)。注意,原始文本被分解为词素,并且从原始文本的开头部分开始向词素分配连续的数字(单词索引)。在开始图15的过程之前,将单词索引设置成缺省值。
文本优化单元13确定单词索引的对应单词是否被注册在重要词典32中(S3102)。注意,例如,可以通过搜索重要词典32中注册的单词来确定是否存在与原始文本的单词相匹配的单词来做出这个决定。
如果在重要词典32中没有注册该单词(S3102,否),那么过程返回到步骤S3101,因为不需要执行英语转换。
如果在重要词典32中注册有该单词(S3102,是),那么文本优化单元13将该单词转换为英语(S3103)。亦即,文本优化单元13基于原始文本的单词的字符代码来搜索英语字典321,并且为原始单词获取对应的英语单词。
随后,文本优化单元13在原始单词之后插入英语单词(S3104)。以这种方法,可以与原始单词一起指示英语单词。
随后,文本优化单元13确定转换过程是否已经执行到了原始文本的最后一个单词(S3105)。如果转换过程还没有达到最后一个单词,那么从步骤S3101开始重复转换过程,并且如果转换过程已经达到最后一个单词,那么结束英语转换过程。
例如,如果单词“お客”对应于重要单词,那么单词“お客”被转换为对应的英语单词“customer”。用于英语单词“customer”的字符代码是“ff54,ff4f,ff4d,ff45,ff52”。因此,如果在单词“お客”之后指示英语单词“customer”,那么对应的字符代码可以如下。注意,虽然将通过字符代码实际代表括号“()”,但是在以下例子中,括号“()”被保留。
お客(customer)=304a,5ba2(ff54,ff4f,ff4d,ff45,ff52)
图16是示出用于执行中文转换的示例性处理步骤的流程图。在当前例子中,假设环境信息与重要词典32相关联。
文本优化单元13将单词索引递增1(S4101)。注意,原始文本被分解为词素,并且从原始文本的开头部分开始向词素分配连续的数字(单词索引)。在开始图16的过程之前,将单词索引设置成缺省值。
文本优化单元13确定单词索引的对应单词是否被注册在重要词典32中(S4102)。注意,例如,可以通过搜索重要词典32中注册的单词来确定是否存在与原始文本的单词相匹配的单词来做出这个决定。
如果在重要词典32中没有注册该单词(S4102,否),那么过程返回到步骤S4101,因为不需要执行中文转换。
如果在重要词典32中注册有该单词(S4102,是),那么文本优化单元13将该单词转换为中文(S4103)。亦即,文本优化单元13基于原始文本的单词的字符代码来搜索中文字典322,并且为原始单词获取对应的中文单词。
随后,文本优化单元13在原始单词之后插入中文单词(S4104)。以这种方法,可以与原始单词一起指示中文单词。
随后,文本优化单元13确定转换过程是否已经执行到了原始文本的最后一个单词(S4105)。如果转换过程还没有达到最后一个单词,那么从步骤S4101开始重复该转换过程,并且如果转换过程已经达到最后一个单词,那么结束中文转换过程。
例如,如果单词“お客”对应于重要单词,那么单词“お客”被转换为对应的中文单词“顾客”。用于中文单词“顾客”的字符代码是“7357,5ba2”。因此,如果在单词“お客”之后指示中文单词“顾客”,那么对应的字符代码可以如下。注意,虽然将通过字符代码实际代表括号“()”,但是在以下例子中,括号“()”被保留。
お客(顾客)=304a,5ba2(7357,5ba2)
图17是示出用于执行表达转换的示例性处理步骤的流程图。在当前例子中,假设环境信息与表达字典24相关联。
文本优化单元13将单词索引递增1(S5101)。注意,原始文本被分解为词素,并且从原始文本的开头部分开始向词素分配连续的数字(单词索引)。在开始图17的过程之前,将单词索引设置成缺省值。
文本优化单元13确定单词索引的对应单词是否被注册在表达字典24中(S5102)。注意,例如,可以通过搜索表达字典24中注册的单词来确定是否存在与原始文本的单词相匹配的单词来做出这个决定。
如果该单词没有注册在表达字典24中(S5102,否),则过程返回到步骤S5101,因为不需要执行表达转换。
如果该单词被注册在表达字典24中(S5102,是),则文本优化单元13将单词转换为不同的表达(S5103)。亦即,文本优化单元13为原始单词获取与字符代码相关联的对应表达。
随后,文本优化单元13在原始单词之后插入表达(S5104)。以这种方法,可以与原始单词一起指示表达。
随后,文本优化单元13确定转化过程是否已经执行到了原始文本的最后一个单词(S5105)。如果转化过程还没有达到最后一个单词,那么从步骤S5101开始重复转化过程,并且如果转化过程已经达到最后一个单词,那么结束中文转化过程。
例如,通过字符代码“30a4,30ce,30d9,2015,30b7,30e7,30f3”代表的单词“イノベーション”(改进)可以被转换为表达“新しいぎじゅつ”(新的技术)。用于表达“新しいぎじゅつ”的字符代码是“65b0,3057,3044,304e,3058,3085,3064”。因此,如果在单词“イノベーション”之后指示表达“新しいぎじゅつ”,那么对应的字符代码可以如下。注意,虽然将通过字符代码实际代表括号“()”,但是在以下例子中,括号“()”被保留。
イノベーション(新しいぎじゅつ)=30a4,30ce,30d9,2015,30b7,30e7,30f3(65b0,3057,3044,304e,3058,3085,3064)
图18是示出用于连续执行表达转换和平假名转换的示例性处理步骤的流程图。在当前例子中,假设环境信息与表达字典24和平假名字典26相关联。
注意,步骤S6101-S6105可以与图17的步骤S5101-S5105基本上相同。然而,在图18的步骤S6104中,原始文本的单词被对应表达替代而不是与对应表达一起被指示。
此外,在步骤S6105中一旦到达文本的末尾,单词索引被初始化为缺省值(S6106)。注意,通过执行处理操作一直到步骤S6106,原始文本“コリー社は、お客様のワークスタイル·イノベーションを実現するITソリューションをご提供いたします。”可以被转换为“コリー社は、お客様の仕事の内容·新しい技術を作るお仕事をご提供します。”。
随后,文本优化单元13对以上经过转换的文本“コリー社は、お客様の仕事の内容·新しい技術を作るお仕事をご提供します。”执行平假名转换。
注意,图18的步骤S6107-S6111可以与图13的步骤S1101-S1105基本上相同。注意,通过执行这些处理步骤,以上经过转换的文本“コリー社は、お客様の仕事の内容·新しい技術を作るお仕事をご提供します。”可以被进一步转换为“コリー社(しゃ)は、お客様(おきゃくさま)の仕事(しごと)の内容(ないよう)·新しい(あたらしい)技術(ぎじゅつ)を作る(つくる)お仕事(しごと)をご提供(ていきょう)します。”。
图19是示出用于多次执行外文转换的示例性处理步骤的流程图。亦即,在当前例子中,假设输入了与重要词典32相关联的多项环境信息。
注意,图19的步骤S7101-S7105可以与图15和图16的步骤S3101-S3105和步骤S4101-S4105基本上相同。然而,在图19的步骤S7100中,环境信息项的数目被设置为变量n。
随后,当处理到达文本的末尾时,做出变量n-1是否等于“0”的确定(S7106)。
如果变量n-1不等于“0”,这意谓着应该基于已经被输入的其他环境信息执行转换过程。因此,文本优化单元13将变量n递减1,初始化单词索引(S7107),并且从步骤S7101开始重复过程。
例如,如果输入了环境信息项“美国人”和“中国人”,那么可以获得以下经过转换的文本。
コリー社(Cory,光理)は、お客様(customer,顾客)の仕事(work,工作)の内容·新しい技術(technology,技術)を作る(make,造)お仕事をご提供(provide,提供)いたします。
[显示例子]
图20A示出了原始文本的例子。
图20B示出了通过对原始文本执行平假名转换获得的用于儿童的经过转换的文本的例子。
图20C示出了通过对原始文本执行表达转换获得的用于中学生的经过转换的文本的例子。在这个例子中,在原始单词旁边显示对应的表达。
图20D示出了通过连续对原始文本执行表达转换和平假名转换而获得的用于儿童的经过转换的文本的例子。在这个例子中,原始单词被对应的表达替代,并且对应的平假名单词被显示在执行表达转换之后剩余的汉字单词旁边。
图20E示出了通过将重要单词转换为英语单词而获得的用于美国人的经过转换的文本的例子。在当前例子中,英语单词被显示在原始重要单词旁边。
图20F示出了通过将重要单词转换为中文单词而获得的用于中国人的经过转换的文本的例子。在当前例子中,中文单词被显示在初始重要单词旁边。
图20G示出了通过将重要单词转换为英语单词和中文单词而获得的用于美国人和中国人的经过转换的文本的例子。在当前例子中,英语单词和中文单词被显示在原始重要单词旁边。
可以通过文本优化单元13使用不同字典23执行转换来获得以上示例性的经过转换的文本。例如,通过使用英语字典321对原始文本执行英语转换,并且其后使用中文字典322执行中文转换来获得用于美国人和中国人的经过转换的文本。以这种方法,重要单词的英语和中文翻译可以被显示在原始文本的重要单词旁边。例如,“Cory,光理”被显示在“コリー社”的旁边,“customer,顾客”被显示在“お客様”的旁边,“work,工作”被显示在“仕事”的旁边,“technology,技術”被显示在“技術”的旁边,“make,造”被显示在“作る”的旁边,“provide,提供”被显示在“ご提供”的旁边。
注意,在一些实施例中,例如,代替如同在图20B-20G中的在原始单词之后显示经过转换的单词,可以在原始单词以上或者以下显示经过转换的单词。在这种情况下,可以比原始单词的大小更小的字体大小将经过转换的单词显示为所谓的“附注文字”来提升文本的可读性。
此外,在一些实施例中,如果动词作为原始文本中的单词出现,根据原始文本将要被转换到的语言,可以相反次序显示对应于动词对象的动词和名词。例如,相对于部分原始文本“ITソリューションをご提供いたします。”,文本处理装置100可以将这个文本转换为如下的英语和中文。
·英文:ITソリューションをご提供します(provide solution)いたします。
·中文:ITソリューションをご提供(提供解決方案)いたします。
如同可以理解的,在日文原始文本中,在动词“提供”(提供)之前显示名词“ソリューション”(解决方案)。在以上示例性的经过转换的文本中,与初始日文单词“ソリューション”相对应的英语单词“solution”和中文单词“解決方案”在动词“提供(provide,提供)”之后显示。以这种方法,例如,英语和中文的经过转换的本文可以更接近于英语和中文词序,并且可以因此更容易被说英语和说中文的人所理解。
如同上述描述的,当前实施例的文本处理装置100根据环境信息将单词转换为另一个单词,并且与原始文本的单词一起指示经过转换的单词。以这种方法,主要目标(例如日本成年人)和其它的潜在目标可以能够同时阅读/理解文本。
虽然以上已经参考特定说明性实施例说明了本发明,但是本发明并不限于这些实施例,并且可以不背离本发明的范围而做出许多变化和修改。
注意,除在图3A-3E中示出的实施例之外,还可以网络上存在的任何信息处理装置来实现文本处理装置100的功能元件。例如,可以在显示器200中实现形态分析单元12和/或文本优化单元13,或者可以以多个信息处理装置实现文本处理装置100的功能元件。
此外,例如,在当前实施例中使用的字典并不必须被包括在文本处理装置100中,而是可以替选地被提供在文本处理装置100可以经由网络访问的另一个地点。
本申请基于2013年8月22日递交的日本专利申请No.2013-172530并且要求其优先权,通过参考将其整个内容合并在本文中。

Claims (12)

1.一种文本处理装置,包括:
用于获取环境信息的环境信息获取单元;
用于获取文本的文本获取单元;
用于从文本中提取单词的单词提取单元;以及
共同显示单元,用于通过根据环境信息获取单元所获取的环境信息而访问的字典,对于从所述文本中提取出的单词进行转换,并且与从所述文本中提取的单词共同显示转换后的单词;
其中所述共同显示单元从与环境信息获取单元所获取的环境信息相关联的字典中读出与从文本中提取的单词相对应的字典注册单词,并且与从文本中提取的单词共同显示所述字典注册单词;
当环境信息获取单元所获取的环境信息与第一字典和第二字典相关联时,共同显示单元从第一字典中读取出与从文本中提取的单词相对应的第一字典注册单词,将从文本中提取的单词替换为第一字典注册单词,从第二字典中读取出与代替从文本中提取的单词的第一字典注册单词相对应的第二字典注册单词,并且共同显示所述第一字典注册单词和所述第二字典注册单词。
2.如权利要求1所述的文本处理装置,其中所述环境信息用于指定通过文本获取单元获取的文本的至少一个潜在读者以及显示通过文本获取单元获取的文本的地点。
3.如权利要求1所述的文本处理装置,其中
当环境信息获取单元获取第一环境信息和第二环境信息时,所述共同显示单元从与环境信息获取单元所获取的第一环境信息相关联的第三字典中读取出与从文本中提取的单词相对应的第三字典注册单词,共同显示从文本中提取的单词和第三字典注册单词,从与环境信息获取单元获取的第二环境信息相关联的第四字典中读取出与从文本中提取的单词相对应的第四字典注册单词,并且共同显示从文本中提取的单词、第三字典注册单词和第四字典注册单词。
4.如权利要求1-3中任一项所述的文本处理装置,其中
环境信息被附加在由所述文本获取单元所获取的文本的开头部分;
环境信息获取单元获取被附加在文本的开头部分的环境信息;并且
所述共同显示单元,针对被附加有环境信息的文本,共同显示转换后的单词和从文本中提取的单词。
5.如权利要求2所述的文本处理装置,其中所述共同显示单元从与环境信息获取单元所获取的环境信息相关联的字典中读出与从文本中提取的单词相对应的字典注册单词,并且与从文本中提取的单词共同显示所述字典注册单词。
6.如权利要求2所述的文本处理装置,其中
当词典与环境信息获取单元所获取的环境信息相关联,并且从文本中提取出的单词被注册在所述词典中时,所述共同显示单元从所述词典中读取出与从文本中提取的单词相对应的字典注册单词,并且与从文本中提取的单词共同显示所述字典注册单词。
7.一种文本显示系统,包括:
用于获取环境信息的环境信息获取单元;
用于获取文本的文本获取单元;
用于从文本中提取单词的单词提取单元;
共同显示单元,用于通过根据环境信息获取单元所获取的环境信息而访问的字典,对于从所述文本中提取出的单词进行转换,并且与从所述文本中提取的单词共同显示转换后的单词;以及
显示单元,用于显示由共同显示单元转换的文本,以便共同显示所述转换后的单词和从所述文本中提取的单词;
其中所述共同显示单元从与环境信息获取单元所获取的环境信息相关联的字典中读出与从文本中提取的单词相对应的字典注册单词,并且与从文本中提取的单词共同显示所述字典注册单词;
当环境信息获取单元所获取的环境信息与第一字典和第二字典相关联时,共同显示单元从第一字典中读取出与从文本中提取的单词相对应的第一字典注册单词,将从文本中提取的单词替换为第一字典注册单词,从第二字典中读取出与代替从文本中提取的单词的第一字典注册单词相对应的第二字典注册单词,并且共同显示所述第一字典注册单词和所述第二字典注册单词。
8.如权利要求7所述的文本显示系统,其中所述环境信息用于指定通过文本获取单元获取的文本的至少一个潜在读者以及显示通过文本获取单元获取的文本的地点。
9.如权利要求7所述的文本显示系统,其中
当环境信息获取单元获取第一环境信息和第二环境信息时,所述共同显示单元从与环境信息获取单元所获取的第一环境信息相关联的第三字典中读取出与从文本中提取的单词相对应的第三字典注册单词,共同显示从文本中提取的单词和第三字典注册单词,从与环境信息获取单元获取的第二环境信息相关联的第四字典中读取出与从文本中提取的单词相对应的第四字典注册单词,并且共同显示从文本中提取的单词、第三字典注册单词和第四字典注册单词。
10.如权利要求7-9中任一项所述的文本显示系统,其中
环境信息被附加在由所述文本获取单元所获取的文本的开头部分;
环境信息获取单元获取被附加在文本的开头部分的环境信息;并且
所述共同显示单元,针对被附加有环境信息的文本,共同显示转换后的单词和从文本中提取的单词。
11.如权利要求8所述的文本显示系统,其中所述共同显示单元从与环境信息获取单元所获取的环境信息相关联的字典中读出与从文本中提取的单词相对应的字典注册单词,并且与从文本中提取的单词共同显示所述字典注册单词。
12.如权利要求8所述的文本显示系统,其中
当词典与环境信息获取单元所获取的环境信息相关联,并且从文本中提取出的单词被注册在所述词典中时,所述共同显示单元从所述词典中读取出与从文本中提取的单词相对应的字典注册单词,并且与从文本中提取的单词共同显示所述字典注册单词。
CN201410419596.9A 2013-08-22 2014-08-22 文本处理装置和文本显示系统 Expired - Fee Related CN104424166B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013172530A JP6417649B2 (ja) 2013-08-22 2013-08-22 文章処理装置、文章表示システム、プログラム
JP2013-172530 2013-08-22

Publications (2)

Publication Number Publication Date
CN104424166A CN104424166A (zh) 2015-03-18
CN104424166B true CN104424166B (zh) 2017-05-24

Family

ID=52481149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410419596.9A Expired - Fee Related CN104424166B (zh) 2013-08-22 2014-08-22 文本处理装置和文本显示系统

Country Status (3)

Country Link
US (1) US9519637B2 (zh)
JP (1) JP6417649B2 (zh)
CN (1) CN104424166B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2639684C2 (ru) * 2014-08-29 2017-12-21 Общество С Ограниченной Ответственностью "Яндекс" Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты)
JP6502279B2 (ja) * 2016-02-26 2019-04-17 日本電信電話株式会社 外れ値箇所抽出装置、方法及びプログラム
JP2019128374A (ja) * 2018-01-22 2019-08-01 トヨタ自動車株式会社 情報処理装置、及び情報処理方法
US11657454B2 (en) * 2018-05-23 2023-05-23 Panagora Asset Management, Inc System and method for constructing optimized ESG investment portfolios
WO2020054244A1 (ja) * 2018-09-13 2020-03-19 株式会社Nttドコモ 対話情報生成装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1618064A (zh) * 2002-01-29 2005-05-18 国际商业机器公司 翻译方法、已翻译句子的输入方法、记录介质、程序与计算机设备
US6999916B2 (en) * 2001-04-20 2006-02-14 Wordsniffer, Inc. Method and apparatus for integrated, user-directed web site text translation
CN1894688A (zh) * 2003-12-15 2007-01-10 有限会社言语技术研究所 对译判断装置、方法及程序

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2836159B2 (ja) * 1990-01-30 1998-12-14 株式会社日立製作所 同時通訳向き音声認識システムおよびその音声認識方法
JPH0635954A (ja) * 1992-07-17 1994-02-10 Matsushita Electric Ind Co Ltd 機械翻訳機
JPH06119379A (ja) * 1992-10-07 1994-04-28 Matsushita Electric Ind Co Ltd ふりがな機能つき機械翻訳装置および方法
JPH1139298A (ja) * 1997-07-18 1999-02-12 Nippon Telegr & Teleph Corp <Ntt> ふりがな制御装置
JP2000010975A (ja) * 1998-06-16 2000-01-14 Toshiba Corp 機械翻訳システム及び電子メール作成支援システム並びに機械翻訳方法及び電子メール作成支援方法
JP2002140252A (ja) * 2000-11-02 2002-05-17 Nec Custommax Ltd 閲覧サービス方法、データ処理方法および装置、ユーザ端末装置、情報記憶媒体
US20020087302A1 (en) * 2000-11-10 2002-07-04 Miyuki Tomaru Processing system, processing method and recording medium
JP3969628B2 (ja) * 2001-03-19 2007-09-05 富士通株式会社 翻訳支援装置、方法及び翻訳支援プログラム
JP4506215B2 (ja) * 2004-03-15 2010-07-21 沖電気工業株式会社 情報システム,スケジュール生成装置,およびスケジュール生成方法
JP2005129086A (ja) * 2005-02-10 2005-05-19 Fujitsu Fip Corp 文書編集装置並びに文書編集処理プログラムを記録した記録媒体
JP2008191976A (ja) * 2007-02-06 2008-08-21 Tsukuba Univ Of Technology リアルタイム字幕提示装置、及び、方法
JP2009104231A (ja) 2007-10-19 2009-05-14 Ricoh Co Ltd 情報処理装置、音出力装置、記号表示装置、画像形成装置、ユーザ属性判定方法、プログラム
JP2009122937A (ja) * 2007-11-14 2009-06-04 Nippon Telegr & Teleph Corp <Ntt> 自動翻訳装置、その方法、そのプログラム
JP5340584B2 (ja) * 2007-11-28 2013-11-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 電子メッセージの読解を支援する装置及び方法
JP2011192163A (ja) * 2010-03-16 2011-09-29 Nec Corp テキスト表示装置、テキスト表示方法、テキスト変換プログラム、及びテキスト変換装置
JP2011227849A (ja) 2010-04-23 2011-11-10 Jvc Kenwood Corp 文章変換装置、文章変換方法、プログラムおよびデータ構造
JP5525921B2 (ja) 2010-06-07 2014-06-18 株式会社リコー 携帯端末、電子文書送信システム、サーバ、機器、文字符号化方法、プログラム
JP2012018633A (ja) * 2010-07-09 2012-01-26 Toshiba Tec Corp 語句解説装置、語句解説方法、翻訳制御装置および翻訳制御方法
JP5529092B2 (ja) * 2011-09-14 2014-06-25 株式会社ゼンリンデータコム 注記データ翻訳装置、注記データ翻訳方法および注記データ翻訳プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6999916B2 (en) * 2001-04-20 2006-02-14 Wordsniffer, Inc. Method and apparatus for integrated, user-directed web site text translation
CN1618064A (zh) * 2002-01-29 2005-05-18 国际商业机器公司 翻译方法、已翻译句子的输入方法、记录介质、程序与计算机设备
CN1894688A (zh) * 2003-12-15 2007-01-10 有限会社言语技术研究所 对译判断装置、方法及程序

Also Published As

Publication number Publication date
US9519637B2 (en) 2016-12-13
CN104424166A (zh) 2015-03-18
US20150057996A1 (en) 2015-02-26
JP6417649B2 (ja) 2018-11-07
JP2015041284A (ja) 2015-03-02

Similar Documents

Publication Publication Date Title
CN104424166B (zh) 文本处理装置和文本显示系统
CN108108342B (zh) 结构化文本的生成方法、检索方法及装置
EP2341450A1 (en) Method and means for data searching and language translation
US20140143703A1 (en) Configurable multilingual keyboard
US20120206477A1 (en) Information retrieval device and information retrieval method
KR101552525B1 (ko) 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법
KR101657886B1 (ko) 한자 입력장치와 한자 입력방법 및 이를 이용한 한자 검색방법
CN106873798B (zh) 用于输出信息的方法和装置
JP2008191936A (ja) コンテンツ登録・検索システムの構築支援方法、およびコンテンツ登録・検索システムの構築支援装置
US9208143B2 (en) Electronic device and dictionary data display method
KR20120103436A (ko) 화상 처리 장치, 비일시적인 컴퓨터 판독 가능한 매체, 및 화상 처리 방법
JP7144795B2 (ja) 和文字変換プログラム及び和文字変換装置
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP6729656B2 (ja) 文章処理装置、文章表示システム、情報処理装置、プログラム
US20200388076A1 (en) Method and system for generating augmented reality interactive content
CN106776489B (zh) 显示设备的电子文档显示方法和系统
CN111353532A (zh) 图像生成方法及装置、计算机可读存储介质、电子设备
JP6891744B2 (ja) 画像マップ作成装置、表示装置及びプログラム
JP6593559B1 (ja) 画像処理装置、プログラム及びデータ構造
JP2019053461A (ja) 画像処理装置、プログラム及び画像データ
JP7268316B2 (ja) 情報処理装置及びプログラム
van Lit Philology: Standards for Digital Editing
CN114327704A (zh) 一种文言文展示方法、装置及电子设备
CN115525160A (zh) 一种汉字输入方法和系统以及键盘
KR20220045797A (ko) 축약형 번역 제공 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170524