CN1426561A - 带有跨语言阅读向导的计算机辅助阅读系统和方法 - Google Patents

带有跨语言阅读向导的计算机辅助阅读系统和方法 Download PDF

Info

Publication number
CN1426561A
CN1426561A CN01808510A CN01808510A CN1426561A CN 1426561 A CN1426561 A CN 1426561A CN 01808510 A CN01808510 A CN 01808510A CN 01808510 A CN01808510 A CN 01808510A CN 1426561 A CN1426561 A CN 1426561A
Authority
CN
China
Prior art keywords
translation
text
word
user
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN01808510A
Other languages
English (en)
Other versions
CN100520768C (zh
Inventor
徐恩东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1426561A publication Critical patent/CN1426561A/zh
Application granted granted Critical
Publication of CN100520768C publication Critical patent/CN100520768C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

某个用户正在以非母语进行阅读,当他需要帮助时,计算机辅助阅读系统为他提供帮助,而无需该用户从文本上转移注意力。在一个实施例中,阅读系统的实现形式为浏览程序的阅读向导。这种阅读向导通过某个图形用户界面(UI)而显现,该用户界面允许用户在非母语的文本中选择某个单词、短语、语句或者单词的其它组合,并查看选定文本在该用户自己母语中的译文。该译文在选定文本附近的窗口或弹出框中出现,以便使分心最小。

Description

带有跨语言阅读向导的 计算机辅助阅读系统和方法
相关申请
本申请源于2000年4月24日提交的、序列号为60/199,288的美国临时申请,并要求其优先权,其公开内容在此特别引用作为参考。本申请也涉及2000年4月24日提交的、序列号为09/556,229的美国专利申请,其公开内容在此引用作为参考。
技术领域
本发明涉及机器辅助阅读系统和方法,更具体地说,本发明涉及有助于用户阅读非母语的一种用户界面和基础体系结构。
背景技术
随着因特网的快速发展,遍布全世界的计算机用户正在越来越多地面对非母语写成的文字材料。许多用户对非母语完全不懂。即使用户进行了一些非母语培训,该用户也往往难以阅读和理解非母语。
考虑某个中国用户访问以英语写成的网页或其它电子文档的情况。这个中国用户在校期间可能接受过某些正规的英语培训,但是这种培训往往不足以使他完全地阅读和理解以英语写成的、特定的单词、短语或者语句。这种汉语-英语的情况仅仅是用于说明这一点的一个例子而已。这个问题在跨越其它语言边界时也是存在的。
所以,本发明起源于提供机器辅助阅读系统和方法有关的问题,这些系统和方法帮助计算机用户阅读和理解非母语表达的文字材料。
发明内容
某个用户正在以非母语进行阅读,当他需要帮助时,计算机辅助阅读系统为他提供帮助,而无需该用户从文本上转移注意力。
在一个实施例中,阅读系统的实现形式为浏览程序的阅读向导。这种阅读向导通过某个图形用户界面(UI)而显现,该用户界面允许用户在非母语的文本中选择某个单词、短语、语句或者单词的其它组合,并查看选定文本在该用户自己母语中的译文。该译文在选定文本附近的窗口或弹出框中出现,以便使分心最小。
一方面,阅读向导的核心包括浅层分析器、统计单词译文选择器和译文生成器。浅层分析器把用户选定的非母语文本中的短语或语句分解成单独的翻译单位(例如短语、单词)。在一个实施例中,浅层分析器将选定文本中的单词划分成片段,并从词态学的角度对其进行分析,以获得每个单词的词态学词根。为了进一步选择译文,浅层分析器采用语句部分(POS)标签和基本名词短语(baseNP)标识,按照特征划分单词和短语。例如,POS标签和baseNP标识可以由某个统计模型来实现。浅层分析器对这些单词应用基于规则的短语扩展和模式匹配,以产生树列表。
对于从非母语文本剖析中得出的翻译单位,统计单词译文选择器选择最优的候选单词译文。单词译文选择器产生所有可能的译文模式,并使用统计翻译和语言模型对该翻译单位进行翻译。输出的是最优的候选译文。
译文生成器将候选单词译文转换成母语中对应的短语。译文生成器部分地使用母语模型,以帮助确定适当的译文。然后,母语单词和短语就通过邻近选定文本的UI显示出来。
附图简要说明
图1是一个计算机系统的框图,它实现了带有跨语言阅读向导的阅读系统。
图2是一个实施例中示范浅层分析器的框图。
图3是一张示意图,用于理解一个实施例中进行的处理。
图4是一张示意图,用于理解图3中的示意图。
图5是一张流程图,介绍一个实施例中方法的步骤。
图6是一张示意图,用于理解一个实施例中进行的处理。
图7是一张流程图,介绍一个实施例中方法的步骤。
图8是一个实施例中示范译文生成器的框图。
图9至图13显示了一个实施例中多种示范用户界面。
具体实施方式
概述
计算机辅助阅读系统帮助用户阅读非母语。为了进行讨论,在一般的浏览程序范围内介绍计算机辅助阅读系统,该程序在通用计算机上运行。不过,计算机辅助阅读系统也可以在许多不同的非浏览环境中实现(例如电子邮件系统、字处理等),并且可以在许多各式各样类型的设备上实行。
下面介绍的实施例,允许更乐于使用母语交流的用户快捷方便地广泛阅读非母语的电子文档,而且其方式促进了集中精力和快速消化有关内容。在要翻译文本的近旁提供带有译文窗口的用户界面,可以增加用户的便利。译文窗口中包含着文本翻译后的译文。将译文窗口放在要翻译文本的近旁,用户的双眼不必移动很远即可确定要翻译的文本。这又减少了用户可察觉的分心,举例来说,假若为了查看要翻译的文本,用户的目光需要扫视一段距离,这种分心就很难避免。
在某些实施例中,光标翻译处理的优点使得用户交互进一步增强。利用鼠标移动来选择文本的位置,用户能够进行快速选择,系统据此自动执行翻译并将翻译后的文本向用户显示。
示范系统体系结构
图1显示了示范计算机系统100,它具有中央处理器(CPU)102、存储器104和输入/输出(I/O)接口106。CPU102与存储器104和I/O接口106通信。存储器104既代表易失性存储器(例如RAM),又代表非易失性存储器(例如ROM、硬盘等)。程序和数据文件可以存放在存储器104中,并在CUP102上执行。
计算机系统100通过I/O接口106连接着一台或多台外围设备。示范外围设备包括鼠标110、键盘112(例如字母数字QWERTY键盘、电话键盘等)、显示监视器114、打印机116、外部存储设备118和话筒120。例如,该计算机系统可以作为通用计算机。所以,计算机系统100执行一种计算机操作系统(未显示),该操作系统在存储器104中存放,在CUP102上执行。该操作系统最好是一种支持窗口环境的多任务操作系统。适宜的操作系统的一个实例是微软公司的Windows品牌操作系统。
应当注意,也可以使用其它计算机系统配置,比如手持设备、多处理器系统、基于微处理器的或者可编程的消费电子产品、网络PC、小型计算机、大型计算机等等。此外,尽管图1中展示的是一种独立的计算机,语言输入系统也可以在分布式计算环境中实现,通过通信网络(例如LAN、因特网等)连接的远程处理设备完成其中的任务。在分布式计算环境中,程序模块既可以位于本机的存储设备中,也可以位于远程存储设备中。
示范阅读系统
计算机系统100实现了阅读系统130,它帮助用户阅读非母语。该阅读系统可以在单词、短语或者语句的级别提供帮助。在图1中实现的阅读系统是作为浏览程序132,它在存储器104中存放,在CUP102上执行。应当重视和理解,下面介绍的阅读系统也可以在浏览器范围以外的氛围中实现。
阅读系统130具有用户界面134和跨语言阅读向导136。UI134展现跨语言阅读向导136。除了阅读系统之外,浏览器程序132还可以包括其它组件,但是这类组件对于浏览器程序被视为标准的,因此将不进行详细显示和介绍。
阅读向导136包括浅层分析器140、统计单词译文选择器142和译文生成器144。
示范浅层分析器
浅层分析器140把选定的非母语文本中的短语或语句分解成单独的翻译单位(例如短语、单词)。
图2稍微详细地显示了一个实施例中的浅层分析器。在任何适当的硬件、软件、固件或者它们的组合中,都可以实现该浅层分析器。在这个展示和介绍的实施例中,浅层分析器是在软件中实现的。
如图所示,浅层分析器140包括单词片段模块200、词态学分析器202、语句部分(POS)标签/基本名词短语标识模块204、短语扩展模块206和模式或模板匹配模块208。虽然这些组件显示为独立的组件,但是应当重视和理解,这些组件也可以互相结合或者与其它组件结合。
依据所介绍的实施例,浅层分析器140把用户已经选定的文本中的单词划分为片段。它使用单词片段模块来做到这一点。然后浅层分析器使用词态学分析器202从词态学的观点处理单词,以获得每个单词的词态学词根。为了发现每个单词的词态学词根,词态学分析器能够对单词应用多种词态学规则。词态学分析器202使用的规则可以由熟练于被分析的具体语言的人制定。例如,英语中的一个规则为,以“ed”结尾的单词,或者通过去除“d”或者通过去除“ed”来形成其词态学词根。
为了进一步选择译文,浅层分析器140采用语句部分(POS)标签/基本名词短语(baseNP)标识模块204,按照特征划分单词和短语。例如,POS标签和baseNP标识可以由某个统计模型来实现,下面紧接着的标题为“POS标签和baseNP标识”的一节介绍了它的一个实例。浅层分析器140使用短语扩展模块206,对POS标签/基本名词短语标识模块204按照特征划分的这些单词,应用基于规则的短语扩展。短语扩展模块的一个目标,是把一个基本名词短语扩展到一个更复杂的名词短语。例如,“baseNP的baseNP”是“baseNP”短语的更复杂的名词短语。浅层分析器140也使用模式或模板匹配模块208来产生树列表。模式或模板匹配模块用于翻译,并认识某些短语翻译是取决于模式的,而不是直接与短语中的单词有关。例如,短语“对baseNP感兴趣”包含一种模式(即“baseNP”),它用于形成一个更复杂的翻译单位,用于翻译。单词“感兴趣”并不直接涉及用于形成更复杂翻译单位的这种模式。
POS标签和baseNP标识
以下的讨论介绍了用于自动识别英语的baseNP(名词短语)的一种统计模型,并构成了处理选定的文本以产生树列表的方式之一。所介绍的方法使用两个步骤:N个最佳语句部分(POS)标签和给予N个最佳POS序列的baseNP标识。所介绍的模型也集成了词法的信息。最后,应用Viterbi算法在整个序列中进行全局搜索,它使得在整个过程中能够获得线性的复杂度。
发现简单的和非递归的基本名词短语(baseNP),是许多自然语言处理应用程序(比如部分剖析、信息检索和机器翻译)的一个重要的子任务。baseNP是简单的名词短语,并不递归地包含其它的名词短语。例如,在以下实例中[…]之内的元素是baseNP,其中NNS、IN、VBG等为语句部分(POS)标签。Marcus et al.,Building a LargeAnnotated Corpus of English:the Penn Treebamk,ComputationalLinguistics,19(2):313-330,1993中介绍了POS标签,使其为世人所知。[Measures/NNS] of/IN[manufacturing/VBG activity/NN]fell/VBD more/RBR than/IN
                 [the/DT overall/JJ measures/NNS]./.
统计方法
在本节中介绍两步法统计模型、参数训练和Viterbi算法,用于搜索POS标签和baseNP标识最佳序列。在介绍该算法之前,引入贯穿讨论的某些记号。
让我们把输入语句E分别表示为下列单词序列和POS序列:E=w1 w2…wn-1 wn
T=t1 t2 …tn-1 tn
其中n为语句中的单词数目,ti为单词wi的POS标签。
给定E后,假设baseNP标识的结果是一个序列,其中某些单词组合成baseNP如下…wi-1[wi wi+1…wj]wj+1
对应的标签序列如下:(a)B=…ti-1[ti ti+1…tj]tj+1…=…ti-1 bi,j tj+1…=n1 n2…nm
其中bi,j对应于某个baseNP的标签序列:[ti ti+1…tj]。bi,j也可以被认为是一种baseNP规则。所以,序列B既包含POS标签,又包含baseNP规则。因此1≤m≤n,ni∈(POS标签集∪baseNP规则集)。这是某个语句带有baseNP记号的第一表达式。有时我们也使用以下等效形式:(b)Q=…(ti-1,bmi-1)(ti,bmi)(ti+1,bmi+1)…(tj,bmj)(tj+1,bmj+1)…=q1 q2…qn
其中每个POS标签ti与其相对于baseNP的位置信息bmi相关联。位置信息为{F,I,E,O,S}之一。F、E和I分别表示该单词在某个baseNP的左边界、右边界,或者某个baseNP内部的另一个位置。O表示该单词在某个baseNP之外。S标注某个单一单词的baseNP。
例如,上面给定实例的两种表达式如下:(a)B=[NNS]IN[VBG NN]VBD RBR IN[DT JJ NNS](b)Q=(NNS S)(IN O)(VBG F)(NN E)(VBD O)(RBR O)(IN O)(JJ I)(NNS E)(.O)
集成的’两步法过程
所介绍方法的原理如下。最可能的baseNP序列B*可以一般地表示如下: B * = arg max B ( p ( B | E ) )
我们把整个过程分成两步,也就是: B * ≈ arg max B ( P ( T | E ) × P ( B | T , E ) ) - - ( 1 )
为了减少搜索空间和计算复杂度,我们仅仅考虑N个最佳POS标签,也就是 T ( N - best ) = arg max T = T 1 , . . . , T N ( P ( T | E ) ) - - ( 2 )
所以,我们有: B * ≈ arg max B , T = T 1 , . . . , T N ( P ( T | E ) × P ( B | T , E ) ) - - ( 3 )
相应地,算法也由两步组成:使用(2)式确定N个最佳POS标签,然后使用(3)式从这些POS序列确定最佳baseNP序列。这两步集成在一起,而不是像在其它方法中那样分开。现在让我们更密切地查看这两步。
确定N个最佳POS序列
在第一步中算法的目标是在搜索空间(POS网格)之内搜索N个最佳POS序列。根据贝叶斯法则,我们有 P ( T | E ) = P ( E | T ) × P ( T ) P ( E )
由于P(E)不影响P(T|E)的最小化过程,(2)式变为 T ( N - best ) = arg max T = T 1 , . . . , T N ( P ( T | E ) ) = arg max T = T 1 , . . . , T N ( P ( E | T ) ) × P ( T ) ) - - ( 4 )
我们现在假设,E中的单词是独立的。因此 P ( E | T ) ≈ Π i = 1 n P ( w i | t i ) - - ( 5 )
然后我们使用三字模型作为P(T)的一种近似,也就是: P ( T ) ≈ Π i = 1 n P ( t i | t i - 2 , t i - 1 ) - - ( 6 )
最后我们有 ( N - bset ) arg max T = T 1 , . . . , T N ( P ( T | E ) ) = arg max T = T 1 , . . . , T N ( Π i = 1 n P ( w i | t i ) × P ( t i | t i - 2 , t i - 1 ) ) - - ( 7 )
在搜索N个最佳的Viterbi算法中,P(wi|ti)被称为词法生成(或输出)概率,P(ti|ti-2,ti-1)被称为隐藏马尔可夫模型中的跃进概率。Viterbi,Error Bounds for Convolution Codes and Asymptotically OptimumDecoding Algorithm,IEEE Transactions on Information TheoryIT-13(2):pp.260-269,April,1967中介绍了Viterbi算法。
确定baseNP
如上所述,给定N个最佳POS序列后,第二步的目标是搜索最佳baseNP序列。
把E、T和B视为随机变量,根据贝叶斯法则,我们有 P ( B | T , E ) = P ( B | T ) × P ( E | B , T ) P ( E | T )
由于 P ( B | T ) = P ( T | B ) × P ( B ) P ( T ) ,我们有, P ( B | T , E ) = P ( E | B , T ) × P ( T | B ) × P ( B ) P ( E | T ) × P ( T ) - - ( 8 )
因为我们对给定语句E中每个可能的POS序列搜索最佳baseNP序列,P(E|T)×P(T)=P(E∩T)=常数。不仅如此,从B的定义,在每个搜索过程期间,我们有 P ( T | B ) = Π i = 1 n P ( t i , . . . , t j | b i , j ) = 1 . 所以,(3)式变为 B * = arg max B , T = T 1 , . . . , T N ( P ( T | E ) × P ( B | T , E ) ) = arg max B , T = T 1 , . . . , T N ( P ( T | E ) × P ( E | B , T ) × P ( B ) ) - - - ( 9 )
使用独立假设,我们有 P ( E | B , T ) ≈ Π i = 1 n P ( w i | t i , bm i ) . - - ( 10 )
利用P(B)的三字近似,我们有: P ( B ) ≈ Π i = 1 m P ( n i | n i - 2 , n i - 1 ) - - ( 11 )
最后,我们得到 B * = arg max B , T = T 1 , . . . , T N ( P ( T | E ) × Π i = 1 n P ( w i | bm i , t i ) × Π i = 1 , m P ( n i | n i - 2 , n i - 1 ) ) - - ( 12 )
总而言之,在第一步中,在POS标签过程中应用搜索N个最佳的Viterbi算法,对于计算的每个POS序列确定路径概率ft如下: f t = Π i = 1 , n p ( w i | t i ) × p ( t i | t i - 2 , t i - 1 ) . 在第二步中,对于每个可能的POS标签结果,再一次应用Viterbi算法搜索最佳baseNP序列。在这一步所找到的每个baseNP序列还与路径概率 f b = Π i = 1 n p ( w i | t i , bm i ) × Π i = 1 , m p ( n i | n i - 2 , n i - 1 ) 相关。某个baseNP序列的总概率由ft a×fb确定,其中α为均衡系数(在我们的实验中α=2.4)。对于给定的语句E,当我们确定最佳baseNP序列时,我们也确定了E的最佳POS序列,它对应于E的最佳baseNP。
作为这个过程如何起作用的一个实例,考虑以下文本:“stockwas down 9.1 points yesterday morning.”在第一步中,该句的N个最佳POS标签结果之一是:T=NN VBD RB CD NNS NN NN。
对于这个POS序列,第二步将试图确定baseNP,如图3所示。虚线中路径的细节在图4中给出。在第二步中计算出它的概率如下(Φ为虚变量):P(B|T,E)=p(stock|NN,S)×p(was|VBD,O)×p(down|RB,O)×p(NU-MBER|CD,B)
  ×p(points|NNS,E)×p(yesterday|NN,B)×p(morning|NN,E)×p(.|.,O)
  ×p([NN]|Φ,Φ)×p(VBD|Φ,[NN])×p(RB|[NN],VBD)×p([CD NNS]|VBD,RB)
  ×p([NN NN]|RB,[CD NNS])×P(.|[CD NNS],[NN NN])
统计参数训练
在这项工作中,训练和试验的数据是取自Penn Treebank的25个部分。我们把整个Penn Treebank数据分成两部分,一部分用于训练,另一部分用于试验。
在我们的统计模型中,我们计算以下四种概率:(1)P(ti|ti-2,ti-1),(2)P(wi|ti),(3)P(ni|ni-2ni-1)和(4)P(wi|ti,bmi)。第一种和第三种参数分别是T和B的三字概率。第二种和第四种是词法生成概率。利用下列公式可以从有POS标签的数据计算概率(1)和(2): ( t i | t i - 2 , t i - 1 ) count ( t i - 2 t i - 2 t i ) Σ j count ( t i - 2 t i - 1 t j ) ( 13 ) p ( w i | t i ) = count ( w i with tag ti ) count ( t i ) - - ( 14 )
由于训练集中的每个语句既有POS标签,又有baseNP边界标签,它可以转换为两个序列,如上节中介绍的B(a)和Q(b)。使用这些序列,利用分别类似于(13)和(14)式的计算公式,可以计算出参数(3)和(4)。
在训练三字模型(3)之前,应当从训练全集提取所有可能的baseNP规则。例如,提取的baseNP规则包括以下三个序列。
        (1)DT CD CD CD NNPS
        (2)RB JJ NNS NNS
        (3)NN NN POS NN
           ……
在Penn Treebank中有超过6000种baseNP规则。训练三字模型(3)时,我们以两种方式对待这些baseNP规则。首先,给每个baseNP规则分配一个唯一标识(UID)。这表明,该算法考虑了每个baseNP规则对应的结构。其次,给所有这些规则分配相同标识(SID)。在这种情况下,这些规则组合成同一类。然而,baseNP规则的标识仍然与分配给POS标签的标识不同。
为了使参数平滑,使用了Katz,Estimation of Probabilities fromsparse Data for Languguage Model Component of Speech Recognize,IEEE Transaction on Acoustics,Speech,and Signal Processing,Volume ASSP-35,pp.400-401,March 1987中介绍的一种方法。为了预测参数(1)和(3)的概率,建立了一个三字模型。在识别baseNP期间遇到未知单词的情况下,以下列方式计算参数(2)和(4): p ( w i | bm i , t i ) = count ( bm i , t i ) max j ( count ( bm j , t i ) ) 2 - - ( 15 ) p ( w i | t i ) = count ( t i ) max j ( count ( t j ) ) 2 - - ( 16 )
这里,bmi表示附着在ti上所有可能的baseNP标号,tj是为未知单词wi猜测的一个POS标签。
图5是一张流程图,介绍一个实施例中方法的步骤。这些步骤可以在任何适当的硬件、软件、固件或者它们的组合中实现。在展示的实例中,这些步骤是在软件中实现的。在上述跨语言的阅读向导136——它形成了浏览器程序132的一部分(见图1)——中,可以发现这种软件的一个具体实施例。更确切地说,将要介绍的方法可以由某个浅层分析器来实现,比如图2中显示和介绍的分析器。
步骤500接收选定的文本。实现这个步骤与某个用户选择文本中要翻译的一个部分有关。通常,用户通过使用一种输入设备比如鼠标等来选择文本。步骤502把选定文本中的单词划分成片段。将会受到本领域的技术人员重视的任何适当的划分处理都可以使用。步骤504获得每个单词的词态学词根。在展示和介绍的实施例中,这一步是由词态学分析器实现的,比如图2中显示的词态学分析器。在展示的实例中,词态学分析器配置为处理以英语写成的单词。不过应当重视和理解,任何适当的语言都可以提供一个基础,在其上可以建立一个词态学分析器。
步骤506使用语句部分(POS)标签和基本名词短语标识来划分单词的特征。任何适当的技术都可以使用。在上面的“POS标签和baseNP标识”一节中,详细介绍了一种示范技术。步骤508对按照特征划分的单词应用基于规则的短语扩展和模式匹配,以产生树列表。在上面的实例中,这一步是使用短语扩展模块206和模式或模板匹配模块208来实现的。步骤510输出树列表,以便进一步处理。
作为树列表的一个实例,考虑图6。其中已经以上面介绍的方法,处理了语句“The Natural Language Computing Group at MicrosoftResearch China is exploring research in advanced natural languagetechnologies”。确切地说,树列表展示了语句中已经使用上面介绍的POS标签和baseNP技术,经过分段、词态学处理和特征划分的各个单词。例如,考虑元素600。其中,单词“Natural”已经从语句中和从父元素“natural language”中划分出来。元素600也已经按特征划分为带有POS标签“JJ”。树上的其它元素也经过类似的处理。
示范单词译文选择器
单词译文选择器142接收树列表并产生所有可能的译文模式。选择器142使用统计翻译和语言模型对剖析后的翻译单位进行翻译,得出母语文本中最优的候选单词译文。输出的是最优的候选译文。
图7是一张流程图,介绍一个实施例中方法的步骤。该方法可以在任何适当的硬件、软件、固件或者它们的组合中实现。在展示和介绍的实施例中,该方法是在软件中实现的。这种软件的一个实施例可以包括单词译文选择器142(见图1)。
按照上面介绍的处理产生的树列表在步骤700接收。步骤702从树列表产生译文模式。在一个实施例中,产生所有可能的译文模式。例如,对于英语到汉语的翻译,英语名词短语“NP1 of NP2”可能有两种可能的译文:(1)T(NP1)+T(NP2)和(2)T(NP2)+T(NP1)。在短语译文中,翻译的短语是一棵句法树,在一个实施例中,所有可能的译文顺序都受到考虑。步骤704使用翻译模型和语言模型来翻译剖析后的翻译单位。翻译单位可以包括单词和短语。然后步骤706输出最优的N个候选单词译文。可以使用统计模型来选择最优的N个候选单词译文。
示范译文生成器
译文生成器144把最优的N个候选单词译文转换为母语中对应的短语。然后母语的单词和短语通过UI出现在选定的文本附近。
图8稍微详细地显示了一个实施例中的译文生成器144。为了翻译最优的候选单词,译文生成器可以利用许多不同的资源。例如,译文生成器可以包括它在翻译过程中使用的词典模块800。词典模块800可以包括单词词典、短语词典、不规则词形词典或者通常在自然语言翻译处理中使用的任何其它词典,这对本领域的技术人员是显而易见的。本领域的技术人员将会理解这类词典的操作和功能,为简便起见此处不再更详细地介绍。
译文生成器144可以包括模板模块802,它包含用于翻译处理中的多个模板。任何适当的模板都可以使用。例如,可以使用所谓的大短语模板来协助翻译过程。在自然语言翻译中使用的模板,其操作已知,此处不再更详细地介绍。
译文生成器144可以包括规则模块804,它包含用于使翻译过程便利的多个规则。规则可以是手工制定的规则,制定它们的人员熟悉被翻译的特定语言。可以制定规则来涉及属于翻译、剖析、翻译模式中的统计错误。本领域的技术人员将会理解基于规则翻译的原理。
译文生成器144可以包括用于翻译过程中的一个或多个统计模型806。这些可以使用的统计模型可以变化范围很广,尤其是对与所需翻译有关的、给定数目的可能的非母语和母语。这些统计模型可以基于上面介绍的POS和baseNP统计参数。在需要从英语翻译成汉语的一个特定实施例中,可以使用以下模型:汉语三字语言模型和汉语交互信息模型。当然,也可以使用其它模型。
上面介绍的模块和模型可以分别使用,也可以按多种相互组合使用。
在处理过程中,至此用户已经选择了非母语文本的一部分,要翻译成母语。选定的文本已经按照上面的介绍进行了处理。在下面紧接着的讨论中,要介绍的方法和系统以对用户方便和高效的方式把翻译后的文本呈现给用户。
阅读向导的用户界面
剩余的讨论是针对阅读向导中用户界面134的特性。具体地说,阅读向导的用户界面134允许用户选择不能确定如何阅读和解释的、以非母语写成的文本。选定的内容可以是各个单词、短语或者语句。
图9至图13显示了阅读向导的若干示范用户界面,以图形UI(GUI)实现,作为浏览器程序或者其它计算机辅助阅读系统的一部分呈现给用户。展示的实例显示了设计为帮助中国用户阅读英语文本的阅读系统。英语文本显示在窗口中。用户可以选择英语文本的某些部分。为了响应用户的选择,阅读向导把选定的内容翻译成汉语文本,并把汉语文本呈现在弹出式译文窗口或滚动框中。
图9显示了用户界面900,它包括“非母语”文本中已经突出显示的一部分。突出显示的文本显示在用户界面的第一区域中。用户界面的第二区域的形式为译文窗口902,配置为以母语显示至少某些文本内容翻译后的部分。在这个实例中,突出显示的文本包括短语“research in advanced natural language technologies”。在这个实例中,用户已经突出显示了单词“advanced”,阅读系统已经自动确定该单词组成被突出显示短语的一部分。然后阅读系统在译文窗口902中自动显示被突出显示短语的最佳译文。通过自动确定包含用户选定单词的短语然后提供该短语的至少一种译文,不仅向读者提供了该单词的译文,而且提供了该单词在其中使用的、翻译后的上下文。这样做的优点在于,它给予读者更多翻译后的信息,这又有助于他们理解正在阅读的材料。
注意,译文窗口902位于突出显示文本的至少一个部分的附近。以这种方式定位译文窗口,为了看见翻译后的文本,用户就不必使其注意力从突出显示的文本转移很远。这样做的优点在于,它不会令用户的阅读过程减慢到不期望的程度。也要注意,译文窗口包含一个下拉箭头904,它可以用于显示选定文本的其它翻译结果。作为一个实例,考虑图10。其中译文窗口902已经下拉,以显示突出显示短语的所有译文。
图11显示了用户界面1100,它带有译文窗口1102。注意,阅读系统自动探测出单词“generated”不在某个短语中,并且只翻译单词“generated”。阅读系统也能够在译文窗口1102中提供多种最可能的译文。例如,显示了三种可能的示范译文。在展示的实例中,显示的译文是与上下文有关的,并按照上下文来排序。所以,在这个实例中,阅读系统仅仅可以显示该单词最佳的n个译文,而不是该单词所有可能的译文。图12显示了用户界面1100,其中单词“generated”的所有可能的译文都在译文窗口1102中呈现给用户。
图13显示了用户界面1300,它带有译文窗口1302,展示了所介绍实施例的一种特性。具体地说,可以给用户一种选择,他们是需要翻译包含选定单词的整个短语,还是只需要翻译选定的单词。在这个实例中,用户已经使其鼠标放置在选择单词“advanced”进行翻译的位置。由于单词“advanced”组成某个较长短语的一部分,阅读系统会自动翻译包含着选定单词的短语,然后向用户呈现各种选择,如上所述。不过在这种情况下,用户已经指示阅读系统,他们仅仅需要翻译选定的单词。他们能够以任何适当的方式做到这一点,比如举例来说,当选定单词时按下“Ctrl”键。
结论
上面介绍的若干实施例帮助用户阅读非母语,并能够允许更乐于使用母语交流的用户快捷方便地广泛阅读非母语的电子文档,而且其方式促进了集中精力和快速消化有关内容。提供的用户界面在要翻译文本的近旁具有译文窗口,包含着文本翻译后的译文,可以增加用户的便利。将译文窗口放在要翻译文本的近旁,用户的双眼不必移动很远即可确定要翻译的文本。这又减少了用户可察觉的分心,举例来说,假若为了查看要翻译的文本,用户的目光需要扫视一段距离,这种分心就很难避免。在某些实施例中,光标翻译处理的优点使得用户交互进一步增强。利用鼠标移动来选择文本的位置,用户能够进行快速选择,系统据此自动执行翻译并将翻译后的文本向用户显示。
尽管是以结构特性和/或词态学步骤的特定语言来介绍了本发明,还是应当理解,在附带的权利要求书中规定的本发明不必局限于所介绍的特定特性或步骤。相反,公开这些特定的特性和步骤,是作为实现要求权利的本发明的优选形式。

Claims (62)

1.一种阅读系统,包括:
一种用户界面,配置为允许用户选择非母语的文本并查看选定文本在母语中的译文;以及
一种跨语言的阅读向导,包括:
一种分析器,把选定的文本分解为各个翻译单位,
一种单词译文选择器,对若干翻译单位选择候选单词译文,以及
一种译文生成器,把候选单词译文转换为母语中对应的单词
和短语,它们可以通过用户界面呈现给用户。
2.根据权利要求1的阅读系统,其特征在于,该分析器包括一种词态学分析器,从词态学的角度处理各个单词,以获得每个单词的词态学词根。
3.根据权利要求1的阅读系统,其特征在于,该分析器包括一种语句部分/基本名词短语标识模块,用于给各个单词加上标签标识。
4.根据权利要求3的阅读系统,其特征在于,该语句部分/基本名词短语标识模块包括一种统计模型。
5.根据权利要求1的阅读系统,其特征在于,该分析器包括一种短语扩展模块,对各个单词应用短语扩展规则。
6.根据权利要求1的阅读系统,其特征在于,该译文生成器包括一种词典模块,把候选单词译文转换为对应的单词和短语。
7.根据权利要求6的阅读系统,其特征在于,该词典模块包括一种单词词典。
8.根据权利要求6的阅读系统,其特征在于,该词典模块包括一种短语词典。
9.根据权利要求6的阅读系统,其特征在于,该词典模块包括一种不规则词形词典。
10.根据权利要求1的阅读系统,其特征在于,该译文生成器包括一种模板模块,它包括一个或多个模板,用于把候选单词译文转换为对应的单词和短语。
11.根据权利要求1的阅读系统,其特征在于,该译文生成器包括一种规则模块,它包含多个规则,用于把非母语单词翻译为母语单词。
12.根据权利要求1的阅读系统,其特征在于,该译文生成器包括一个或多个统计模型。
13.根据权利要求1的阅读系统,实施为一个浏览器。
14.一种阅读系统,包括:
一种用户界面,配置为允许用户选择英语的文本并查看选定文本的汉语译文;以及
一种跨语言的阅读向导,包括:
一种分析器,把选定的文本分解为各个翻译单位,
一种单词译文选择器,对若干翻译单位选择候选单词译文,以及
一种译文生成器,把候选单词译文转换为汉语中对应的短
语,它们可以通过用户界面呈现给用户。
15.根据权利要求14的阅读系统,实施为一个浏览器。
16.一种阅读系统,包括:
一种用户界面,配置为允许用户选择非母语的文本并查看选定文本的母语译文,该用户界面包括弹出式窗口,用户可在其中查看母语文本;以及
一种跨语言的阅读向导,配置为:
接收用户已经选定的非母语文本,以及
自动地把非母语文本翻译成母语文本。
17.根据权利要求16的阅读系统,其特征在于,该弹出式窗口显示在用户已经选定的文本附近。
18.根据权利要求16的阅读系统,其特征在于,该弹出式窗口是可滚动的,以显示多种译文,并显示在用户已经选定的文本附近。
19.根据权利要求16的阅读系统,实现为一个浏览器。
20.一种计算机辅助阅读方法,包括:
通过用户界面向用户呈现非母语文本;
接收用户选定的文本;
处理用户选定的文本,以提供已经从非母语翻译成母语的文本;以及
通过用户界面向用户呈现翻译后的文本。
21.根据权利要求20的计算机辅助阅读方法,其特征在于,所述处理包括:
把文本分解为翻译单位;以及
对于一个或多个翻译单位,获得词态学词根。
22.根据权利要求20的计算机辅助阅读方法,其特征在于,所述处理包括:
把文本分解为翻译单位;以及
使用语句部分标签和基本名词短语标识,按特征划分翻译单位。
23.根据权利要求20的计算机辅助阅读方法,其特征在于,所述处理包括:
把文本分解为翻译单位;
使用语句部分标签和基本名词短语标识,按特征划分翻译单位;以及
对按特征划分的翻译单位应用基于规则的短语扩展和模式匹配,以提供树列表。
24.根据权利要求23的计算机辅助阅读方法,其特征在于,所述处理进一步包括根据树列表产生母语的候选单词译文。
25.根据权利要求24的计算机辅助阅读方法,其特征在于,所述处理进一步包括把候选单词译文转换为母语中对应的单词和/或短语。
26.一种或多种计算机可读的介质,其中具有计算机可读的指令,当某个处理器执行这些指令时,它们指示计算机实现权利要求20的方法。
27.根据权利要求20的计算机辅助阅读方法,其特征在于,所列举的动作由某个浏览器来实现。
28.一种阅读系统,包括:
一种或多种计算机可读的介质;以及
记录在该介质上的代码,配置为实现某个浏览器,该浏览器配置为:
通过用户界面向用户呈现英语文本;
接收用户选定的文本;
处理用户选定的文本,以提供已经从英语翻译成汉语的文本;以及
通过用户界面向用户呈现翻译后的文本。
29.根据权利要求28的阅读系统,其特征在于,该浏览器配置为向用户呈现同一英语文本的多种译文。
30.根据权利要求28的阅读系统,其特征在于,该浏览器配置为在用户选定的英语文本附近的译文窗口中呈现翻译后的文本。
31.根据权利要求28的阅读系统,其特征在于,该浏览器配置为在用户选定的英语文本附近的译文窗口中呈现同一英语文本的多种译文,该译文窗口具有下拉的特性,以显示多种译文的至少某一些。
32.一种计算机辅助阅读方法,包括:
通过用户界面向用户呈现英语文本;
接收用户选定的文本;
处理用户选定的文本,以提供已经从英语翻译成汉语的文本;以及
通过用户界面向用户呈现翻译后的文本。
33.根据权利要求32的计算机辅助阅读方法,其特征在于,所述处理包括:
把文本分解为翻译单位;以及
对于一个或多个翻译单位,获得词态学词根。
34.根据权利要求32的计算机辅助阅读方法,其特征在于,所述处理包括:
把文本分解为翻译单位;以及
使用语句部分标签和基本名词短语标识,按特征划分翻译单位。
35.根据权利要求32的计算机辅助阅读方法,其特征在于,所述处理包括:
把文本分解为翻译单位;
使用语句部分标签和基本名词短语标识,按特征划分翻译单位;以及
对按特征划分的翻译单位应用基于规则的短语扩展和模式匹配,以提供树列表。
36.根据权利要求35的计算机辅助阅读方法,其特征在于,所述处理进一步包括根据树列表产生汉语的候选单词译文。
37.根据权利要求36的计算机辅助阅读方法,其特征在于,所述处理进一步包括把候选单词译文转换为汉语中对应的单词和/或短语。
38.一种或多种计算机可读的介质,其中具有计算机可读的指令,当某个处理器执行这些指令时,它们指示计算机实现权利要求32的方法。
39.一种计算机辅助阅读方法,包括:
通过用户界面向用户呈现非母语文本,使得用户能够选取至少一个单词;
自动确定是否有对应的短语与选定的一个单词相关联;以及
以母语呈现至少选定单词的一种或多种译文,或者如果有对应的短语与选定的单词相关联,以母语呈现对应短语的至少一种译文。
40.根据权利要求39的计算机辅助阅读方法,其特征在于,所述呈现包括在译文窗口中呈现译文,该窗口邻近对应的、选定的至少一个单词。
41.根据权利要求40的计算机辅助阅读方法,其特征在于,所述译文窗口是可滚动的,以便呈现多种不同的译文。
42.根据权利要求39的计算机辅助阅读方法,其特征在于,所述呈现包括呈现多种最可能的译文。
43.根据权利要求42的计算机辅助阅读方法,其特征在于,所述呈现进一步包括根据上下文分选最可能的译文。
44.根据权利要求39的计算机辅助阅读方法,进一步包括:
接收用户输入,该输入表示用户仅仅需要翻译组成短语一部分的、某个选定的单词;以及
仅仅呈现选定单词的一种或多种译文。
45.一种或多种计算机可读的介质,其中具有计算机可读的指令,当某个处理器执行这些指令时,它们指示计算机实现权利要求39的方法。
46.一种阅读系统,包括:
一种或多种计算机可读的介质;以及
记录在该介质上的代码,配置为实现某个浏览器,该浏览器配置为:
使得用户能够选取通过用户界面呈现的至少一个英语单词;
自动确定是否有对应的短语与选定的至少一个英语单词相关联;以及
以汉语呈现选定的至少一个英语单词的一种或多种译文,或者如果有对应的短语与选定的至少一个英语单词相关联,以汉语呈现对应短语的至少一种译文。
47.一种跨语言的用户界面,包括:
第一区域,配置为显示非母语文本;以及
第二区域,配置为以母语显示文本中至少一部分的译文。
48.根据权利要求47的跨语言用户界面,其特征在于,第二区域安排在用户选定来翻译的至少某些文本附近。
49.根据权利要求47的跨语言用户界面,其特征在于,非母语包括英语,母语包括汉语。
50.根据权利要求47的跨语言用户界面,其特征在于,第二区域包括弹出式窗口。
51.根据权利要求50的跨语言用户界面,其特征在于,弹出式窗口包括下拉特性,以显示另外的译文。
52.根据权利要求47的跨语言用户界面,其特征在于,第二区域显示同一文本的多种不同的译文。
53.一种跨语言的用户界面,包括:
第一区域,其中可以显示文本以便用户选择,该文本以第一语言显示;以及
第二区域,邻近用户选定的文本,该第二区域配置为显示已经翻译成第二语言的文本,翻译后的文本对应于用户已经选定的文本。
54.根据权利要求53的跨语言用户界面,其特征在于,第一语言包括英语,第二语言包括汉语。
55.根据权利要求53的跨语言用户界面,其特征在于,第二区域包括弹出式窗口。
56.根据权利要求53的跨语言用户界面,其特征在于,第二区域包括弹出式窗口,它具有下拉特性,以显示多种译文。
57.根据权利要求53的跨语言用户界面,其特征在于,第二区域显示同一文本的多种不同的译文。
58.一种阅读系统,包括:
一种跨语言的阅读向导,包括:
一种分析器,把选定的文本分解为各个翻译单位,该分析器包括包括一种语句部分/基本名词短语标识模块,用于给各个举词加上标签标识,
一种单词译文选择器,对若干翻译单位选择候选单词译文,以及
一种译文生成器,把候选单词译文转换为母语中对应的单词或短语,它们可以通过用户界面呈现给用户。
59.根据权利要求58的阅读系统,其特征在于,该分析器包括一种词态学分析器,从词态学的角度处理各个单词,以获得每个单词的词态学词根。
60.根据权利要求58的阅读系统,其特征在于,该分析器包括一种短语扩展模块,对各个单词应用短语扩展规则。
61.一种或多种计算机可读的介质,其中具有计算机可读的指令,当一个或多个处理器执行这些指令时,使这一个或多个处理器实现一种跨语言的阅读向导,包括:
一种分析器,把选定的文本分解为各个翻译单位,该分析器包括包括一种语句部分/基本名词短语标识模块,用于给各个单词加上标签标识,
一种单词译文选择器,对若干翻译单位选择候选单词译文,以及
一种译文生成器,把候选单词译文转换为母语中对应的单词或短语,它们可以通过用户界面呈现给用户。
62.一种或多种计算机可读的介质,其中具有计算机可读的指令,当一个或多个处理器执行这些指令时,使这一个或多个处理器:
通过用户界面向用户呈现非母语文本;
接收用户选定的文本;
处理选定的文本,步骤包括:
把选定的文本分解为翻译单位,
使用语句部分标签和基本名词短语标识,按照特征划分翻译单位,
对按特征划分的翻译单位应用基于规则的短语扩展和模式匹配,以提供树列表,
根据树列表产生母语的候选单词译文,
把候选单词译文转换为母语中对应的单词和/或短语,以提供已经从非母语翻译成母语的文本;以及
通过用户界面向用户呈现翻译后的文本。
CNB018085105A 2000-04-24 2001-04-23 带有跨语言阅读向导的计算机辅助阅读系统和方法 Expired - Fee Related CN100520768C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US19928800P 2000-04-24 2000-04-24
US60/199,288 2000-04-24

Publications (2)

Publication Number Publication Date
CN1426561A true CN1426561A (zh) 2003-06-25
CN100520768C CN100520768C (zh) 2009-07-29

Family

ID=22736941

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018085105A Expired - Fee Related CN100520768C (zh) 2000-04-24 2001-04-23 带有跨语言阅读向导的计算机辅助阅读系统和方法

Country Status (6)

Country Link
US (4) US7315809B2 (zh)
JP (1) JP2003532194A (zh)
CN (1) CN100520768C (zh)
AU (1) AU2001255599A1 (zh)
HK (1) HK1055492A1 (zh)
WO (1) WO2001082111A2 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100416591C (zh) * 2005-03-25 2008-09-03 富士施乐株式会社 字符识别电子设备和字符识别方法
CN101309731B (zh) * 2005-10-17 2011-04-13 转换注意力治疗技术有限公司 转移注意力治疗的设备以及平板装置
CN101322097B (zh) * 2005-12-05 2011-06-08 微软公司 灵活的显示翻译
US8219907B2 (en) 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
CN102955820A (zh) * 2011-08-30 2013-03-06 上海爱读信息技术有限公司 一种外语词汇积累的系统及其方法
CN103034437A (zh) * 2011-09-29 2013-04-10 三星电子株式会社 在便携式装置中提供用户接口的方法和设备
CN103429265A (zh) * 2010-05-25 2013-12-04 国家医疗保健研究所 用于治疗和预防hcv感染的抗包膜抗体和抗受体抗体组合物
CN104731776A (zh) * 2015-03-27 2015-06-24 百度在线网络技术(北京)有限公司 翻译信息的提供方法及系统
CN105808527A (zh) * 2016-02-24 2016-07-27 北京百度网讯科技有限公司 基于人工智能的定向翻译方法及装置
CN108170660A (zh) * 2018-01-22 2018-06-15 北京百度网讯科技有限公司 多语言排版的显示方法、装置、浏览器、终端及介质

Families Citing this family (195)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
JP3522644B2 (ja) * 2000-04-28 2004-04-26 株式会社講談社 表示言語変換システム及び記憶媒体
US6985851B2 (en) * 2001-07-17 2006-01-10 Microsoft Corporation Method and apparatus for providing improved HMM POS tagger for multi-word entries and factoids
US7634397B2 (en) * 2002-06-27 2009-12-15 Siebel Systems, Inc. Single server instance, multi-lingual applications based on loosely coupled metadata and presentation layers
US20040024585A1 (en) * 2002-07-03 2004-02-05 Amit Srivastava Linguistic segmentation of speech
US20040004599A1 (en) * 2002-07-03 2004-01-08 Scott Shepard Systems and methods for facilitating playback of media
US20060100849A1 (en) * 2002-09-30 2006-05-11 Ning-Ping Chan Pointer initiated instant bilingual annotation on textual information in an electronic document
US8137105B2 (en) 2003-07-31 2012-03-20 International Business Machines Corporation Chinese/English vocabulary learning tool
US7412385B2 (en) * 2003-11-12 2008-08-12 Microsoft Corporation System for identifying paraphrases using machine translation
US7584092B2 (en) 2004-11-15 2009-09-01 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
CN1950820A (zh) * 2004-03-02 2007-04-18 梅林格有限公司 嵌入式翻译文档方法和系统
JP2005293174A (ja) * 2004-03-31 2005-10-20 Toshiba Corp テキストデータ編集装置、テキストデータ編集方法及びテキストデータ編集プログラム
US7546235B2 (en) * 2004-11-15 2009-06-09 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
US20060173829A1 (en) * 2005-01-10 2006-08-03 Neeman Yoni M Embedded translation-enhanced search
US7676357B2 (en) * 2005-02-17 2010-03-09 International Business Machines Corporation Enhanced Chinese character/Pin Yin/English translator
US9785329B2 (en) * 2005-05-23 2017-10-10 Nokia Technologies Oy Pocket computer and associated methods
US20070024646A1 (en) * 2005-05-23 2007-02-01 Kalle Saarinen Portable electronic apparatus and associated method
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7908132B2 (en) 2005-09-29 2011-03-15 Microsoft Corporation Writing assistance using machine translation techniques
US20070174045A1 (en) * 2006-01-25 2007-07-26 International Business Machines Corporation Automatic acronym expansion using pop-ups
US20070219782A1 (en) * 2006-03-14 2007-09-20 Qing Li User-supported multi-language online dictionary
US20080019281A1 (en) * 2006-07-21 2008-01-24 Microsoft Corporation Reuse of available source data and localizations
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US9495358B2 (en) * 2006-10-10 2016-11-15 Abbyy Infopoisk Llc Cross-language text clustering
US9588958B2 (en) * 2006-10-10 2017-03-07 Abbyy Infopoisk Llc Cross-language text classification
US8144990B2 (en) 2007-03-22 2012-03-27 Sony Ericsson Mobile Communications Ab Translation and display of text in picture
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8260619B1 (en) 2008-08-22 2012-09-04 Convergys Cmg Utah, Inc. Method and system for creating natural language understanding grammars
WO2009036800A1 (en) * 2007-09-19 2009-03-26 Nokia Corporation Method of text translation and electronic device capable thereof
US20090083026A1 (en) * 2007-09-24 2009-03-26 Microsoft Corporation Summarizing document with marked points
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US20090162818A1 (en) * 2007-12-21 2009-06-25 Martin Kosakowski Method for the determination of supplementary content in an electronic device
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
WO2009146238A1 (en) * 2008-05-01 2009-12-03 Chacha Search, Inc. Method and system for improvement of request processing
KR100978581B1 (ko) * 2008-05-08 2010-08-27 엔에이치엔(주) 웹 페이지 열람 중에 편리하게 사전 서비스를 제공하기위한 방법 및 시스템
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9262409B2 (en) * 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US8296125B2 (en) * 2008-10-17 2012-10-23 International Business Machines Corporation Translating source locale input string to target locale output string
US9323854B2 (en) * 2008-12-19 2016-04-26 Intel Corporation Method, apparatus and system for location assisted translation
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
CN101576878A (zh) * 2009-06-17 2009-11-11 董名垂 用户勾圈网页即时翻译系统及方法
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8520983B2 (en) * 2009-10-07 2013-08-27 Google Inc. Gesture-based selective text recognition
US20110097693A1 (en) * 2009-10-28 2011-04-28 Richard Henry Dana Crawford Aligning chunk translations for language learners
US8732577B2 (en) 2009-11-24 2014-05-20 Clear Channel Management Services, Inc. Contextual, focus-based translation for broadcast automation software
US8515185B2 (en) * 2009-11-25 2013-08-20 Google Inc. On-screen guideline-based selective text recognition
US20110167350A1 (en) * 2010-01-06 2011-07-07 Apple Inc. Assist Features For Content Display Device
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20120010870A1 (en) * 2010-07-09 2012-01-12 Vladimir Selegey Electronic dictionary and dictionary writing system
US8635059B2 (en) * 2010-11-15 2014-01-21 Google Inc. Providing alternative translations
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US9195652B2 (en) * 2011-06-08 2015-11-24 Accenture Global Services Limited Automated systems and methods for integrated multi-platform communication including real-time language translation
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
KR101475284B1 (ko) * 2011-11-29 2014-12-23 에스케이텔레콤 주식회사 작문 자동 평가를 위해 샬로우 파서를 이용한 오류 검출 장치 및 방법
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9536438B2 (en) * 2012-05-18 2017-01-03 Xerox Corporation System and method for customizing reading materials based on reading ability
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
CN103577397A (zh) * 2012-08-10 2014-02-12 阿里巴巴集团控股有限公司 计算机翻译数据处理方法及装置
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9256798B2 (en) * 2013-01-31 2016-02-09 Aurasma Limited Document alteration based on native text analysis and OCR
CN103218353B (zh) * 2013-03-05 2018-12-11 刘树根 母语人士学用其它语言文字之人工智能实现方法
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3937002A1 (en) 2013-06-09 2022-01-12 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101482430B1 (ko) * 2013-08-13 2015-01-15 포항공과대학교 산학협력단 전치사 교정 방법 및 이를 수행하는 장치
US9678939B2 (en) * 2013-12-04 2017-06-13 International Business Machines Corporation Morphology analysis for machine translation
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9639526B2 (en) * 2014-01-10 2017-05-02 Microsoft Technology Licensing, Llc Mobile language translation of web content
US10394938B2 (en) 2014-04-30 2019-08-27 MBTE Holdings Sweden AB Visual searching and navigation
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
JP5748381B1 (ja) * 2014-07-31 2015-07-15 楽天株式会社 メッセージ処理装置、メッセージ処理方法、記録媒体およびプログラム
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US9852131B2 (en) * 2015-05-18 2017-12-26 Google Llc Techniques for providing visual translation cards including contextually relevant definitions and examples
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
WO2017160746A1 (en) 2016-03-14 2017-09-21 Yakyapp Corporation Devices, systems, and methods for selectively providing contextual language translation
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
JP6709678B2 (ja) * 2016-05-10 2020-06-17 日本放送協会 読解支援装置及びプログラム
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US10409903B2 (en) 2016-05-31 2019-09-10 Microsoft Technology Licensing, Llc Unknown word predictor and content-integrated translator
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
WO2018018333A1 (zh) * 2016-07-24 2018-02-01 张鹏华 一种阅读英文时查询单词的方法和阅读系统
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
CN108075959B (zh) * 2016-11-14 2021-03-12 腾讯科技(深圳)有限公司 一种会话消息处理方法和装置
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
CN107679043A (zh) * 2017-09-22 2018-02-09 广州阿里巴巴文学信息技术有限公司 数据处理方法、装置及终端设备
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
US11385916B2 (en) * 2020-03-16 2022-07-12 Servicenow, Inc. Dynamic translation of graphical user interfaces
US11580312B2 (en) 2020-03-16 2023-02-14 Servicenow, Inc. Machine translation of chat sessions
CN113221582B (zh) * 2021-04-29 2024-08-06 北京搜狗科技发展有限公司 一种翻译处理方法、装置和用于翻译处理的装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6170660A (ja) * 1984-09-14 1986-04-11 Hitachi Ltd 機械翻訳システムにおける多義表示・選択方法
JPS61255468A (ja) * 1985-05-08 1986-11-13 Toshiba Corp 機械翻訳処理装置
JPH0743719B2 (ja) * 1986-05-20 1995-05-15 シャープ株式会社 機械翻訳装置
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
JPH05225233A (ja) * 1992-02-13 1993-09-03 Matsushita Electric Ind Co Ltd 機械翻訳装置
JP3038079B2 (ja) 1992-04-28 2000-05-08 シャープ株式会社 自動翻訳装置
ES2143509T3 (es) * 1992-09-04 2000-05-16 Caterpillar Inc Sistema integrado de edicion y traduccion.
US5822720A (en) 1994-02-16 1998-10-13 Sentius Corporation System amd method for linking streams of multimedia data for reference material for display
JPH0877176A (ja) * 1994-09-07 1996-03-22 Hitachi Ltd 外国語翻訳装置
US5715468A (en) 1994-09-30 1998-02-03 Budzinski; Robert Lucius Memory system for storing and retrieving experience and knowledge with natural language
US5697789A (en) 1994-11-22 1997-12-16 Softrade International, Inc. Method and system for aiding foreign language instruction
US6139201A (en) * 1994-12-22 2000-10-31 Caterpillar Inc. Integrated authoring and translation system
US6516296B1 (en) 1995-11-27 2003-02-04 Fujitsu Limited Translating apparatus, dictionary search apparatus, and translating method
JPH11161682A (ja) * 1997-09-29 1999-06-18 Toshiba Corp 情報検索装置、情報検索方法及び記録媒体
CN1302398A (zh) * 1998-03-20 2001-07-04 诺福米迪亚股份有限公司 电子书籍系统
US6092036A (en) 1998-06-02 2000-07-18 Davox Corporation Multi-lingual data processing system and system and method for translating text used in computer software utilizing an embedded translator
US6092034A (en) * 1998-07-27 2000-07-18 International Business Machines Corporation Statistical translation system and method for fast sense disambiguation and translation of large corpora using fertility models and sense models
CN1250915A (zh) 1998-10-09 2000-04-19 英业达股份有限公司 即时翻译系统
US6327566B1 (en) 1999-06-16 2001-12-04 International Business Machines Corporation Method and apparatus for correcting misinterpreted voice commands in a speech recognition system
US6434518B1 (en) 1999-09-23 2002-08-13 Charles A. Glenn Language translator
JP2001101185A (ja) 1999-09-24 2001-04-13 Internatl Business Mach Corp <Ibm> 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体
US6778949B2 (en) * 1999-10-18 2004-08-17 Sony Corporation Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
JP3522644B2 (ja) 2000-04-28 2004-04-26 株式会社講談社 表示言語変換システム及び記憶媒体

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8219907B2 (en) 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
CN100416591C (zh) * 2005-03-25 2008-09-03 富士施乐株式会社 字符识别电子设备和字符识别方法
CN101309731B (zh) * 2005-10-17 2011-04-13 转换注意力治疗技术有限公司 转移注意力治疗的设备以及平板装置
CN101322097B (zh) * 2005-12-05 2011-06-08 微软公司 灵活的显示翻译
CN103429265A (zh) * 2010-05-25 2013-12-04 国家医疗保健研究所 用于治疗和预防hcv感染的抗包膜抗体和抗受体抗体组合物
CN102955820A (zh) * 2011-08-30 2013-03-06 上海爱读信息技术有限公司 一种外语词汇积累的系统及其方法
CN103034437A (zh) * 2011-09-29 2013-04-10 三星电子株式会社 在便携式装置中提供用户接口的方法和设备
US10176169B2 (en) 2015-03-27 2019-01-08 Baidu Online Network Technology (Beijing) Co., Ltd. Method and system for providing translation information
CN104731776A (zh) * 2015-03-27 2015-06-24 百度在线网络技术(北京)有限公司 翻译信息的提供方法及系统
WO2016155144A1 (zh) * 2015-03-27 2016-10-06 百度在线网络技术(北京)有限公司 翻译信息的提供方法及系统
CN104731776B (zh) * 2015-03-27 2017-12-26 百度在线网络技术(北京)有限公司 翻译信息的提供方法及系统
KR101863484B1 (ko) 2015-03-27 2018-05-31 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 번역 정보 제공 방법 및 시스템
CN105808527A (zh) * 2016-02-24 2016-07-27 北京百度网讯科技有限公司 基于人工智能的定向翻译方法及装置
US10055405B2 (en) 2016-02-24 2018-08-21 Beijing Baidu Netcom Science And Technology Co., Ltd. Computer-implemented directional translation method and apparatus
CN108170660A (zh) * 2018-01-22 2018-06-15 北京百度网讯科技有限公司 多语言排版的显示方法、装置、浏览器、终端及介质
CN108170660B (zh) * 2018-01-22 2021-08-06 北京百度网讯科技有限公司 多语言排版的显示方法、装置、浏览器、终端及介质

Also Published As

Publication number Publication date
US20010056352A1 (en) 2001-12-27
US20050071173A1 (en) 2005-03-31
JP2003532194A (ja) 2003-10-28
CN100520768C (zh) 2009-07-29
WO2001082111A2 (en) 2001-11-01
WO2001082111A3 (en) 2002-08-29
US7228268B2 (en) 2007-06-05
US7315809B2 (en) 2008-01-01
HK1055492A1 (en) 2004-01-09
US20050049881A1 (en) 2005-03-03
US7254527B2 (en) 2007-08-07
US7228269B2 (en) 2007-06-05
AU2001255599A1 (en) 2001-11-07
US20050055198A1 (en) 2005-03-10

Similar Documents

Publication Publication Date Title
CN1426561A (zh) 带有跨语言阅读向导的计算机辅助阅读系统和方法
US9672206B2 (en) Apparatus, system and method for application-specific and customizable semantic similarity measurement
CN1205572C (zh) 对拼写、打字和转换错误具有容错能力的将一种文本形式转换为另一种文本形式的语言输入体系结构
Och Statistical machine translation: From single word models to alignment templates
US6278967B1 (en) Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
JP5774751B2 (ja) ツリーレット翻訳対の抽出
US7536295B2 (en) Machine translation using non-contiguous fragments of text
CN104462072B (zh) 面向计算机辅助翻译的输入方法与装置
US20090094017A1 (en) Multilingual Translation Database System and An Establishing Method Therefor
CN112256860A (zh) 客服对话内容的语义检索方法、系统、设备及存储介质
JP5586817B2 (ja) ツリーレット翻訳対の抽出
CN1387651A (zh) 词典、分段和语言模型联合优化的系统和迭代方法
CN1618064A (zh) 翻译方法、已翻译句子的输入方法、记录介质、程序与计算机设备
CN1475907A (zh) 基于例子的机器翻译系统
JP2004171575A (ja) 句の間の翻訳関係を学習するための統計的な方法および装置
JP2006012168A (ja) 翻訳メモリシステムにおいてカバレージおよび質を改良する方法
JP2005529386A (ja) 単語関連付け方法及び装置
CN101079028A (zh) 一种统计机器翻译中的在线翻译模型选择方法
Ofazer et al. Bootstrapping morphological analyzers by combining human elicitation and machine learning
CN1661593A (zh) 一种计算机语言翻译方法及其翻译系统
JP2016516247A (ja) 翻字、翻訳、書記素洞察のキュレーション及び統合による多言語ビジネスの印の向上
Prabhakar et al. Machine transliteration and transliterated text retrieval: a survey
Carter et al. Syntactic discriminative language model rerankers for statistical machine translation
CN1256650C (zh) 一种中文整句输入法
WO1997040452A1 (en) Automated natural language translation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1055492

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150506

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150506

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington, USA

Patentee before: Microsoft Corp.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090729

Termination date: 20190423

CF01 Termination of patent right due to non-payment of annual fee