CN102214175A - 依据字词相关性生成例句的系统及其方法 - Google Patents

依据字词相关性生成例句的系统及其方法 Download PDF

Info

Publication number
CN102214175A
CN102214175A CN2010101423931A CN201010142393A CN102214175A CN 102214175 A CN102214175 A CN 102214175A CN 2010101423931 A CN2010101423931 A CN 2010101423931A CN 201010142393 A CN201010142393 A CN 201010142393A CN 102214175 A CN102214175 A CN 102214175A
Authority
CN
China
Prior art keywords
words
example sentence
target
relevant
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010101423931A
Other languages
English (en)
Inventor
邱全成
徐晓燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CN2010101423931A priority Critical patent/CN102214175A/zh
Publication of CN102214175A publication Critical patent/CN102214175A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

一种依据字词相关性生成例句的系统及其方法,其通过目标字词的相关字词查找对应相关字词的相关例句,并将相关例句中的相关字词置换为目标字词,藉以产生目标例句的技术手段,可以增加字词数据库中具有对应例句的字词的数量,并达成减少字词数据库的储存空间的技术功效。

Description

依据字词相关性生成例句的系统及其方法
技术领域
一种例句生成系统及其方法,特别是指一种依据字词相关性生成例句的系统及其方法。
背景技术
使用者在学习语言时,往往会遇到无法理解某个字词的意义的情况,大部分的使用者在遇到这种情况时,通常会通过查找辞典的方式来取得字词的意义。当然,随着电子产品的普及、网路的发达,使用者查找辞典的行为也由查找纸本的辞典转变为使用可以查找字词释义的辞典软件或在线的字词释义服务。
目前的辞典软件或在线字词释义服务在提供使用者查找字词的意义时,通常会依据被查找的字词至字典数据库中查找与该字词对应的释义数据,例如字词的说明、词性、例句以及例句的翻译等,并在查找后显示给使用者观看。其中,字词的例句以及例句的翻译可以让使用者更快更正确的得知被查找的字词可以如何使用,因此,大部分的使用者都会希望辞典软件或在线字词释义服务所显示的释义数据可以包含例句。
然而,目前的辞典软件或在线字词释义服务所使用的字典数据库碍于可用储存空间的考虑,并未对所有字词的各个词性记录相对应的例句,如此,当使用者使用辞典软件或在线字词释义服务查找字词的释义数据时,将可能无法获得出被查找的字词的例句,使用者的期待无法被满足。
综上所述,可知现有技术中长期以来一直存在目前的字典数据库中没有储存所有字词的例句,而导致使用者无法获得部分字词的例句的问题,因此有必要提出改进的技术手段,来解决此一问题。
发明内容
有鉴于现有技术存在字典数据库中没有储存所有字词的例句导致使用者无法获得部分字词的例句的问题,本发明遂提供一种依据字词相关性生成例句的系统及其方法,其中:
本发明所提供的依据字词相关性生成例句的系统,至少包含:输入模块,用以提供输入目标字词;储存模块,用以储存目标字词、目标字词的相关字词、及对应相关字词的相关例句;查找模块,其中更包含字词查找单元,用以依据目标字词至储存模块查找相关字词,以及例句查找单元,用以依据相关字词至储存模块查找相关例句;数据置换模块,用以使用目标字词置换相关例句中的相关字词以产生目标例句;输出模块,用以输出目标例句。
本发明所提供的依据字词相关性生成例句的系统,其中,相关字词为目标字词的同意词、近义词及/或反义词,且相关字词的词性与目标字词的词性相同。
本发明所提供的依据字词相关性生成例句的系统,其中,数据置换模块更用以于相关例句的翻译中,以目标字词的意义置换的相关字词的意义,输出模块更用以输出经过置换的相关例句的翻译。
本发明所提供的依据字词相关性生成例句的系统,更包含例句修正模块,用以于判断目标例句的语法,并于该目标例句的语法不正确时,修改目标例句的语法为正确的语法,其中,被判断的语法包含动词时态、名词单复数。例句修正模块更用以依据字词区别表及/或词组表判断目标字词是否可于目标例句中使用,并于不可使用时修改目标例句。
本发明所提供的依据字词相关性生成例句的方法,其步骤至少包括:提供输入目标字词;依据目标字词的相关字词查找相对应的相关例句;以目标字词置换相关例句中的相关字词以产生目标例句;输出目标例句。
本发明所提供的依据字词相关性生成例句的方法,其中,依据目标字词的相关字词查找相对应的相关例句的步骤为依据词性与目标字词相同的同意词、近义词及/或反义词查找相关例句;另外,依据目标字词的相关字词查找相对应的相关例句的步骤更包含先查找相关字词,再判断无法查找出目标例句后,依据相关字词查找相关例句的步骤,或包含先判断无法查找出目标例句后,再查找相关字词,并依据相关字词查找相关例句的步骤。
本发明所提供的依据字词相关性生成例句的方法,于输出目标例句前,更包含判断目标例句的语法不正确时,修改目标例句的语法为正确的语法的步骤;另外,于查找对应相关字词的相关例句后,更包含以目标字词的意义置换相关例句的翻译中相关字词的意义,并输出经过置换的相关例句的翻译的步骤。
本发明所提供的系统与方法如上,与现有技术之间的差异在于本发明通过查找被输入的目标字词的相关字词后,查找对应相关字词的相关例句,并将相关例句中的相关字词置换为目标字词来产生目标例句,藉以解决现有技术所存在的问题,并可以达成减少字词数据库的储存空间的技术功效。
附图说明
图1为本发明所提的依据字词相关性生成例句的系统架构图;
图2A为本发明所提的依据字词相关性生成例句的方法流程图;
图2B为本发明所提的依据目标字词的相关字词查找相关例句的详细方法流程图;
图2C为本发明所提的另一种依据目标字词的相关字词查找相关例句的详细方法流程图;
图2D为本发明所提的产生目标例句的翻译的方法流程图;
图3为本发明实施例所提的字词数据库的示意图。
【主要元件符号说明】
110储存模块            120输入模块
130查找模块            132例句查找单元
136字词查找单元        150数据置换模块
160输出模块            190例句修正模块
300字词数据库          320词性字段
330说明字段            340例句字段
350相关字词字段
具体实施方式
以下将配合图式及实施例来详细说明本发明的特征与实施方式,内容足以使任何熟习相关技艺者能够轻易地充分理解本发明解决技术问题所应用的技术手段并据以实施,藉此实现本发明可达成的功效。
本发明可以将相关字词的例句中的相关字词置换为目标字词,藉以产生目标字词的例句。其中,本发明所提供的目标字词可以为本发明的使用者欲查找释义数据的字词,但本发明并不以此为限;而本发明所提供的相关字词可以为目标字词的同义词、近义词及/或反义词等字词,但本发明并不以此为限。其中,特别值得一提的是,目标字词的词性与目标字词的相关字词的词性相同。
以下先以「图1」本发明所提供的依据字词相关性生成例句的系统架构图来说明本发明的系统运作。如「图1」所示,本发明的系统含有储存模块110、输入模块120、查找模块130、数据置换模块150以及输出模块160。其中,查找模块130更包含例句查找单元132以及字词查找单元136。
储存模块110负责储存字词数据库,藉以提供字词数据库给其他各模块使用。储存模块110所储存的字词数据库可以记录一个以上的字词以及分别与各个字词相对应的释义数据。字词数据库可以为公知的各种数据库的形式,或是以档案的形式记录字词、例句以及相对应的释义数据。
字词数据库记录的释义数据可以为包含相对应的字词的例句、相对应的字词的词性、相对应的字词的说明以及各例句的翻译等一个或多个项目的任意组合,但本发明并不以此为限。
输入模块120负责提供输入目标字词。一般而言,使用者可以通过输入模块120输入目标字词,但本发明并不以此为限,其他方式例如,输入模块120也可以将执行本发明的装置的存储器中的特定地址所记录的数据作为目标字词等。
字词查找单元136负责至储存模块110所储存的字词数据库中查找目标字词的相关字词,并将查找出的相关字词提供给例句查找单元132,藉以让例句查找单元132查找相关例句。
字词查找单元136可以在例句查找单元132无法由储存模块110所储存的字词数据库中查找出与目标字词对应的例句后,才至字词数据库中查找目标字词的相关字词,也可以在例句查找单元132查找对应目标字词的例句的同时或之前,至字词数据库中查找目标字词的相关字词。其中,本发明所提供的字词(目标字词/相关字词)与例句的对应关系并不以在例句中包含对应的字词为限,例如,包含目标字词/相关字词的动词变化或名词单复数的例句同样与目标字词/相关字词对应。
例句查找单元132负责至储存模块110所储存的字词数据库中查找例句。也就是说,例句查找单元132可以依据输入模块120提供输入的目标字词,至储存模块110所储存的字词数据库中查找与目标字词对应的例句,如包含目标字词的例句;例句查找单元132也可以依据字词查找单元136所查找出的目标字词的相关字词,至储存模块110所储存的字词数据库中查找与相关字词对应的例句,如包含相关字词的例句。在本发明中,例句查找单元132所查找出的与目标字词对应的例句称为「目标例句」,而例句查找单元132所查找出的与相关字词对应的例句称为「相关例句」。
数据置换模块150负责将例句查找单元132所查找出的相关例句中的相关字词置换为目标字词,藉以产生「目标例句」。在本发明中,目标例句即为将相关例句中的相关字词置换为目标字词的例句。
数据置换模块150也可以将相关例句的翻译中该相关字词的意义置换为目标字词的意义,被置换后的翻译即为目标例句的翻译。
输出模块160负责输出数据置换模块150所产生的目标例句。输出模块160可以以显示目标例句的方式输出目标例句,输出模块160也可以将目标例句传送到执行本发明的装置以外的外部装置来输出,使该外部装置可以显示目标例句,但输出模块160输出目标例句的方式并不以上述为限。
此外,本发明更可以额外包含例句修正模块190,例句修正模块190负责判断数据置换模块150所产生的目标例句的语法是否正确。一般而言,例句修正模块190可以在数据置换模块150将相关例句中的相关字词置换为目标字词后,判断目标例句的语法是否正确,但例句修正模块190也可以在数据置换模块150将相关例句中的相关字词置换为目标字词前,先进行语法正确与否的判断。
例句修正模块190可以使用如公知文书编辑软件所提供的文法检查的方式判断目标例句的语法正确性,其中,例句修正模块190可以对完整的目标例句进行语法正确性的判断,也可以只对目标例句中,与目标字词相关的词组、介词、动词时态、名词单复数等部分的语法正确性进行判断。
另外,例句修正模块190可以依据记录各种词组的词组表判断目标例句的语法是否正确,例如,例句修正模块190依据相关字词在词组表中搜寻包含相关字词的词组,并比对被搜寻出的词组是否存在于相关例句中,若是,则在词组表中搜寻将相关字词置换为目标字词的词组,若例句修正模块190无法在词组表中搜寻到经过置换的词组,则表示目标例句的语法错误。例句修正模块190甚至可以在词组表中,搜寻包含目标字词且与相关例句中包含相关字词的词组的意义相同的词组,并判断藉以修正目标例句中产生语法错误的词组。
例句修正模块190也可以依据字词区别表判断目标例句的语法是否正确,字词区别表中记录用法不同的目标字词与相关字词,例如字词「some」以及字词「any」,虽然两字词在形容词时的意义都为「一些」,但由于字词「some」通常在非疑问句中使用,而字词「any」通常使用在疑问句中,故两字词并不能互相置换。因此,例句修正模块190判断字词区别表中存在一笔数据记录目标字词与被置换的相关字词时,会判断目标例句的语法不正确。
例句修正模块190还负责在判断出目标例句的语法不正确后,将目标例句中的错误的语法修改为正确的语法。相似的,例句修正模块190可以使用如公知文书编辑软件所提供文法检查后所产生的修改建议,直接修改目标例句的语法,例如修改介词、动词时态、名词单复数的错误等,但本发明并不以此为限。
接着以第一实施例来解说本发明的运作系统与方法,并请参照「图2A」本发明所提供的依据字词相关性生成例句的方法流程图。
在本实施例中,假设使用者使用的计算机、PDA、手机等本地装置中安装有字词释义软件,且安装于本地装置中的字词释义软件包含本发明,如此,在使用者阅读英文文件过程中,遇到不认识的字词「pretty」时,可以使用包含本发明的字词释义软件查找不认识的字词「pretty」的释义。
首先,使用者可以在字词释义软件的使用者界面中输入目标字词,在本实施例中也就是字词「pretty」,输入模块120可以提供使用者操作本地装置,藉以输入目标字词「pretty」(步骤201)。
在使用者通过输入模块120输入目标字词后,字词释义软件会至储存模块110所储存的字词数据库中查找目标字词的释义数据。由于本实施例的字词释义软件会提供使用者目标字词的释义数据,故本实施例的字词释义软件至少会查找与目标字词对应的说明以及其他项目,但本发明并不以此为限。
其中,若本实施例的字词释义软件会提供使用者包含目标字词的例句,则例句查找单元132可以至储存模块110所储存的字词数据库中查找对应目标字词的例句(步骤210)。在本实施例中,假设字词与例句的对应关系为例句包含字词,则例句查找单元132会以目标字词「pretty」作为查找的键值(key),在字词数据库中查找包含目标字词「pretty」的例句,但例句查找单元132查找包含目标字词的例句的方式并不以此为限。
若储存模块110所储存的字词数据库中没有记录目标字词「pretty」的例句,则例句查找单元132将无法由字词数据库中查找出对应目标字词的例句,如此,例句查找单元132会进一步依据字词查找单元136所查找出的目标字词的相关字词,至字词数据库中查找包含相关字词的相关例句(步骤230)。另外,若本发明希望输出更多目标字词「pretty」的例句,则例句查找单元132也可以依据字词查找单元136所查找出的目标字词的相关字词,至字词数据库中查找包含相关字词的相关例句(步骤230)。
其中,如「图2B」的流程所示,在例句查找单元132进行查找后所获得的查找结果为空集合时,字词查找单元136可以判断出例句查找单元132没有查找出与目标字词对应的例句(步骤233),之后,字词查找单元136可以至储存模块110所储存的字词数据库中查找目标字词的相关字词(步骤231),而若例句查找单元132确实查找出与目标字词对应的例句,则字词查找单元136可以不进行任何动作,由输出模块160输出与目标字词对应的例句(步骤290)。事实上,字词查找单元136也可以不论例句查找单元132是否有查找出包含目标字词的例句,都直接至储存模块110所储存的字词数据库中查找目标字词的相关字词(步骤231)。在本实施例中,假设字词查找单元136会以目标字词「pretty」作为查找的键值(key),在字词数据库中查找目标字词「pretty」的相关字词,例如同为形容词的同义词「beautiful」或是同为形容词的反义词「ugly」,但字词查找单元136查找目标字词的相关字词的方式并不以此为限。
在字词查找单元136至储存模块110所储存的字词数据库中查找目标字词的相关字词(步骤231)后,可以将查找出的相关字词提供给例句查找单元132,使例句查找单元132可以依据字词查找单元136所查找出的相关字词至字词数据库中查找相关例句(步骤235)。在本实施例中,若目标字词「pretty」的相关字词为反义词「ugly」,例句查找单元132同样会以相关字词「ugly」作为查找的键值(key),在字词数据库中查找包含相关字词「ugly」的相关例句,假设例句查找单元132查找出的相关例句为「She is an uglygirl.」。但例句查找单元132查找包含相关字词的相关例句的方式并不以此为限,且相关例句亦不以「She is an ugly girl.」为限。
在实务上,字词数据库可能不会将与字词相对应的释义数据中的各个项目分开储存,而是以词性字段320、说明字段330、例句字段340、相关字词字段350等不同的字段分别记录为释义数据中的各个项目,如「图3」的字词数据库300所示,藉以将同一个字词的释义数据储存为一笔数据,但本发明并不以此为限。在此情况下,本发明的查找模块130可以不需要分为例句查找单元132以及字词查找单元136进行运作,如此,查找模块130可以依据目标字词直接由字词数据库中查找与目标字词对应的例句以及相关字词,也就是说,本发明将如「图2C」的流程所示,在查找模块130(例句查找单元132)查找包含目标字词的例句(步骤210)时,查找模块130(字词查找单元136)也可以查找目标字词「pretty」的相关字词(步骤231),例如同为形容词的同义词「beautiful」或是同为形容词的反义词「ugly」,查找模块130(例句查找单元132)可以在判断出没有查找出包含(对应)目标数据的例句(步骤233)后,依据查找模块130(字词查找单元136)所查找出的相关字词,如反义词「ugly」,至字词数据库中查找出相关例句「She is an ugly girl.」(步骤235)。若例句查找单元132有查找出与目标字词对应的例句,则例句查找单元132可以不再依据相关字词查找相关例句,而由输出模块160直接输出与目标字词对应的例句(步骤290)。
事实上,本发明的例句查找单元132并不只限于只对目标数据的一个相关字词查找相关例句,也就是说,例句查找单元132在查找出包含相关字词「ugly」的相关例句后,也可以继续依据相关字词「beautiful」至储存模块110所储存的字词数据库中查找包含相关字词「beautiful」的相关例句。
在例句查找单元132依据字词查找单元136所查找出的相关字词至字词数据库中查找出相关例句(步骤235)后,数据置换模块150可以将相关例句中的相关字词置换为目标字词,藉以产生目标例句(步骤250)。在本实施例中,数据置换模块150会将例句查找单元132查找出的相关例句「She isan ugly girl.」中的相关字词「ugly」置换为目标字词「pretty」,藉以产生目标例句「She is an pretty girl.」。
在数据置换模块150将相关例句中的相关字词置换为目标字词,藉以产生目标例句后,若本发明包含例句修正模块190,则例句修正模块190会判断目标例句的语法是否正确(步骤262)。假设在本实施例中,例句修正模块190会以公知的方式判断目标例句的语法的正确性,但例句修正模块190判断目标例句的语法是否正确的方式并不以此为限。由于本实施例的目标例句为「She is an pretty girl.」,因此例句修正模块190可以判断出目标例句中的冠词「an」错误,应为「a」,故例句修正模块190可以将目标例句修改为正确的语法(步骤266),也就是将冠词「an」修改为「a」,使得目标例句被修改为「She is a pretty girl.」。
在例句修正模块190判断出目标例句的语法正确或判断出目标例句的语法错误并修改为正确的语法(步骤262、步骤266)后,输出模块160会在字词释义软件显示目标字词「pretty」的释义数据时,显示目标例句「Sheis a pretty girl.」,藉以输出目标例句(步骤290)。
在上述实施例中,若字词释义软件所查找出的释义数据需要包含例句的解释,则本发明将如「图2D」的流程所示,数据置换模块150可以将相关例句「She is an ugly girl.」的翻译「她是个丑陋的女孩」中相关字词的意义「丑陋」置换为目标字词的意义「漂亮」(步骤270),被置换后的翻译「她是个漂亮的女孩」即为目标例句的翻译。而后,输出模块160可以在显示目标例句「She is a pretty girl.」时,一并显示目标例句的翻译「她是个漂亮的女孩」,藉以输出由相关例句所置换的翻译(步骤280)。
接着以第二实施例来解说本发明的运作系统与方法,请继续参照「图2A」本发明所提供的依据字词相关性生成例句的方法流程图。
在本实施例中,假设使用者使用的计算机、PDA、手机等本地装置中没有安装字词查询软件,但使用者可以使用本地装置联机到提供字词查询服务的服务器,而服务器所提供的字词查询服务包含本发明,如此,在使用者希望查找字词「speak」的例句时,可以使用本地装置联机到服务器进行查找。
首先,使用者可以在与服务器提供的字词查询服务相对应的使用者界面中输入目标字词,在本实施例中也就是字词「speak」,输入模块120可以提供使用者操作本地装置,藉以在使用者界面中输入目标字词「speak」(步骤201)。
在使用者输入目标字词「speak」后,输入模块120会将目标字词「speak」传送到服务器上的查找模块130。之后,查找模块130中的例句查找单元132可以至储存模块110所储存的字词数据库中查找包含目标字词「speak」的例句(步骤210),查找模块130中的字词查找单元136也可以至字词数据库中查找目标字词的相关字词,使得例句查找单元132可以依据字词查找单元136所查找出的目标字词的相关字词,至字词数据库中查找包含相关字词的相关例句(步骤230)。由于目标字词「speak」包含「及物动词」以及「不及物动词」两种词性,假设在本实施例中,字词查找单元136所查找出的词性同为不及物动词的相关字词为目标字词「speak」的近义词「talk」,并假设相关例句为「They do not talk to each other.」,但本发明并不以此为限。其中,值得一提的是,由于字词「talk」只有在词性为不及物动词时才与不及物动词的字词「speak」意义相同,当字词「talk」或字词「speak」任何一个不为及物动词时,字词「talk」与字词「speak」便不会是同义词。
事实上,字词查找单元136并不只能为目标字词查找一种词性的相关字词,也就是说,字词查找单元136也可以为目标字词「speak」查找词性同为「及物动词」的相关字词,例如意义同为「表达」的同义词「express」,但本发明并不以此为限,例句查找模块132也可以为多个相关字词分别查找对应的相关例句。
在查找模块130至字词数据库中查找出包含相关字词的相关例句(步骤230)后,数据置换模块150可以将相关例句「They do not talk to each other.」中的相关字词「talk」置换为目标字词「speak」产生目标例句「They do not speakto each other.」(步骤250),而后,输出模块160会输出目标例句至使用者所使用的本地装置(步骤290),也就是通过服务器将目标例句传回使用者所使用的本地装置,使得本地装置上的使用者界面显示目标例句「They donot speak to each other.」给使用者。
综上所述,可知本发明与现有技术之间的差异在于具有查找被输入的目标字词的相关字词后,查找对应相关字词的相关例句,并将相关例句中的相关字词置换为目标字词来产生目标例句的技术手段,藉由此一技术手段可以解决现有技术所存在字典数据库中没有储存所有字词的例句导致使用者无法获得部分字词的例句的问题,进而达成减少字词数据库的储存空间的技术功效。
再者,本发明的依据字词相关性生成例句的方法,可实现于硬体、软件或硬体与软件的组合中,亦可在计算机系统中以集中方式实现或以不同元件散布于若干互连的计算机系统的分散方式实现。
虽然本发明所提供的实施方式如上,惟所述的内容并非用以直接限定本发明的专利保护范围。任何本发明所属技术领域中的技术人员,在不脱离本发明所公开的精神和范围的前提下,对本发明的实施的形式上及细节上作些许的更动润饰,均属于本发明的专利保护范围。本发明的专利保护范围,仍须以所附的权利要求书所界定者为准。

Claims (10)

1.一种依据字词相关性生成例句的方法,其特征在于,该方法至少包含下列步骤:
提供输入一目标字词;
依据该目标字词的一相关字词查找相对应的一相关例句;
以该目标字词置换该相关例句中的该相关字词以产生一目标例句;及
输出该目标例句。
2.如权利要求1所述的依据字词相关性生成例句的方法,其特征在于,该依据该目标字词的该相关字词查找相对应的该相关例句的步骤更包含先查找该相关字词,再判断无法查找出与该目标字词对应的例句后,依据该相关字词查找该相关例句的步骤,或包含先判断无法查找出与该目标字词对应的例句后,再查找该相关字词,并依据该相关字词查找该相关例句的步骤。
3.如权利要求1所述的依据字词相关性生成例句的方法,其特征在于,该方法于输出该目标例句的步骤前,更包含判断该目标例句的语法不正确时,修改该目标例句的语法为正确的语法的步骤。
4.如权利要求1所述的依据字词相关性生成例句的方法,其特征在于,该方法于查找对应该相关字词的该相关例句的步骤后,更包含以该目标字词的意义置换该相关例句的翻译中该相关字词的意义,并输出经过置换的相关例句的翻译的步骤。
5.如权利要求1所述的依据字词相关性生成例句的方法,其特征在于,该依据该目标字词的该相关字词查找相对应的该相关例句的步骤为依据词性与该目标字词相同的同意词、近义词及/或反义词查找该相关例句。
6.一种依据字词相关性生成例句的系统,其特征在于,该系统至少包含:
一输入模块,用以提供输入一目标字词;
一储存模块,用以储存该目标字词、该目标字词的一相关字词、及对应该相关字词的一相关例句;
一查找模块,其中更包含:
一字词查找单元,用以依据该目标字词至该储存模块查找该相关字词;及
一例句查找单元,用以依据该相关字词至该储存模块查找该相关例句;
一数据置换模块,用以使用该目标字词置换该相关例句中的该相关字词以产生一目标例句;及
一输出模块,用以输出该目标例句。
7.如权利要求6所述的依据字词相关性生成例句的系统,其特征在于,该相关字词为目标字词的同意词、近义词及/或反义词,且该相关字词的词性与该目标字词的词性相同。
8.如权利要求6所述的依据字词相关性生成例句的系统,其特征在于,该系统更包含一例句修正模块,用以于判断该目标例句的语法,并于该目标例句的语法不正确时,修改该目标例句的语法为正确的语法,其中,被判断的语法包含动词时态、名词单复数。
9.如权利要求8所述的依据字词相关性生成例句的系统,其特征在于,该例句修正模块更用以依据一字词区别表及/或一词组表判断该目标字词是否可于该目标例句中使用,并于不可使用时修改该目标例句。
10.如权利要求6所述的依据字词相关性生成例句的系统,其特征在于,该数据置换模块更用以于该相关例句的翻译中,以该目标字词的意义置换的该相关字词的意义,该输出模块更用以输出经过置换的相关例句的翻译。
CN2010101423931A 2010-04-02 2010-04-02 依据字词相关性生成例句的系统及其方法 Pending CN102214175A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101423931A CN102214175A (zh) 2010-04-02 2010-04-02 依据字词相关性生成例句的系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101423931A CN102214175A (zh) 2010-04-02 2010-04-02 依据字词相关性生成例句的系统及其方法

Publications (1)

Publication Number Publication Date
CN102214175A true CN102214175A (zh) 2011-10-12

Family

ID=44745490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101423931A Pending CN102214175A (zh) 2010-04-02 2010-04-02 依据字词相关性生成例句的系统及其方法

Country Status (1)

Country Link
CN (1) CN102214175A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136297A (zh) * 2011-12-05 2013-06-05 英顺源(上海)科技有限公司 通过资料查找扩充相关字词的系统及其方法
CN104657344A (zh) * 2013-11-21 2015-05-27 英业达科技有限公司 写作提示系统及其方法
CN110489528A (zh) * 2019-08-14 2019-11-22 掌阅科技股份有限公司 基于电子书内容的电子词典重构方法及计算设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136297A (zh) * 2011-12-05 2013-06-05 英顺源(上海)科技有限公司 通过资料查找扩充相关字词的系统及其方法
CN104657344A (zh) * 2013-11-21 2015-05-27 英业达科技有限公司 写作提示系统及其方法
CN110489528A (zh) * 2019-08-14 2019-11-22 掌阅科技股份有限公司 基于电子书内容的电子词典重构方法及计算设备
CN110489528B (zh) * 2019-08-14 2022-05-17 掌阅科技股份有限公司 基于电子书内容的电子词典重构方法及计算设备

Similar Documents

Publication Publication Date Title
Gupta et al. Abstractive summarization: An overview of the state of the art
US9672206B2 (en) Apparatus, system and method for application-specific and customizable semantic similarity measurement
Rayson Matrix: A statistical method and software tool for linguistic analysis through corpus comparison
Tiedemann Recycling translations: Extraction of lexical data from parallel corpora and their application in natural language processing
US8473278B2 (en) Systems and methods for identifying collocation errors in text
Maamouri et al. Developing an Egyptian Arabic Treebank: Impact of Dialectal Morphology on Annotation and Tool Development.
Kiyavitskaya et al. Cerno: Light-weight tool support for semantic annotation of textual documents
Abdurakhmonova et al. Linguistic functionality of Uzbek Electron Corpus: uzbekcorpus. uz
Chakma et al. Cmir: A corpus for evaluation of code mixed information retrieval of hindi-english tweets
Laur et al. Estnltk 1.6: Remastered estonian nlp pipeline
Golpar-Rabooki et al. Feature extraction in opinion mining through Persian reviews
Patrick et al. Automated proof reading of clinical notes
Sawalha et al. A standard tag set expounding traditional morphological features for Arabic language part-of-speech tagging
Pęzik Providing corpus feedback for translators with the PELCRA search engine for NKJP
CN102214175A (zh) 依据字词相关性生成例句的系统及其方法
US20220229986A1 (en) System and method for compiling and using taxonomy lookup sources in a natural language understanding (nlu) framework
Rouces et al. Defining a Gold Standard for a Swedish Sentiment Lexicon: Towards Higher-Yield Text Mining in the Digital Humanities.
Kennedy et al. Evaluation of automatic updates of Roget’s Thesaurus
Carl et al. Toward a hybrid integrated translation environment
Prokopidis et al. Experiments for dependency parsing of Greek
Murthy et al. A New Approach to Tagging in Indian Languages.
Alkhazi et al. BAAC: Bangor Arabic Annotated Corpus
Strassel et al. Data acquisition and linguistic resources
Mihajlov et al. Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities
Lee et al. Chinese WordNet domains: Bootstrapping Chinese WordNet with semantic domain labels

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111012