CN101853247A - 片语检查系统及其方法 - Google Patents

片语检查系统及其方法 Download PDF

Info

Publication number
CN101853247A
CN101853247A CN200910131162A CN200910131162A CN101853247A CN 101853247 A CN101853247 A CN 101853247A CN 200910131162 A CN200910131162 A CN 200910131162A CN 200910131162 A CN200910131162 A CN 200910131162A CN 101853247 A CN101853247 A CN 101853247A
Authority
CN
China
Prior art keywords
words
phrase
target
phrases
inspection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910131162A
Other languages
English (en)
Inventor
邱全成
罗隽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CN200910131162A priority Critical patent/CN101853247A/zh
Publication of CN101853247A publication Critical patent/CN101853247A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种片语检查系统及其方法,其通过以来源词句中为动词或名词的字词作为目标字词,再撷取来源词句中包含目标字词的连续字词来组成检查词组,并查找具有目标字词的目标片语,比对运算检查词组与目标片语匹配相符的字词单位数得到匹配值,当匹配值符合提示范围值时,显示检查词组与目标片语,可以达到检查词句中含有动词或名词的片语是否错误的技术功效。

Description

片语检查系统及其方法
技术领域
本发明涉及一种片语检查系统及其方法,特别是指一种针对具有动词或名词的片语进行错误检查的片语检查系统及其方法。
背景技术
随着信息科技的发展,信息的传播速度非常快速,加上国际化的趋势,一般人接触外语的机会大大的增加,不管是网页、报章杂志、商业信件等,常常可以看到以外语形式出现的词句,但是并非所有大众对外语皆能精通,因此出现了许多可帮助使用者撰写或阅读外语时的辅助翻译软件。
目前现有的辅助翻译软件,当使用者输入的词句出现部分字词拼写错误或文法错误时,翻译软件可快速找出字词的拼字错误与文法错误,并提示使用者进行修改,但是使用者输入的词句中,除了字词之外,还包括由字词组成的片语,字词的拼写错误检查或文法的错误检查皆无法检查出片语的错误,举例来说,词句“I will go to home.”由拼写错误检查与文法错误检查皆为正确,而实际存在“go to home”这样的使用错误,应为片语“go home”,因此现有的翻译软件无法对其进行错误检查。
综上所述,可知现有技术中长期以来一直存在以往只能检查词句中拼字错误及文法错误的问题,因此有必要提出改进的技术手段,来解决此一问题。
发明内容
有鉴于现有技术存在以往只能检查词句中拼字错误及文法错误的问题,本发明遂提供一种片语检查系统及其方法,其中:
本发明所提供的片语检查系统,至少包含片语数据库、接收模块、识别模块、撷取模块、查找模块、比对运算模块及显示模块,其中片语数据库是用于储存复数笔片语数据;接收模块是用于接收来源词句,其中来源词句由复数个字词所组成;识别模块是用于运用文法规则解析来源词句识别出字词为动词或名词,以得到目标字词;撷取模块是用于撷取来源词句中目标字词前后的连续字词组成检查词组;查找模块是用于依据目标字词至片语数据库中查找具有目标字词的片语数据,以得到目标片语;比对运算模块是用于比对运算检查词组与目标片语中匹配相符的字词单位数以得到匹配值;显示模块是用于当匹配值符合提示范围值时,在来源词句中标记显示检查词组并且显示目标片语。
本发明所提供的片语检查方法,其步骤至少包括建立片语数据库,片语数据库用于储存复数笔片语数据,接收来源词句,其中来源词句由复数个字词所组成,运用文法规则解析来源词句识别出字词为动词或名词,以得到目标字词,撷取来源词句中目标字词前后的连续字词组成检查词组,依据目标字词至片语数据库中查找具有目标字词的片语数据,以得到目标片语,比对运算检查词组与目标片语中匹配相符的字词单位数以得到匹配值,当匹配值符合提示范围值时,在来源词句中标记显示检查词组并且显示目标片语。
本发明所提供的系统与方法如上,与现有技术之间的差异在于本发明通过以来源词句中为动词或名词的字词作为目标字词,再撷取来源词句中包含目标字词的连续字词来组成检查词组,并查找具有目标字词的目标片语,比对运算检查词组与目标片语匹配相符的字词单位数得到匹配值,当匹配值符合提示范围值时,显示检查词组与目标片语,进而达到检查词句中含有动词或名词的片语是否错误的技术功效。
附图说明
图1为本发明片语检查系统方框图;
图2为本发明片语检查方法流程图;
图3至图6为本发明片语检查系统的实施例示意图。
具体实施方式
以下将配合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题并达到技术功效的实现过程能充分理解并据以实施。
首先配合附图对本发明片语检查系统及其方法作进一步的说明,请参阅图1,图1为本发明片语检查系统方框图,片语检查系统100包含:片语数据库110、接收模块120、识别模块130、撷取模块140、查找模块150、比对运算模块160及显示模块170。
片语数据库110是负责储存多笔片语数据,所述片语数据是由多个字词所组成的,例如:“go home”、“feel like”、“make a visit to”。
接收模块120是负责接收来源词句,其中来源词句由多个字词所组成,所述来源词句是指使用者欲进行片语检查的词句,举例来说,若来源词句为“I make visit to the exhibition.”,则来源词句是由字词“I”、“make”、“visit”、“exhibition”所组成。
识别模块130是负责运用文法规则来解析识别(recognize)来源词句中的动词或名词,以得到目标字词。也就是识别模块130依据文法规则解析接收模块120接收到的来源词句中的字词,经过识别得到哪些字词为动词、哪些为名词,并将来源词句中为动词或名词的字词作为目标字词。承上述例子,来源词句为“I make visit to the exhibition.”,识别模块130运用文法规则解析来源词句“I make visit to the exhibition.”识别出字词“make”、“visit”为动词,字词“exhibition”为名词,则字词“make”、“visit”、“exhibition”为目标字词。
撷取模块140是负责在来源词句中撷取包含目标字词及其前后的连续字词所组成检查词组,也就是撷取模块140撷取经过识别模块130识别得到的目标字词前后的连续字词,据此来组成检查词组。值得注意的是,所述撷取来源词句中目标字词前后的连续字词是指撷取目标字词前后N个连续字词来组成检查词组,也就是经由撷取组成的检查词组中必须包含目标字词,其中N可以是系统预先设定,N为正整数,承上述例子,若N为“1”或“2”,撷取模块140撷取来源词句“I make visit to the exhibition.”中目标字词“make”前后的连续字词例如是“I make”、“I make visit”、“I make visit to”、“make visit”、“make visit to”。
查找模块150是负责依据目标字词至片语数据库110中查找具有目标字词的片语数据,以得到目标片语。也就是查找模块150依据识别模块130得到的目标字词至片语数据库110中查找片语数据,而得到目标片语,其中片语数据包含目标字词,承上述例子,目标字词为“make”、“visit”、“exhibition”,查找模块150依据目标字词“make”、“visit”、“exhibition”至片语数据库110中查找具有目标字词“make”、“visit”、“exhibition”的片语数据例如是“make a visit to”、“make at”、“make an exhibition ofoneself”,则目标片语为“make a visit to”、“make at”、“make an exhibitionof oneself”。
比对运算模块160是负责比对运算检查词组与目标片语中匹配相符的字词单位数以得到匹配值,所述字词单位数是指字词的个数,也就是比对模块160会将由撷取模块140撷取的检查词组的字词与查找模块150得到的目标片语的字词加以比对,运算匹配相符的字词个数并得到匹配值。值得注意的是,所述匹配值是将检查词组中与目标片语相符的字词单位数除以目标片语的字词单位数再乘以顺序系数所得到的百分比值,其中顺序系数是依据检查词组与目标片语相符的字词顺序与目标片语的字词顺序为正确或错误预先设定的系数,例如,若顺序正确则顺序系数为“1”,若顺序错误则顺序系数为“1/2”,另外,在计算匹配值时,目标字词设定为2个字词单位数,其余字词为1个字词单位数,因此匹配值计算方式例如是“匹配值=(检查词组与目标片语相符的字词单位数/目标片语的字词单位数)*顺序系数*100%”。
承上述例子,若目标字词为“make”、“visit”,目标片语为“make avisit to”,检查词组为“make visit to”,比对运算模块160比对检查词组“makevisit to”与目标片语“make a visit to”中匹配相符的字词为“make”、“visit”、“to”,由于目标字词“make”、“visit”为2个字词单位数,其余字词“to”为1个字词单位数,检查词组“make visit to”具有5个字词单位数与目标片语“make a visit to”匹配相符,而目标片语“make a visit to”具有6个字词单位数,但是检查词组“make visit to”与目标片语“make a visit to”的顺序正确,也就是“make”排列在“visit”前面,因此运算“匹配值=(检查词组与目标片语相符的字词单位数/目标片语的字词单位数)*1*100%=(5/6)*1*100%=83%”,匹配值为“83%”。
显示模块170是负责当匹配值符合提示范围值时,在来源词句中显示标记检查词组,并显示目标片语,值得注意的是,所述提示范围值是大于等于66%小于100%,显示模块170判断由比对运算模块得到的匹配值符合提示范围值时,显示模块170会在来源词句中标记显示检查词组,例如是将检查词组以底线标记,或改变检查词组的颜色,本发明不予以限定,只要将在来源词句中标记显示检查词组,皆为本发明所指,并且显示模块170会同时显示目标片语,以供使用者选择参考替换,承上述例子,显示模块170判断匹配值为“80%”大于66%小于100%,并在来源词句“I make visit to theexhibition.”标记显示检查词语“make visit to”,并显示目标片语“make a visitto”供使用者参考选择替换。
通过上述片语检查系统的运作,以来源词句中为动词或名词的字词作为目标字词,再撷取来源词句中包含目标字词的连续字词来组成检查词组,并查找具有目标字词的目标片语,比对运算检查词组与目标片语匹配相符的字词单位数得到匹配值,当匹配值符合提示范围值时,显示检查词组与目标片语,可解决以往只能检查词句中拼字错误及文法错误的问题。
以下将搭配本发明方法流程并举实施例具体说明本发明,然其并非用于限定本发明,本领域技术人员可依照本发明的精神对下述实施例稍做修饰,惟其仍属于本发明的范围。
图2为本发明片语检查方法流程图,图3至图6为本发明片语检查系统的实施例示意图。以下将同时配合图2至图6说明本发明片语检查的运作步骤和实施例。
请先参阅图3,片语检查系统100与先建立片语数据库300,片语数据库300用来储存多笔片语数据310,片语数据310例如是“go home”、“bybus”(步骤201)。
请参阅图4,片语检查界面400包含来源词句输入区域410及片语检查元件420,使用者欲进行片语检查时需在来源词句输入区域410中输入欲进行片语检查的来源词句例如是“I will go home on bus.”,输入后点选片语检查元件420,片语检查系统100会接收来源词句“I will go home on bus.”,其中来源词句是由字词“I”、“will”、“go”、“home”、“on”、“bus”所组成的(步骤202)。
片语检查系统100运用文法解析来源词句“I will go home on bus.”识别出字词“go”为动词,字词“home”、“bus”为名词,而字词“go”、“home”、“bus”即为目标字词,也就是目标字词为“go”、“home”、“bus”(步骤203)。
请参阅图5,得到目标字词“go”、“home”、“bus”后,片语检查系统100会撷取来源词句“I will go home on bus.”中目标字词“go”、“home”、“bus”前后的连续字词组成检查词组510例如是“go home”、“on bus”(步骤204)。接着片语检查系统100依据目标字词“go”、“home”、“bus”至片语数据库300中查找具有目标字词的片语数据例如是“go home”、“bybus”,也就是目标片语520为“go home”、“by bus”(步骤205)。
得到检查词组510“go home”、“on bus”与目标片语520“go home”、“by bus”后,片语检查系统100比对运算检查词组510“go home”与目标片语520“go home”匹配相符的字词单位数,检查词组510“go home”与目标片语520“go home”匹配相符的字词单位数为“4”除以目标片语520“go home”的字词单位数为“4”,再乘以顺序系数“1”,得到匹配值530“100%”,片语检查系统100比对运算检查词组510“on bus”与目标片语520“by bus”匹配相符的字词单位数,检查词组510“on bus”与目标片语520“by bus”匹配相符的字词单位数为“2”除以目标片语520“by bus”的字词单位数为“3”,再乘以顺序系数“1”,得到匹配值530“67%”(步骤206)。
请参阅图6,当片语检查系统100得到匹配值530后,匹配值530“67%”符合大于等于66%小于100%的提示范围值,因此片语检查系统100在片语检查界面400的检查词组显示区域430将“on bus”以加底线的方式标记显示,并在目标片语显示区域440将“by bus”显示供使用者参考选择替换(步骤207)。
综上所述,可知本发明与现有技术之间的差异在于以来源词句中为动词或名词的字词作为目标字词,再撷取来源词句中包含目标字词的连续字词来组成检查词组,并查找具有目标字词的目标片语,比对运算检查词组与目标片语匹配相符的字词单位数得到匹配值,当匹配值符合提示范围值时,显示检查词组与目标片语,借由此一技术手段可解决以往只能检查词句中拼字错误及文法错误的问题,进而达到检查词句中含有动词或名词的片语是否错误的技术功效。
虽然本发明所公开的实施方式如上,惟所述的内容并非用于直接限定本发明的专利保护范围。本领域技术人员在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作些许的更动。本发明的专利保护范围,仍须以所附的权利要求书所界定为准。

Claims (10)

1.一种片语检查系统,其特征在于,至少包含:
一片语数据库,用于储存复数笔片语数据;
一接收模块,用于接收一来源词句,其中该来源词句由复数个字词所组成;
一识别模块,用于运用文法规则解析该来源词句识别出该些字词为动词或名词,以得到至少一目标字词;
一撷取模块,用于撷取该来源词句中该目标字词前后的连续字词组成至少一检查词组;
一查找模块,用于依据该目标字词至该片语数据库中查找具有该目标字词的片语数据,以得到至少一目标片语;
一比对运算模块,用于比对运算该检查词组与该目标片语中匹配相符的字词单位数以得到一匹配值;及
一显示模块,用于当该匹配值符合一提示范围值时,在该来源词句中标记显示该检查词组并且显示该目标片语。
2.如权利要求1所述的片语检查系统,其特征在于,该撷取模块是撷取该目标字词前后N个连续字词以组成该检查词组,且该检查词组包含该目标字词;其中,N为正整数。
3.如权利要求1所述的片语检查系统,其特征在于,该匹配值是将该检查词组中与该目标片语相符的字词单位数除以该目标片语的字词单位数再乘以一顺序系数所得到的百分比值。
4.如权利要求3所述的片语检查系统,其特征在于,该目标字词为2个字词单位数,其余字词皆为1个字词单位数。
5.如权利要求3所述的片语检查系统,其特征在于,该顺序系数是依据该检查词组与该目标片语相符的字词顺序与目标片语的字词顺序为正确或错误预先设定的系数。
6.一种片语检查方法,其特征在于,至少包含下列步骤:
建立一片语数据库,该片语数据库用于储存复数笔片语数据;
接收一来源词句,其中该来源词句由复数个字词所组成;
运用文法规则解析该来源词句识别出该些字词为动词或名词,以得到至少一目标字词;
撷取该来源词句中该目标字词前后的连续字词组成至少一检查词组;
依据该目标字词至该片语数据库中查找具有该目标字词的片语数据,以得到至少一目标片语;
比对运算该检查词组与该目标片语中匹配相符的字词单位数以得到一匹配值;及
当该匹配值符合一提示范围值时,在该来源词句中标记显示该检查词组并且显示该目标片语。
7.如权利要求6所述的片语检查方法,其特征在于,所述撷取该来源词句中该目标字词前后的连续字词的步骤是撷取该目标字词前后N个连续字词以组成该检查词组,且该检查词组包含该目标字词;其中,N为正整数。
8.如权利要求6所述的片语检查方法,其特征在于,该匹配值是将该检查词组中与该目标片语相符的字词单位数除以该目标片语的字词单位数再乘以一顺序系数所得到的百分比值。
9.如权利要求8所述的片语检查方法,其特征在于,该目标字词为2个字词单位数,其余字词皆为1个字词单位数。
10.如权利要求8所述的片语检查方法,其特征在于,该顺序系数是依据该检查词组与该目标片语相符的字词顺序与目标片语的字词顺序为正确或错误预先设定的系数。
CN200910131162A 2009-04-03 2009-04-03 片语检查系统及其方法 Pending CN101853247A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910131162A CN101853247A (zh) 2009-04-03 2009-04-03 片语检查系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910131162A CN101853247A (zh) 2009-04-03 2009-04-03 片语检查系统及其方法

Publications (1)

Publication Number Publication Date
CN101853247A true CN101853247A (zh) 2010-10-06

Family

ID=42804745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910131162A Pending CN101853247A (zh) 2009-04-03 2009-04-03 片语检查系统及其方法

Country Status (1)

Country Link
CN (1) CN101853247A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102012897A (zh) * 2010-12-02 2011-04-13 无敌科技(西安)有限公司 一种实现高命中率的逐词比对方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102012897A (zh) * 2010-12-02 2011-04-13 无敌科技(西安)有限公司 一种实现高命中率的逐词比对方法

Similar Documents

Publication Publication Date Title
KR102268875B1 (ko) 전자 장치에 텍스트를 입력하는 시스템 및 방법
US7774193B2 (en) Proofing of word collocation errors based on a comparison with collocations in a corpus
US8412517B2 (en) Dictionary word and phrase determination
CN107247707B (zh) 基于补全策略的企业关联关系信息提取方法和装置
Kurokawa et al. Automatic detection of translated text and its impact on machine translation
US8010344B2 (en) Dictionary word and phrase determination
Brooke et al. Measuring Interlanguage: Native Language Identification with L1-influence Metrics.
CN101233484A (zh) 定义提取
JP6404511B2 (ja) 翻訳支援システム、翻訳支援方法、および翻訳支援プログラム
CN104008093A (zh) 用于中文姓名音译的方法和系统
WO2014087703A1 (ja) 単語分割装置、単語分割方法、及び単語分割プログラム
CN111125438A (zh) 实体信息提取方法、装置、电子设备及存储介质
Sawalha et al. A standard tag set expounding traditional morphological features for Arabic language part-of-speech tagging
Gimenes et al. Spelling error patterns in Brazilian Portuguese
US20120265520A1 (en) Text processor and method of text processing
US9720896B1 (en) Synthesizing union tables from the web
US20180089180A1 (en) Method, device, and recording medium for providing translated sentence
CN114281979A (zh) 生成文本摘要的文本处理方法、装置、设备以及存储介质
CN101853247A (zh) 片语检查系统及其方法
KR100805190B1 (ko) 영어 문장 분리 장치 및 방법
CN101425087A (zh) 构建词典的方法和系统
CN114528824A (zh) 文本纠错方法、装置、电子设备及存储介质
KR101052004B1 (ko) 번역서비스 제공방법 및 그 시스템
EP3598322A1 (en) Machine based expansion of contractions in text in digital media
JP6677158B2 (ja) 文書データ処理装置、文書データ処理方法、及び文書データ処理プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101006