CN103377188A - 翻译库的构建方法及系统 - Google Patents

翻译库的构建方法及系统 Download PDF

Info

Publication number
CN103377188A
CN103377188A CN2012101211208A CN201210121120A CN103377188A CN 103377188 A CN103377188 A CN 103377188A CN 2012101211208 A CN2012101211208 A CN 2012101211208A CN 201210121120 A CN201210121120 A CN 201210121120A CN 103377188 A CN103377188 A CN 103377188A
Authority
CN
China
Prior art keywords
entry
translation
english
professional
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101211208A
Other languages
English (en)
Inventor
苏公雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou bigger Network Technology Co. Ltd.
Original Assignee
SUZHOU YINJIAO INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU YINJIAO INFORMATION TECHNOLOGY Co Ltd filed Critical SUZHOU YINJIAO INFORMATION TECHNOLOGY Co Ltd
Priority to CN2012101211208A priority Critical patent/CN103377188A/zh
Publication of CN103377188A publication Critical patent/CN103377188A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明揭示了一种翻译库的构建方法及系统,其方法包括构建专业句典,所述构建专业句典包括以下步骤:S1、提取双语网站上的文本内容;S2、将所述文本内容以句子为单元进行拆分;S3、将文本内容中的原始语句和相对应的翻译语句相关联,形成专业句典,存储于翻译库。与现有技术相比,本发明通过构建专业句典,使得专业领域内文献的翻译效率及准确度更高。

Description

翻译库的构建方法及系统
技术领域
本发明涉及语言翻译技术领域,尤其涉及一种包括专业句典的翻译库构建方法及系统。
背景技术
目前,电子行业几乎所有的产品和技术资料都是英文的,人们都习惯从熟悉的语言环境中迅速地获取自己感兴趣的信息,因此对于中国庞大的从业人员来讲,将他们需要查阅的产品和技术资料的主要部分进行中文的翻译,对于他们了解技术内容的效率具有非常大的意义;同时将部分资料进行本地化翻译也利于本地搜索引擎的收录,和本地用户的检索。然而,目前人们采用的翻译工具大多为在线词典(比如google翻译、Bing翻译、有道翻译、金山词霸等),这些词典对于行业内专业术语的翻译往往存在严重偏差。
发明内容
本发明的目的在于提供一种准确度高的翻译库构建方法。
相应地,本发明的目的还在于提供一种应用上述方法的翻译库构建系统。
为实现上述发明目的之一,本发明采用的技术方案如下:一种翻译库的构建方法,该方法包括构建专业句典,所述构建专业句典包括以下步骤:
S1、提取双语网站上的文本内容;
S2、将所述文本内容以句子为单元进行拆分;
S3、将文本内容中的原始语句和相对应的翻译语句相关联,形成专业句典,存储于翻译库。
作为本发明的进一步改进,在S3步骤后,还包括:
提取电子行业产品及技术资料的英文内容;
将所述英文内容以英文句子为单元进行拆分;
将拆分后的英文句子与所述翻译库中句典进行匹配,若匹配到,则通过所述翻译库中句典对所述英文句子进行翻译;若匹配不到,则在所述翻译库中调取与所述英文句子中关键词最大相似度的句典,并参考所述句典对所述英文句子进行翻译后,以新句典存储于所述翻译库。
作为本发明的进一步改进,在所述“将所述英文内容以英文句子为单元进行拆分”步骤后,还包括:对所述英文句子按照出现于所述产品及技术资料中的频率进行排序。
作为本发明的进一步改进,该方法还包括建立专业词典,所述构建专业词典包括以下步骤:
抓取行业内各网站上指定区域的网页信息;
提取所述网页信息中的文本信息;
对所述文本信息进行分词,以获取若干词条;
判断所述词条是否为本行业的专业词条,若是,将该词条存储于词库中;若否,对该词条进行剔除;
将所述专业词条查找专业词典或者人工翻译,以获取相应的翻译词条;
将所述专业词条与所述翻译词条关联。
作为本发明的进一步改进,在“对所述文本信息进行分词,以获取若干词条”步骤后,还包括:
查询专业英语词库,判断所述专业英语词库中是否已存在该词条,若是,剔除该词条;若否,保存该词条;
统计所述词条在所述网站上的使用频率,并根据所述使用频率对所述词条进行排序。
相应地,为实现上述另一发明目的,本发明提供的一种翻译库的构建系统,该系统用于专业句典的构建,该系统包括:
文本提取单元、用于提取双语网站上的文本内容;
分句单元、用于将所述文本内容以句子为单元进行拆分;
句典生成单元、用于将文本内容中的原始语句和相对应的翻译语句相关联,形成专业句典,存储于翻译库。
作为本发明的进一步改进,该系统还用于:
提取电子行业产品及技术资料的英文内容;
将所述英文内容以英文句子为单元进行拆分;
将拆分后的英文句子与所述翻译库中句典进行匹配,若匹配到,则通过所述翻译库中句典对所述英文句子进行翻译;若匹配不到,则在所述翻译库中调取与所述英文句子中关键词最大相似度的句典,并参考所述句典对所述英文句子进行翻译后,以新句典存储于所述翻译库。
作为本发明的进一步改进,该系统还具体用于:对所述英文句子按照出现于所述产品及技术资料中的频率进行排序。
作为本发明的进一步改进,该系统还用于建立专业词典,其包括如下单元:
网页抓取单元、用于抓取电子行业网站上的网页信息;
文本提取单元、用于提取所述网页信息中的文本信息;
分词单元、用于对所述文本信息进行分词,以获取若干词条;
筛选单元、用于判断所述词条是否为本行业的专业词条,若是,将该词条存储于专业英语词库中;若否,对该词条进行剔除。
翻译单元、用于将所述专业词条查找专业词典或者人工翻译,以获取相应的翻译词条;
专业词典生成单元、用于将所述专业词条与所述翻译词条关联。
作为本发明的进一步改进,该系统还具体用于:
查询专业英语词库,判断所述专业英语词库中是否已存在该词条,若是,剔除该词条;若否,保存该词条;
统计所述词条在所述网站上的使用频率,并根据所述使用频率对所述词条进行排序。
与现有技术相比,本发明通过构建专业句典,使得专业领域内文献的翻译效率及准确度更高。
附图说明
图1是本发明具体实施方式中翻译库的构建方法的基本流程图;
图2是本发明具体实施方式中专业句典的构建方法的基本流程图;
图3是本发明具体实施方式中运用所述专业句典的具体步骤流程图,其中,包括对所述专业句典的完善步骤;
图4是本发明具体实施方式中专业词典的构建方法的具体步骤流程图;
图5是本发明具体实施方式中翻译库的构建系统的功能单元示意图。
具体实施方式
以下将结合附图所示的具体实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
参图1至图3所示,为本发明翻译库的构建方法的一具体实施方式。其中,该方法包括构建专业句典和构建专业词典,如图2所示,所述构建专业句典包括以下步骤:
S1、提取双语网站上的文本内容;所述双语网站可为电子行业内各主要厂商的官方网站,主要是针对中英双语网站的提取。
S2、将所述文本内容以句子为单元进行拆分;
S3、将文本内容中的原始语句和相对应的翻译语句相关联,形成专业句典,存储于翻译库。优选地,原始语句可为中文句子,翻译语句可为当前此中文句子的意思相对应的英文句子。通过将互相翻译对应的中英文句子进行一一映射,并存储于翻译库中,从而形成可供专业人员翻译专业文献使用的专业句典。
参图3所示,优选地,在本实施方式中,在S3步骤后,本方法还包括如下步骤:
S51、提取电子行业产品及技术资料的英文内容;电子行业的专业人员将待翻译的文献输入到翻译系统,翻译系统提取这些待翻译文献的英文内容,以利用上述构建好的句典作翻译。
S52、将所述英文内容以英文句子为单元进行拆分;
S53、将拆分后的英文句子与所述翻译库中句典进行匹配,此处匹配的方式为完全相似匹配,即将标的英文句子与翻译库中保存的句子进行一一比对,并且在匹配到完全一样的句子时停止匹配。
S54、判断匹配是否成功,若匹配到,则通过所述翻译库中句典对所述英文句子进行翻译(S55);若匹配不到,则在所述翻译库中调取与所述英文句子中关键词最大相似度的句典(S56),并参考所述句典对所述英文句子进行翻译后(S57),以新句典存储于所述翻译库(S58)。
优选地,本实施方式中,在所述S52步骤后,还包括:对所述英文句子按照出现于所述产品及技术资料中的频率进行排序。因句子出现频度高,也就意味着它被使用的概率大,那么必然在库中已经存储的概率也就更大,所以对英文句子按照出现频度从高到低的次序进行排序的,那高频度的句子就被匹配到的概率就非常大,从而对句典翻译带了更高的效率。
参照图4所示,以下以本发明优选的实施方式的专业词典的构建进行详尽描述。专业句典的构建方法,包括如下:
S41、抓取电子行业网站上的网页信息;优选地,电子行业网站主要包括德州仪器等国外各大电子厂商官方网站。本发明中,网页信息抓取器通过特定的优先策略从上述网站上进行特定区域的网页信息抓取动作,其中,优先策略包括链接欢迎度、或者链接重要度、或者平均链接的深度等。
S42、提取所述网页信息中的文本信息;于本发明中,所述网页信息中可能包括图片、链接、文字等信息,从抓取到的网页信息中解析出我们需要的字段信息,并按照指定的格式进行信息的存放和加工处理。
S43、对所述文本信息进行分词,以获取若干词条;因为是全英文网站,所以提取的文本信息中包括多个英文词汇,这其中包括电子类专业词条、非专业词条(其他行业的专业词条)以及一些通用的词条。所以,本实施方式中,需要将所以提取到的文本信息分词为多个词条。
S44、判断所述词条是否为本行业的专业词条,若是,将该词条存储于专业英语词库中;若否,对该词条进行剔除。优选地,通过滤除词条中非专业词条、和通用词条,以实现专业词条的获取。
S45、将所述专业词条查找专业词典(google翻译,金山词霸等)或者人工翻译(专业翻译人员),以获取相应的翻译词条(中文);
S46、将所述专业词条(英文)与所述翻译词条(中文)关联。如此,可构建电子行业比较健全的中英文对照词典。
优选地,在本实施方式中,在S43步骤后,还包括:
查询专业英语词库,判断所述专业英语词库中是否已存在该词条,若是,剔除该词条;若否,保存该词条;该步骤首先确保库中不存在重复收集的词条,也进一步提高英文信息库的建立效率。
统计所述词条在所述网站上的使用频率,并根据所述使用频率对所述词条进行排序。将文本信息分词后,统计出所有搜集到的词条,因一段文字中可能多次出现某词条,于是,本发明通过统计出各词条在所有提取的文体中出现过的总次数,并按照这样的出现次数的高度进行排序 ,从而在判断词条是否为专业词条时更加方便。众所周知,一般地,此类专业电子网站上出现频度最高的是通用词条(is、all、the等),而电子行业的专业词条往往是出现频度次于上述通用词条的,出现频度再低一些的词条可能就是其他行业的词条。
值得一提的是,本发明构建的专业词典,可供专业翻译人员进行特定句子的参考翻译时,作为部分词汇的翻译参考。
接下来,请参图5所示,为本发明翻译库的构建系统的一具体实施方式。因该系统应用上述方法,所以在具体技术特征上沿用上述方法。其中,该系统同样包括构建专业句典功能和构建专业词典功能,在本实施方式中,构建专业句典功能通过以下单元:
文本提取单元10、用于提取双语网站上的文本内容;所述双语网站可为电子行业内各主要厂商的官方网站,主要是针对中英双语网站的提取。
分句单元20、用于将所述文本内容以句子为单元进行拆分;
句典生成单元30、用于将文本内容中的原始语句和相对应的翻译语句相关联,形成专业句典,存储于翻译库。优选地,原始语句可为中文句子,翻译语句可为当前此中文句子的意思相对应的英文句子。通过将互相翻译对应的中英文句子进行一一映射,并存储于翻译库中,从而形成可供专业人员翻译专业文献使用的专业句典。
优选地,在本实施方式中,,本系统还用于:
提取电子行业产品及技术资料的英文内容;电子行业的专业人员将待翻译的文献输入到翻译系统,翻译系统提取这些待翻译文献的英文内容,以利用上述构建好的句典作翻译。
将所述英文内容以英文句子为单元进行拆分;
将拆分后的英文句子与所述翻译库中句典进行匹配,此处匹配的方式为完全相似匹配,即将标的英文句子与翻译库中保存的句子进行一一比对,并且在匹配到完全一样的句子时停止匹配。
判断匹配是否成功,若匹配到,则通过所述翻译库中句典对所述英文句子进行翻译;若匹配不到,则在所述翻译库中调取与所述英文句子中关键词最大相似度的句典,并参考所述句典对所述英文句子进行翻译后,以新句典存储于所述翻译库。
优选地,本实施方式中,上述系统还用于:对所述英文句子按照出现于所述产品及技术资料中的频率进行排序。因句子出现频度高,也就意味着它被使用的概率大,那么必然在库中已经存储的概率也就更大,所以对英文句子按照出现频度从高到低的次序进行排序的,那高频度的句子就被匹配到的概率就非常大,从而对句典翻译带了更高的效率。
以下以本发明优选的实施方式的该系统中专业词典的构建进行详尽描述。其包括如下如下单元:
网页抓取单元40、用于抓取电子行业网站上的网页信息;优选地,电子行业网站主要包括德州仪器等国外各大电子厂商官方网站。本发明中,网页信息抓取器通过特定的优先策略从上述网站上进行特定区域的网页信息抓取动作,其中,优先策略包括链接欢迎度、或者链接重要度、或者平均链接的深度等。
文本提取单元50、用于提取所述网页信息中的文本信息;于本发明中,所述网页信息中可能包括图片、链接、文字等信息,从抓取到的网页信息中解析出我们需要的字段信息,并按照指定的格式进行信息的存放和加工处理。
分词单元60、用于对所述文本信息进行分词,以获取若干词条;因为是全英文网站,所以提取的文本信息中包括多个英文词汇,这其中包括电子类专业词条、非专业词条(其他行业的专业词条)以及一些通用的词条。所以,本实施方式中,需要将所以提取到的文本信息分词为多个词条。
筛选单元70、用于判断所述词条是否为本行业的专业词条,若是,将该词条存储于专业英语词库中;若否,对该词条进行剔除。优选地,通过滤除词条中非专业词条、和通用词条,以实现专业词条的获取。
翻译单元80、用于将所述专业词条查找专业词典(google翻译,金山词霸等)或者人工翻译(专业翻译人员),以获取相应的翻译词条(中文);
专业词典生成单元90、用于将所述专业词条(英文)与所述翻译词条(中文)关联。如此,可构建电子行业比较健全的中英文对照词典。
优选地,在本实施方式中,该系统还用于:
查询专业英语词库,判断所述专业英语词库中是否已存在该词条,若是,剔除该词条;若否,保存该词条;该步骤首先确保库中不存在重复收集的词条,也进一步提高英文信息库的建立效率。
统计所述词条在所述网站上的使用频率,并根据所述使用频率对所述词条进行排序。将文本信息分词后,统计出所有搜集到的词条,因一段文字中可能多次出现某词条,于是,本发明通过统计出各词条在所有提取的文体中出现过的总次数,并按照这样的出现次数的高度进行排序 ,从而在判断词条是否为专业词条时更加方便。众所周知,一般地,此类专业电子网站上出现频度最高的是通用词条(is、all、the等),而电子行业的专业词条往往是出现频度次于上述通用词条的,出现频度再低一些的词条可能就是其他行业的词条。
综上所述,本发明主要通过构建行业内的专业句典以及专业词典的专业翻译库,通过在使用专业句典对行业内专业文献进行翻译,并在此过程中不断完善和更新翻译库,使得专业领域内文献的翻译效率及准确度更高。不仅如此,本发明通过建立这样的专业翻译库,可避免使用在线翻译工具的过程中,所带来的翻译效率不高的问题,本发明的翻译方法,通过优化搜索引擎,将库中包括的句典和词典按照使用频度进行排序,从而减小搜索引擎的负担,进而提升专业文献的翻译效率,提高行业效益。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims (10)

1.一种翻译库的构建方法,其特征在于,该方法包括构建专业句典,所述构建专业句典包括以下步骤:
S1、提取双语网站上的文本内容;
S2、将所述文本内容以句子为单元进行拆分;
S3、将文本内容中的原始语句和相对应的翻译语句相关联,形成专业句典,存储于翻译库。
2.根据权利要求1所述的方法,其特征在于,在S3步骤后,还包括:
提取电子行业产品及技术资料的英文内容;
将所述英文内容以英文句子为单元进行拆分;
将拆分后的英文句子与所述翻译库中句典进行匹配,若匹配到,则通过所述翻译库中句典对所述英文句子进行翻译;若匹配不到,则在所述翻译库中调取与所述英文句子中关键词最大相似度的句典,并参考所述句典对所述英文句子进行翻译后,以新句典存储于所述翻译库。
3.根据权利要求2所述的方法,其特征在于,在所述“将所述英文内容以英文句子为单元进行拆分”步骤后,还包括:
对所述英文句子按照出现于所述产品及技术资料中的频率进行排序。
4.根据权利要求1所述的方法,其特征在于,该方法还包括建立专业词典,所述构建专业词典包括以下步骤:
抓取行业内各网站上指定区域的网页信息;
提取所述网页信息中的文本信息;
对所述文本信息进行分词,以获取若干词条;
判断所述词条是否为本行业的专业词条,若是,将该词条存储于词库中;若否,对该词条进行剔除;
将所述专业词条查找专业词典或者人工翻译,以获取相应的翻译词条;
将所述专业词条与所述翻译词条关联。
5.根据权利要求4所述的方法,其特征在于,在“对所述文本信息进行分词,以获取若干词条”步骤后,还包括:
查询专业英语词库,判断所述专业英语词库中是否已存在该词条,若是,剔除该词条;若否,保存该词条;
统计所述词条在所述网站上的使用频率,并根据所述使用频率对所述词条进行排序。
6.一种翻译库的构建系统,其特征在于,该系统用于专业句典的构建,该系统包括:
文本提取单元、用于提取双语网站上的文本内容;
分句单元、用于将所述文本内容以句子为单元进行拆分;
句典生成单元、用于将文本内容中的原始语句和相对应的翻译语句相关联,形成专业句典,存储于翻译库。
7.根据权利要求6所述的系统,其特征在于,该系统还用于:
提取电子行业产品及技术资料的英文内容;
将所述英文内容以英文句子为单元进行拆分;
将拆分后的英文句子与所述翻译库中句典进行匹配,若匹配到,则通过所述翻译库中句典对所述英文句子进行翻译;若匹配不到,则在所述翻译库中调取与所述英文句子中关键词最大相似度的句典,并参考所述句典对所述英文句子进行翻译后,以新句典存储于所述翻译库。
8.根据权利要求7所述的系统,其特征在于,该系统还具体用于:
对所述英文句子按照出现于所述产品及技术资料中的频率进行排序。
9.根据权利要求6所述的系统,其特征在于,该系统还用于建立专业词典,其包括如下单元:
网页抓取单元、用于抓取电子行业网站上的网页信息;
文本提取单元、用于提取所述网页信息中的文本信息;
分词单元、用于对所述文本信息进行分词,以获取若干词条;
筛选单元、用于判断所述词条是否为本行业的专业词条,若是,将该词条存储于专业英语词库中;若否,对该词条进行剔除;
翻译单元、用于将所述专业词条查找专业词典或者人工翻译,以获取相应的翻译词条;
专业词典生成单元、用于将所述专业词条与所述翻译词条关联。
10.根据权利要求9所述的系统,其特征在于,该系统还具体用于:
查询专业英语词库,判断所述专业英语词库中是否已存在该词条,若是,剔除该词条;若否,保存该词条;
统计所述词条在所述网站上的使用频率,并根据所述使用频率对所述词条进行排序。
CN2012101211208A 2012-04-24 2012-04-24 翻译库的构建方法及系统 Pending CN103377188A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101211208A CN103377188A (zh) 2012-04-24 2012-04-24 翻译库的构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101211208A CN103377188A (zh) 2012-04-24 2012-04-24 翻译库的构建方法及系统

Publications (1)

Publication Number Publication Date
CN103377188A true CN103377188A (zh) 2013-10-30

Family

ID=49462321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101211208A Pending CN103377188A (zh) 2012-04-24 2012-04-24 翻译库的构建方法及系统

Country Status (1)

Country Link
CN (1) CN103377188A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022728A (zh) * 2015-07-13 2015-11-04 广西达译商务服务有限责任公司 汉老双语平行语料自动采集的系统及实现方法
CN105760368A (zh) * 2016-03-11 2016-07-13 张广睿 一种文档文字的深度处理方法
CN105808528A (zh) * 2016-03-04 2016-07-27 张广睿 一种文档文字的处理方法
CN107943794A (zh) * 2016-10-12 2018-04-20 阿里巴巴集团控股有限公司 一种翻译方法及系统
CN112487791A (zh) * 2020-11-27 2021-03-12 江苏省舜禹信息技术有限公司 一种多语言混合智能翻译方法
CN113177420A (zh) * 2021-04-29 2021-07-27 同方知网(北京)技术有限公司 一种基于学术文献的中英双语词典构建方法
CN114626390A (zh) * 2020-12-12 2022-06-14 郑州宝冶钢结构有限公司 一种基于钢结构工程平行语料库提升翻译效率的方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1661593A (zh) * 2004-02-24 2005-08-31 北京中专翻译有限公司 一种计算机语言翻译方法及其翻译系统
CN1707476A (zh) * 2005-05-06 2005-12-14 贺方升 辅助翻译搜索引擎系统及其方法
JP2007257644A (ja) * 2006-03-24 2007-10-04 Fujitsu Ltd 訳語候補文字列予測に基づく訳語取得のためのプログラム、方法および装置
CN101187924A (zh) * 2007-11-28 2008-05-28 北京金山软件有限公司 一种从双语句对获取词对译文的方法及系统
US20080126074A1 (en) * 2006-11-23 2008-05-29 Sharp Kabushiki Kaisha Method for matching of bilingual texts and increasing accuracy in translation systems
CN101388007A (zh) * 2007-09-14 2009-03-18 英业达股份有限公司 计算机可执行之语言翻译系统及其方法
CN101482861A (zh) * 2008-01-09 2009-07-15 中国科学院自动化研究所 一种汉英词语自动对齐方法
CN101533391A (zh) * 2008-03-14 2009-09-16 英业达股份有限公司 一种查找相似的匹配句的系统及其方法
CN101996166A (zh) * 2009-08-14 2011-03-30 张龙哺 双语句对模式化记录方法以及翻译方法和翻译系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1661593A (zh) * 2004-02-24 2005-08-31 北京中专翻译有限公司 一种计算机语言翻译方法及其翻译系统
CN1707476A (zh) * 2005-05-06 2005-12-14 贺方升 辅助翻译搜索引擎系统及其方法
JP2007257644A (ja) * 2006-03-24 2007-10-04 Fujitsu Ltd 訳語候補文字列予測に基づく訳語取得のためのプログラム、方法および装置
US20080126074A1 (en) * 2006-11-23 2008-05-29 Sharp Kabushiki Kaisha Method for matching of bilingual texts and increasing accuracy in translation systems
CN101388007A (zh) * 2007-09-14 2009-03-18 英业达股份有限公司 计算机可执行之语言翻译系统及其方法
CN101187924A (zh) * 2007-11-28 2008-05-28 北京金山软件有限公司 一种从双语句对获取词对译文的方法及系统
CN101482861A (zh) * 2008-01-09 2009-07-15 中国科学院自动化研究所 一种汉英词语自动对齐方法
CN101533391A (zh) * 2008-03-14 2009-09-16 英业达股份有限公司 一种查找相似的匹配句的系统及其方法
CN101996166A (zh) * 2009-08-14 2011-03-30 张龙哺 双语句对模式化记录方法以及翻译方法和翻译系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022728A (zh) * 2015-07-13 2015-11-04 广西达译商务服务有限责任公司 汉老双语平行语料自动采集的系统及实现方法
CN105808528A (zh) * 2016-03-04 2016-07-27 张广睿 一种文档文字的处理方法
CN105808528B (zh) * 2016-03-04 2019-01-25 张广睿 一种文档文字的处理方法
CN105760368A (zh) * 2016-03-11 2016-07-13 张广睿 一种文档文字的深度处理方法
CN105760368B (zh) * 2016-03-11 2019-02-12 张广睿 一种文档文字的深度处理方法
CN107943794A (zh) * 2016-10-12 2018-04-20 阿里巴巴集团控股有限公司 一种翻译方法及系统
CN112487791A (zh) * 2020-11-27 2021-03-12 江苏省舜禹信息技术有限公司 一种多语言混合智能翻译方法
CN114626390A (zh) * 2020-12-12 2022-06-14 郑州宝冶钢结构有限公司 一种基于钢结构工程平行语料库提升翻译效率的方法
CN113177420A (zh) * 2021-04-29 2021-07-27 同方知网(北京)技术有限公司 一种基于学术文献的中英双语词典构建方法

Similar Documents

Publication Publication Date Title
CN103377188A (zh) 翻译库的构建方法及系统
CN106537370B (zh) 在存在来源和翻译错误的情况下对命名实体鲁棒标记的方法和系统
CN102651003B (zh) 一种跨语言搜索的方法和装置
CN107690634B (zh) 自动查询模式生成方法及系统
CN104281702A (zh) 基于电力关键词分词的数据检索方法及装置
WO2013146736A1 (ja) 同義関係判定装置、同義関係判定方法、及びそのプログラム
CN102681983A (zh) 一种文本数据的对齐方法和装置
CN102929902A (zh) 一种基于中文检索的分词方法及装置
CN102779135A (zh) 跨语言获取搜索资源的方法和装置及对应搜索方法和装置
CN103902619A (zh) 一种网络舆情监控方法及系统
CN103631938A (zh) 一种分词词典自动扩展的方法和装置
CN108037837A (zh) 一种搜索词的智能提示方法
CN103886094A (zh) 电子商务搜索引擎纠错扩展方法
KR101616031B1 (ko) 위키피디아의 언어자원과 병렬 코퍼스를 이용한 교차언어 검색기의 질의어 번역 시스템 및 방법
CN107577713B (zh) 基于电力词典的文本处理方法
Jia et al. A Chinese unknown word recognition method for micro-blog short text based on improved FP-growth
CN101763403A (zh) 面向多语言信息检索系统的查询翻译方法
Alhanini et al. The enhancement of arabic stemming by using light stemming and dictionary-based stemming
US9336317B2 (en) System and method for searching aliases associated with an entity
CN101833571B (zh) 一种从互联网上自动提取双语翻译词典的方法
Hajjem et al. Building comparable corpora from social networks
Sridhar et al. A Scalable Approach to Building a Parallel Corpus from the Web.
Dhanjal et al. Gravity based Punjabi question answering system
CN103544139A (zh) 一种基于中文检索的正向分词方法及装置
CN103544167A (zh) 一种基于中文检索的逆向分词方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SUZHOU BIGE NETWORK TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: SUZHOU YINJIAO INFORMATION TECHNOLOGY CO., LTD.

Effective date: 20150401

TA01 Transfer of patent application right

Effective date of registration: 20150401

Address after: Dongping street Suzhou Industrial Park in Jiangsu province 215000 Australia Shunchang No. 270 building 3A unit

Applicant after: Suzhou bigger Network Technology Co. Ltd.

Address before: Suzhou City, Jiangsu Province, Suzhou Industrial Park 215000 Xinghu Street No. 328 Creative Industry Park Building 2 room B701

Applicant before: Suzhou Yinjiao Information Technology Co., Ltd.

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20131030