CN104298420A - 应用电费自助缴费终端维吾尔文翻译引擎的方法 - Google Patents

应用电费自助缴费终端维吾尔文翻译引擎的方法 Download PDF

Info

Publication number
CN104298420A
CN104298420A CN201310740830.3A CN201310740830A CN104298420A CN 104298420 A CN104298420 A CN 104298420A CN 201310740830 A CN201310740830 A CN 201310740830A CN 104298420 A CN104298420 A CN 104298420A
Authority
CN
China
Prior art keywords
translation
self
uyghur
payment terminal
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310740830.3A
Other languages
English (en)
Inventor
阿布都哈力力·阿布都热依木
塔拉甫·加盘
钟方伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XINJIANG INFORMATION INDUSTRY Co Ltd
Original Assignee
XINJIANG INFORMATION INDUSTRY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XINJIANG INFORMATION INDUSTRY Co Ltd filed Critical XINJIANG INFORMATION INDUSTRY Co Ltd
Priority to CN201310740830.3A priority Critical patent/CN104298420A/zh
Publication of CN104298420A publication Critical patent/CN104298420A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明公开了应用电费自助缴费终端维吾尔文翻译引擎的方法,1、从自助缴费终端选择显示类型如汉文、维吾尔文;2、若选择汉文,则无需进行机器翻译;若选择维吾尔文,则启动翻译引擎对数据库里的信息进行翻译,并显示在终端界面上。本发明大大减少人工互译汉文-维吾尔文的成本和时间。

Description

应用电费自助缴费终端维吾尔文翻译引擎的方法
技术领域
本发明涉及语言翻译技术,特别是应用电费自助缴费终端维吾尔文翻译引擎的方法。
背景技术
机器翻译的研究历史可以追溯到 20 世纪三四十年代。20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法。1933年,苏联发明家П.П.特罗扬斯基设计了把一种语言翻译成另一种语言的机器,并在同年9月5日登记了他的发明;但是,由于30年代技术水平还很低,他的翻译机没有制成。1946 年,第一台现代电子计算机 ENIAC 诞生,随后不久,信息论的先驱、美国科学家 W. Weaver 和英国工程师A. D. Booth 在讨论电子计算机的应用范围时,于1947年提出了利用计算机进行语言自动翻译的想法。1949年,W. Weaver 发表《翻译备忘录》 ,正式提出机器翻译的思想。走过六十年的风风雨雨,机器翻译经历了一条曲折而漫长的发展道路。
随着 Internet 的普遍应用,世界经济一体化进程的加速以及国际社会交流的日渐频繁,传统的人工作业的方式已经远远不能满足迅猛增长的翻译需求,人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机遇。国际性的关于机器翻译研究的会议频繁召开,相继推出了一系列机器翻译软件,例如“google” 、 “yahoo”、“百度”。
上世界90年代,在国外对翻译引擎的研究和工作展开得比较多,研究成果广泛地应用到各个行业和日常生活中。在国内,针对汉语的自然语言处理研究中已经一部分工作涉及计算机和嵌入式系统中进行机器翻译。在新疆维吾尔自治区,由于地理和其他原因,信息化的起步开始得较晚,这方面的需求也没有明显地体现出来。本世纪初十年,该地区的信息化加快,各个行业中自然语言处理的需求非常紧急。目前为止,没有进行过关于实时机器翻译的研究,更没有事实应用的现象。此工作的基础是基于统计的汉哈机器翻译。该工作还需要建立电力相关的平行语料库。这些基础工作在翻译引擎中应用。翻译引擎的设计中,首先用GIZA++对平行语料库进行对接,第二步利用IBM模型制造翻译模型。第三步通过Moses译码机输出结果。
新疆维吾尔自治区是多民族居住的地区,随着社会向信息化社会发展,在西部大开发的推进下,基于少数民族文的IT行业进入快速发展的时期。在新疆维吾尔自治区电力系统中用电用户的分布比较广,13个地州公司,89个县公司、营业区,业务覆盖用户数约378万户,电力自助缴费终端的应用很大程度上减少了电力公司收电费成本。但是由于新疆是中国多民族多语言的省区,汉族与维族各占40%,剩下20%是其他民族,使用语言有汉语、维吾尔语、哈萨克语等,其中吐鲁番、哈密、阿克苏、巴州、疆南、和田六地州是居住少数民族同志较多的地区,大部分的少数民族同志不会汉语,使电力自助缴费终端的推广受到阻碍。多语种(维哈柯)自助缴费终端来说,疆内有建设银行等银行业有了初步的推广应用,但目前的电力行业还是以汉语版本为主,没有提供具有本地化支持的自助缴费终端。目前为止,新疆维吾尔自治区电力行业中还没有汉语-维吾尔语自助缴费终端,一部分原因归于嵌入式系统中进行机器翻译的研究还不够深入,对信息的实时翻译准确率得不到保证。
发明内容
本发明的目的在于提供一种应用电费自助缴费终端维吾尔文翻译引擎的方法,大大减少人工互译汉文-维吾尔文的成本和时间。
本发明的目的是这样实现的:一种应用电费自助缴费终端维吾尔文翻译引擎的方法,1、从自助缴费终端选择显示类型如汉文、维吾尔文;2、若选择汉文,则无需进行机器翻译;若选择维吾尔文,则启动翻译引擎对数据库里的信息进行翻译,并显示在终端界面上。
本发明在新疆维吾尔自治区范围内,少数民族语言的电表,哈汉双语营销系统已经开始推广和应用。该工作是少数民族语言电力业务标准化的有效保障,该系统可以适应到其他少数民族语言,比如维吾尔语,柯尔克孜语等等。在新疆维吾尔自治区范围内,少数民族语言的电表,哈汉双语营销系统已经开始推广和应用。本发明是少数民族语言电力业务标准化的有效保障,本发明使用词典和双语实例库,对基于实例的机器翻译技术进行研究,面向电力行业自助终端的机器翻译引擎。本发明应用广泛,可对给予的维吾尔文字资料进行词法分析,分词,根据预料的知识进行翻译,并输出结果,其应用范围是电力行业自助缴费终端信息,大大减少人工互译汉文-维吾尔文的成本和时间。
附图说明
下面将结合附图对本发明作进一步说明。
图1为本发明的工作流程图;
图2为本发明翻译模型形成的工作流程图。
具体实施方式
一种应用电费自助缴费终端维吾尔文翻译引擎的方法,如图1所示,1、从自助缴费终端选择显示类型如汉文、维吾尔文;2、若选择汉文,则无需进行机器翻译;若选择维吾尔文,则启动翻译引擎对数据库里的信息进行翻译,并显示在终端界面上。
如图2所示:本发明的翻译模型的形成包括训练模型和基于统计翻译模型的翻译部分。
训练模型:①建立大量的维吾尔文语料库。②对已建立的维吾尔文语料库,在SRILM算法的基础上建立维吾尔语的语言模型。③需要大量的平行语料库来训练翻译模型,该发明中的资料均来自于新疆维吾尔自治区电力系统中的相关规则,电力系统中发表的文档和法律条款,这些资料都是以汉哈文对齐的,具体如下所示:
科学用电常识
安全用电常识
节约用电常识
电网调度管理条例
电力设施保护条例
中华人民共和国电力法
电力供应与使用条例
电网调度管理条例
电力设施保护条例
汉哈专用名词辞典
国家电网公司供电服务“十项承诺”
汉哈专用名词辞典
国家电网公司供电服务“十项承诺”
… … … … … …
上述全部文字资料通过人工对接,用于训练。
④对平行语料库进行基于Mkcls算法的单词分类。⑤用GIZA++实现了IBM模型1~5的所有代码,在生成源语言语目标语言之间翻译概率的同时,产生了翻译模型。
翻译部分:①从汉文数据库提取相应的汉文信息。②对汉文进行词法分析。③通过Moses译码机实现汉-哈翻译,并显示维吾尔文的翻译结果。

Claims (1)

1.一种应用电费自助缴费终端维吾尔文翻译引擎的方法,其特征在于:1、从自助缴费终端选择显示类型如汉文、维吾尔文;2、若选择汉文,则无需进行机器翻译;若选择维吾尔文,则启动翻译引擎对数据库里的信息进行翻译,并显示在终端界面上。
CN201310740830.3A 2013-12-29 2013-12-29 应用电费自助缴费终端维吾尔文翻译引擎的方法 Pending CN104298420A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310740830.3A CN104298420A (zh) 2013-12-29 2013-12-29 应用电费自助缴费终端维吾尔文翻译引擎的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310740830.3A CN104298420A (zh) 2013-12-29 2013-12-29 应用电费自助缴费终端维吾尔文翻译引擎的方法

Publications (1)

Publication Number Publication Date
CN104298420A true CN104298420A (zh) 2015-01-21

Family

ID=52318171

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310740830.3A Pending CN104298420A (zh) 2013-12-29 2013-12-29 应用电费自助缴费终端维吾尔文翻译引擎的方法

Country Status (1)

Country Link
CN (1) CN104298420A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101561954A (zh) * 2009-05-26 2009-10-21 戴克功 客户免对话服务器
US20110282648A1 (en) * 2010-05-13 2011-11-17 International Business Machines Corporation Machine Translation with Side Information
CN103164397A (zh) * 2011-12-19 2013-06-19 新疆信息产业有限责任公司 汉哈电子辞典及其自动转译汉哈语的方法
CN103164398A (zh) * 2011-12-19 2013-06-19 新疆新能信息通信有限责任公司 汉维电子辞典及其自动转译汉维语的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101561954A (zh) * 2009-05-26 2009-10-21 戴克功 客户免对话服务器
US20110282648A1 (en) * 2010-05-13 2011-11-17 International Business Machines Corporation Machine Translation with Side Information
CN103164397A (zh) * 2011-12-19 2013-06-19 新疆信息产业有限责任公司 汉哈电子辞典及其自动转译汉哈语的方法
CN103164398A (zh) * 2011-12-19 2013-06-19 新疆新能信息通信有限责任公司 汉维电子辞典及其自动转译汉维语的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谭煜辉等: ""基于统计的维文汉文人名音译研究"", 《新疆大学学报(自然科学版)》 *

Similar Documents

Publication Publication Date Title
Goh et al. Stochastic modeling and forecasting of solar radiation data
CN110188345B (zh) 一种电力操作票的智能识别方法与装置
CN107748803A (zh) 一种空间态势特征事件数据库设计方法
CN103593334A (zh) 一种用于判断文本情感程度的方法和系统
Mendoza España et al. Resource demand and economic impact of various thorium-based fuels for potential near-term use in a pressure-tube heavy water reactor
CN104298420A (zh) 应用电费自助缴费终端维吾尔文翻译引擎的方法
CN104298661A (zh) 应用电费自助缴费终端柯尔克孜文翻译引擎的方法
CN104298660A (zh) 应用电费自助缴费终端哈萨克文翻译引擎的方法
CN115730078A (zh) 用于类案检索的事件知识图谱构建方法、装置及电子设备
Choi et al. Development of decision making model of measures on the decrease of traffic accident following implementation of intra-city bus by using AHP
Jin et al. Identification of primary activity and management plan for construction standard unit price
Zhang China is speeding up its plutonium recycling programs
Kim et al. QGIS-based Autonomous Process and Arc River Data Repository for Efficient Flood Inundation and Hazard Mapping
Noh et al. A Case Study on the Educational Facility Project for the Improvement of Work Item's Structure in BoQ
Igwe et al. STATISTICAL EVIDENCE VS THEORETICAL POSTULATION OF THE RELATIVE IMPORTANCE OF LAND VALUE VARIABLES VIS-À-VIS BUILDING VALUE VARIABLES IN THE PROPERTY VALUATION MODEL
Ochoa et al. Quantitative demonstration of Lenz's law
Yang et al. Resident activity pattern recognition from household travel survey data
Kim et al. Development of Intelligent Planning and Analysis Method for Railroad Alignment Improvement
Kim et al. A Study on the Demand of Taxi Transfer Discount Using Ordinal Logistic Model
CN103885931A (zh) 基于统计模型的电力系统维吾尔语专用名词提取方法
Muralikrishna et al. Neural Networks for Estimating Galaxy Redshifts from a Multi-Band Photometric Astronomical Survey
Kuehn et al. Neural-network-based sea state reconstruction of under-resolved coastal spectral wave computations
Tang et al. Long-term streamflow forecasting using SWAT through the integration of a Random Forest Precipitation Generator
Uritsky et al. Image-based optimization of coronal magnetic field models for improved space weather forecasting
Bandyopadhyay et al. Fuzzy based Approach for Recognition of Solar Coronal Holes in SDO/AIA Images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150121

RJ01 Rejection of invention patent application after publication