CN107515860A - 一种基于神经元的机器翻译方法 - Google Patents
一种基于神经元的机器翻译方法 Download PDFInfo
- Publication number
- CN107515860A CN107515860A CN201710664397.8A CN201710664397A CN107515860A CN 107515860 A CN107515860 A CN 107515860A CN 201710664397 A CN201710664397 A CN 201710664397A CN 107515860 A CN107515860 A CN 107515860A
- Authority
- CN
- China
- Prior art keywords
- server
- translation
- fpga
- method based
- gpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
Abstract
本发明提供一种基于神经元的机器翻译方法,包括:服务器接受翻译请求;服务器将翻译请求发送至资源调度模块;资源调度模块根据资源的占用情况将翻译请求发送至相对空闲的处理器;处理器输出翻译结果;服务器对不同的处理器输出的翻译结果进行合并。本发明采用GPU+FPGA+CPU的联合服务模式,可以有效缓解单CPU或单FPGA的压力,通过服务器的CPU调配硬件资源,实现负载均衡,优化服务器的翻译效率。
Description
技术领域
本发明涉及神经元机器翻译技术领域。
背景技术
神经元机器翻译引擎自问世以来,一直都是人工智能领域的热点之一,由于它仍处于高速发展期,暂时还不能像统计型机器翻译引擎一样高效、稳定。目前,神经元网络分类和用途各有不同,但总体来说对神经元机器翻译引擎的研究侧重于深度学习部分,而由于其解码时间较长,商用难度较大。
发明内容
本发明所要解决的技术问题是提供一种基于神经元的机器翻译方法,能自动合理分配资源,提高翻译效率。
本发明解决技术问题所采用的技术方案是:一种基于神经元的机器翻译方法,包括以下步骤:
(1)服务器接受翻译请求;
(2)服务器将翻译请求发送至资源调度模块;
(3)资源调度模块根据资源的占用情况将翻译请求发送至相对空闲的处理器;
(4)处理器输出翻译结果;
(5)服务器对不同的处理器输出的翻译结果进行合并。
进一步地,服务器所接收到的翻译请求被处理为符合翻译引擎格式的字符串。
进一步地,处理器包括FPGA/GPU处理器和服务器的CPU处理器。
进一步地,翻译模型被存储在FPGA/GPU的显存以及服务器的内存中。
进一步地,资源调度模块的分配原则是:如存在空闲的FPGA/GPU资源,则优先采用FPGA/GPU进行解码,如无空闲的FPGA/GPU资源,则优先采用CPU进行解码,无论采用哪种方式,字符串都将被送入翻译模型中进行翻译。
本发明的有益效果是:本发明采用GPU+FPGA+CPU的联合服务模式,可以有效缓解单CPU或单FPGA的压力,通过服务器的CPU调配硬件资源,实现负载均衡,优化服务器的翻译效率。
附图说明
图1是本发明的流程图。
具体实施方式
在介绍实施例之前,首先对本发明所涉及到的专业术语进行解释如下:
FPGA:FPGA(Field-Programmable Gate Array),即现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。
GPU:图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。
CPU:中央处理器(CPU,Central Processing Unit)是一块超大规模的集成电路,是一台计算机的运算核心(Core)和控制核心( Control Unit)。它的功能主要是解释计算机指令以及处理计算机软件中的数据。
如图1所示,本发明的机器翻译方法具体包括以下步骤:
1)服务器接收到某一翻译请求A,
该翻译请求A已经由其他系统处理为符合翻译引擎格式的字符串A1,A2..An。
2)服务器将该字符串送入资源调度模块,由资源调度模块以决定由哪个或哪些单元来处理。
3)资源调度模块根据FPGA/GPU的资源情况,决定是否优先采用FPGA/GPU作为解码方式:
根据资源调度规则,以FPGA/GPU为先,其翻译模型存在于每个FPGA/GPU的显存以及服务器内存中,无论采用以下哪种方式,字符串An都会被送入翻译模型中进行翻译。
①若有空闲FPGA/GPU资源,则优先采用FPGA/GPU进行解码。
②若无空闲FPGA/GPU资源,则采用CPU进行解码。
按照这样的方式,对于一串字符串A1,A2..An很大可能是FPGA/GPU和CPU同时处理,在这种情况下,需要将翻译结果进行合并,因此,在翻译完成后,FPGA/GPU和CPU会统一将翻译结果输出给服务器。
4)服务器将FPGA/GPU和CPU中的翻译结果进行合并,输出此次翻译请求的结果。
Claims (5)
1.一种基于神经元的机器翻译方法,其特征是,包括以下步骤:
(1)服务器接受翻译请求;
(2)服务器将翻译请求发送至资源调度模块;
(3)资源调度模块根据资源的占用情况将翻译请求发送至相对空闲的处理器;
(4)处理器输出翻译结果;
(5)服务器对不同的处理器输出的翻译结果进行合并。
2.根据权利要求1所述的一种基于神经元的机器翻译方法,其特征是,服务器所接收到的翻译请求被处理为符合翻译引擎格式的字符串。
3.根据权利要求2所述的一种基于神经元的机器翻译方法,其特征是,处理器包括FPGA/GPU处理器和服务器的CPU处理器。
4.根据权利要求3所述的一种基于神经元的机器翻译方法,其特征是,翻译模型被存储在FPGA/GPU的显存以及服务器的内存中。
5.根据权利要求4所述的一种基于神经元的机器翻译方法,其特征是,资源调度模块的分配原则是:如存在空闲的FPGA/GPU资源,则优先采用FPGA/GPU进行解码,如无空闲的FPGA/GPU资源,则优先采用CPU进行解码,无论采用哪种方式,字符串都将被送入翻译模型中进行翻译。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710664397.8A CN107515860A (zh) | 2017-08-07 | 2017-08-07 | 一种基于神经元的机器翻译方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710664397.8A CN107515860A (zh) | 2017-08-07 | 2017-08-07 | 一种基于神经元的机器翻译方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107515860A true CN107515860A (zh) | 2017-12-26 |
Family
ID=60721937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710664397.8A Pending CN107515860A (zh) | 2017-08-07 | 2017-08-07 | 一种基于神经元的机器翻译方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107515860A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110400249A (zh) * | 2019-07-23 | 2019-11-01 | 杨勇 | 一种基于cpu的图像处理方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567312A (zh) * | 2011-12-30 | 2012-07-11 | 北京理工大学 | 一种基于分布式并行计算框架的机器翻译方法 |
CN102662639A (zh) * | 2012-04-10 | 2012-09-12 | 南京航空航天大学 | 一种基于Mapreduce的多GPU协同计算方法 |
WO2012141677A1 (en) * | 2011-04-11 | 2012-10-18 | Hewlett-Packard Development Company, L.P. | Performing a task in a system having different types of hardware resources |
CN102857565A (zh) * | 2012-09-03 | 2013-01-02 | 重庆邮电大学 | 一种基于云计算的智能试衣系统 |
CN102982678A (zh) * | 2012-11-28 | 2013-03-20 | 青岛海信网络科技股份有限公司 | 交通数据信息服务系统及实现交通数据信息服务的方法 |
CN103197976A (zh) * | 2013-04-11 | 2013-07-10 | 华为技术有限公司 | 异构系统的任务处理方法及装置 |
CN106155635A (zh) * | 2015-04-03 | 2016-11-23 | 北京奇虎科技有限公司 | 一种数据处理方法和装置 |
-
2017
- 2017-08-07 CN CN201710664397.8A patent/CN107515860A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012141677A1 (en) * | 2011-04-11 | 2012-10-18 | Hewlett-Packard Development Company, L.P. | Performing a task in a system having different types of hardware resources |
CN102567312A (zh) * | 2011-12-30 | 2012-07-11 | 北京理工大学 | 一种基于分布式并行计算框架的机器翻译方法 |
CN102662639A (zh) * | 2012-04-10 | 2012-09-12 | 南京航空航天大学 | 一种基于Mapreduce的多GPU协同计算方法 |
CN102857565A (zh) * | 2012-09-03 | 2013-01-02 | 重庆邮电大学 | 一种基于云计算的智能试衣系统 |
CN102982678A (zh) * | 2012-11-28 | 2013-03-20 | 青岛海信网络科技股份有限公司 | 交通数据信息服务系统及实现交通数据信息服务的方法 |
CN103197976A (zh) * | 2013-04-11 | 2013-07-10 | 华为技术有限公司 | 异构系统的任务处理方法及装置 |
CN106155635A (zh) * | 2015-04-03 | 2016-11-23 | 北京奇虎科技有限公司 | 一种数据处理方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110400249A (zh) * | 2019-07-23 | 2019-11-01 | 杨勇 | 一种基于cpu的图像处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112784989B (zh) | 推理系统、推理方法、电子设备及计算机存储介质 | |
CN109508316A (zh) | 异构计算环境的设备和系统 | |
WO2022042113A1 (zh) | 数据处理方法、装置、电子设备及存储介质 | |
EP3779690A1 (en) | Processor core scheduling method and apparatus, terminal, and storage medium | |
CN111490946B (zh) | 基于OpenCL框架的FPGA连接实现方法及装置 | |
CN115244511A (zh) | 分布式计算流水线处理 | |
US20220004873A1 (en) | Techniques to manage training or trained models for deep learning applications | |
CN114281521B (zh) | 优化深度学习异构资源通信效率方法、系统、设备及介质 | |
CN111340243B (zh) | 用于联盟学习的方法、装置及联盟学习系统 | |
CN109509139A (zh) | 顶点数据处理方法、装置及设备 | |
CN105701037B (zh) | 车载娱乐系统中weston与DRM同时访问显示控制器的系统及方法 | |
CN113574656A (zh) | 一种数据处理装置及方法 | |
CN104142907A (zh) | 增强型处理器、处理方法和电子设备 | |
CN109284192A (zh) | 参数配置方法及电子设备 | |
CN103870331B (zh) | 一种动态分配处理器内核的方法及电子设备 | |
CN107515860A (zh) | 一种基于神经元的机器翻译方法 | |
EP4148627A1 (en) | Neural network scheduling method and apparatus | |
KR101620896B1 (ko) | 이기종 프로세싱 타입을 고려한 맵리듀스 프로그램 모델의 수행 성능 향상 방법, 수행 성능 향상 장치 및 수행 성능 향상 시스템 | |
CN116244231A (zh) | 一种数据传输方法、装置、系统、电子设备及存储介质 | |
CN114245173B (zh) | 一种图像压缩方法、装置、终端设备和存储介质 | |
CN105046638A (zh) | 处理器系统及其图像数据处理方法 | |
CN105138392B (zh) | 一种带宽控制方法及电子设备 | |
CN110036621A (zh) | 跨窄链路压缩频繁数据值 | |
CN116301872A (zh) | 代码转换工具、代码编译方法及相关产品 | |
CN115599533A (zh) | 任务处理方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171226 |