CN110648768B - 一种pom海洋模式优化方法及装置 - Google Patents

一种pom海洋模式优化方法及装置 Download PDF

Info

Publication number
CN110648768B
CN110648768B CN201910773010.1A CN201910773010A CN110648768B CN 110648768 B CN110648768 B CN 110648768B CN 201910773010 A CN201910773010 A CN 201910773010A CN 110648768 B CN110648768 B CN 110648768B
Authority
CN
China
Prior art keywords
pom
ocean
calculation program
ocean mode
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910773010.1A
Other languages
English (en)
Other versions
CN110648768A (zh
Inventor
管洪涛
吴涛
董小凤
罗志荣
唐云波
陈曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu University of Information Technology
Original Assignee
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu University of Information Technology filed Critical Chengdu University of Information Technology
Priority to CN201910773010.1A priority Critical patent/CN110648768B/zh
Publication of CN110648768A publication Critical patent/CN110648768A/zh
Application granted granted Critical
Publication of CN110648768B publication Critical patent/CN110648768B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种POM海洋模式优化方法及装置,其方法包括:通过对POM海洋模式计算程序进行热点分析,得到所述POM海洋模式计算程序的热点区域;在得到所述POM海洋模式计算程序的热点区域之后,将所述POM海洋模式计算程序的进程数进行修改;在所述POM海洋模式计算程序的进程数修改之后,通过对所述POM海洋模式计算程序的热点区域中的性能优化参数进行编译处理,得到性能优化参数编译后的POM海洋模式;在得到所述性能优化参数编译后的POM海洋模式之后,通过开启所述POM海洋模式的计算流程,完成对所述POM海洋模式的优化。

Description

一种POM海洋模式优化方法及装置
技术领域
本发明涉及通信技术领域,特别涉及一种POM(Princeton Ocean Model,普林斯顿海洋模型)海洋模式优化方法及装置。
背景技术
随着海洋科学的发展,对海洋现象的研究越来越倚重于定量和预测,海洋数值模式在定量和预测海洋动力过程的研究和应用中已起着不可替代的作用。海洋模式的发展经历了海浪的数值预报、潮汐的数值预报、三维海洋温、盐、流数值模拟方法、海洋数值预报(包括温、盐、流和水位等)等几个阶段。随着读入数值模式的实测数据种类的增多和质量的优化以及模式自身的发展,数值模式如今已能较好的应用于海洋领域的基础研究,并向精确预测方向发展。
其中,以POM(Princeton Ocean Model)为代表的有限差分计算方法。POM是由美国普林斯顿大学建立起来的一个三维斜压原始方程数值海洋模式,是一种被当今国内外广泛应用于河口、近岸海洋的模式。国内外许多业务化数值预报和再分析系统都是以POM模式为基础开发的。该类方法计算结构相对简单,所以该类算法计算速度较快并且容易修改调试。然而,POM模式经过多年的开发利用,对运行平台的计算能力和分辨率的需求不断扩大,高性能计算机提供的计算资源能够较好满足POM模式的并行计算,但仍不能够达到实时计算的要求。
其中,以FVCOM(Finite Volume Community Ocean Model,有限体积群落海洋模型)为代表的有限体积法。FVCOM是无结构三角形网格架构、有限体积、自由表面、三维原始方程海洋数值模型。该方法通过从数值上求解方程组的积分形式,在网格上可以采用三角网格。但是,海洋模式中对于一些无法准确给出或是求得的物理量,通常是采用参数化的方法,这些系数的选取带有很大的人为性和经验性,系数选取的不同将直接导致数值结果的差异。
其中,有限元法,该类方法采用三角网格,可以对复杂岸界进行拟合从而提高计算精度。但是,有限元法涉及大量的矩阵运算,计算效率低。将并行化技术难度大,复杂程度高,阻碍了其业务化系统的建设和应用。
发明内容
根据本发明实施例提供的方案解决了CPU利用率低和程序执行效率低的技术问题。
根据本发明实施例提供的一种POM海洋模式优化方法,包括:
通过对POM海洋模式计算程序进行热点分析,得到所述POM海洋模式计算程序的热点区域;
在得到所述POM海洋模式计算程序的热点区域之后,将所述POM海洋模式计算程序的进程数进行修改;
在所述POM海洋模式计算程序的进程数修改之后,通过对所述POM海洋模式计算程序的热点区域中的性能优化参数进行编译处理,得到性能优化参数编译后的POM海洋模式;
在得到所述性能优化参数编译后的POM海洋模式之后,通过开启所述POM海洋模式的计算流程,完成对所述POM海洋模式的优化。
优选地,所述通过对POM海洋模式计算程序进行热点分析,得到所述POM海洋模式计算程序的热点区域包括:
通过使用IVPA(Intel VTune Performance Analyzer,英特尔vtunes性能分析仪)对所述POM海洋模式计算程序进行热点分析,得到每个计算程序区域的消耗时间;
通过将所述每个计算程序区域的消耗时间与预置的消耗时间阈值进行比较,将所述计算程序区域的消耗时间大于所述消耗时间阈值的计算程序区域作为所述POM海洋模式计算程序的热点区域。
优选地,所述将所述POM海洋模式计算程序的进程数进行修改包括:
将所述POM海洋模式计算程序中默认的64个进程数修改为48个进程数。
优选地,所述POM海洋模式计算程序的热点区域中的性能优化参数包括以下任一或组合:
03性能优化参数、ip性能优化参数、pad性能优化参数、ipo性能优化参数以及no-prec-div性能优化参数。
优选地,所述通过开启所述POM海洋模式的计算流程,完成对所述POM海洋模式的优化包括:
在开启所述POM海洋模式时,对各个变量参数进行初始化处理,从而进入内模循环;
在进入内膜循环后,通过分别计算斜压梯度力项、水平对流、扩散系数,从而进入外模循环;
在进入外模循环后,分别计算水位、平流、扩散项、流速以及供内模使用的时间平均流速,以便进行外膜处理;
重复上述外膜处理的操作步骤,直到跳出所述外模循环;
在跳出所述外膜循环后,依次进行内外模流速的匹配、垂直边界条件处理及外膜参数的计算处理,以便进行内膜处理;
重复上述内膜处理的操作步骤,直到跳出所述内模循环,完成对所述POM海洋模式的优化。
优选地,所述外膜参数包括以下任一或组合:
水平湍粘性系数、垂直湍粘性系数、扩散系数、施加边界条件、温度场、盐度场、流场以及施加边界条件。
根据本发明实施例提供的一种POM海洋模式优化装置,包括:
热点分析模块,用于通过对POM海洋模式计算程序进行热点分析,得到所述POM海洋模式计算程序的热点区域;
进程数修改模块,用于在得到所述POM海洋模式计算程序的热点区域之后,将所述POM海洋模式计算程序的进程数进行修改;
编译模块,用于在所述POM海洋模式计算程序的进程数修改之后,通过对所述POM海洋模式计算程序的热点区域中的性能优化参数进行编译处理,得到性能优化参数编译后的POM海洋模式;
优化模块,用于在得到所述性能优化参数编译后的POM海洋模式之后,通过开启所述POM海洋模式的计算流程,完成对所述POM海洋模式的优化。
优选地,所述热点分析模块具体用于通过使用IVPA对所述POM海洋模式计算程序进行热点分析,得到每个计算程序区域的消耗时间,以及通过将所述每个计算程序区域的消耗时间与预置的消耗时间阈值进行比较,将所述计算程序区域的消耗时间大于所述消耗时间阈值的计算程序区域作为所述POM海洋模式计算程序的热点区域。
优选地,所述进程数修改模块具体用于将所述POM海洋模式计算程序中默认的64个进程数修改为48个进程数。
优选地,所述POM海洋模式计算程序的热点区域中的性能优化参数包括以下任一或组合:
03性能优化参数、ip性能优化参数、pad性能优化参数、ipo性能优化参数以及no-prec-div性能优化参数。
根据本发明实施例提供的方案,从修改进程数和开启自动向量化两个方面对POM在并行超算云上的计算进行优化,分别从进程切换损失和性能优化参数入手,提高CPU的利用率和程序的执行效率,且优化后的计算方法能够以有效减少执行时间,明显提高POM模式的计算性能。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于理解本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例提供的一种POM海洋模式优化方法的流程图;
图2是本发明实施例提供的一种POM海洋模式优化装置的示意图;
图3是本发明实施例提供的POM海洋模式的热点函数示意图;
图4是本发明实施例提供的POM海洋模式优化的整体示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
随着海洋模式的不断改进和分辨率的提高,对运行平台的计算能力和分辨率的需求不断扩大,使得现有POM的并行模式运行平台的压力越来越重。本发明将POM中的MPI(Message Passing Interface,讯息传递接口)并行模式向以Intel Xeon为核心的高性能科学计算与系统仿真平台上进行移植,通过对POM模式进行大规模测试,分析该模式存在的问题,从而制定相应的优化策略,降低执行时间,实现对POM模式的整体优化,使其能够在科学研究和实际应用中发挥更大的作用。
图1是本发明实施例提供的一种POM海洋模式优化方法的流程图,如图1所示,包括:
通过对POM海洋模式计算程序进行热点分析,得到所述POM海洋模式计算程序的热点区域;
在得到所述POM海洋模式计算程序的热点区域之后,将所述POM海洋模式计算程序的进程数进行修改;
在所述POM海洋模式计算程序的进程数修改之后,通过对所述POM海洋模式计算程序的热点区域中的性能优化参数进行编译处理,得到性能优化参数编译后的POM海洋模式;
在得到所述性能优化参数编译后的POM海洋模式之后,通过开启所述POM海洋模式的计算流程,完成对所述POM海洋模式的优化。
其中,所述通过对POM海洋模式计算程序进行热点分析,得到所述POM海洋模式计算程序的热点区域包括:通过使用IVPA对所述POM海洋模式计算程序进行热点分析,得到每个计算程序区域的消耗时间;通过将所述每个计算程序区域的消耗时间与预置的消耗时间阈值进行比较,将所述计算程序区域的消耗时间大于所述消耗时间阈值的计算程序区域作为所述POM海洋模式计算程序的热点区域。
所述将所述POM海洋模式计算程序的进程数进行修改包括:将所述POM海洋模式计算程序中默认的64个进程数修改为48个进程数。
所述POM海洋模式计算程序的热点区域中的性能优化参数包括以下任一或组合:03性能优化参数、ip性能优化参数、pad性能优化参数、ipo性能优化参数以及no-prec-div性能优化参数。
所述通过开启所述POM海洋模式的计算流程,完成对所述POM海洋模式的优化包括:在开启所述POM海洋模式时,对各个变量参数进行初始化处理,从而进入内模循环;在进入内膜循环后,通过分别计算斜压梯度力项、水平对流、扩散系数,从而进入外模循环;在进入外模循环后,分别计算水位、平流、扩散项、流速以及供内模使用的时间平均流速,以便进行外膜处理;重复上述外膜处理的操作步骤,直到跳出所述外模循环;在跳出所述外膜循环后,依次进行内外模流速的匹配、垂直边界条件处理及外膜参数的计算处理,以便进行内膜处理;重复上述内膜处理的操作步骤,直到跳出所述内模循环,完成对所述POM海洋模式的优化。其中,所述外膜参数包括以下任一或组合:水平湍粘性系数、垂直湍粘性系数、扩散系数、施加边界条件、温度场、盐度场、流场以及施加边界条件。
图2是本发明实施例提供的一种POM海洋模式优化装置的示意图,如图2所示,包括:热点分析模块、进程数修改模块、编译模块以及优化模块。
所述热点分析模块,用于通过对POM海洋模式计算程序进行热点分析,得到所述POM海洋模式计算程序的热点区域;所述进程数修改模块,用于在得到所述POM海洋模式计算程序的热点区域之后,将所述POM海洋模式计算程序的进程数进行修改;所述编译模块,用于在所述POM海洋模式计算程序的进程数修改之后,通过对所述POM海洋模式计算程序的热点区域中的性能优化参数进行编译处理,得到性能优化参数编译后的POM海洋模式;所述优化模块,用于在得到所述性能优化参数编译后的POM海洋模式之后,通过开启所述POM海洋模式的计算流程,完成对所述POM海洋模式的优化。
其中,所述热点分析模块具体用于通过使用IVPA对所述POM海洋模式计算程序进行热点分析,得到每个计算程序区域的消耗时间,以及通过将所述每个计算程序区域的消耗时间与预置的消耗时间阈值进行比较,将所述计算程序区域的消耗时间大于所述消耗时间阈值的计算程序区域作为所述POM海洋模式计算程序的热点区域。
所述进程数修改模块具体用于将所述POM海洋模式计算程序中默认的64个进程数修改为48个进程数。
其中,所述POM海洋模式计算程序的热点区域中的性能优化参数包括以下任一或组合:03性能优化参数、ip性能优化参数、pad性能优化参数、ipo性能优化参数以及no-prec-div性能优化参数。
图4是本发明实施例提供的POM海洋模式优化的整体示意图,如图4所示,包括:首先,使用图形化的软件性能测试工具对POM海洋模式计算程序进行分析;其次,基于POM测试结果,提出MPI并行模式中热点函数的优化方法,提高模式运行效率,对于热点函数的优化从工作从两个方面进行:①修改进程数:通过编译计算,寻找计算效率最高的进程数;②开启自动向量化:通过修改编译选项,充分发挥编译器自动优化功能;最后,开启POM计算流程,完成对POM模式的优化。具体步骤如下:
步骤1:POM海洋模式计算程序热点分析;
使用IVPA对应该程序热点区域进行分析,找出最耗时间的模块、函数、代码或汇编指令。本发明提供当前操作系统中运行的应用程序的函数以及代码的视图,并在性能参数表格内将具体参数值列出来,如图3所示。由分析结果得出,热点函数为profq.f函数和advt.f函数。
步骤2:修改应用进程数;
原POM计算程序默认使用64个核心,本发明将最终进程数定为48,减少进程间的切换损失,提高CPU的使用率。
步骤3:开启自动向量化;
通过对以下性能优化参数进行编译优化来开启自动向量化:
(31)性能优化参数-03:除了激活在-02中包含的全局指令调度、软件流水预测、与数据预取,同时还包括内部函数的内嵌、常量的复响、僵码的删除、全局寄存器分配、循环展开、优化代码选择、部分冗余的消除、溢出处理优化等之外,还包括标量重分布、循环变换等;
(32)性能优化参数-ip:激活在当前源程序内部的其他优化过程,包括对定义于当前源程序文件内部的函数调用的内联展开;
(33)性能优化参数-pad:通过补边对数组变量的内存分布进行调整,可利于发挥cache性能;
(34)性能优化参数-ipo:通过内联展开不同文件间的函数来提高性能;
(35)性能优化参数-no-prec-div:通过降低除法的浮点精度来提高性能。
步骤4:开启POM计算流程。
(41)模式开始后对各个变量参数赋初始值,计算开始进入内模循环;
(42)调用BAROPG计算斜压梯度力项,调用ADVCT计算水平对流、扩散系数,并进行垂直积分;
(43)进入外模循环,首先计算水位,用BCOND(1)进行水位边界处理,然后调用ADVAVE计算平流与扩散项,接着计算流速,以及供内模使用的时间平均流速,再调用BCOND(2)进行流速边界处理;
(44)二维计算完成后跳出该时间层,进入下一时间层的计算,直到跳出外模循环,首先调整U、V的积分以匹配内外模流速;
(45)调用VERTVL计算垂向速度、使用BCOND(5)进行垂直边界条件处理;
(46)调用ADVQ(Q2)、ADVQ(Q2L)、PROFQ、BCOND(6)计算水平和垂直湍粘性系数和扩散系数并施加边界条件,若不选择湍封闭子模型则不用进入此步计算;
(47)调用ADVT(T)、ADVT(S)、PROFT(T)、PROFT(S)、BCOND(4)计算温度场、盐度场,如果模式是诊断计算则温度、盐度不随计算时间变化,因而不用进入此步;
(48)调用ADVU、ADVV、PROFU、PROFV计算流场,利用BCOND(3)施加边界条件,三维计算完成后跳出该时间层,进入下一时间层的计算。直到跳出内模循环,输出计算结果,模式停止。
下面以具体的实施例对本发明的技术内容进行详细说明:
某市超算中心高性能科学计算与系统仿真平台采用CPU的同构计算架构,共600个双路刀片计算节点,总体计算峰值高达420万亿次。每个刀片计算节点配备两颗主频为2.6GHz的Intel Xeon E5-2690v3 12核处理器、128GB DDR4内存,管理网络采用的是以太万兆交换网络加千兆交换机级联架构,并行数据交互采用Intel 100GB Omni-Path网络。集群的存储系统上层采用lustre分布式文件系统、下层采用DDN存储共计768块硬盘组成,可用空间达到3.3P。该文件系统的高可用、高性能的特点满足了整体平台的存储需求。整个超算系统采用Cluster Engine和天眼特征分析软件,有效提升作业提交效率,简化集群管理应用难度。高性能科学计算与系统仿真平台在现有P级超算的基础上、依托国产众核推进E级超算建设,建立以计算、智能和大数据耦合驱动的超高精度全球海洋系统模拟器,通过智能超算和大数据的融合,开展透明海洋、深海极地、蓝色生命等海洋大科学计划,为海洋科研领域发展提供强大的技术支持。
本发明在某市超算中心高性能科学计算与系统仿真平台上运行,测试环境详细信息如下表1所示。
表1测试环境的详细信息
Figure BDA0002174176060000091
根据本发明实施例提供的方案,将POM海洋模式的整个计算程序运行加速比为113%,从而实现了对POM模式的整体优化。
尽管上文对本发明进行了详细说明,但是本发明不限于此,本技术领域技术人员可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。

Claims (5)

1.一种POM海洋模式优化方法,其特征在于,包括:
通过使用IVPA对POM海洋模式计算程序进行热点分析,得到每个计算程序区域的消耗时间,并通过将所述每个计算程序区域的消耗时间与预置的消耗时间阈值进行比较,将所述计算程序区域的消耗时间大于所述消耗时间阈值的计算程序区域作为所述POM海洋模式计算程序的热点区域;
在得到所述POM海洋模式计算程序的热点区域之后,将所述POM海洋模式计算程序的进程数进行修改,其包括:将所述POM海洋模式计算程序中默认的64个进程数修改为48个进程数;
在所述POM海洋模式计算程序的进程数修改之后,通过对所述POM海洋模式计算程序的热点区域中的性能优化参数进行编译处理,得到性能优化参数编译后的POM海洋模式;
在得到所述性能优化参数编译后的POM海洋模式之后,通过开启所述POM海洋模式的计算流程,完成对所述POM海洋模式的优化,其包括:
在开启所述POM海洋模式时,对各个变量参数进行初始化处理,从而进入内模循环;
在进入内膜循环后,通过分别计算斜压梯度力项、水平对流、扩散系数,从而进入外模循环;
在进入外模循环后,分别计算水位、平流、扩散项、流速以及供内模使用的时间平均流速,以便进行外膜处理;
重复上述外膜处理的操作步骤,直到跳出所述外模循环;
在跳出所述外膜循环后,依次进行内外模流速的匹配、垂直边界条件处理及外膜参数的计算处理,以便进行内膜处理;
重复上述内膜处理的操作步骤,直到跳出所述内模循环,完成对所述POM海洋模式的优化;
其中,所述POM是指普林斯顿海洋模型;所述IVPA是指英特尔vtunes性能分析仪。
2.根据权利要求1所述的方法,其特征在于,所述POM海洋模式计算程序的热点区域中的性能优化参数包括以下任一或组合:
03性能优化参数、ip性能优化参数、pad性能优化参数、ipo性能优化参数以及no-prec-div性能优化参数。
3.根据权利要求1所述的方法,其特征在于,所述外膜参数包括以下任一或组合:
水平湍粘性系数、垂直湍粘性系数、扩散系数、施加边界条件、温度场、盐度场、流场以及施加边界条件。
4.一种POM海洋模式优化装置,其特征在于,包括:
热点分析模块,用于通过使用IVPA对POM海洋模式计算程序进行热点分析,得到每个计算程序区域的消耗时间,并通过将所述每个计算程序区域的消耗时间与预置的消耗时间阈值进行比较,将所述计算程序区域的消耗时间大于所述消耗时间阈值的计算程序区域作为所述POM海洋模式计算程序的热点区域;
进程数修改模块,用于在得到所述POM海洋模式计算程序的热点区域之后,将所述POM海洋模式计算程序的进程数进行修改,其包括:将所述POM海洋模式计算程序中默认的64个进程数修改为48个进程数;
编译模块,用于在所述POM海洋模式计算程序的进程数修改之后,通过对所述POM海洋模式计算程序的热点区域中的性能优化参数进行编译处理,得到性能优化参数编译后的POM海洋模式;
优化模块,用于在得到所述性能优化参数编译后的POM海洋模式之后,通过开启所述POM海洋模式的计算流程,完成对所述POM海洋模式的优化,其包括:在开启所述POM海洋模式时,对各个变量参数进行初始化处理,从而进入内模循环;在进入内膜循环后,通过分别计算斜压梯度力项、水平对流、扩散系数,从而进入外模循环;在进入外模循环后,分别计算水位、平流、扩散项、流速以及供内模使用的时间平均流速,以便进行外膜处理;重复上述外膜处理的操作步骤,直到跳出所述外模循环;在跳出所述外膜循环后,依次进行内外模流速的匹配、垂直边界条件处理及外膜参数的计算处理,以便进行内膜处理;重复上述内膜处理的操作步骤,直到跳出所述内模循环,完成对所述POM海洋模式的优化;
其中,所述POM是指普林斯顿海洋模型;所述IVPA是指英特尔vtunes性能分析仪。
5.根据权利要求4所述的装置,其特征在于,所述POM海洋模式计算程序的热点区域中的性能优化参数包括以下任一或组合:
03性能优化参数、ip性能优化参数、pad性能优化参数、ipo性能优化参数以及no-prec-div性能优化参数。
CN201910773010.1A 2019-08-21 2019-08-21 一种pom海洋模式优化方法及装置 Active CN110648768B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910773010.1A CN110648768B (zh) 2019-08-21 2019-08-21 一种pom海洋模式优化方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910773010.1A CN110648768B (zh) 2019-08-21 2019-08-21 一种pom海洋模式优化方法及装置

Publications (2)

Publication Number Publication Date
CN110648768A CN110648768A (zh) 2020-01-03
CN110648768B true CN110648768B (zh) 2022-08-26

Family

ID=69009638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910773010.1A Active CN110648768B (zh) 2019-08-21 2019-08-21 一种pom海洋模式优化方法及装置

Country Status (1)

Country Link
CN (1) CN110648768B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111352738B (zh) * 2020-02-29 2022-08-12 苏州浪潮智能科技有限公司 一种在高性能服务器上运行wrf时的优化方法与系统
CN115391069B (zh) * 2022-10-27 2023-02-03 山东省计算中心(国家超级计算济南中心) 基于海洋模式roms的并行通讯方法及系统
CN118350229B (zh) * 2024-06-18 2024-09-27 自然资源部第一海洋研究所 基于客户驱动和预构造库的全球海洋环境自动模拟系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014093338A1 (en) * 2012-12-10 2014-06-19 Bissell Allen M Methods and apparatus for affecting an atmospheric cyclone

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10331814B2 (en) * 2015-12-08 2019-06-25 International Business Machines Corporation Forecast-based refinement and load balancing for prediction of advection-diffusion processes
CN109857459B (zh) * 2018-12-27 2022-03-08 中国海洋大学 一种e级超算海洋模式自动移植优化方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014093338A1 (en) * 2012-12-10 2014-06-19 Bissell Allen M Methods and apparatus for affecting an atmospheric cyclone

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
POM.gpu-v1.0: a GPU-based Princeton Ocean Model;S. Xu et al.;《Geoscientific Model Development》;20150909;第8卷(第9期);第2815-2827页 *

Also Published As

Publication number Publication date
CN110648768A (zh) 2020-01-03

Similar Documents

Publication Publication Date Title
CN110648768B (zh) 一种pom海洋模式优化方法及装置
CN110084363B (zh) 一种基于fpga平台的深度学习模型加速方法
CA3114635A1 (en) System and method for automated precision configuration for deep neural networks
CN112817730B (zh) 深度神经网络服务批处理调度方法、系统及gpu
CN114995823B (zh) 一种面向cnn专用加速器的深度学习编译器优化方法
CN114995822B (zh) 专用于cnn加速器的深度学习编译器优化方法
CN113934410A (zh) 支持自定义算子的多硬件目标深度模型优化部署架构
WO2022178660A1 (zh) 一种数据处理方法、装置、设备及介质
CN111831354B (zh) 数据精度配置方法、装置、芯片、芯片阵列、设备及介质
CN116128019A (zh) Transformer模型的并行训练方法及装置
CN114676522A (zh) 融合gan和迁移学习的气动形状优化设计方法及系统及设备
CN112200310B (zh) 智能处理器、数据处理方法及存储介质
Zhang et al. A locally distributed mobile computing framework for DNN based android applications
CN116108764B (zh) 光学智能优化方法、装置、设备、介质
CN117574767A (zh) 存内计算架构软硬件系统仿真方法和仿真器
CN114021733B (zh) 模型训练优化方法、装置、计算机设备及存储介质
CN113469326B (zh) 在神经网络模型中执行剪枝优化的集成电路装置及板卡
CN111931913B (zh) 基于Caffe的卷积神经网络在FPGA上的部署方法
CN109597619A (zh) 一种面向异构多核架构的自适应编译框架
CN109190160B (zh) 一种分布式水文模型的矩阵化模拟方法
Metz Machine Learning aided Computer Architecture Design for CNN Inferencing Systems
CN109214726A (zh) 多水库水量调度方法、终端、存储介质及异构计算系统
CN113469328B (zh) 执行转数穿过的装置、板卡、方法及可读存储介质
CN113657059B (zh) 一种适用于点云数据处理器的自动化设计方法及装置
CN116755714B (zh) 深度神经网络模型的运行方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant