Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas

Vidaurre Navarrete, Nelson Leonardo

doi:10.11606/T.45.2014.tde-23032015-110916

Home

Facilities

Doctoral Thesis

DOI

https://doi.org/10.11606/T.45.2014.tde-23032015-110916

Document

Doctoral Thesis

Author

Vidaurre Navarrete, Nelson Leonardo (Catálogo USP)

Full name

Nelson Leonardo Vidaurre Navarrete

E-mail

Institute/School/College

Instituto de Matemática e Estatística

Knowledge Area

Applied Mathematics

Date of Defense

2014-10-31

Published

São Paulo, 2014

Supervisor

Barros, Saulo Rabello Maciel de (Catálogo USP)

Committee

Barros, Saulo Rabello Maciel de (President)
Dias, Pedro Leite da Silva
Garcia, Claudia Inés
Panetta, Jairo
Roma, Alexandre Megiorin

Title in Portuguese

Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas

Keywords in Portuguese

Computação paralela
Multigrid
Refinamento local
Simulação numérica do tempo

Abstract in Portuguese

O objetivo principal deste trabalho é a paralelização de um modelo global de previsão do tempo em diferenças finitas com refinamento local. Este é baseado nas equações primitivas, e faz uso de uma discretização semi-Lagrangiana e semi-implícita em três níveis no tempo em uma malha de Lorenz na vertical e uma malha do tipo C de Arakawa na horizontal. A discretização horizontal é feita através de diferenças finitas de segunda ordem. A equação escalar elíptica tridimensional resultante é desacoplada em um sistema de equações bidimensionais do tipo Helmholtz, o qual é resolvido por meio de um método multigrid. O modelo de paralelização foi desenvolvido para máquinas com memória distribuída, fazendo uso de MPI para passagens de mensagens e baseado em técnicas de decomposição de domínio. O acoplamento apenas local dos operadores de diferenças finitas viabiliza a decomposição em duas direções horizontais. Evitamos a decomposição vertical, tendo em vista o forte acoplamento nesta direção das parametrizações de fenômenos físicos. A estratégia de paralelização foi elaborada visando o uso eficiente de centenas ou alguns milhares de processadores, dependendo da resolução do modelo. Para tal, a malha localmente refinada é separada em três regiões: uma grossa, uma de transição e uma fina, onde cada uma delas é dividida de forma independente entre um número de processadores proporcional ao número de pontos que cada uma armazena, garantindo assim um balanceamento de carga adequado. Não obstante, para resolver o sistema de equações bidimensionais do tipo Helmholtz foi necessário mudar a estratégia de paralelização, dividindo o domínio unicamente nas direções vertical e latitudinal. Ambas partes do modelo com paralelizações diferentes estão conectadas por meio da estratégia de transposição de dados. Testamos nosso modelo utilizando até 1024 processadores e os resultados ainda mostraram uma boa escalabilidade.

Title in English

Parallelization of a numerical weather prediction global model with local refinement grids

Keywords in English

Local refinement
Multigrid
Numerical weather simulation
Parallel computing

Abstract in English

The main goal of this work is the parallelization of a weather prediction model employing finite differences on locally refined meshes. The model is based on the primitive equations and uses a three-time-level semi-implicit semi-Lagrangian temporal discretization on a Lorenz-type vertical grid combined with a horizontal Arakawa C-grid. The horizontal discretization is performed by means of second order finite differences. The resulting three-dimensional scalar elliptic equation is decoupled into a set of Helmholtz-type two-dimensional equations, solved by a multigrid method. The parallelization has been written for distributed-memory machines, employing the MPI message passing standard and was based on domain decomposition techniques. The local coupling of the finite difference operators was exploited in a two-dimensional horizontal decomposition. We avoid a vertical decomposition due to the strong coupling of physical parameterization routines. The parallelization strategy has been designed in order to allow the efficient use of hundreds to a few thousand processors, depending on the model resolution. In order to achieve this, the locally refined mesh is split into three regions: a coarse, a transition and a fine one, each decomposed independently. The number of allocated processors for each region is proportional to the number of the grid-points it contains, in order to guarantee a good load-balancing distribution. However, to solve the set of Helmholtz-type bidimensional equations it was necessary to change the parallelization strategy, splitting the domain only in vertical and latitudinal directions. Both parts of the model with different parallelizations are related by means the data transposition strategy. We tested our model using up to 1024 processors and the results still showed a good scalability.

WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.

tese_NUSP_3025066.pdf (4.65 Mbytes)

Publishing Date

2015-04-08

Derived works

WARNING: Learn what derived works are clicking here.