testsuite/libgomp.fortran/jacobi.f

*404b540aSrobert* { dg-do run }
*404b540aSrobert
*404b540aSrobert      program main
*404b540aSrobert************************************************************
*404b540aSrobert* program to solve a finite difference
*404b540aSrobert* discretization of Helmholtz equation :
*404b540aSrobert* (d2/dx2)u + (d2/dy2)u - alpha u = f
*404b540aSrobert* using Jacobi iterative method.
*404b540aSrobert*
*404b540aSrobert* Modified: Sanjiv Shah,       Kuck and Associates, Inc. (KAI), 1998
*404b540aSrobert* Author:   Joseph Robicheaux, Kuck and Associates, Inc. (KAI), 1998
*404b540aSrobert*
*404b540aSrobert* Directives are used in this code to achieve paralleism.
*404b540aSrobert* All do loops are parallized with default 'static' scheduling.
*404b540aSrobert*
*404b540aSrobert* Input :  n - grid dimension in x direction
*404b540aSrobert*          m - grid dimension in y direction
*404b540aSrobert*          alpha - Helmholtz constant (always greater than 0.0)
*404b540aSrobert*          tol   - error tolerance for iterative solver
*404b540aSrobert*          relax - Successice over relaxation parameter
*404b540aSrobert*          mits  - Maximum iterations for iterative solver
*404b540aSrobert*
*404b540aSrobert* On output
*404b540aSrobert*       : u(n,m) - Dependent variable (solutions)
*404b540aSrobert*       : f(n,m) - Right hand side function
*404b540aSrobert*************************************************************
*404b540aSrobert      implicit none
*404b540aSrobert
*404b540aSrobert      integer n,m,mits,mtemp
*404b540aSrobert      include "omp_lib.h"
*404b540aSrobert      double precision tol,relax,alpha
*404b540aSrobert
*404b540aSrobert      common /idat/ n,m,mits,mtemp
*404b540aSrobert      common /fdat/tol,alpha,relax
*404b540aSrobert*
*404b540aSrobert* Read info
*404b540aSrobert*
*404b540aSrobert      write(*,*) "Input n,m - grid dimension in x,y direction "
*404b540aSrobert      n = 64
*404b540aSrobert      m = 64
*404b540aSrobert*     read(5,*) n,m
*404b540aSrobert      write(*,*) n, m
*404b540aSrobert      write(*,*) "Input alpha - Helmholts constant "
*404b540aSrobert      alpha = 0.5
*404b540aSrobert*     read(5,*) alpha
*404b540aSrobert      write(*,*) alpha
*404b540aSrobert      write(*,*) "Input relax - Successive over-relaxation parameter"
*404b540aSrobert      relax = 0.9
*404b540aSrobert*     read(5,*) relax
*404b540aSrobert      write(*,*) relax
*404b540aSrobert      write(*,*) "Input tol - error tolerance for iterative solver"
*404b540aSrobert      tol = 1.0E-12
*404b540aSrobert*     read(5,*) tol
*404b540aSrobert      write(*,*) tol
*404b540aSrobert      write(*,*) "Input mits - Maximum iterations for solver"
*404b540aSrobert      mits = 100
*404b540aSrobert*     read(5,*) mits
*404b540aSrobert      write(*,*) mits
*404b540aSrobert
*404b540aSrobert      call omp_set_num_threads (2)
*404b540aSrobert
*404b540aSrobert*
*404b540aSrobert* Calls a driver routine
*404b540aSrobert*
*404b540aSrobert      call driver ()
*404b540aSrobert
*404b540aSrobert      stop
*404b540aSrobert      end
*404b540aSrobert
*404b540aSrobert      subroutine driver ( )
*404b540aSrobert*************************************************************
*404b540aSrobert* Subroutine driver ()
*404b540aSrobert* This is where the arrays are allocated and initialzed.
*404b540aSrobert*
*404b540aSrobert* Working varaibles/arrays
*404b540aSrobert*     dx  - grid spacing in x direction
*404b540aSrobert*     dy  - grid spacing in y direction
*404b540aSrobert*************************************************************
*404b540aSrobert      implicit none
*404b540aSrobert
*404b540aSrobert      integer n,m,mits,mtemp
*404b540aSrobert      double precision tol,relax,alpha
*404b540aSrobert
*404b540aSrobert      common /idat/ n,m,mits,mtemp
*404b540aSrobert      common /fdat/tol,alpha,relax
*404b540aSrobert
*404b540aSrobert      double precision u(n,m),f(n,m),dx,dy
*404b540aSrobert
*404b540aSrobert* Initialize data
*404b540aSrobert
*404b540aSrobert      call initialize (n,m,alpha,dx,dy,u,f)
*404b540aSrobert
*404b540aSrobert* Solve Helmholtz equation
*404b540aSrobert
*404b540aSrobert      call jacobi (n,m,dx,dy,alpha,relax,u,f,tol,mits)
*404b540aSrobert
*404b540aSrobert* Check error between exact solution
*404b540aSrobert
*404b540aSrobert      call  error_check (n,m,alpha,dx,dy,u,f)
*404b540aSrobert
*404b540aSrobert      return
*404b540aSrobert      end
*404b540aSrobert
*404b540aSrobert      subroutine initialize (n,m,alpha,dx,dy,u,f)
*404b540aSrobert******************************************************
*404b540aSrobert* Initializes data
*404b540aSrobert* Assumes exact solution is u(x,y) = (1-x^2)*(1-y^2)
*404b540aSrobert*
*404b540aSrobert******************************************************
*404b540aSrobert      implicit none
*404b540aSrobert
*404b540aSrobert      integer n,m
*404b540aSrobert      double precision u(n,m),f(n,m),dx,dy,alpha
*404b540aSrobert
*404b540aSrobert      integer i,j, xx,yy
*404b540aSrobert      double precision PI
*404b540aSrobert      parameter (PI=3.1415926)
*404b540aSrobert
*404b540aSrobert      dx = 2.0 / (n-1)
*404b540aSrobert      dy = 2.0 / (m-1)
*404b540aSrobert
*404b540aSrobert* Initilize initial condition and RHS
*404b540aSrobert
*404b540aSrobert!$omp parallel do private(xx,yy)
*404b540aSrobert      do j = 1,m
*404b540aSrobert         do i = 1,n
*404b540aSrobert            xx = -1.0 + dx * dble(i-1)        ! -1 < x < 1
*404b540aSrobert            yy = -1.0 + dy * dble(j-1)        ! -1 < y < 1
*404b540aSrobert            u(i,j) = 0.0
*404b540aSrobert            f(i,j) = -alpha *(1.0-xx*xx)*(1.0-yy*yy)
*404b540aSrobert     &           - 2.0*(1.0-xx*xx)-2.0*(1.0-yy*yy)
*404b540aSrobert         enddo
*404b540aSrobert      enddo
*404b540aSrobert!$omp end parallel do
*404b540aSrobert
*404b540aSrobert      return
*404b540aSrobert      end
*404b540aSrobert
*404b540aSrobert      subroutine jacobi (n,m,dx,dy,alpha,omega,u,f,tol,maxit)
*404b540aSrobert******************************************************************
*404b540aSrobert* Subroutine HelmholtzJ
*404b540aSrobert* Solves poisson equation on rectangular grid assuming :
*404b540aSrobert* (1) Uniform discretization in each direction, and
*404b540aSrobert* (2) Dirichlect boundary conditions
*404b540aSrobert*
*404b540aSrobert* Jacobi method is used in this routine
*404b540aSrobert*
*404b540aSrobert* Input : n,m   Number of grid points in the X/Y directions
*404b540aSrobert*         dx,dy Grid spacing in the X/Y directions
*404b540aSrobert*         alpha Helmholtz eqn. coefficient
*404b540aSrobert*         omega Relaxation factor
*404b540aSrobert*         f(n,m) Right hand side function
*404b540aSrobert*         u(n,m) Dependent variable/Solution
*404b540aSrobert*         tol    Tolerance for iterative solver
*404b540aSrobert*         maxit  Maximum number of iterations
*404b540aSrobert*
*404b540aSrobert* Output : u(n,m) - Solution
*404b540aSrobert*****************************************************************
*404b540aSrobert      implicit none
*404b540aSrobert      integer n,m,maxit
*404b540aSrobert      double precision dx,dy,f(n,m),u(n,m),alpha, tol,omega
*404b540aSrobert*
*404b540aSrobert* Local variables
*404b540aSrobert*
*404b540aSrobert      integer i,j,k,k_local
*404b540aSrobert      double precision error,resid,rsum,ax,ay,b
*404b540aSrobert      double precision error_local, uold(n,m)
*404b540aSrobert
*404b540aSrobert      real ta,tb,tc,td,te,ta1,ta2,tb1,tb2,tc1,tc2,td1,td2
*404b540aSrobert      real te1,te2
*404b540aSrobert      real second
*404b540aSrobert      external second
*404b540aSrobert*
*404b540aSrobert* Initialize coefficients
*404b540aSrobert      ax = 1.0/(dx*dx) ! X-direction coef
*404b540aSrobert      ay = 1.0/(dy*dy) ! Y-direction coef
*404b540aSrobert      b  = -2.0/(dx*dx)-2.0/(dy*dy) - alpha ! Central coeff
*404b540aSrobert
*404b540aSrobert      error = 10.0 * tol
*404b540aSrobert      k = 1
*404b540aSrobert
*404b540aSrobert      do while (k.le.maxit .and. error.gt. tol)
*404b540aSrobert
*404b540aSrobert         error = 0.0
*404b540aSrobert
*404b540aSrobert* Copy new solution into old
*404b540aSrobert!$omp parallel
*404b540aSrobert
*404b540aSrobert!$omp do
*404b540aSrobert         do j=1,m
*404b540aSrobert            do i=1,n
*404b540aSrobert               uold(i,j) = u(i,j)
*404b540aSrobert            enddo
*404b540aSrobert         enddo
*404b540aSrobert
*404b540aSrobert* Compute stencil, residual, & update
*404b540aSrobert
*404b540aSrobert!$omp do private(resid) reduction(+:error)
*404b540aSrobert         do j = 2,m-1
*404b540aSrobert            do i = 2,n-1
*404b540aSrobert*     Evaluate residual
*404b540aSrobert               resid = (ax*(uold(i-1,j) + uold(i+1,j))
*404b540aSrobert     &                + ay*(uold(i,j-1) + uold(i,j+1))
*404b540aSrobert     &                 + b * uold(i,j) - f(i,j))/b
*404b540aSrobert* Update solution
*404b540aSrobert               u(i,j) = uold(i,j) - omega * resid
*404b540aSrobert* Accumulate residual error
*404b540aSrobert               error = error + resid*resid
*404b540aSrobert            end do
*404b540aSrobert         enddo
*404b540aSrobert!$omp enddo nowait
*404b540aSrobert
*404b540aSrobert!$omp end parallel
*404b540aSrobert
*404b540aSrobert* Error check
*404b540aSrobert
*404b540aSrobert         k = k + 1
*404b540aSrobert
*404b540aSrobert         error = sqrt(error)/dble(n*m)
*404b540aSrobert*
*404b540aSrobert      enddo                     ! End iteration loop
*404b540aSrobert*
*404b540aSrobert      print *, 'Total Number of Iterations ', k
*404b540aSrobert      print *, 'Residual                   ', error
*404b540aSrobert
*404b540aSrobert      return
*404b540aSrobert      end
*404b540aSrobert
*404b540aSrobert      subroutine error_check (n,m,alpha,dx,dy,u,f)
*404b540aSrobert      implicit none
*404b540aSrobert************************************************************
*404b540aSrobert* Checks error between numerical and exact solution
*404b540aSrobert*
*404b540aSrobert************************************************************
*404b540aSrobert
*404b540aSrobert      integer n,m
*404b540aSrobert      double precision u(n,m),f(n,m),dx,dy,alpha
*404b540aSrobert
*404b540aSrobert      integer i,j
*404b540aSrobert      double precision xx,yy,temp,error
*404b540aSrobert
*404b540aSrobert      dx = 2.0 / (n-1)
*404b540aSrobert      dy = 2.0 / (m-1)
*404b540aSrobert      error = 0.0
*404b540aSrobert
*404b540aSrobert!$omp parallel do private(xx,yy,temp) reduction(+:error)
*404b540aSrobert      do j = 1,m
*404b540aSrobert         do i = 1,n
*404b540aSrobert            xx = -1.0d0 + dx * dble(i-1)
*404b540aSrobert            yy = -1.0d0 + dy * dble(j-1)
*404b540aSrobert            temp  = u(i,j) - (1.0-xx*xx)*(1.0-yy*yy)
*404b540aSrobert            error = error + temp*temp
*404b540aSrobert         enddo
*404b540aSrobert      enddo
*404b540aSrobert
*404b540aSrobert      error = sqrt(error)/dble(n*m)
*404b540aSrobert
*404b540aSrobert      print *, 'Solution Error : ',error
*404b540aSrobert
*404b540aSrobert      return
*404b540aSrobert      end