ghost_doc/cu__complex_8h_source.html

 #ifndef GHOST_CU_COMPLEX_H

 #define GHOST_CU_COMPLEX_H


 #include <cuComplex.h>


 template<typename T>

 __device__  __host__ inline void zero(T &val)

 {

     val = 0.;

 }


 template<>

 __device__  __host__ inline void zero<cuFloatComplex>(cuFloatComplex &val)

 {

     val = make_cuFloatComplex(0.,0.);

 }


 template<>

 __device__  __host__ inline void zero<cuDoubleComplex>(cuDoubleComplex &val)

 {

     val = make_cuDoubleComplex(0.,0.);

 }


 template<typename T>

 __device__ __host__ inline void one(T &val)

 {

     val = 1.;

 }


 template<>

 __device__  __host__ inline void one<cuFloatComplex>(cuFloatComplex &val)

 {

     val = make_cuFloatComplex(1.,0.);

 }


 template<>

 __device__  __host__ inline void one<cuDoubleComplex>(cuDoubleComplex &val)

 {

     val = make_cuDoubleComplex(1.,0.);

 }


 template<typename T, typename T_b>

 __device__ inline void fromReal(T &val, T_b real)

 {

     val = real;

 }


 template<>

 __device__ inline void fromReal<cuDoubleComplex,double>(cuDoubleComplex &val, double real)

 {

     val = make_cuDoubleComplex(real,0.);

 }


 template<>

 __device__ inline void fromReal<cuFloatComplex,float>(cuFloatComplex &val, float real)

 {

     val = make_cuFloatComplex(real,0.f);

 }


 template<typename T, typename T_b>

 __device__ inline T_b Real(T val)

 {

     return val;

 }


 template<>

 __device__ inline double Real<cuDoubleComplex,double>(cuDoubleComplex val)

 {

     return cuCreal(val);

 }


 template<>

 __device__ inline float Real<cuFloatComplex,float>(cuFloatComplex val)

 {

     return cuCrealf(val);

 }


 template<typename T, typename T_b>

 __device__ inline T_b Imag(T val)

 {

     return val;

 }


 template<>

 __device__ inline double Imag<cuDoubleComplex,double>(cuDoubleComplex val)

 {

     return cuCimag(val);

 }


 template<>

 __device__ inline float Imag<cuFloatComplex,float>(cuFloatComplex val)

 {

     return cuCimagf(val);

 }


 // val += val2

 template<typename t>

 __device__ inline t accu(t val, t val2)

 {

     return val+val2;

 }


 template<>

 __device__ inline cuFloatComplex accu<cuFloatComplex>(cuFloatComplex val, cuFloatComplex val2)

 {

     return cuCaddf(val,val2);

 }


 template<>

 __device__ inline cuDoubleComplex accu<cuDoubleComplex>(cuDoubleComplex val, cuDoubleComplex val2)

 {

     return cuCadd(val,val2);

 }


 // val += val2*val3

 template<typename T, typename T2>

 __device__ inline T axpy(T val, T val2, T2 val3)

 {

     return val+val2*val3;

 }


 template<>

 __device__ inline cuFloatComplex axpy<cuFloatComplex,cuFloatComplex>(cuFloatComplex val, cuFloatComplex val2, cuFloatComplex val3)

 {

     return cuCaddf(val,cuCmulf(val2,val3));

 }


 template<>

 __device__ inline cuFloatComplex axpy<cuFloatComplex,double>(cuFloatComplex val, cuFloatComplex val2, double val3)

 {

     return cuCaddf(val,cuCmulf(val2,make_cuFloatComplex((float)val3,0.f)));

 }


 template<>

 __device__ inline cuFloatComplex axpy<cuFloatComplex,float>(cuFloatComplex val, cuFloatComplex val2, float val3)

 {

     return cuCaddf(val,cuCmulf(val2,make_cuFloatComplex(val3,0.f)));

 }


 template<>

 __device__ inline cuFloatComplex axpy<cuFloatComplex,cuDoubleComplex>(cuFloatComplex val, cuFloatComplex val2, cuDoubleComplex val3)

 {

     return cuCaddf(val,cuCmulf(val2,make_cuFloatComplex((float)(cuCreal(val3)),(float)(cuCimag(val3)))));

 }


 template<>

 __device__ inline cuDoubleComplex axpy<cuDoubleComplex,double>(cuDoubleComplex val, cuDoubleComplex val2, double val3)

 {

     return cuCadd(val,cuCmul(val2,make_cuDoubleComplex(val3,0.)));

 }


 template<>

 __device__ inline cuDoubleComplex axpy<cuDoubleComplex,float>(cuDoubleComplex val, cuDoubleComplex val2, float val3)

 {

     return cuCadd(val,cuCmul(val2,make_cuDoubleComplex((double)val3,0.)));

 }


 template<>

 __device__ inline cuDoubleComplex axpy<cuDoubleComplex,cuDoubleComplex>(cuDoubleComplex val, cuDoubleComplex val2, cuDoubleComplex val3)

 {

     return cuCadd(val,cuCmul(val2,val3));

 }


 template<>

 __device__ inline cuDoubleComplex axpy<cuDoubleComplex,cuFloatComplex>(cuDoubleComplex val, cuDoubleComplex val2, cuFloatComplex val3)

 {

     return cuCadd(val,cuCmul(val2,make_cuDoubleComplex((double)(cuCrealf(val3)),(double)(cuCimagf(val3)))));

 }


 template<>

 __device__ inline double axpy<double,cuFloatComplex>(double val, double val2, cuFloatComplex val3)

 {

     return val+val2*(double)cuCrealf(val3);

 }


 template<>

 __device__ inline double axpy<double,cuDoubleComplex>(double val, double val2, cuDoubleComplex val3)

 {

     return val+val2*cuCreal(val3);

 }


 template<>

 __device__ inline float axpy<float,cuFloatComplex>(float val, float val2, cuFloatComplex val3)

 {

     return val+val2*cuCrealf(val3);

 }


 template<>

 __device__ inline float axpy<float,cuDoubleComplex>(float val, float val2, cuDoubleComplex val3)

 {

     return val+val2*(float)cuCreal(val3);

 }


 // y = a*x + b*y

 template<typename T>

 __device__ inline T axpby(T x, T y, T a, T b)

 {

     return b*y+a*x;

 }


 template<typename T,typename T_b>

 __device__ inline T_b mulConjSame(T x)

 {

     return x*x;

 }


 template<>

 __device__ inline float mulConjSame<cuFloatComplex,float>(cuFloatComplex x)

 {

     return cuCrealf(x)*cuCrealf(x) + cuCimagf(x)*cuCimagf(x);

 }


 template<>

 __device__ inline double mulConjSame<cuDoubleComplex,double>(cuDoubleComplex x)

 {

     return cuCreal(x)*cuCreal(x) + cuCimag(x)*cuCimag(x);

 }


 template<typename T>

 __device__ inline T conj(T x)

 {

     return x;

 }


 template<>

 __device__ inline cuFloatComplex conj<cuFloatComplex>(cuFloatComplex x)

 {

     return cuConjf(x);

 }


 template<>

 __device__ inline cuDoubleComplex conj<cuDoubleComplex>(cuDoubleComplex x)

 {

     return cuConj(x);

 }


 template<typename T>

 __device__ inline T mulConj(T x, T y)

 {

     return x*y;

 }


 template<>

 __device__ inline cuFloatComplex mulConj<cuFloatComplex>(cuFloatComplex x, cuFloatComplex y)

 {

     return cuCmulf(cuConjf(x),y);

 }


 template<>

 __device__ inline cuDoubleComplex mulConj<cuDoubleComplex>(cuDoubleComplex x, cuDoubleComplex y)

 {

     return cuCmul(cuConj(x),y);

 }


 template<>

 __device__ inline cuFloatComplex axpby<cuFloatComplex>(cuFloatComplex x, cuFloatComplex y, cuFloatComplex a, cuFloatComplex b)

 {

     return cuCaddf(cuCmulf(b,y),cuCmulf(a,x));

 }


 template<>

 __device__ inline cuDoubleComplex axpby<cuDoubleComplex>(cuDoubleComplex x, cuDoubleComplex y, cuDoubleComplex a, cuDoubleComplex b)

 {

     return cuCadd(cuCmul(b,y),cuCmul(a,x));

 }


 // x = a*y

 template<typename T>

 __device__ inline T scale(T y, T a)

 {

     return a*y;

 }


 template<>

 __device__ inline cuFloatComplex scale<cuFloatComplex>(cuFloatComplex y, cuFloatComplex a)

 {

     return cuCmulf(a,y);

 }


 template<>

 __device__ inline cuDoubleComplex scale<cuDoubleComplex>(cuDoubleComplex y, cuDoubleComplex a)

 {

     return cuCmul(a,y);

 }


 template<typename T1, typename T2>

 __device__ inline T1 scale2(T1 y, T2 a)

 {

     return a*y;

 }


 template<>

 __device__ inline cuFloatComplex scale2<cuFloatComplex,cuFloatComplex>(cuFloatComplex y, cuFloatComplex a)

 {

     return cuCmulf(a,y);

 }


 template<>

 __device__ inline cuFloatComplex scale2<cuFloatComplex,float>(cuFloatComplex y, float a)

 {

     return cuCmulf(make_cuFloatComplex(a,0.f),y);

 }


 template<>

 __device__ inline cuFloatComplex scale2<cuFloatComplex,double>(cuFloatComplex y, double a)

 {

     return cuCmulf(make_cuFloatComplex((float)a,0.f),y);

 }


 template<>

 __device__ inline cuDoubleComplex scale2<cuDoubleComplex,cuDoubleComplex>(cuDoubleComplex y, cuDoubleComplex a)

 {

     return cuCmul(a,y);

 }


 template<>

 __device__ inline cuDoubleComplex scale2<cuDoubleComplex,float>(cuDoubleComplex y, float a)

 {

     return cuCmul(make_cuDoubleComplex(a,0.),y);

 }


 template<>

 __device__ inline cuDoubleComplex scale2<cuDoubleComplex,double>(cuDoubleComplex y, double a)

 {

     return cuCmul(make_cuDoubleComplex(a,0.),y);

 }


 // z = a*x*y

 template<typename T>

 __device__ inline T mult(T x, T y, T a)

 {

     return a*x*y;

 }


 template<>

 __device__ inline cuFloatComplex mult<cuFloatComplex>(cuFloatComplex x, cuFloatComplex y, cuFloatComplex a)

 {

     return cuCmulf(a,cuCmulf(x,y));

 }


 template<>

 __device__ inline cuDoubleComplex mult<cuDoubleComplex>(cuDoubleComplex x, cuDoubleComplex y, cuDoubleComplex a)

 {

     return cuCmul(a,cuCmul(x,y));

 }


 #endif

Real< cuDoubleComplex, double >
__device__ double Real< cuDoubleComplex, double >(cuDoubleComplex val)
Definition: cu_complex.h:72

fromReal
__device__ void fromReal(T &val, T_b real)
Definition: cu_complex.h:48

axpy< cuDoubleComplex, cuDoubleComplex >
__device__ cuDoubleComplex axpy< cuDoubleComplex, cuDoubleComplex >(cuDoubleComplex val, cuDoubleComplex val2, cuDoubleComplex val3)
Definition: cu_complex.h:164

mult< cuFloatComplex >
__device__ cuFloatComplex mult< cuFloatComplex >(cuFloatComplex x, cuFloatComplex y, cuFloatComplex a)
Definition: cu_complex.h:343

conj
__device__ T conj(T x)
Definition: cu_complex.h:226

accu< cuFloatComplex >
__device__ cuFloatComplex accu< cuFloatComplex >(cuFloatComplex val, cuFloatComplex val2)
Definition: cu_complex.h:109

axpby< cuFloatComplex >
__device__ cuFloatComplex axpby< cuFloatComplex >(cuFloatComplex x, cuFloatComplex y, cuFloatComplex a, cuFloatComplex b)
Definition: cu_complex.h:262

mulConj< cuFloatComplex >
__device__ cuFloatComplex mulConj< cuFloatComplex >(cuFloatComplex x, cuFloatComplex y)
Definition: cu_complex.h:250

axpy< float, cuDoubleComplex >
__device__ float axpy< float, cuDoubleComplex >(float val, float val2, cuDoubleComplex val3)
Definition: cu_complex.h:195

mulConjSame
__device__ T_b mulConjSame(T x)
Definition: cu_complex.h:208

one
__device__ __host__ void one(T &val)
Definition: cu_complex.h:30

axpby
__device__ T axpby(T x, T y, T a, T b)
Definition: cu_complex.h:202

axpy< double, cuDoubleComplex >
__device__ double axpy< double, cuDoubleComplex >(double val, double val2, cuDoubleComplex val3)
Definition: cu_complex.h:182

axpy< cuDoubleComplex, double >
__device__ cuDoubleComplex axpy< cuDoubleComplex, double >(cuDoubleComplex val, cuDoubleComplex val2, double val3)
Definition: cu_complex.h:152

scale2< cuFloatComplex, double >
__device__ cuFloatComplex scale2< cuFloatComplex, double >(cuFloatComplex y, double a)
Definition: cu_complex.h:311

mulConjSame< cuFloatComplex, float >
__device__ float mulConjSame< cuFloatComplex, float >(cuFloatComplex x)
Definition: cu_complex.h:214

mulConj< cuDoubleComplex >
__device__ cuDoubleComplex mulConj< cuDoubleComplex >(cuDoubleComplex x, cuDoubleComplex y)
Definition: cu_complex.h:256

scale
__device__ T scale(T y, T a)
Definition: cu_complex.h:275

scale2
__device__ T1 scale2(T1 y, T2 a)
Definition: cu_complex.h:293

mulConj
__device__ T mulConj(T x, T y)
Definition: cu_complex.h:244

axpy< float, cuFloatComplex >
__device__ float axpy< float, cuFloatComplex >(float val, float val2, cuFloatComplex val3)
Definition: cu_complex.h:188

accu< cuDoubleComplex >
__device__ cuDoubleComplex accu< cuDoubleComplex >(cuDoubleComplex val, cuDoubleComplex val2)
Definition: cu_complex.h:115

Real
__device__ T_b Real(T val)
Definition: cu_complex.h:66

scale2< cuFloatComplex, cuFloatComplex >
__device__ cuFloatComplex scale2< cuFloatComplex, cuFloatComplex >(cuFloatComplex y, cuFloatComplex a)
Definition: cu_complex.h:299

conj< cuFloatComplex >
__device__ cuFloatComplex conj< cuFloatComplex >(cuFloatComplex x)
Definition: cu_complex.h:232

axpy< cuDoubleComplex, float >
__device__ cuDoubleComplex axpy< cuDoubleComplex, float >(cuDoubleComplex val, cuDoubleComplex val2, float val3)
Definition: cu_complex.h:158

Imag< cuDoubleComplex, double >
__device__ double Imag< cuDoubleComplex, double >(cuDoubleComplex val)
Definition: cu_complex.h:90

fromReal< cuDoubleComplex, double >
__device__ void fromReal< cuDoubleComplex, double >(cuDoubleComplex &val, double real)
Definition: cu_complex.h:54

one< cuDoubleComplex >
__device__ __host__ void one< cuDoubleComplex >(cuDoubleComplex &val)
Definition: cu_complex.h:42

fromReal< cuFloatComplex, float >
__device__ void fromReal< cuFloatComplex, float >(cuFloatComplex &val, float real)
Definition: cu_complex.h:60

Imag
__device__ T_b Imag(T val)
Definition: cu_complex.h:84

one< cuFloatComplex >
__device__ __host__ void one< cuFloatComplex >(cuFloatComplex &val)
Definition: cu_complex.h:36

Imag< cuFloatComplex, float >
__device__ float Imag< cuFloatComplex, float >(cuFloatComplex val)
Definition: cu_complex.h:96

axpy< double, cuFloatComplex >
__device__ double axpy< double, cuFloatComplex >(double val, double val2, cuFloatComplex val3)
Definition: cu_complex.h:176

zero
__device__ __host__ void zero(T &val)
Definition: cu_complex.h:12

scale2< cuDoubleComplex, float >
__device__ cuDoubleComplex scale2< cuDoubleComplex, float >(cuDoubleComplex y, float a)
Definition: cu_complex.h:324

mulConjSame< cuDoubleComplex, double >
__device__ double mulConjSame< cuDoubleComplex, double >(cuDoubleComplex x)
Definition: cu_complex.h:220

mult< cuDoubleComplex >
__device__ cuDoubleComplex mult< cuDoubleComplex >(cuDoubleComplex x, cuDoubleComplex y, cuDoubleComplex a)
Definition: cu_complex.h:349

accu
__device__ t accu(t val, t val2)
Definition: cu_complex.h:103

scale2< cuFloatComplex, float >
__device__ cuFloatComplex scale2< cuFloatComplex, float >(cuFloatComplex y, float a)
Definition: cu_complex.h:305

zero< cuDoubleComplex >
__device__ __host__ void zero< cuDoubleComplex >(cuDoubleComplex &val)
Definition: cu_complex.h:24

scale2< cuDoubleComplex, double >
__device__ cuDoubleComplex scale2< cuDoubleComplex, double >(cuDoubleComplex y, double a)
Definition: cu_complex.h:330

Real< cuFloatComplex, float >
__device__ float Real< cuFloatComplex, float >(cuFloatComplex val)
Definition: cu_complex.h:78

axpy< cuFloatComplex, float >
__device__ cuFloatComplex axpy< cuFloatComplex, float >(cuFloatComplex val, cuFloatComplex val2, float val3)
Definition: cu_complex.h:140

axpy
__device__ T axpy(T val, T val2, T2 val3)
Definition: cu_complex.h:122

scale< cuFloatComplex >
__device__ cuFloatComplex scale< cuFloatComplex >(cuFloatComplex y, cuFloatComplex a)
Definition: cu_complex.h:281

zero< cuFloatComplex >
__device__ __host__ void zero< cuFloatComplex >(cuFloatComplex &val)
Definition: cu_complex.h:18

scale2< cuDoubleComplex, cuDoubleComplex >
__device__ cuDoubleComplex scale2< cuDoubleComplex, cuDoubleComplex >(cuDoubleComplex y, cuDoubleComplex a)
Definition: cu_complex.h:317

mult
__device__ T mult(T x, T y, T a)
Definition: cu_complex.h:337

axpy< cuFloatComplex, double >
__device__ cuFloatComplex axpy< cuFloatComplex, double >(cuFloatComplex val, cuFloatComplex val2, double val3)
Definition: cu_complex.h:134

axpy< cuFloatComplex, cuDoubleComplex >
__device__ cuFloatComplex axpy< cuFloatComplex, cuDoubleComplex >(cuFloatComplex val, cuFloatComplex val2, cuDoubleComplex val3)
Definition: cu_complex.h:146

axpy< cuFloatComplex, cuFloatComplex >
__device__ cuFloatComplex axpy< cuFloatComplex, cuFloatComplex >(cuFloatComplex val, cuFloatComplex val2, cuFloatComplex val3)
Definition: cu_complex.h:128

scale< cuDoubleComplex >
__device__ cuDoubleComplex scale< cuDoubleComplex >(cuDoubleComplex y, cuDoubleComplex a)
Definition: cu_complex.h:287

axpy< cuDoubleComplex, cuFloatComplex >
__device__ cuDoubleComplex axpy< cuDoubleComplex, cuFloatComplex >(cuDoubleComplex val, cuDoubleComplex val2, cuFloatComplex val3)
Definition: cu_complex.h:170

axpby< cuDoubleComplex >
__device__ cuDoubleComplex axpby< cuDoubleComplex >(cuDoubleComplex x, cuDoubleComplex y, cuDoubleComplex a, cuDoubleComplex b)
Definition: cu_complex.h:268

conj< cuDoubleComplex >
__device__ cuDoubleComplex conj< cuDoubleComplex >(cuDoubleComplex x)
Definition: cu_complex.h:238