1、nvcc编译器支持OpenMP
书写makefile时,使用-fopenmp命令选项时会报nvcc fatal : Unknown option ‘fopenmp’错误。正确的编译选项是:
-Xcompiler -fopenmp
2、nvcc指定GPU计算能力
在内核中调用原子函数(例如atomicAdd)时,如果编译的时候出现”error: identifier “atomicAdd” is undefined”
那么首先要确定的GPU显卡计算能力是否在1.1或者1.1以上,原子性操作在低端的计算能力 GPU 是不支持的,1.1 以上的计算能力才支持全局内存的原子操作,1.2 以上的计算能力才支持共享内存的原子操作。
3、nvcc提示警告
使用 nvcc -Wall时会提示nvcc fatal : Unknown option ‘Wall’的错误。原来nvcc默认开启所有警告,如果想禁止警告,使用-w编译选项。