my_cudaPass_inKernel(threadの一次元化ID, 任意の数字);
とすれば,そこまで進んだというのを表示できる関数.
ただ,カーネル関数のPrintの記述の順番と,表示の順番が何故か異なるケースもあるようで.
#define my_cudaPass_inKernel(idx, n) __my_cudaPass_inKernel(idx, n, __FILE__, __LINE__)
inline __device__ void __my_cudaPass_inKernel(const int idx, const int n, const char *file, const int line)
{
if(idx == n){
//compute Capabirity 2.0 or higher
printf("%s (%i) : Pass, in Kernel.\n", file, line);
}
return;
}