[clang][FE][Cuda] Fix a sm90a cuda arch define check in TargetInfo (#12885)

GeorgeWeb · web-flow · commit fffe9a10d1d6 · 2024-03-22T15:18:59.000-07:00
The original commit from upstream: [llvm-project/commit/631c6e8](llvm/llvm-project@631c6e8) conditionally defines `__CUDA_ARCH_FEAT_SM90_ALL` separately from the CUDA_ARCH, but we break this by making it a either or decision in a if-else block. Hence, we were not setting correctly the definitions for upstream's clang -x cuda execution mode for sm90a. I believe this slipped in as a wrongly resolved merge during an upstream pulldown.
diff --git a/clang/lib/Basic/Targets/NVPTX.cpp b/clang/lib/Basic/Targets/NVPTX.cpp
@@ -284,10 +284,10 @@ void NVPTXTargetInfo::getTargetDefines(const LangOptions &Opts,
 
     if (Opts.SYCLIsDevice) {
       Builder.defineMacro("__SYCL_CUDA_ARCH__", CUDAArchCode);
-    } else if (GPU == CudaArch::SM_90a) {
-      Builder.defineMacro("__CUDA_ARCH_FEAT_SM90_ALL", "1");
     } else {
       Builder.defineMacro("__CUDA_ARCH__", CUDAArchCode);
+      if (GPU == CudaArch::SM_90a)
+        Builder.defineMacro("__CUDA_ARCH_FEAT_SM90_ALL", "1");
     }
   }
 }

Original file line number	Diff line number	Diff line change
`@@ -284,10 +284,10 @@ void NVPTXTargetInfo::getTargetDefines(const LangOptions &Opts,`
`284`	`284`
`285`	`285`	`if (Opts.SYCLIsDevice) {`
`286`	`286`	`Builder.defineMacro("__SYCL_CUDA_ARCH__", CUDAArchCode);`
`287`		`- } else if (GPU == CudaArch::SM_90a) {`
`288`		`- Builder.defineMacro("__CUDA_ARCH_FEAT_SM90_ALL", "1");`
`289`	`287`	`} else {`
`290`	`288`	`Builder.defineMacro("__CUDA_ARCH__", CUDAArchCode);`
	`289`	`+ if (GPU == CudaArch::SM_90a)`
	`290`	`+ Builder.defineMacro("__CUDA_ARCH_FEAT_SM90_ALL", "1");`
`291`	`291`	`}`
`292`	`292`	`}`
`293`	`293`	`}`