[Clang][CUDA] Add support for SM_88, SM_110, and SM_110a architectures (#170258)

rajatbajpai · web-flow · commit 0df8306479ab · 2025-12-09T10:47:28.000+05:30
This patch adds support for new GPU architectures introduced in CUDA
13.0 in Clang:
- SM_88: Ampere architecture variant
- SM_110/SM_110a: Blackwell architecture variants

Additionally, this patch deprecates SM_101/SM_101a support for CUDA 13.0
and later versions. The SM_101 architecture is superseded by SM_110 and
is no longer supported by CUDA 13.0+ toolchain components.
diff --git a/clang/include/clang/Basic/BuiltinsNVPTX.td b/clang/include/clang/Basic/BuiltinsNVPTX.td
@@ -23,19 +23,22 @@ class SM<string version, list<SMFeatures> newer_list> : SMFeatures {
 
 let Features = "sm_121a" in def SM_121a : SMFeatures;
 let Features = "sm_120a" in def SM_120a : SMFeatures;
+let Features = "sm_110a" in def SM_110a : SMFeatures;
 let Features = "sm_103a" in def SM_103a : SMFeatures;
 let Features = "sm_101a" in def SM_101a : SMFeatures;
 let Features = "sm_100a" in def SM_100a : SMFeatures;
 let Features = "sm_90a" in def SM_90a : SMFeatures;
 
 def SM_121 : SM<"121", [SM_121a]>;
 def SM_120 : SM<"120", [SM_120a, SM_121]>;
-def SM_103 : SM<"103", [SM_103a, SM_120]>;
+def SM_110 : SM<"110", [SM_110a, SM_120]>;
+def SM_103 : SM<"103", [SM_103a, SM_110]>;
 def SM_101 : SM<"101", [SM_101a, SM_103]>;
 def SM_100 : SM<"100", [SM_100a, SM_101]>;
 def SM_90 : SM<"90", [SM_90a, SM_100]>;
 def SM_89 : SM<"89", [SM_90]>;
-def SM_87 : SM<"87", [SM_89]>;
+def SM_88 : SM<"88", [SM_89]>;
+def SM_87 : SM<"87", [SM_88]>;
 def SM_86 : SM<"86", [SM_87]>;
 def SM_80 : SM<"80", [SM_86]>;
 def SM_75 : SM<"75", [SM_80]>;
@@ -54,8 +57,9 @@ class PTX<string version, PTXFeatures newer> : PTXFeatures {
   let Features = !strconcat("ptx", version, "|", newer.Features);
 }
 
-let Features = "ptx88" in def PTX88 : PTXFeatures;
+let Features = "ptx90" in def PTX90 : PTXFeatures;
 
+def PTX88 : PTX<"88", PTX90>;
 def PTX87 : PTX<"87", PTX88>;
 def PTX86 : PTX<"86", PTX87>;
 def PTX85 : PTX<"85", PTX86>;
diff --git a/clang/include/clang/Basic/Cuda.h b/clang/include/clang/Basic/Cuda.h
@@ -48,6 +48,7 @@ enum class CudaVersion {
   CUDA_126,
   CUDA_128,
   CUDA_129,
+  CUDA_130,
   FULLY_SUPPORTED = CUDA_128,
   PARTIALLY_SUPPORTED =
       CUDA_129, // Partially supported. Proceed with a warning.
diff --git a/clang/include/clang/Basic/OffloadArch.h b/clang/include/clang/Basic/OffloadArch.h
@@ -38,6 +38,7 @@ enum class OffloadArch {
   SM_80,
   SM_86,
   SM_87,
+  SM_88,
   SM_89,
   SM_90,
   SM_90a,
@@ -47,6 +48,8 @@ enum class OffloadArch {
   SM_101a,
   SM_103,
   SM_103a,
+  SM_110,
+  SM_110a,
   SM_120,
   SM_120a,
   SM_121,
diff --git a/clang/lib/Basic/Cuda.cpp b/clang/lib/Basic/Cuda.cpp
@@ -45,6 +45,7 @@ static const CudaVersionMapEntry CudaNameVersionMap[] = {
     CUDA_ENTRY(12, 6),
     CUDA_ENTRY(12, 8),
     CUDA_ENTRY(12, 9),
+    CUDA_ENTRY(13, 0),
     {"", CudaVersion::NEW, llvm::VersionTuple(std::numeric_limits<int>::max())},
     {"unknown", CudaVersion::UNKNOWN, {}} // End of list tombstone.
 };
@@ -125,6 +126,10 @@ CudaVersion MinVersionForOffloadArch(OffloadArch A) {
   case OffloadArch::SM_121:
   case OffloadArch::SM_121a:
     return CudaVersion::CUDA_129;
+  case OffloadArch::SM_88:
+  case OffloadArch::SM_110:
+  case OffloadArch::SM_110a:
+    return CudaVersion::CUDA_130;
   default:
     llvm_unreachable("invalid enum");
   }
@@ -147,6 +152,9 @@ CudaVersion MaxVersionForOffloadArch(OffloadArch A) {
   case OffloadArch::SM_35:
   case OffloadArch::SM_37:
     return CudaVersion::CUDA_118;
+  case OffloadArch::SM_101:
+  case OffloadArch::SM_101a:
+    return CudaVersion::CUDA_129;
   default:
     return CudaVersion::NEW;
   }
diff --git a/clang/lib/Basic/OffloadArch.cpp b/clang/lib/Basic/OffloadArch.cpp
@@ -26,6 +26,7 @@ static const OffloadArchToStringMap ArchNames[] = {
     SM(75),                          // Turing
     SM(80), SM(86),                  // Ampere
     SM(87),                          // Jetson/Drive AGX Orin
+    SM(88),                          // Ampere
     SM(89),                          // Ada Lovelace
     SM(90),                          // Hopper
     SM(90a),                         // Hopper
@@ -35,6 +36,8 @@ static const OffloadArchToStringMap ArchNames[] = {
     SM(101a),                        // Blackwell
     SM(103),                         // Blackwell
     SM(103a),                        // Blackwell
+    SM(110),                         // Blackwell
+    SM(110a),                        // Blackwell
     SM(120),                         // Blackwell
     SM(120a),                        // Blackwell
     SM(121),                         // Blackwell
diff --git a/clang/lib/Basic/Targets/NVPTX.cpp b/clang/lib/Basic/Targets/NVPTX.cpp
@@ -287,6 +287,8 @@ void NVPTXTargetInfo::getTargetDefines(const LangOptions &Opts,
         return "860";
       case OffloadArch::SM_87:
         return "870";
+      case OffloadArch::SM_88:
+        return "880";
       case OffloadArch::SM_89:
         return "890";
       case OffloadArch::SM_90:
@@ -301,6 +303,9 @@ void NVPTXTargetInfo::getTargetDefines(const LangOptions &Opts,
       case OffloadArch::SM_103:
       case OffloadArch::SM_103a:
         return "1030";
+      case OffloadArch::SM_110:
+      case OffloadArch::SM_110a:
+        return "1100";
       case OffloadArch::SM_120:
       case OffloadArch::SM_120a:
         return "1200";
@@ -316,6 +321,7 @@ void NVPTXTargetInfo::getTargetDefines(const LangOptions &Opts,
       case OffloadArch::SM_100a:
       case OffloadArch::SM_101a:
       case OffloadArch::SM_103a:
+      case OffloadArch::SM_110a:
       case OffloadArch::SM_120a:
       case OffloadArch::SM_121a:
         Builder.defineMacro("__CUDA_ARCH_FEAT_SM" + CUDAArchCode.drop_back() + "_ALL", "1");
diff --git a/clang/lib/CodeGen/CGOpenMPRuntimeGPU.cpp b/clang/lib/CodeGen/CGOpenMPRuntimeGPU.cpp
@@ -2309,6 +2309,7 @@ void CGOpenMPRuntimeGPU::processRequiresDirective(const OMPRequiresDecl *D) {
       case OffloadArch::SM_80:
       case OffloadArch::SM_86:
       case OffloadArch::SM_87:
+      case OffloadArch::SM_88:
       case OffloadArch::SM_89:
       case OffloadArch::SM_90:
       case OffloadArch::SM_90a:
@@ -2318,6 +2319,8 @@ void CGOpenMPRuntimeGPU::processRequiresDirective(const OMPRequiresDecl *D) {
       case OffloadArch::SM_101a:
       case OffloadArch::SM_103:
       case OffloadArch::SM_103a:
+      case OffloadArch::SM_110:
+      case OffloadArch::SM_110a:
       case OffloadArch::SM_120:
       case OffloadArch::SM_120a:
       case OffloadArch::SM_121:
diff --git a/clang/test/Misc/target-invalid-cpu-note/nvptx.c b/clang/test/Misc/target-invalid-cpu-note/nvptx.c
@@ -23,6 +23,7 @@
 // CHECK-SAME: {{^}}, sm_80
 // CHECK-SAME: {{^}}, sm_86
 // CHECK-SAME: {{^}}, sm_87
+// CHECK-SAME: {{^}}, sm_88
 // CHECK-SAME: {{^}}, sm_89
 // CHECK-SAME: {{^}}, sm_90
 // CHECK-SAME: {{^}}, sm_90a
@@ -32,6 +33,8 @@
 // CHECK-SAME: {{^}}, sm_101a
 // CHECK-SAME: {{^}}, sm_103
 // CHECK-SAME: {{^}}, sm_103a
+// CHECK-SAME: {{^}}, sm_110
+// CHECK-SAME: {{^}}, sm_110a
 // CHECK-SAME: {{^}}, sm_120
 // CHECK-SAME: {{^}}, sm_120a
 // CHECK-SAME: {{^}}, sm_121