llvm
diff --git a/‎llvm/test/CodeGen/AMDGPU/flat_atomics_i32_system.ll
Lines changed: 1744 additions & 417 deletions b/‎llvm/test/CodeGen/AMDGPU/flat_atomics_i32_system.ll
Lines changed: 1744 additions & 417 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/flat_atomics_i64_system.ll
Lines changed: 1875 additions & 393 deletions b/‎llvm/test/CodeGen/AMDGPU/flat_atomics_i64_system.ll
Lines changed: 1875 additions & 393 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/global_atomics_i32_system.ll
Lines changed: 1918 additions & 463 deletions b/‎llvm/test/CodeGen/AMDGPU/global_atomics_i32_system.ll
Lines changed: 1918 additions & 463 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/global_atomics_i64_system.ll
Lines changed: 1961 additions & 367 deletions b/‎llvm/test/CodeGen/AMDGPU/global_atomics_i64_system.ll
Lines changed: 1961 additions & 367 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/global_atomics_scan_fadd.ll
Lines changed: 741 additions & 0 deletions b/‎llvm/test/CodeGen/AMDGPU/global_atomics_scan_fadd.ll
Lines changed: 741 additions & 0 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/global_atomics_scan_fmax.ll
Lines changed: 672 additions & 0 deletions b/‎llvm/test/CodeGen/AMDGPU/global_atomics_scan_fmax.ll
Lines changed: 672 additions & 0 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/global_atomics_scan_fmin.ll
Lines changed: 671 additions & 0 deletions b/‎llvm/test/CodeGen/AMDGPU/global_atomics_scan_fmin.ll
Lines changed: 671 additions & 0 deletions
diff --git a/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-f32-system.ll
Lines changed: 3717 additions & 0 deletions b/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-f32-system.ll
Lines changed: 3717 additions & 0 deletions
diff --git a/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-f64-system.ll
Lines changed: 1685 additions & 0 deletions b/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-f64-system.ll
Lines changed: 1685 additions & 0 deletions
diff --git a/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-i32-system.ll
Lines changed: 828 additions & 0 deletions b/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-i32-system.ll
Lines changed: 828 additions & 0 deletions
diff --git a/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-i64-system.ll
Lines changed: 828 additions & 0 deletions b/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-i64-system.ll
Lines changed: 828 additions & 0 deletions
diff --git a/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-v2bf16-system.ll
Lines changed: 859 additions & 0 deletions b/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-v2bf16-system.ll
Lines changed: 859 additions & 0 deletions
diff --git a/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-v2f16-system.ll
Lines changed: 859 additions & 0 deletions b/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomic-v2f16-system.ll
Lines changed: 859 additions & 0 deletions
diff --git a/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomicrmw-integer-ops-0-to-add-0.ll
Lines changed: 10 additions & 0 deletions b/‎llvm/test/Transforms/AtomicExpand/AMDGPU/expand-atomicrmw-integer-ops-0-to-add-0.ll
Lines changed: 10 additions & 0 deletions
diff --git a/‎llvm/test/Transforms/InferAddressSpaces/AMDGPU/basic.ll
Lines changed: 10 additions & 0 deletions b/‎llvm/test/Transforms/InferAddressSpaces/AMDGPU/basic.ll
Lines changed: 10 additions & 0 deletions
diff --git a/‎llvm/test/Transforms/Inline/AMDGPU/inline-atomicrmw-md-preserve.ll
Lines changed: 30 additions & 0 deletions b/‎llvm/test/Transforms/Inline/AMDGPU/inline-atomicrmw-md-preserve.ll
Lines changed: 30 additions & 0 deletions
@@ -124,6 +124,16 @@ define i32 @test_atomicrmw_xor_0_global_system(ptr addrspace(1) %ptr) {
 }
 
 
+define i32 @test_atomicrmw_or_0_global_system__metadata(ptr addrspace(1) %ptr) {
+; CHECK-LABEL: define i32 @test_atomicrmw_or_0_global_system__metadata(
+; CHECK-SAME: ptr addrspace(1) [[PTR:%.*]]) {
+; CHECK-NEXT:    [[RES:%.*]] = atomicrmw add ptr addrspace(1) [[PTR]], i32 0 seq_cst, align 4, !amdgpu.no.fine.grained.memory [[META0]], !amdgpu.no.remote.memory.access [[META0]]
+; CHECK-NEXT:    ret i32 [[RES]]
+;
+  %res = atomicrmw or ptr addrspace(1) %ptr, i32 0 seq_cst, !amdgpu.no.fine.grained.memory !0, !amdgpu.no.remote.memory.access !0
+  ret i32 %res
+}
+
 !0 = !{}
 ;.
 ; CHECK: [[META0]] = !{}
 
@@ -182,4 +182,14 @@ entry:
   ret void
 }
 
+; CHECK-LABEL: @atomicrmw_add_global_to_flat_preserve_amdgpu_md(
+; CHECK-NEXT: %ret = atomicrmw add ptr addrspace(1) %global.ptr, i32 %y seq_cst, align 4, !amdgpu.no.fine.grained.memory !0, !amdgpu.no.remote.memory.access !0
+define i32 @atomicrmw_add_global_to_flat_preserve_amdgpu_md(ptr addrspace(1) %global.ptr, i32 %y) #0 {
+  %cast = addrspacecast ptr addrspace(1) %global.ptr to ptr
+  %ret = atomicrmw add ptr %cast, i32 %y seq_cst, align 4, !amdgpu.no.fine.grained.memory !0, !amdgpu.no.remote.memory.access !0
+  ret i32 %ret
+}
+
 attributes #0 = { nounwind }
+
+!0 = !{}
@@ -0,0 +1,30 @@
+; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -mtriple=amdgcn-amd-amdhsa -S -passes=inline < %s | FileCheck %s
+; RUN: opt -mtriple=amdgcn-amd-amdhsa -S -passes='cgscc(inline)' < %s | FileCheck %s
+
+; Ensure that custom metadata survives inlining
+
+define i32 @atomic_xor(ptr addrspace(1) %ptr, i32 %val) {
+; CHECK-LABEL: define i32 @atomic_xor(
+; CHECK-SAME: ptr addrspace(1) [[PTR:%.*]], i32 [[VAL:%.*]]) {
+; CHECK-NEXT:    [[RES:%.*]] = atomicrmw xor ptr addrspace(1) [[PTR]], i32 [[VAL]] monotonic, align 4, !amdgpu.no.fine.grained.memory [[META0:![0-9]+]], !amdgpu.no.remote.memory.access [[META0]]
+; CHECK-NEXT:    ret i32 [[RES]]
+;
+  %res = atomicrmw xor ptr addrspace(1) %ptr, i32 %val monotonic, !amdgpu.no.fine.grained.memory !0, !amdgpu.no.remote.memory.access !0
+  ret i32 %res
+}
+
+define i32 @caller(ptr addrspace(1) %ptr, i32 %val) {
+; CHECK-LABEL: define i32 @caller(
+; CHECK-SAME: ptr addrspace(1) [[PTR:%.*]], i32 [[VAL:%.*]]) {
+; CHECK-NEXT:    [[RES_I:%.*]] = atomicrmw xor ptr addrspace(1) [[PTR]], i32 [[VAL]] monotonic, align 4, !amdgpu.no.fine.grained.memory [[META0]], !amdgpu.no.remote.memory.access [[META0]]
+; CHECK-NEXT:    ret i32 [[RES_I]]
+;
+  %res = call i32 @atomic_xor(ptr addrspace(1) %ptr, i32 %val)
+  ret i32 %res
+}
+
+!0 = !{}
+;.
+; CHECK: [[META0]] = !{}
+;.