Applied EmitScalarAtomics for 64 bit uniform atomics 3rd try

ppogotov · igcbot · commit b796a878782d · 2023-03-16T15:30:00.000+01:00
3rd try
Extended EmitScalarAtomics function for atomics with 64 bit type
diff --git a/IGC/Compiler/CISACodeGen/EmitVISAPass.cpp b/IGC/Compiler/CISACodeGen/EmitVISAPass.cpp
@@ -12723,6 +12723,10 @@ void EmitPass::emitScalarAtomics(
     {
     case EATOMIC_IADD:
     case EATOMIC_SUB:
+    case EATOMIC_IADD64:
+    case EATOMIC_SUB64:
+    case EATOMIC_FADD64:
+    case EATOMIC_FSUB64:
     case EATOMIC_INC:
     case EATOMIC_DEC:
     case EATOMIC_FADD:
@@ -12768,13 +12772,18 @@ void EmitPass::emitScalarAtomics(
     {
         type = ISA_TYPE_F;
     }
+    else if (atomic_op == EATOMIC_FADD64 || atomic_op == EATOMIC_FSUB64)
+    {
+        type = ISA_TYPE_DF;
+    }
     else
     {
         type =
             bitWidth == 16 ? ISA_TYPE_W :
             bitWidth == 32 ? ISA_TYPE_D :
                         ISA_TYPE_Q;
     }
+
     IGC_ASSERT_MESSAGE((bitWidth == 16) || (bitWidth == 32) || (bitWidth == 64), "invalid bitsize");
     if (atomic_op == EATOMIC_INC || atomic_op == EATOMIC_DEC)
     {
@@ -12968,7 +12977,7 @@ void EmitPass::emitScalarAtomics(
             m_encoder->Add(pSrcsArr[i], pSrcsArr[i], pReturnVal);
             m_encoder->Push();
 
-            if (atomic_op == EATOMIC_IADD)
+            if (atomic_op == EATOMIC_IADD || atomic_op == EATOMIC_IADD64)
             {
                 m_encoder->SetSrcModifier(1, EMOD_NEG);
             }
@@ -13098,14 +13107,32 @@ bool EmitPass::IsUniformAtomic(llvm::Instruction* pInst)
         {
             Function* F = pInst->getParent()->getParent();
             //We cannot optimize float atomics if the flag "unsafe-fp-math" was not passed.
-            if (id == GenISAIntrinsic::GenISA_floatatomicrawA64) {
-                if (pInst->getType()->getScalarSizeInBits() != 32) {
+            if (id == GenISAIntrinsic::GenISA_floatatomicrawA64)
+            {
+                if (!F->hasFnAttribute("unsafe-fp-math") || !(F->getFnAttribute("unsafe-fp-math").getValueAsString() == "true"))
+                {
                     return false;
                 }
-                if (!F->hasFnAttribute("unsafe-fp-math") || !(F->getFnAttribute("unsafe-fp-math").getValueAsString() == "true")) {
+            }
+
+            if (pInst->getType()->getScalarSizeInBits() == 64)
+            {
+                AtomicOp atomic_op = static_cast<AtomicOp>(llvm::cast<llvm::ConstantInt>(pInst->getOperand(3))->getZExtValue());
+
+                if ((atomic_op == EATOMIC_IADD64 || atomic_op == EATOMIC_SUB64) && m_currShader->m_Platform->hasInt64Add())
+                {
+                    return true;
+                }
+                else if ((atomic_op == EATOMIC_FADD64 || atomic_op == EATOMIC_FSUB64) && m_currShader->m_Platform->hasFP64GlobalAtomicAdd())
+                {
+                    return true;
+                }
+                else
+                {
                     return false;
                 }
             }
+
             if (IGC_IS_FLAG_ENABLED(DisableScalarAtomics) ||
                 F->hasFnAttribute("KMPLOCK") ||
                 m_currShader->m_DriverInfo->WASLMPointersDwordUnit())
@@ -13122,6 +13149,10 @@ bool EmitPass::IsUniformAtomic(llvm::Instruction* pInst)
 
                 bool isAtomicAdd =
                     atomic_op == EATOMIC_IADD ||
+                    atomic_op == EATOMIC_IADD64 ||
+                    atomic_op == EATOMIC_SUB64 ||
+                    atomic_op == EATOMIC_FADD64 ||
+                    atomic_op == EATOMIC_FSUB64 ||
                     atomic_op == EATOMIC_INC ||
                     atomic_op == EATOMIC_SUB ||
                     atomic_op == EATOMIC_DEC ||
@@ -13290,7 +13321,7 @@ void EmitPass::emitAtomicRaw(llvm::GenIntrinsicInst* pInsn)
     CVariable* pDstAddr = GetSymbol(pllDstAddr);
     // If DisableScalarAtomics regkey is enabled or DisableIGCOptimizations regkey is enabled then
     // don't enable scalar atomics, also do not enable for 64 bit
-    if (IsUniformAtomic(pInsn) && bitwidth != 64)
+    if (IsUniformAtomic(pInsn))
     {
         PointerType* PtrTy = dyn_cast<PointerType>(pllDstAddr->getType());
         bool isA64 = PtrTy && isA64Ptr(PtrTy, m_currShader->GetContext());