llvm
diff --git a/‎mlir/include/mlir/Dialect/ArmSME/IR/ArmSMEOps.td
Lines changed: 44 additions & 44 deletions b/‎mlir/include/mlir/Dialect/ArmSME/IR/ArmSMEOps.td
Lines changed: 44 additions & 44 deletions
diff --git a/‎mlir/include/mlir/Dialect/ArmSME/Transforms/Passes.h
Lines changed: 3 additions & 2 deletions b/‎mlir/include/mlir/Dialect/ArmSME/Transforms/Passes.h
Lines changed: 3 additions & 2 deletions
diff --git a/‎mlir/include/mlir/Dialect/ArmSME/Transforms/Passes.td
Lines changed: 9 additions & 9 deletions b/‎mlir/include/mlir/Dialect/ArmSME/Transforms/Passes.td
Lines changed: 9 additions & 9 deletions
diff --git a/‎mlir/include/mlir/Dialect/ArmSME/Transforms/Transforms.h
Lines changed: 1 addition & 1 deletion b/‎mlir/include/mlir/Dialect/ArmSME/Transforms/Transforms.h
Lines changed: 1 addition & 1 deletion
diff --git a/‎mlir/lib/Conversion/ArmSMEToLLVM/ArmSMEToLLVM.cpp
Lines changed: 22 additions & 22 deletions b/‎mlir/lib/Conversion/ArmSMEToLLVM/ArmSMEToLLVM.cpp
Lines changed: 22 additions & 22 deletions
diff --git a/‎mlir/lib/Dialect/ArmSME/Transforms/CMakeLists.txt
Lines changed: 1 addition & 1 deletion b/‎mlir/lib/Dialect/ArmSME/Transforms/CMakeLists.txt
Lines changed: 1 addition & 1 deletion
@@ -814,10 +814,10 @@ let arguments = (ins
   }];
 }
 
-class OuterProductWideBase<string mnemonic,
-                           list<Type> allowedInputVectorTypes,
-                           list<Type> allowedResultVectorTypes,
-                           int numOuterProducts> :
+class OuterProductWideningBase<string mnemonic,
+                               list<Type> allowedInputVectorTypes,
+                               list<Type> allowedResultVectorTypes,
+                               int numOuterProducts> :
   ArmSME_Op<mnemonic, [
     ArmSMETileOpInterface,
     AttrSizedOperandSegments,
@@ -869,14 +869,14 @@ class OuterProductWideBase<string mnemonic,
   }];
 }
 
-class OuterProductWide2Way<string mnemonic,
-                           list<Type> allowedInputVectorTypes,
-                           list<Type> allowedResultVectorTypes>
-  : OuterProductWideBase<mnemonic, allowedInputVectorTypes,
-                         allowedResultVectorTypes, /*numOuterProducts=*/2>;
+class OuterProduct2Way<string mnemonic,
+                       list<Type> allowedInputVectorTypes,
+                       list<Type> allowedResultVectorTypes>
+  : OuterProductWideningBase<mnemonic, allowedInputVectorTypes,
+                             allowedResultVectorTypes, /*numOuterProducts=*/2>;
 
-def FMopaWide2WayOp
-  : OuterProductWide2Way<"fmopa_wide_2way",
+def FMopa2WayOp
+  : OuterProduct2Way<"fmopa_2way",
       [ScalableVectorOfRankAndLengthAndType<[1], [8], [F16, BF16]>],
       [nxnxv4f32]> {
   let summary = "Floating-point sum of 2 outer products and accumulate";
@@ -888,14 +888,14 @@ def FMopaWide2WayOp
     For example (fp16 to fp32):
 
     ```mlir
-    %result = arm_sme.fmopa_wide_2way %lhs, %rhs :
+    %result = arm_sme.fmopa_2way %lhs, %rhs :
       vector<[8]xf16>, vector<[8]xf16> into vector<[4]x[4]xf32>
     ```
 
     The `lhs` encodes a matrix of shape SVLSx2 and the `rhs` a matrix of
     2xSVLS, where SVLS (spec [1], section B2.1) is the number of 32-bit
     elements in a vector of SVL bits. To illustrate, below is a breakdown of
-    this operation for SVL=128 (i.e., vscale=1):
+    this operation for fp16 to fp32, SVL=128 (i.e., vscale=1):
 
     ```
                           LHS                          RHS
@@ -960,19 +960,19 @@ def FMopaWide2WayOp
 	```mlir
     %a_packed = "llvm.intr.experimental.vector.interleave2"(%a0, %a1) : (vector<[4]xf16>, vector<[4]xf16>) -> vector<[8]xf16>
     %b_packed = "llvm.intr.experimental.vector.interleave2"(%b0, %b1) : (vector<[4]xf16>, vector<[4]xf16>) -> vector<[8]xf16>
-    %0 = arm_sme.fmopa_wide_2way %a_packed, %b_packed : vector<[8]xf16>, vector<[8]xf16> into vector<[4]x[4]xf32>
+    %0 = arm_sme.fmopa_2way %a_packed, %b_packed : vector<[8]xf16>, vector<[8]xf16> into vector<[4]x[4]xf32>
 	```
 
-    This is implemented in the `-arm-sme-outer-product-widening` pass.
+    This is implemented in the `-arm-sme-outer-product-fusion` pass.
 
     Example: FP16 to FP32
     ```mlir
-    %result = arm_sme.fmopa_wide_2way $lhs, $rhs : vector<[8]xf16>, vector<[8]xf16> into vector<[4]x[4]xf32>
+    %result = arm_sme.fmopa_2way $lhs, $rhs : vector<[8]xf16>, vector<[8]xf16> into vector<[4]x[4]xf32>
     ```
 
     Example: BF16 to FP32
     ```mlir
-    %result = arm_sme.fmopa_wide_2way $lhs, $rhs : vector<[8]xbf16>, vector<[8]xbf16> into vector<[4]x[4]xf32>
+    %result = arm_sme.fmopa_2way $lhs, $rhs : vector<[8]xbf16>, vector<[8]xbf16> into vector<[4]x[4]xf32>
     ```
 
     | Spec | Features |
@@ -989,27 +989,27 @@ def FMopaWide2WayOp
 // - FMOPA 4-way FP16 to FP32
 // once intrinsic support lands in the backend.
 
-def FMopsWide2WayOp
-  : OuterProductWide2Way<"fmops_wide_2way",
+def FMops2WayOp
+  : OuterProduct2Way<"fmops_2way",
       [ScalableVectorOfRankAndLengthAndType<[1], [8], [F16, BF16]>],
       [nxnxv4f32]> {
   let summary = "Floating-point sum of 2 outer products and subtract";
   let description = [{
-    Equivalent to `fmopa_wide_2way` but outer products are subtracted from
+    Equivalent to `fmopa_2way` but outer products are subtracted from
     destination `result`.
 
     Example: FP16 to FP32
     ```mlir
-    %result = arm_sme.fmops_wide_2way $lhs, $rhs : vector<[8]xf16>, vector<[8]xf16> into vector<[4]x[4]xf32>
+    %result = arm_sme.fmops_2way $lhs, $rhs : vector<[8]xf16>, vector<[8]xf16> into vector<[4]x[4]xf32>
     ```
 
     Example: BF16 to FP32
     ```mlir
-    %result = arm_sme.fmops_wide_2way $lhs, $rhs : vector<[8]xbf16>, vector<[8]xbf16> into vector<[4]x[4]xf32>
+    %result = arm_sme.fmops_2way $lhs, $rhs : vector<[8]xbf16>, vector<[8]xbf16> into vector<[4]x[4]xf32>
 
     Refer to
-    [fmopa_wide_2way](#arm_smefmopa_wide_2way-arm_smefmopa_wide_2wayop) for a
-    detailed description of 2-way outer products.
+    [fmopa_2way](#arm_smefmopa_2way-arm_smefmopa_2wayop) for a detailed
+    description of 2-way outer products.
 
     | Spec | Features |
     | ---- | -------- |
@@ -1019,19 +1019,19 @@ def FMopsWide2WayOp
   }];
 }
 
-def SMopaWide2WayOp
-  : OuterProductWide2Way<"smopa_wide_2way",
+def SMopa2WayOp
+  : OuterProduct2Way<"smopa_2way",
       [ScalableVectorOfRankAndLengthAndType<[1], [8], [I16]>],
       [nxnxv4i32]> {
   let summary = "Signed integer sum of 2 outer products and accumulate";
   let description = [{
     Example:
     ```mlir
-    %result = arm_sme.smopa_wide_2way $lhs, $rhs : vector<[8]xi16>, vector<[8]xi16> into vector<[4]x[4]xi32>
+    %result = arm_sme.smopa_2way $lhs, $rhs : vector<[8]xi16>, vector<[8]xi16> into vector<[4]x[4]xi32>
 
     Refer to
-    [fmopa_wide_2way](#arm_smefmopa_wide_2way-arm_smefmopa_wide_2wayop) for a
-    detailed description of 2-way outer products.
+    [fmopa_2way](#arm_smefmopa_2way-arm_smefmopa_2wayop) for a detailed
+    description of 2-way outer products.
 
     | Spec | Features |
     | ---- | -------- |
@@ -1040,19 +1040,19 @@ def SMopaWide2WayOp
   }];
 }
 
-def SMopsWide2WayOp
-  : OuterProductWide2Way<"smops_wide_2way",
+def SMops2WayOp
+  : OuterProduct2Way<"smops_2way",
       [ScalableVectorOfRankAndLengthAndType<[1], [8], [I16]>],
       [nxnxv4i32]> {
   let summary = "Signed integer sum of 2 outer products and subtract";
   let description = [{
     Example:
     ```mlir
-    %result = arm_sme.smops_wide_2way $lhs, $rhs : vector<[8]xi16>, vector<[8]xi16> into vector<[4]x[4]xi32>
+    %result = arm_sme.smops_2way $lhs, $rhs : vector<[8]xi16>, vector<[8]xi16> into vector<[4]x[4]xi32>
 
     Refer to
-    [fmopa_wide_2way](#arm_smefmopa_wide_2way-arm_smefmopa_wide_2wayop) for a
-    detailed description of 2-way outer products.
+    [fmopa_2way](#arm_smefmopa_2way-arm_smefmopa_2wayop) for a detailed
+    description of 2-way outer products.
 
     | Spec | Features |
     | ---- | -------- |
@@ -1061,19 +1061,19 @@ def SMopsWide2WayOp
   }];
 }
 
-def UMopaWide2WayOp
-  : OuterProductWide2Way<"umopa_wide_2way",
+def UMopa2WayOp
+  : OuterProduct2Way<"umopa_2way",
       [ScalableVectorOfRankAndLengthAndType<[1], [8], [I16]>],
       [nxnxv4i32]> {
   let summary = "Unsiged integer sum of 2 outer products and accumulate";
   let description = [{
     Example:
     ```mlir
-    %result = arm_sme.umopa_wide_2way $lhs, $rhs : vector<[8]xi16>, vector<[8]xi16> into vector<[4]x[4]xi32>
+    %result = arm_sme.umopa_2way $lhs, $rhs : vector<[8]xi16>, vector<[8]xi16> into vector<[4]x[4]xi32>
 
     Refer to
-    [fmopa_wide_2way](#arm_smefmopa_wide_2way-arm_smefmopa_wide_2wayop) for a
-    detailed description of 2-way outer products.
+    [fmopa_2way](#arm_smefmopa_2way-arm_smefmopa_2wayop) for a detailed
+    description of 2-way outer products.
 
     | Spec | Features |
     | ---- | -------- |
@@ -1082,19 +1082,19 @@ def UMopaWide2WayOp
   }];
 }
 
-def UMopsWide2WayOp
-  : OuterProductWide2Way<"umops_wide_2way",
+def UMops2WayOp
+  : OuterProduct2Way<"umops_2way",
       [ScalableVectorOfRankAndLengthAndType<[1], [8], [I16]>],
       [nxnxv4i32]> {
   let summary = "Unsiged integer sum of 2 outer products and subtract";
   let description = [{
     Example:
     ```mlir
-    %result = arm_sme.umops_wide_2way $lhs, $rhs : vector<[8]xi16>, vector<[8]xi16> into vector<[4]x[4]xi32>
+    %result = arm_sme.umops_2way $lhs, $rhs : vector<[8]xi16>, vector<[8]xi16> into vector<[4]x[4]xi32>
 
     Refer to
-    [fmopa_wide_2way](#arm_smefmopa_wide_2way-arm_smefmopa_wide_2wayop) for a
-    detailed description of 2-way outer products.
+    [fmopa_2way](#arm_smefmopa_2way-arm_smefmopa_2wayop) for a detailed
+    description of 2-way outer products.
 
     | Spec | Features |
     | ---- | -------- |
 
@@ -32,8 +32,9 @@ std::unique_ptr<Pass> createEnableArmStreamingPass(
 /// Pass that allocates tile IDs to ArmSME operations.
 std::unique_ptr<Pass> createTileAllocationPass();
 
-/// Pass that folds 'arm_sme.outerproduct' ops into widening variants.
-std::unique_ptr<Pass> createOuterProductWideningPass();
+/// Pass that fuses 'arm_sme.outerproduct' ops into 2-way or 4-way widening
+/// variants.
+std::unique_ptr<Pass> createOuterProductFusionPass();
 
 //===----------------------------------------------------------------------===//
 // Registration
 
@@ -122,11 +122,11 @@ def TileAllocation
   let dependentDialects = ["func::FuncDialect"];
 }
 
-def OuterProductWidening
-    : Pass<"arm-sme-outer-product-widening", "mlir::func::FuncOp"> {
-  let summary = "Fold 'arm_sme.outerproduct' operations into widening variants";
+def OuterProductFusion
+    : Pass<"arm-sme-outer-product-fusion", "mlir::func::FuncOp"> {
+  let summary = "Fuse 'arm_sme.outerproduct' operations into 2-way or 4-way widening variants";
   let description = [{
-    This pass folds 'arm_sme.outerproduct' operations that are chained via the
+    This pass fuses 'arm_sme.outerproduct' operations that are chained via the
     accumulator into 2-way or 4-way ArmSME outer product operations.
 
     For example:
@@ -145,14 +145,14 @@ def OuterProductWidening
     ```mlir
     %a_packed = "llvm.intr.experimental.vector.interleave2"(%a0, %a1) : (vector<[4]xf16>, vector<[4]xf16>) -> vector<[8]xf16>
     %b_packed = "llvm.intr.experimental.vector.interleave2"(%b0, %b1) : (vector<[4]xf16>, vector<[4]xf16>) -> vector<[8]xf16>
-    %0 = arm_sme.fmopa_wide_2way %a_packed, %b_packed : vector<[8]xf16>, vector<[8]xf16> into vector<[4]x[4]xf32>
+    %0 = arm_sme.fmopa_2way %a_packed, %b_packed : vector<[8]xf16>, vector<[8]xf16> into vector<[4]x[4]xf32>
     ```
 
-    For further information on the widening ops see:
-    https://mlir.llvm.org/docs/Dialects/ArmSME/#arm_smefmopa_wide_2way-arm_smefmopa_wide_2wayop
-    https://mlir.llvm.org/docs/Dialects/ArmSME/#arm_smesmopa_wide_4way-arm_smesmopa_wide_4wayop
+    For further information on the 2-way or 4-way widening ops see:
+    https://mlir.llvm.org/docs/Dialects/ArmSME/#arm_smefmopa_2way-arm_smefmopa_2wayop
+    https://mlir.llvm.org/docs/Dialects/ArmSME/#arm_smesmopa_4way-arm_smesmopa_4wayop
   }];
-  let constructor = "mlir::arm_sme::createOuterProductWideningPass()";
+  let constructor = "mlir::arm_sme::createOuterProductFusionPass()";
   let dependentDialects = ["func::FuncDialect", "arm_sme::ArmSMEDialect", "arm_sve::ArmSVEDialect", "LLVM::LLVMDialect"];
 }
 
 
@@ -16,7 +16,7 @@ class LLVMTypeConverter;
 class RewritePatternSet;
 
 namespace arm_sme {
-void populateOuterProductWideningPatterns(RewritePatternSet &patterns);
+void populateOuterProductFusionPatterns(RewritePatternSet &patterns);
 } // namespace arm_sme
 
 } // namespace mlir
 
@@ -776,16 +776,16 @@ struct OuterProductOpConversion
   }
 };
 
-/// Lower 2-way and 4-way outer products to intrinsics.
-template <class OuterProductWideOp, class OuterProductWideIntrOp>
-struct OuterProductWideOpConversion
-    : public ConvertArmSMEOpToLLVMPattern<OuterProductWideOp> {
+/// Lower 2-way and 4-way widening outer products to intrinsics.
+template <class OuterProductWideningOp, class OuterProductWideningIntrOp>
+struct OuterProductWideningOpConversion
+    : public ConvertArmSMEOpToLLVMPattern<OuterProductWideningOp> {
   using ConvertArmSMEOpToLLVMPattern<
-      OuterProductWideOp>::ConvertArmSMEOpToLLVMPattern;
+      OuterProductWideningOp>::ConvertArmSMEOpToLLVMPattern;
 
   LogicalResult
-  matchAndRewrite(OuterProductWideOp op,
-                  typename OuterProductWideOp::Adaptor adaptor,
+  matchAndRewrite(OuterProductWideningOp op,
+                  typename OuterProductWideningOp::Adaptor adaptor,
                   ConversionPatternRewriter &rewriter) const override {
     auto tileId = getTileIdOrError(op);
     if (!tileId)
@@ -807,9 +807,9 @@ struct OuterProductWideOpConversion
       rhsMask = allActiveMask;
     }
 
-    rewriter.create<OuterProductWideIntrOp>(op.getLoc(), tileId, lhsMask,
-                                            rhsMask, adaptor.getLhs(),
-                                            adaptor.getRhs());
+    rewriter.create<OuterProductWideningIntrOp>(op.getLoc(), tileId, lhsMask,
+                                                rhsMask, adaptor.getLhs(),
+                                                adaptor.getRhs());
 
     // The outerproduct intrinsics have no result, replace
     // 'arm_sme.outerproduct' with the input tile to preserve dataflow.
@@ -927,18 +927,18 @@ void mlir::populateArmSMEToLLVMConversionPatterns(LLVMTypeConverter &converter,
       LoadTileSliceConversion, MoveTileSliceToVectorConversion,
       MoveVectorToTileSliceConversion, StoreTileSliceConversion,
       StreamingVLOpConversion, OuterProductOpConversion,
-      OuterProductWideOpConversion<arm_sme::FMopaWide2WayOp,
-                                   arm_sme::aarch64_sme_mopa_wide>,
-      OuterProductWideOpConversion<arm_sme::FMopsWide2WayOp,
-                                   arm_sme::aarch64_sme_mops_wide>,
-      OuterProductWideOpConversion<arm_sme::SMopaWide2WayOp,
-                                   arm_sme::aarch64_sme_smopa_za32>,
-      OuterProductWideOpConversion<arm_sme::SMopsWide2WayOp,
-                                   arm_sme::aarch64_sme_smops_za32>,
-      OuterProductWideOpConversion<arm_sme::UMopaWide2WayOp,
-                                   arm_sme::aarch64_sme_umopa_za32>,
-      OuterProductWideOpConversion<arm_sme::UMopsWide2WayOp,
-                                   arm_sme::aarch64_sme_umops_za32>,
+      OuterProductWideningOpConversion<arm_sme::FMopa2WayOp,
+                                       arm_sme::aarch64_sme_mopa_wide>,
+      OuterProductWideningOpConversion<arm_sme::FMops2WayOp,
+                                       arm_sme::aarch64_sme_mops_wide>,
+      OuterProductWideningOpConversion<arm_sme::SMopa2WayOp,
+                                       arm_sme::aarch64_sme_smopa_za32>,
+      OuterProductWideningOpConversion<arm_sme::SMops2WayOp,
+                                       arm_sme::aarch64_sme_smops_za32>,
+      OuterProductWideningOpConversion<arm_sme::UMopa2WayOp,
+                                       arm_sme::aarch64_sme_umopa_za32>,
+      OuterProductWideningOpConversion<arm_sme::UMops2WayOp,
+                                       arm_sme::aarch64_sme_umops_za32>,
       ZeroOpConversion, GetTileConversion>(patterns, converter);
 }
 
 
@@ -1,6 +1,6 @@
 add_mlir_dialect_library(MLIRArmSMETransforms
   EnableArmStreaming.cpp
-  OuterProductWidening.cpp
+  OuterProductFusion.cpp
   TileAllocation.cpp
 
   ADDITIONAL_HEADER_DIRS