[SYCL] Fix templated and convertible builtins (#11977)

steffenlarsen · aelovikov-intel · web-flow · commit 928618356ac2 · 2023-11-30T15:42:42.000+01:00
With SYCL 2020 revision 8 builtins were clarified to have more specific
definitions. This commit fixes a handful of definitions in accordance
with the changes to the specification, primarily in relation to
templated scalar builtins and builtins accepting implicitly convertible
types and swizzles.

---------

Signed-off-by: Larsen, Steffen &lt;steffen.larsen@intel.com&gt;
Co-authored-by: aelovikov-intel &lt;andrei.elovikov@intel.com&gt;
diff --git a/sycl/include/sycl/detail/generic_type_traits.hpp b/sycl/include/sycl/detail/generic_type_traits.hpp
@@ -352,7 +352,12 @@ template <typename T>
 inline constexpr bool is_nan_type_v = is_contained_v<T, gtl::nan_list>;
 
 // nan_types
-template <typename T, typename Enable = void> struct nan_types;
+template <typename T, typename Enable = void> struct nan_types {
+  // Nonsensical case for types implicitly convertible to scalar to avoid
+  // templated overloads which are SFINAE'd out to cause compilation errors.
+  using ret_type = void;
+  using arg_type = int;
+};
 
 template <typename T>
 struct nan_types<
diff --git a/sycl/include/sycl/detail/type_traits.hpp b/sycl/include/sycl/detail/type_traits.hpp
@@ -218,6 +218,12 @@ template <class T> struct make_signed<const T> {
 template <class T, int N> struct make_signed<vec<T, N>> {
   using type = vec<make_signed_t<T>, N>;
 };
+template <typename VecT, typename OperationLeftT, typename OperationRightT,
+          template <typename> class OperationCurrentT, int... Indexes>
+struct make_signed<SwizzleOp<VecT, OperationLeftT, OperationRightT,
+                             OperationCurrentT, Indexes...>> {
+  using type = make_signed_t<std::remove_cv_t<VecT>>;
+};
 template <class T, std::size_t N> struct make_signed<marray<T, N>> {
   using type = marray<make_signed_t<T>, N>;
 };
@@ -233,6 +239,12 @@ template <class T> struct make_unsigned<const T> {
 template <class T, int N> struct make_unsigned<vec<T, N>> {
   using type = vec<make_unsigned_t<T>, N>;
 };
+template <typename VecT, typename OperationLeftT, typename OperationRightT,
+          template <typename> class OperationCurrentT, int... Indexes>
+struct make_unsigned<SwizzleOp<VecT, OperationLeftT, OperationRightT,
+                               OperationCurrentT, Indexes...>> {
+  using type = make_unsigned_t<std::remove_cv_t<VecT>>;
+};
 template <class T, std::size_t N> struct make_unsigned<marray<T, N>> {
   using type = marray<make_unsigned_t<T>, N>;
 };
diff --git a/sycl/source/builtins_generator.py b/sycl/source/builtins_generator.py
@@ -935,17 +935,17 @@ def custom_nan_invoke(return_type, arg_types, arg_names):
                            Def("vfloatn", ["vfloatn", "float"], invoke_name="fmax_common", convert_args=[(1,0)]),
                            Def("vdoublen", ["vdoublen", "double"], invoke_name="fmax_common", convert_args=[(1,0)]),
                            Def("vhalfn", ["vhalfn", "half"], invoke_name="fmax_common", convert_args=[(1,0)]), # Non-standard. Deprecated.
-                           Def("igeninteger", ["igeninteger", "igeninteger"], invoke_name="s_max", marray_use_loop=True),
-                           Def("ugeninteger", ["ugeninteger", "ugeninteger"], invoke_name="u_max", marray_use_loop=True),
+                           Def("igeninteger", ["igeninteger", "igeninteger"], invoke_name="s_max", marray_use_loop=True, template_scalar_args=True),
+                           Def("ugeninteger", ["ugeninteger", "ugeninteger"], invoke_name="u_max", marray_use_loop=True, template_scalar_args=True),
                            Def("vigeninteger", ["vigeninteger", "elementtype0"], invoke_name="s_max"),
                            Def("vugeninteger", ["vugeninteger", "elementtype0"], invoke_name="u_max"),
                            Def("mgentype", ["mgentype", "elementtype0"], marray_use_loop=True)],
                  "(min)": [Def("genfloat", ["genfloat", "genfloat"], invoke_name="fmin_common", template_scalar_args=True),
                            Def("vfloatn", ["vfloatn", "float"], invoke_name="fmin_common", convert_args=[(1,0)]),
                            Def("vdoublen", ["vdoublen", "double"], invoke_name="fmin_common", convert_args=[(1,0)]),
                            Def("vhalfn", ["vhalfn", "half"], invoke_name="fmin_common", convert_args=[(1,0)]), # Non-standard. Deprecated.
-                           Def("igeninteger", ["igeninteger", "igeninteger"], invoke_name="s_min", marray_use_loop=True),
-                           Def("ugeninteger", ["ugeninteger", "ugeninteger"], invoke_name="u_min", marray_use_loop=True),
+                           Def("igeninteger", ["igeninteger", "igeninteger"], invoke_name="s_min", marray_use_loop=True, template_scalar_args=True),
+                           Def("ugeninteger", ["ugeninteger", "ugeninteger"], invoke_name="u_min", marray_use_loop=True, template_scalar_args=True),
                            Def("vigeninteger", ["vigeninteger", "elementtype0"], invoke_name="s_min"),
                            Def("vugeninteger", ["vugeninteger", "elementtype0"], invoke_name="u_min"),
                            Def("mgentype", ["mgentype", "elementtype0"], marray_use_loop=True)],
@@ -957,7 +957,7 @@ def custom_nan_invoke(return_type, arg_types, arg_names):
                          Def("mdoublen", ["mdoublen", "mdoublen", "double"]),
                          Def("mhalfn", ["mhalfn", "mhalfn", "half"])], # Non-standard. Deprecated.
                  "radians": [Def("genfloat", ["genfloat"], template_scalar_args=True)],
-                 "step": [Def("genfloat", ["genfloat", "genfloat"]),
+                 "step": [Def("genfloat", ["genfloat", "genfloat"], template_scalar_args=True),
                           Def("vfloatn", ["float", "vfloatn"], convert_args=[(0,1)]),
                           Def("vdoublen", ["double", "vdoublen"], convert_args=[(0,1)]),
                           Def("vhalfn", ["half", "vhalfn"], convert_args=[(0,1)]), # Non-standard. Deprecated.
@@ -989,25 +989,25 @@ def custom_nan_invoke(return_type, arg_types, arg_names):
                          Def("float", ["mgeofloat", "mgeofloat"], invoke_name="Dot"),
                          Def("double", ["mgeodouble", "mgeodouble"], invoke_name="Dot"),
                          Def("half", ["mgeohalf", "mgeohalf"], invoke_name="Dot"),
-                         Def("sgenfloat", ["sgenfloat", "sgenfloat"], custom_invoke=(lambda return_types, arg_types, arg_names: '  return ' + ' * '.join(arg_names) + ';'))],
-                 "distance": [Def("float", ["gengeofloat", "gengeofloat"]),
-                              Def("double", ["gengeodouble", "gengeodouble"]),
-                              Def("half", ["gengeohalf", "gengeohalf"])],
-                 "length": [Def("float", ["gengeofloat"]),
-                            Def("double", ["gengeodouble"]),
-                            Def("half", ["gengeohalf"])],
-                 "normalize": [Def("gengeofloat", ["gengeofloat"]),
-                               Def("gengeodouble", ["gengeodouble"]),
-                               Def("gengeohalf", ["gengeohalf"])],
-                 "fast_distance": [Def("float", ["gengeofloat", "gengeofloat"]),
-                                   Def("double", ["gengeodouble", "gengeodouble"]),
-                                   Def("half", ["gengeohalf", "gengeohalf"])],
-                 "fast_length": [Def("float", ["gengeofloat"]),
-                                 Def("double", ["gengeodouble"]),
-                                 Def("half", ["gengeohalf"])],
-                 "fast_normalize": [Def("gengeofloat", ["gengeofloat"]),
-                                    Def("gengeodouble", ["gengeodouble"]),
-                                    Def("gengeohalf", ["gengeohalf"])],
+                         Def("sgenfloat", ["sgenfloat", "sgenfloat"], template_scalar_args=True, custom_invoke=(lambda return_types, arg_types, arg_names: '  return ' + ' * '.join(arg_names) + ';'))],
+                 "distance": [Def("float", ["gengeofloat", "gengeofloat"], template_scalar_args=True),
+                              Def("double", ["gengeodouble", "gengeodouble"], template_scalar_args=True),
+                              Def("half", ["gengeohalf", "gengeohalf"], template_scalar_args=True)],
+                 "length": [Def("float", ["gengeofloat"], template_scalar_args=True),
+                            Def("double", ["gengeodouble"], template_scalar_args=True),
+                            Def("half", ["gengeohalf"], template_scalar_args=True)],
+                 "normalize": [Def("gengeofloat", ["gengeofloat"], template_scalar_args=True),
+                               Def("gengeodouble", ["gengeodouble"], template_scalar_args=True),
+                               Def("gengeohalf", ["gengeohalf"], template_scalar_args=True)],
+                 "fast_distance": [Def("float", ["gengeofloat", "gengeofloat"], template_scalar_args=True),
+                                   Def("double", ["gengeodouble", "gengeodouble"], template_scalar_args=True),
+                                   Def("half", ["gengeohalf", "gengeohalf"], template_scalar_args=True)],
+                 "fast_length": [Def("float", ["gengeofloat"], template_scalar_args=True),
+                                 Def("double", ["gengeodouble"], template_scalar_args=True),
+                                 Def("half", ["gengeohalf"], template_scalar_args=True)],
+                 "fast_normalize": [Def("gengeofloat", ["gengeofloat"], template_scalar_args=True),
+                                    Def("gengeodouble", ["gengeodouble"], template_scalar_args=True),
+                                    Def("gengeohalf", ["gengeohalf"], template_scalar_args=True)],
                  # Relational functions
                  "isequal": [RelDef("samesizesignedint0", ["vgenfloat", "vgenfloat"], invoke_name="FOrdEqual"),
                              RelDef("bool", ["sgenfloat", "sgenfloat"], invoke_name="FOrdEqual"),
@@ -1052,13 +1052,13 @@ def custom_nan_invoke(return_type, arg_types, arg_names):
                              RelDef("bool", ["sgenfloat"], invoke_name="SignBitSet"),
                              RelDef("boolelements0", ["mgenfloat"])],
                  "any": [Def("int", ["vigeninteger"], custom_invoke=get_custom_any_all_vec_invoke("Any")),
-                         Def("bool", ["sigeninteger"], custom_invoke=(lambda return_type, arg_types, arg_names: f'  return bool(int(detail::msbIsSet({arg_names[0]})));')),
+                         Def("bool", ["sigeninteger"], template_scalar_args=True, custom_invoke=(lambda return_type, arg_types, arg_names: f'  return bool(int(detail::msbIsSet({arg_names[0]})));')),
                          Def("bool", ["migeninteger"], custom_invoke=get_custom_any_all_marray_invoke("any"))],
                  "all": [Def("int", ["vigeninteger"], custom_invoke=get_custom_any_all_vec_invoke("All")),
-                         Def("bool", ["sigeninteger"], custom_invoke=(lambda return_type, arg_types, arg_names: f'  return bool(int(detail::msbIsSet({arg_names[0]})));')),
+                         Def("bool", ["sigeninteger"], template_scalar_args=True, custom_invoke=(lambda return_type, arg_types, arg_names: f'  return bool(int(detail::msbIsSet({arg_names[0]})));')),
                          Def("bool", ["migeninteger"], custom_invoke=get_custom_any_all_marray_invoke("all"))],
                  "bitselect": [Def("vgentype", ["vgentype", "vgentype", "vgentype"]),
-                               Def("sgentype", ["sgentype", "sgentype", "sgentype"]),
+                               Def("sgentype", ["sgentype", "sgentype", "sgentype"], template_scalar_args=True),
                                Def("mgentype", ["mgentype", "mgentype", "mgentype"], marray_use_loop=True)],
                  "select": [Def("vint8n", ["vint8n", "vint8n", "vint8n"]),
                             Def("vint16n", ["vint16n", "vint16n", "vint16n"]),
@@ -1082,7 +1082,7 @@ def custom_nan_invoke(return_type, arg_types, arg_names):
                             Def("vfloatn", ["vfloatn", "vfloatn", "vuint32n"]),
                             Def("vdoublen", ["vdoublen", "vdoublen", "vuint64n"]),
                             Def("vhalfn", ["vhalfn", "vhalfn", "vuint16n"]),
-                            Def("sgentype", ["sgentype", "sgentype", "bool"], custom_invoke=custom_bool_select_invoke),
+                            Def("sgentype", ["sgentype", "sgentype", "bool"], template_scalar_args=True, custom_invoke=custom_bool_select_invoke),
                             Def("mgentype", ["mgentype", "mgentype", "mbooln"], marray_use_loop=True)]}
 # List of all builtins definitions in the sycl::native namespace.
 native_builtins = {"cos": [Def("genfloatf", ["genfloatf"], invoke_prefix="native_")],
@@ -1210,10 +1210,15 @@ def type_combinations(return_type, arg_types, template_scalars):
   Generates all return and argument type combinations for a given builtin
   definition.
   """
-  unique_types = list(dict.fromkeys(arg_types + [return_type]))
+  unique_types = list(dict.fromkeys(arg_types))
   unique_type_lists = [builtin_types[unique_type] for unique_type in unique_types]
   if template_scalars:
     unique_type_lists = [convert_scalars_to_templated(type_list) for type_list in unique_type_lists]
+  if return_type not in unique_types:
+    # Add return type after scalars have been turned to template arguments if
+    # it is unique, to avoid undeducible return types.
+    unique_types.append(return_type)
+    unique_type_lists.append(builtin_types[return_type])
   combinations = list(itertools.product(*unique_type_lists))
   result = []
   for combination in combinations:
diff --git a/sycl/test/basic_tests/builtins_implicitly_convertible_args.cpp b/sycl/test/basic_tests/builtins_implicitly_convertible_args.cpp
@@ -0,0 +1,161 @@
+// RUN: %clangxx -fsycl -fpreview-breaking-changes -fsyntax-only %s -o %t
+// REQUIRES: preview-breaking-changes-supported
+
+// Checks that builtins without template arguments allow for implicit
+// conversions of arguments.
+
+#include <sycl/sycl.hpp>
+
+template <typename T> struct ImplicitlyConvertibleType {
+  operator T() const { return {}; }
+};
+
+#define ONE_ARG_DECLVAL_IMPLICITLY_CONVERTIBLE(...)                            \
+  std::declval<ImplicitlyConvertibleType<__VA_ARGS__>>()
+
+#define TWO_ARGS_DECLVAL_IMPLICITLY_CONVERTIBLE(...)                           \
+  ONE_ARG_DECLVAL_IMPLICITLY_CONVERTIBLE(__VA_ARGS__),                         \
+      ONE_ARG_DECLVAL_IMPLICITLY_CONVERTIBLE(__VA_ARGS__)
+
+#define THREE_ARGS_DECLVAL_IMPLICITLY_CONVERTIBLE(...)                         \
+  TWO_ARGS_DECLVAL_IMPLICITLY_CONVERTIBLE(__VA_ARGS__),                        \
+      ONE_ARG_DECLVAL_IMPLICITLY_CONVERTIBLE(__VA_ARGS__)
+
+#define ONE_ARG_DECLVAL(...) std::declval<__VA_ARGS__>()
+
+#define TWO_ARGS_DECLVAL(...)                                                  \
+  ONE_ARG_DECLVAL(__VA_ARGS__), ONE_ARG_DECLVAL(__VA_ARGS__)
+
+#define THREE_ARGS_DECLVAL(...)                                                \
+  TWO_ARGS_DECLVAL(__VA_ARGS__), ONE_ARG_DECLVAL(__VA_ARGS__)
+
+#define CHECK_INNER(NUM_ARGS, FUNC_NAME, ...)                                  \
+  static_assert(std::is_same_v<                                                \
+                decltype(sycl::FUNC_NAME(                                      \
+                    NUM_ARGS##_DECLVAL_IMPLICITLY_CONVERTIBLE(__VA_ARGS__))),  \
+                decltype(sycl::FUNC_NAME(NUM_ARGS##_DECLVAL(__VA_ARGS__)))>);
+
+#define FLOAT_CHECK(NUM_ARGS, FUNC_NAME) CHECK_INNER(NUM_ARGS, FUNC_NAME, float)
+
+#define GENFLOAT_CHECK(NUM_ARGS, FUNC_NAME)                                    \
+  FLOAT_CHECK(NUM_ARGS, FUNC_NAME)                                             \
+  CHECK_INNER(NUM_ARGS, FUNC_NAME, sycl::half)                                 \
+  CHECK_INNER(NUM_ARGS, FUNC_NAME, double)
+
+#define UGENINT_NAN_CHECK(NUM_ARGS, FUNC_NAME)                                 \
+  CHECK_INNER(NUM_ARGS, FUNC_NAME, unsigned int)                               \
+  CHECK_INNER(NUM_ARGS, FUNC_NAME, unsigned short)                             \
+  CHECK_INNER(NUM_ARGS, FUNC_NAME, unsigned long)
+
+void check() {
+  GENFLOAT_CHECK(ONE_ARG, acos)
+  GENFLOAT_CHECK(ONE_ARG, acosh)
+  GENFLOAT_CHECK(ONE_ARG, acospi)
+  GENFLOAT_CHECK(ONE_ARG, asin)
+  GENFLOAT_CHECK(ONE_ARG, asinh)
+  GENFLOAT_CHECK(ONE_ARG, asinpi)
+  GENFLOAT_CHECK(ONE_ARG, atan)
+  GENFLOAT_CHECK(ONE_ARG, atanh)
+  GENFLOAT_CHECK(ONE_ARG, atanpi)
+  GENFLOAT_CHECK(TWO_ARGS, atan2)
+  GENFLOAT_CHECK(TWO_ARGS, atan2pi)
+  GENFLOAT_CHECK(ONE_ARG, cbrt)
+  GENFLOAT_CHECK(ONE_ARG, ceil)
+  GENFLOAT_CHECK(TWO_ARGS, copysign)
+  GENFLOAT_CHECK(ONE_ARG, cos)
+  GENFLOAT_CHECK(ONE_ARG, cosh)
+  GENFLOAT_CHECK(ONE_ARG, cospi)
+  GENFLOAT_CHECK(ONE_ARG, erfc)
+  GENFLOAT_CHECK(ONE_ARG, erf)
+  GENFLOAT_CHECK(ONE_ARG, exp)
+  GENFLOAT_CHECK(ONE_ARG, exp2)
+  GENFLOAT_CHECK(ONE_ARG, exp10)
+  GENFLOAT_CHECK(ONE_ARG, expm1)
+  GENFLOAT_CHECK(ONE_ARG, fabs)
+  GENFLOAT_CHECK(TWO_ARGS, fdim)
+  GENFLOAT_CHECK(ONE_ARG, floor)
+  GENFLOAT_CHECK(THREE_ARGS, fma)
+  GENFLOAT_CHECK(TWO_ARGS, fmax)
+  GENFLOAT_CHECK(TWO_ARGS, fmin)
+  GENFLOAT_CHECK(TWO_ARGS, fmod)
+  GENFLOAT_CHECK(TWO_ARGS, hypot)
+  GENFLOAT_CHECK(ONE_ARG, ilogb)
+  GENFLOAT_CHECK(ONE_ARG, lgamma)
+  GENFLOAT_CHECK(ONE_ARG, log)
+  GENFLOAT_CHECK(ONE_ARG, log2)
+  GENFLOAT_CHECK(ONE_ARG, log10)
+  GENFLOAT_CHECK(ONE_ARG, log1p)
+  GENFLOAT_CHECK(ONE_ARG, logb)
+  GENFLOAT_CHECK(THREE_ARGS, mad)
+  GENFLOAT_CHECK(TWO_ARGS, maxmag)
+  GENFLOAT_CHECK(TWO_ARGS, minmag)
+  UGENINT_NAN_CHECK(ONE_ARG, nan)
+  GENFLOAT_CHECK(TWO_ARGS, nextafter)
+  GENFLOAT_CHECK(TWO_ARGS, pow)
+  GENFLOAT_CHECK(TWO_ARGS, powr)
+  GENFLOAT_CHECK(TWO_ARGS, remainder)
+  GENFLOAT_CHECK(ONE_ARG, rint)
+  GENFLOAT_CHECK(ONE_ARG, round)
+  GENFLOAT_CHECK(ONE_ARG, rsqrt)
+  GENFLOAT_CHECK(ONE_ARG, sin)
+  GENFLOAT_CHECK(ONE_ARG, sinh)
+  GENFLOAT_CHECK(ONE_ARG, sinpi)
+  GENFLOAT_CHECK(ONE_ARG, sqrt)
+  GENFLOAT_CHECK(ONE_ARG, tan)
+  GENFLOAT_CHECK(ONE_ARG, tanh)
+  GENFLOAT_CHECK(ONE_ARG, tanpi)
+  GENFLOAT_CHECK(ONE_ARG, tgamma)
+  GENFLOAT_CHECK(ONE_ARG, trunc)
+
+  FLOAT_CHECK(ONE_ARG, native::cos)
+  FLOAT_CHECK(TWO_ARGS, native::divide)
+  FLOAT_CHECK(ONE_ARG, native::exp)
+  FLOAT_CHECK(ONE_ARG, native::exp2)
+  FLOAT_CHECK(ONE_ARG, native::exp10)
+  FLOAT_CHECK(ONE_ARG, native::log)
+  FLOAT_CHECK(ONE_ARG, native::log2)
+  FLOAT_CHECK(ONE_ARG, native::log10)
+  FLOAT_CHECK(TWO_ARGS, native::powr)
+  FLOAT_CHECK(ONE_ARG, native::recip)
+  FLOAT_CHECK(ONE_ARG, native::rsqrt)
+  FLOAT_CHECK(ONE_ARG, native::sin)
+  FLOAT_CHECK(ONE_ARG, native::sqrt)
+  FLOAT_CHECK(ONE_ARG, native::tan)
+
+  FLOAT_CHECK(ONE_ARG, half_precision::cos)
+  FLOAT_CHECK(TWO_ARGS, half_precision::divide)
+  FLOAT_CHECK(ONE_ARG, half_precision::exp)
+  FLOAT_CHECK(ONE_ARG, half_precision::exp2)
+  FLOAT_CHECK(ONE_ARG, half_precision::exp10)
+  FLOAT_CHECK(ONE_ARG, half_precision::log)
+  FLOAT_CHECK(ONE_ARG, half_precision::log2)
+  FLOAT_CHECK(ONE_ARG, half_precision::log10)
+  FLOAT_CHECK(TWO_ARGS, half_precision::powr)
+  FLOAT_CHECK(ONE_ARG, half_precision::recip)
+  FLOAT_CHECK(ONE_ARG, half_precision::rsqrt)
+  FLOAT_CHECK(ONE_ARG, half_precision::sin)
+  FLOAT_CHECK(ONE_ARG, half_precision::sqrt)
+  FLOAT_CHECK(ONE_ARG, half_precision::tan)
+
+  GENFLOAT_CHECK(TWO_ARGS, isequal)
+  GENFLOAT_CHECK(TWO_ARGS, isnotequal)
+  GENFLOAT_CHECK(TWO_ARGS, isgreater)
+  GENFLOAT_CHECK(TWO_ARGS, isgreaterequal)
+  GENFLOAT_CHECK(TWO_ARGS, isless)
+  GENFLOAT_CHECK(TWO_ARGS, islessequal)
+  GENFLOAT_CHECK(TWO_ARGS, islessgreater)
+  GENFLOAT_CHECK(ONE_ARG, isfinite)
+  GENFLOAT_CHECK(ONE_ARG, isinf)
+  GENFLOAT_CHECK(ONE_ARG, isnan)
+  GENFLOAT_CHECK(ONE_ARG, isnormal)
+  GENFLOAT_CHECK(TWO_ARGS, isordered)
+  GENFLOAT_CHECK(TWO_ARGS, isunordered)
+  GENFLOAT_CHECK(ONE_ARG, signbit)
+}
+
+int main() {
+  check();
+
+  sycl::queue Q;
+  Q.single_task([=]() { check(); });
+}
diff --git a/sycl/test/basic_tests/builtins_templates.cpp b/sycl/test/basic_tests/builtins_templates.cpp