[X86][BF16] Customize VSELECT for BF16 under AVX-NECONVERT #113322

phoebewang · 2024-10-22T14:27:40Z

Fixes: https://godbolt.org/z/9abGnE8zs

llvmbot · 2024-10-22T14:28:16Z

@llvm/pr-subscribers-backend-x86

Author: Phoebe Wang (phoebewang)

Changes

Fixes: https://godbolt.org/z/9abGnE8zs

Full diff: https://github.com/llvm/llvm-project/pull/113322.diff

2 Files Affected:

(modified) llvm/lib/Target/X86/X86ISelLowering.cpp (+1)
(modified) llvm/test/CodeGen/X86/avxneconvert-intrinsics.ll (+114)

diff --git a/llvm/lib/Target/X86/X86ISelLowering.cpp b/llvm/lib/Target/X86/X86ISelLowering.cpp
index bcb84add65d83e..c453d7ae1d3889 100644
--- a/llvm/lib/Target/X86/X86ISelLowering.cpp
+++ b/llvm/lib/Target/X86/X86ISelLowering.cpp
@@ -2393,6 +2393,7 @@ X86TargetLowering::X86TargetLowering(const X86TargetMachine &TM,
     setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::bf16, Custom);
     for (auto VT : {MVT::v8bf16, MVT::v16bf16}) {
       setF16Action(VT, Expand);
+      setOperationAction(ISD::VSELECT, VT, Custom);
       setOperationAction(ISD::BUILD_VECTOR, VT, Custom);
       setOperationAction(ISD::VECTOR_SHUFFLE, VT, Custom);
       setOperationAction(ISD::INSERT_SUBVECTOR, VT, Legal);
diff --git a/llvm/test/CodeGen/X86/avxneconvert-intrinsics.ll b/llvm/test/CodeGen/X86/avxneconvert-intrinsics.ll
index b311c8831457b8..ef87ac31fcf48c 100644
--- a/llvm/test/CodeGen/X86/avxneconvert-intrinsics.ll
+++ b/llvm/test/CodeGen/X86/avxneconvert-intrinsics.ll
@@ -215,3 +215,117 @@ define <8 x bfloat> @test_int_x86_vcvtneps2bf16256(<8 x float> %A) {
 }
 declare <8 x bfloat> @llvm.x86.vcvtneps2bf16256(<8 x float> %A)
 
+define <8 x bfloat> @select(i8 %x, <8 x bfloat> %y) nounwind {
+; X64-LABEL: select:
+; X64:       # %bb.0:
+; X64-NEXT:    vmovaps %xmm0, %xmm1 # encoding: [0xc5,0xf8,0x28,0xc8]
+; X64-NEXT:    movb %dil, %al # encoding: [0x40,0x88,0xf8]
+; X64-NEXT:    movb %al, -{{[0-9]+}}(%rsp) # encoding: [0x88,0x44,0x24,0xff]
+; X64-NEXT:    movzbl -{{[0-9]+}}(%rsp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0xff]
+; X64-NEXT:    movl %eax, %ecx # encoding: [0x89,0xc1]
+; X64-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X64-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X64-NEXT:    vmovd %ecx, %xmm0 # encoding: [0xc5,0xf9,0x6e,0xc1]
+; X64-NEXT:    # kill: def $al killed $al killed $eax
+; X64-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X64-NEXT:    shrb %cl # encoding: [0xd0,0xe9]
+; X64-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X64-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X64-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X64-NEXT:    vpinsrw $1, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x01]
+; X64-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X64-NEXT:    shrb $2, %cl # encoding: [0xc0,0xe9,0x02]
+; X64-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X64-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X64-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X64-NEXT:    vpinsrw $2, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x02]
+; X64-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X64-NEXT:    shrb $3, %cl # encoding: [0xc0,0xe9,0x03]
+; X64-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X64-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X64-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X64-NEXT:    vpinsrw $3, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x03]
+; X64-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X64-NEXT:    shrb $4, %cl # encoding: [0xc0,0xe9,0x04]
+; X64-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X64-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X64-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X64-NEXT:    vpinsrw $4, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x04]
+; X64-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X64-NEXT:    shrb $5, %cl # encoding: [0xc0,0xe9,0x05]
+; X64-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X64-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X64-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X64-NEXT:    vpinsrw $5, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x05]
+; X64-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X64-NEXT:    shrb $6, %cl # encoding: [0xc0,0xe9,0x06]
+; X64-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X64-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X64-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X64-NEXT:    vpinsrw $6, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x06]
+; X64-NEXT:    shrb $7, %al # encoding: [0xc0,0xe8,0x07]
+; X64-NEXT:    movzbl %al, %eax # encoding: [0x0f,0xb6,0xc0]
+; X64-NEXT:    negl %eax # encoding: [0xf7,0xd8]
+; X64-NEXT:    vpinsrw $7, %eax, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc0,0x07]
+; X64-NEXT:    vpandn %xmm1, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xdf,0xc1]
+; X64-NEXT:    retq # encoding: [0xc3]
+;
+; X86-LABEL: select:
+; X86:       # %bb.0:
+; X86-NEXT:    pushl %eax # encoding: [0x50]
+; X86-NEXT:    vmovaps %xmm0, %xmm1 # encoding: [0xc5,0xf8,0x28,0xc8]
+; X86-NEXT:    movb {{[0-9]+}}(%esp), %al # encoding: [0x8a,0x44,0x24,0x08]
+; X86-NEXT:    movb %al, {{[0-9]+}}(%esp) # encoding: [0x88,0x44,0x24,0x03]
+; X86-NEXT:    movzbl {{[0-9]+}}(%esp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0x03]
+; X86-NEXT:    movl %eax, %ecx # encoding: [0x89,0xc1]
+; X86-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X86-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X86-NEXT:    vmovd %ecx, %xmm0 # encoding: [0xc5,0xf9,0x6e,0xc1]
+; X86-NEXT:    # kill: def $al killed $al killed $eax
+; X86-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X86-NEXT:    shrb %cl # encoding: [0xd0,0xe9]
+; X86-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X86-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X86-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X86-NEXT:    vpinsrw $1, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x01]
+; X86-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X86-NEXT:    shrb $2, %cl # encoding: [0xc0,0xe9,0x02]
+; X86-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X86-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X86-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X86-NEXT:    vpinsrw $2, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x02]
+; X86-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X86-NEXT:    shrb $3, %cl # encoding: [0xc0,0xe9,0x03]
+; X86-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X86-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X86-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X86-NEXT:    vpinsrw $3, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x03]
+; X86-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X86-NEXT:    shrb $4, %cl # encoding: [0xc0,0xe9,0x04]
+; X86-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X86-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X86-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X86-NEXT:    vpinsrw $4, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x04]
+; X86-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X86-NEXT:    shrb $5, %cl # encoding: [0xc0,0xe9,0x05]
+; X86-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X86-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X86-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X86-NEXT:    vpinsrw $5, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x05]
+; X86-NEXT:    movb %al, %cl # encoding: [0x88,0xc1]
+; X86-NEXT:    shrb $6, %cl # encoding: [0xc0,0xe9,0x06]
+; X86-NEXT:    movzbl %cl, %ecx # encoding: [0x0f,0xb6,0xc9]
+; X86-NEXT:    andl $1, %ecx # encoding: [0x83,0xe1,0x01]
+; X86-NEXT:    negl %ecx # encoding: [0xf7,0xd9]
+; X86-NEXT:    vpinsrw $6, %ecx, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc1,0x06]
+; X86-NEXT:    shrb $7, %al # encoding: [0xc0,0xe8,0x07]
+; X86-NEXT:    movzbl %al, %eax # encoding: [0x0f,0xb6,0xc0]
+; X86-NEXT:    negl %eax # encoding: [0xf7,0xd8]
+; X86-NEXT:    vpinsrw $7, %eax, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xc4,0xc0,0x07]
+; X86-NEXT:    vpandn %xmm1, %xmm0, %xmm0 # encoding: [0xc5,0xf9,0xdf,0xc1]
+; X86-NEXT:    popl %eax # encoding: [0x58]
+; X86-NEXT:    retl # encoding: [0xc3]
+  %1 = bitcast i8 %x to <8 x i1>
+  %2 = select <8 x i1> %1, <8 x bfloat> zeroinitializer, <8 x bfloat> %y
+  ret <8 x bfloat> %2
+}

Fixes: https://godbolt.org/z/9abGnE8zs

FreddyLeaf

LGTM

llvm-ci · 2024-10-28T07:22:57Z

LLVM Buildbot has detected a new failure on builder openmp-offload-amdgpu-runtime running on omp-vega20-0 while building llvm at step 7 "Add check check-offload".

Full details are available at: https://lab.llvm.org/buildbot/#/builders/30/builds/8981

Here is the relevant piece of the build log for the reference

Step 7 (Add check check-offload) failure: test (failure)
******************** TEST 'libomptarget :: amdgcn-amd-amdhsa :: offloading/schedule.c' FAILED ********************
Exit Code: 1

Command Output (stdout):
--
# RUN: at line 2
/home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/./bin/clang -fopenmp    -I /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.src/offload/test -I /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/openmp/runtime/src -L /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/offload -L /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/./lib -L /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/openmp/runtime/src  -nogpulib -Wl,-rpath,/home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/offload -Wl,-rpath,/home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/openmp/runtime/src -Wl,-rpath,/home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/./lib  -fopenmp-targets=amdgcn-amd-amdhsa /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.src/offload/test/offloading/schedule.c -o /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/offload/test/amdgcn-amd-amdhsa/offloading/Output/schedule.c.tmp /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/./lib/libomptarget.devicertl.a && /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/offload/test/amdgcn-amd-amdhsa/offloading/Output/schedule.c.tmp 2>&1 | /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/./bin/FileCheck /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.src/offload/test/offloading/schedule.c
# executed command: /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/./bin/clang -fopenmp -I /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.src/offload/test -I /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/openmp/runtime/src -L /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/offload -L /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/./lib -L /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/openmp/runtime/src -nogpulib -Wl,-rpath,/home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/offload -Wl,-rpath,/home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/openmp/runtime/src -Wl,-rpath,/home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/./lib -fopenmp-targets=amdgcn-amd-amdhsa /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.src/offload/test/offloading/schedule.c -o /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/offload/test/amdgcn-amd-amdhsa/offloading/Output/schedule.c.tmp /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/./lib/libomptarget.devicertl.a
# note: command had no output on stdout or stderr
# executed command: /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/runtimes/runtimes-bins/offload/test/amdgcn-amd-amdhsa/offloading/Output/schedule.c.tmp
# note: command had no output on stdout or stderr
# executed command: /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.build/./bin/FileCheck /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.src/offload/test/offloading/schedule.c
# .---command stderr------------
# | /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.src/offload/test/offloading/schedule.c:80:12: error: CHECK: expected string not found in input
# |  // CHECK: test no order OK
# |            ^
# | <stdin>:1:1: note: scanning from here
# | Fail to schedule in order.
# | ^
# | <stdin>:2:1: note: possible intended match here
# | test ordered OK
# | ^
# | 
# | Input file: <stdin>
# | Check file: /home/ompworker/bbot/openmp-offload-amdgpu-runtime/llvm.src/offload/test/offloading/schedule.c
# | 
# | -dump-input=help explains the following input dump.
# | 
# | Input was:
# | <<<<<<
# |             1: Fail to schedule in order. 
# | check:80'0     X~~~~~~~~~~~~~~~~~~~~~~~~~~ error: no match found
# |             2: test ordered OK 
# | check:80'0     ~~~~~~~~~~~~~~~~
# | check:80'1     ?                possible intended match
# | >>>>>>
# `-----------------------------
# error: command failed with exit status: 1

--

********************

llvm-ci · 2024-10-28T07:22:58Z

LLVM Buildbot has detected a new failure on builder clangd-ubuntu-tsan running on clangd-ubuntu-clang while building llvm at step 6 "test-build-clangd-clangd-index-server-clangd-indexer-check-clangd".

Full details are available at: https://lab.llvm.org/buildbot/#/builders/134/builds/7555

Here is the relevant piece of the build log for the reference

Step 6 (test-build-clangd-clangd-index-server-clangd-indexer-check-clangd) failure: test (failure)
******************** TEST 'Clangd :: target_info.test' FAILED ********************
Exit Code: 66

Command Output (stderr):
--
RUN: at line 5: rm -rf /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir && mkdir -p /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir
+ rm -rf /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir
+ mkdir -p /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir
RUN: at line 7: echo '[{"directory": "/vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir", "command": "/vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir/armv7-clang -x c++ the-file.cpp -v", "file": "the-file.cpp"}]' > /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir/compile_commands.json
+ echo '[{"directory": "/vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir", "command": "/vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir/armv7-clang -x c++ the-file.cpp -v", "file": "the-file.cpp"}]'
RUN: at line 9: sed -e "s|INPUT_DIR|/vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir|g" /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/llvm-project/clang-tools-extra/clangd/test/target_info.test > /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.test.1
+ sed -e 's|INPUT_DIR|/vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.dir|g' /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/llvm-project/clang-tools-extra/clangd/test/target_info.test
RUN: at line 12: sed -E -e 's|"file://([A-Z]):/|"file:///\1:/|g' /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.test.1 > /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.test
+ sed -E -e 's|"file://([A-Z]):/|"file:///\1:/|g' /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.test.1
RUN: at line 14: clangd -lit-test < /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.test 2>&1 | /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/bin/FileCheck -strict-whitespace /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.test
+ clangd -lit-test
+ /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/bin/FileCheck -strict-whitespace /vol/worker/clangd-ubuntu-clang/clangd-ubuntu-tsan/build/tools/clang/tools/extra/clangd/test/Output/target_info.test.tmp.test

--

********************

Fixes: https://godbolt.org/z/9abGnE8zs

phoebewang requested review from RKSimon and FreddyLeaf October 22, 2024 14:27

llvmbot added the backend:X86 label Oct 22, 2024

phoebewang force-pushed the bf16 branch from fd56af9 to aac3ef2 Compare October 22, 2024 14:39

[X86][BF16] Customize VSELECT for BF16 under AVX-NECONVERT

ad0f310

Fixes: https://godbolt.org/z/9abGnE8zs

phoebewang force-pushed the bf16 branch from aac3ef2 to ad0f310 Compare October 22, 2024 14:43

FreddyLeaf approved these changes Oct 28, 2024

View reviewed changes

phoebewang merged commit fd85761 into llvm:main Oct 28, 2024
8 checks passed

phoebewang deleted the bf16 branch October 28, 2024 07:15

NoumanAmir657 pushed a commit to NoumanAmir657/llvm-project that referenced this pull request Nov 4, 2024

[X86][BF16] Customize VSELECT for BF16 under AVX-NECONVERT (llvm#113322)

165a5b9

Fixes: https://godbolt.org/z/9abGnE8zs

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[X86][BF16] Customize VSELECT for BF16 under AVX-NECONVERT #113322

[X86][BF16] Customize VSELECT for BF16 under AVX-NECONVERT #113322

Uh oh!

phoebewang commented Oct 22, 2024

Uh oh!

llvmbot commented Oct 22, 2024

Uh oh!

FreddyLeaf left a comment

Uh oh!

Uh oh!

llvm-ci commented Oct 28, 2024

Uh oh!

llvm-ci commented Oct 28, 2024

Uh oh!

Uh oh!

[X86][BF16] Customize VSELECT for BF16 under AVX-NECONVERT #113322

[X86][BF16] Customize VSELECT for BF16 under AVX-NECONVERT #113322

Uh oh!

Conversation

phoebewang commented Oct 22, 2024

Uh oh!

llvmbot commented Oct 22, 2024

Uh oh!

FreddyLeaf left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

llvm-ci commented Oct 28, 2024

Uh oh!

llvm-ci commented Oct 28, 2024

Uh oh!

Uh oh!