[x86] fix assert with horizontal math + broadcast of vector (PR43402)
[llvm-core.git] / test / CodeGen / X86 / pr33960.ll
blobfd5a9a400503c5dee649b476120ab7dbbe2e0c8a
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-unknown -mattr=+avx | FileCheck %s --check-prefix=X86
3 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx | FileCheck %s --check-prefix=X64
5 @b = external local_unnamed_addr global i32, align 4
7 define void @PR33960() {
8 ; X86-LABEL: PR33960:
9 ; X86:       # %bb.0: # %entry
10 ; X86-NEXT:    movl $-1, b
11 ; X86-NEXT:    retl
13 ; X64-LABEL: PR33960:
14 ; X64:       # %bb.0: # %entry
15 ; X64-NEXT:    movl $-1, {{.*}}(%rip)
16 ; X64-NEXT:    retq
17 entry:
18   %tmp = insertelement <4 x i32> <i32 undef, i32 -7, i32 -3, i32 undef>, i32 -2, i32 3
19   %predphi26 = insertelement <4 x i32> %tmp, i32 -7, i32 0
20   %tmp1 = trunc <4 x i32> %predphi26 to <4 x i16>
21   %tmp2 = icmp eq <4 x i16> %tmp1, zeroinitializer
22   %tmp3 = icmp eq <4 x i32> undef, zeroinitializer
23   %tmp4 = and <4 x i1> %tmp2, %tmp3
24   %predphi17 = select <4 x i1> %tmp4, <4 x i32> undef, <4 x i32> zeroinitializer
25   %tmp5 = shl <4 x i32> %predphi17, <i32 16, i32 16, i32 16, i32 16>
26   %tmp6 = ashr exact <4 x i32> %tmp5, <i32 16, i32 16, i32 16, i32 16>
27   %tmp7 = or <4 x i32> %tmp6, undef
28   %tmp8 = or <4 x i32> undef, %tmp7
29   %tmp9 = or <4 x i32> undef, %tmp8
30   %tmp10 = or <4 x i32> undef, %tmp9
31   %tmp11 = or <4 x i32> undef, %tmp10
32   %tmp12 = or <4 x i32> undef, %tmp11
33   %bin.rdx = or <4 x i32> %tmp12, undef
34   %bin.rdx19 = or <4 x i32> %bin.rdx, undef
35   %tmp13 = extractelement <4 x i32> %bin.rdx19, i32 0
36   %or = or i32 0, %tmp13
37   store i32 %or, i32* @b, align 4
38   ret void