[x86] fix assert with horizontal math + broadcast of vector (PR43402)
[llvm-core.git] / test / CodeGen / X86 / pr26870.ll
blob1e8470bfba398a96e33db134ff7fcdde2736c3e7
1 ; RUN: llc < %s -mtriple=i686-pc-windows-msvc18.0.0 -mcpu=pentium4
3 define x86_thiscallcc i32* @fn4(i32* %this, i8* dereferenceable(1) %p1) {
4 entry:
5   %dl = getelementptr inbounds i32, i32* %this, i32 0
6   %call.i = tail call x86_thiscallcc i64 @fn1(i32* %dl)
7   %getTypeAllocSize___trans_tmp_2.i = getelementptr inbounds i32, i32* %this, i32 0
8   %0 = load i32, i32* %getTypeAllocSize___trans_tmp_2.i, align 4
9   %call.i8 = tail call x86_thiscallcc i64 @fn1(i32* %dl)
10   %1 = insertelement <2 x i64> undef, i64 %call.i, i32 0
11   %2 = insertelement <2 x i64> %1, i64 %call.i8, i32 1
12   %3 = add nsw <2 x i64> %2, <i64 7, i64 7>
13   %4 = sdiv <2 x i64> %3, <i64 8, i64 8>
14   %5 = add nsw <2 x i64> %4, <i64 1, i64 1>
15   %6 = load i32, i32* %getTypeAllocSize___trans_tmp_2.i, align 4
16   %7 = insertelement <2 x i32> undef, i32 %0, i32 0
17   %8 = insertelement <2 x i32> %7, i32 %6, i32 1
18   %9 = zext <2 x i32> %8 to <2 x i64>
19   %10 = srem <2 x i64> %5, %9
20   %11 = sub <2 x i64> %5, %10
21   %12 = trunc <2 x i64> %11 to <2 x i32>
22   %13 = extractelement <2 x i32> %12, i32 0
23   %14 = extractelement <2 x i32> %12, i32 1
24   %cmp = icmp eq i32 %13, %14
25   br i1 %cmp, label %if.then, label %cleanup
27 if.then:
28   %call4 = tail call x86_thiscallcc i32* @fn3(i8* nonnull %p1)
29   br label %cleanup
31 cleanup:
32   %retval.0 = phi i32* [ %call4, %if.then ], [ undef, %entry ]
33   ret i32* %retval.0
36 declare x86_thiscallcc i32* @fn3(i8*)
37 declare x86_thiscallcc i64 @fn1(i32*)