Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / Thumb2 / 2013-03-02-vduplane-nonconstant-source-index.ll
blob693c11a02ff64b9d053f2d4598a3ce1346126f82
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
2 ; RUN: llc < %s -mtriple=thumbv7-apple-ios | FileCheck %s
4 define void @bar(ptr %p, i32 %lane, <4 x i32> %phitmp) nounwind {
5 ; CHECK-LABEL: bar:
6 ; CHECK:       @ %bb.0:
7 ; CHECK-NEXT:    push {r4, r7, lr}
8 ; CHECK-NEXT:    add r7, sp, #4
9 ; CHECK-NEXT:    sub sp, #20
10 ; CHECK-NEXT:    mov r4, sp
11 ; CHECK-NEXT:    bfc r4, #0, #4
12 ; CHECK-NEXT:    mov sp, r4
13 ; CHECK-NEXT:    and r1, r1, #3
14 ; CHECK-NEXT:    vldr d17, [r7, #8]
15 ; CHECK-NEXT:    vmov d16, r2, r3
16 ; CHECK-NEXT:    mov r2, sp
17 ; CHECK-NEXT:    lsls r1, r1, #2
18 ; CHECK-NEXT:    subs r4, r7, #4
19 ; CHECK-NEXT:    vst1.64 {d16, d17}, [r2:128], r1
20 ; CHECK-NEXT:    vld1.32 {d16[], d17[]}, [r2:32]
21 ; CHECK-NEXT:    vst1.32 {d16, d17}, [r0]
22 ; CHECK-NEXT:    mov sp, r4
23 ; CHECK-NEXT:    pop {r4, r7, pc}
24   %val = extractelement <4 x i32> %phitmp, i32 %lane
25   %r1 = insertelement <4 x i32> undef, i32 %val, i32 1
26   %r2 = insertelement <4 x i32> %r1, i32 %val, i32 2
27   %r3 = insertelement <4 x i32> %r2, i32 %val, i32 3
28   store <4 x i32> %r3, ptr %p, align 4
29   ret void