Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / 2007-11-06-InstrSched.ll
blob750d06d9e6031f1c44d77a67280fbbb28a82700d
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-- -mattr=+sse2 | FileCheck %s
4 define float @foo(ptr %x, ptr %y, i32 %c) nounwind {
5 ; CHECK-LABEL: foo:
6 ; CHECK:       # %bb.0: # %entry
7 ; CHECK-NEXT:    pushl %esi
8 ; CHECK-NEXT:    pushl %eax
9 ; CHECK-NEXT:    movl {{[0-9]+}}(%esp), %eax
10 ; CHECK-NEXT:    testl %eax, %eax
11 ; CHECK-NEXT:    je .LBB0_1
12 ; CHECK-NEXT:  # %bb.2: # %bb18.preheader
13 ; CHECK-NEXT:    movl {{[0-9]+}}(%esp), %ecx
14 ; CHECK-NEXT:    movl {{[0-9]+}}(%esp), %edx
15 ; CHECK-NEXT:    xorps %xmm0, %xmm0
16 ; CHECK-NEXT:    xorl %esi, %esi
17 ; CHECK-NEXT:    .p2align 4, 0x90
18 ; CHECK-NEXT:  .LBB0_3: # %bb18
19 ; CHECK-NEXT:    # =>This Inner Loop Header: Depth=1
20 ; CHECK-NEXT:    xorps %xmm1, %xmm1
21 ; CHECK-NEXT:    cvtsi2ssl (%edx,%esi,4), %xmm1
22 ; CHECK-NEXT:    mulss (%ecx,%esi,4), %xmm1
23 ; CHECK-NEXT:    addss %xmm1, %xmm0
24 ; CHECK-NEXT:    incl %esi
25 ; CHECK-NEXT:    cmpl %eax, %esi
26 ; CHECK-NEXT:    jb .LBB0_3
27 ; CHECK-NEXT:    jmp .LBB0_4
28 ; CHECK-NEXT:  .LBB0_1:
29 ; CHECK-NEXT:    xorps %xmm0, %xmm0
30 ; CHECK-NEXT:  .LBB0_4: # %bb23
31 ; CHECK-NEXT:    movss %xmm0, (%esp)
32 ; CHECK-NEXT:    flds (%esp)
33 ; CHECK-NEXT:    addl $4, %esp
34 ; CHECK-NEXT:    popl %esi
35 ; CHECK-NEXT:    retl
36 entry:
37         %tmp2132 = icmp eq i32 %c, 0            ; <i1> [#uses=1]
38         br i1 %tmp2132, label %bb23, label %bb18
40 bb18:           ; preds = %bb18, %entry
41         %i.0.reg2mem.0 = phi i32 [ 0, %entry ], [ %tmp17, %bb18 ]               ; <i32> [#uses=3]
42         %res.0.reg2mem.0 = phi float [ 0.000000e+00, %entry ], [ %tmp14, %bb18 ]                ; <float> [#uses=1]
43         %tmp3 = getelementptr i32, ptr %x, i32 %i.0.reg2mem.0           ; <ptr> [#uses=1]
44         %tmp4 = load i32, ptr %tmp3, align 4            ; <i32> [#uses=1]
45         %tmp45 = sitofp i32 %tmp4 to float              ; <float> [#uses=1]
46         %tmp8 = getelementptr float, ptr %y, i32 %i.0.reg2mem.0         ; <ptr> [#uses=1]
47         %tmp9 = load float, ptr %tmp8, align 4          ; <float> [#uses=1]
48         %tmp11 = fmul float %tmp9, %tmp45               ; <float> [#uses=1]
49         %tmp14 = fadd float %tmp11, %res.0.reg2mem.0            ; <float> [#uses=2]
50         %tmp17 = add i32 %i.0.reg2mem.0, 1              ; <i32> [#uses=2]
51         %tmp21 = icmp ult i32 %tmp17, %c                ; <i1> [#uses=1]
52         br i1 %tmp21, label %bb18, label %bb23
54 bb23:           ; preds = %bb18, %entry
55         %res.0.reg2mem.1 = phi float [ 0.000000e+00, %entry ], [ %tmp14, %bb18 ]                ; <float> [#uses=1]
56         ret float %res.0.reg2mem.1