Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / pic-load-remat.ll
blob7737093d2ba076b144fce9f2c463adfef8e1d1b6
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+sse2 -relocation-model=pic | FileCheck %s
4 define void @f() nounwind  {
5 ; CHECK-LABEL: f:
6 ; CHECK:       ## %bb.0: ## %entry
7 ; CHECK-NEXT:    calll L0$pb
8 ; CHECK-NEXT:  L0$pb:
9 ; CHECK-NEXT:    popl %eax
10 ; CHECK-NEXT:    movdqa {{.*#+}} xmm1 = [1,1,1,1,1,1,1,1]
11 ; CHECK-NEXT:    psllw {{\.?LCPI[0-9]+_[0-9]+}}-L0$pb(%eax), %xmm1
12 ; CHECK-NEXT:    movdqa {{.*#+}} xmm0 = [21183,21183,21183,21183,21183,21183,21183,21183]
13 ; CHECK-NEXT:    paddsw %xmm0, %xmm0
14 ; CHECK-NEXT:    paddw %xmm1, %xmm0
15 ; CHECK-NEXT:    .p2align 4, 0x90
16 ; CHECK-NEXT:  LBB0_1: ## %bb
17 ; CHECK-NEXT:    ## =>This Inner Loop Header: Depth=1
18 ; CHECK-NEXT:    movdqa %xmm0, 0
19 ; CHECK-NEXT:    jmp LBB0_1
20 entry:
21         br label %bb
23 bb:             ; preds = %bb, %entry
24         %tmp4403 = tail call <8 x i16> @llvm.ssub.sat.v8i16( <8 x i16> zeroinitializer, <8 x i16> zeroinitializer ) nounwind readnone           ; <<8 x i16>> [#uses=2]
25         %tmp4443 = tail call <8 x i16> @llvm.sadd.sat.v8i16( <8 x i16> zeroinitializer, <8 x i16> zeroinitializer ) nounwind readnone           ; <<8 x i16>> [#uses=1]
26         %tmp4609 = tail call <8 x i16> @llvm.x86.sse2.psll.w( <8 x i16> zeroinitializer, <8 x i16> bitcast (<4 x i32> < i32 3, i32 5, i32 6, i32 9 > to <8 x i16>) )            ; <<8 x i16>> [#uses=1]
27         %tmp4651 = add <8 x i16> %tmp4609, < i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1 >           ; <<8 x i16>> [#uses=1]
28         %tmp4658 = tail call <8 x i16> @llvm.x86.sse2.psll.w( <8 x i16> %tmp4651, <8 x i16> bitcast (<4 x i32> < i32 4, i32 1, i32 2, i32 3 > to <8 x i16>) )           ; <<8 x i16>> [#uses=1]
29         %tmp4669 = tail call <8 x i16> @llvm.x86.sse2.pavg.w( <8 x i16> < i16 -23170, i16 -23170, i16 -23170, i16 -23170, i16 -23170, i16 -23170, i16 -23170, i16 -23170 >, <8 x i16> %tmp4443 ) nounwind readnone              ; <<8 x i16>> [#uses=2]
30         %tmp4679 = tail call <8 x i16> @llvm.sadd.sat.v8i16( <8 x i16> %tmp4669, <8 x i16> %tmp4669 ) nounwind readnone                 ; <<8 x i16>> [#uses=1]
31         %tmp4689 = add <8 x i16> %tmp4679, %tmp4658             ; <<8 x i16>> [#uses=1]
32         %tmp4700 = tail call <8 x i16> @llvm.sadd.sat.v8i16( <8 x i16> %tmp4689, <8 x i16> zeroinitializer ) nounwind readnone          ; <<8 x i16>> [#uses=1]
33         %tmp4708 = bitcast <8 x i16> %tmp4700 to <2 x i64>              ; <<2 x i64>> [#uses=1]
34         %tmp4772 = add <8 x i16> zeroinitializer, < i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1 >            ; <<8 x i16>> [#uses=1]
35         %tmp4779 = tail call <8 x i16> @llvm.x86.sse2.psll.w( <8 x i16> %tmp4772, <8 x i16> bitcast (<4 x i32> < i32 3, i32 5, i32 undef, i32 7 > to <8 x i16>) )               ; <<8 x i16>> [#uses=1]
36         %tmp4810 = add <8 x i16> zeroinitializer, %tmp4779              ; <<8 x i16>> [#uses=1]
37         %tmp4821 = tail call <8 x i16> @llvm.sadd.sat.v8i16( <8 x i16> %tmp4810, <8 x i16> zeroinitializer ) nounwind readnone          ; <<8 x i16>> [#uses=1]
38         %tmp4829 = bitcast <8 x i16> %tmp4821 to <2 x i64>              ; <<2 x i64>> [#uses=1]
39         %tmp4900 = tail call <8 x i16> @llvm.x86.sse2.psll.w( <8 x i16> zeroinitializer, <8 x i16> bitcast (<4 x i32> < i32 1, i32 1, i32 2, i32 2 > to <8 x i16>) )            ; <<8 x i16>> [#uses=1]
40         %tmp4911 = tail call <8 x i16> @llvm.x86.sse2.pavg.w( <8 x i16> < i16 -23170, i16 -23170, i16 -23170, i16 -23170, i16 -23170, i16 -23170, i16 -23170, i16 -23170 >, <8 x i16> zeroinitializer ) nounwind readnone               ; <<8 x i16>> [#uses=2]
41         %tmp4921 = tail call <8 x i16> @llvm.sadd.sat.v8i16( <8 x i16> %tmp4911, <8 x i16> %tmp4911 ) nounwind readnone                 ; <<8 x i16>> [#uses=1]
42         %tmp4931 = add <8 x i16> %tmp4921, %tmp4900             ; <<8 x i16>> [#uses=1]
43         %tmp4942 = tail call <8 x i16> @llvm.sadd.sat.v8i16( <8 x i16> %tmp4931, <8 x i16> zeroinitializer ) nounwind readnone          ; <<8 x i16>> [#uses=1]
44         %tmp4950 = bitcast <8 x i16> %tmp4942 to <2 x i64>              ; <<2 x i64>> [#uses=1]
45         %tmp4957 = tail call <8 x i16> @llvm.sadd.sat.v8i16( <8 x i16> %tmp4403, <8 x i16> zeroinitializer ) nounwind readnone          ; <<8 x i16>> [#uses=1]
46         %tmp4958 = bitcast <8 x i16> %tmp4957 to <2 x i64>              ; <<2 x i64>> [#uses=1]
47         %tmp4967 = tail call <8 x i16> @llvm.ssub.sat.v8i16( <8 x i16> %tmp4403, <8 x i16> zeroinitializer ) nounwind readnone          ; <<8 x i16>> [#uses=1]
48         %tmp4968 = bitcast <8 x i16> %tmp4967 to <2 x i64>              ; <<2 x i64>> [#uses=1]
49         store <2 x i64> %tmp4829, ptr null, align 16
50         store <2 x i64> %tmp4958, ptr null, align 16
51         store <2 x i64> %tmp4968, ptr null, align 16
52         store <2 x i64> %tmp4950, ptr null, align 16
53         store <2 x i64> %tmp4708, ptr null, align 16
54         br label %bb
57 declare <8 x i16> @llvm.x86.sse2.psll.w(<8 x i16>, <8 x i16>) nounwind readnone
59 declare <8 x i16> @llvm.x86.sse2.pavg.w(<8 x i16>, <8 x i16>) nounwind readnone
61 declare <8 x i16> @llvm.sadd.sat.v8i16(<8 x i16>, <8 x i16>) nounwind readnone
63 declare <8 x i16> @llvm.ssub.sat.v8i16(<8 x i16>, <8 x i16>) nounwind readnone