[ARM] Better OR's for MVE compares
[llvm-core.git] / test / Transforms / LoopVectorize / float-minmax-instruction-flag.ll
blob8b86a71b85e8a73ff6f2c63c0e3f7b98b1aee508
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt < %s  -loop-vectorize -force-vector-width=4 -S | FileCheck %s
4 ; The function finds the smallest value from a float vector.
5 ; Check if vectorization is enabled by instruction flag `fcmp nnan`.
7 define float @minloop(float* nocapture readonly %arg) {
8 ; CHECK-LABEL: @minloop(
9 ; CHECK-NEXT:  top:
10 ; CHECK-NEXT:    [[T:%.*]] = load float, float* [[ARG:%.*]]
11 ; CHECK-NEXT:    br label [[LOOP:%.*]]
12 ; CHECK:       loop:
13 ; CHECK-NEXT:    [[T1:%.*]] = phi i64 [ [[T7:%.*]], [[LOOP]] ], [ 1, [[TOP:%.*]] ]
14 ; CHECK-NEXT:    [[T2:%.*]] = phi float [ [[T6:%.*]], [[LOOP]] ], [ [[T]], [[TOP]] ]
15 ; CHECK-NEXT:    [[T3:%.*]] = getelementptr float, float* [[ARG]], i64 [[T1]]
16 ; CHECK-NEXT:    [[T4:%.*]] = load float, float* [[T3]], align 4
17 ; CHECK-NEXT:    [[T5:%.*]] = fcmp nnan olt float [[T2]], [[T4]]
18 ; CHECK-NEXT:    [[T6]] = select i1 [[T5]], float [[T2]], float [[T4]]
19 ; CHECK-NEXT:    [[T7]] = add i64 [[T1]], 1
20 ; CHECK-NEXT:    [[T8:%.*]] = icmp eq i64 [[T7]], 65537
21 ; CHECK-NEXT:    br i1 [[T8]], label [[OUT:%.*]], label [[LOOP]]
22 ; CHECK:       out:
23 ; CHECK-NEXT:    [[T6_LCSSA:%.*]] = phi float [ [[T6]], [[LOOP]] ]
24 ; CHECK-NEXT:    ret float [[T6_LCSSA]]
26 top:
27   %t = load float, float* %arg
28   br label %loop
30 loop:                                             ; preds = %loop, %top
31   %t1 = phi i64 [ %t7, %loop ], [ 1, %top ]
32   %t2 = phi float [ %t6, %loop ], [ %t, %top ]
33   %t3 = getelementptr float, float* %arg, i64 %t1
34   %t4 = load float, float* %t3, align 4
35   %t5 = fcmp nnan olt float %t2, %t4
36   %t6 = select i1 %t5, float %t2, float %t4
37   %t7 = add i64 %t1, 1
38   %t8 = icmp eq i64 %t7, 65537
39   br i1 %t8, label %out, label %loop
41 out:                                              ; preds = %loop
42   ret float %t6
45 ; Check if vectorization is still enabled by function attribute.
47 define float @minloopattr(float* nocapture readonly %arg) #0 {
48 ; CHECK-LABEL: @minloopattr(
49 ; CHECK-NEXT:  top:
50 ; CHECK-NEXT:    [[T:%.*]] = load float, float* [[ARG:%.*]]
51 ; CHECK-NEXT:    br i1 false, label [[SCALAR_PH:%.*]], label [[VECTOR_PH:%.*]]
52 ; CHECK:       vector.ph:
53 ; CHECK-NEXT:    [[MINMAX_IDENT_SPLATINSERT:%.*]] = insertelement <4 x float> undef, float [[T]], i32 0
54 ; CHECK-NEXT:    [[MINMAX_IDENT_SPLAT:%.*]] = shufflevector <4 x float> [[MINMAX_IDENT_SPLATINSERT]], <4 x float> undef, <4 x i32> zeroinitializer
55 ; CHECK-NEXT:    br label [[VECTOR_BODY:%.*]]
56 ; CHECK:       vector.body:
57 ; CHECK-NEXT:    [[INDEX:%.*]] = phi i64 [ 0, [[VECTOR_PH]] ], [ [[INDEX_NEXT:%.*]], [[VECTOR_BODY]] ]
58 ; CHECK-NEXT:    [[VEC_PHI:%.*]] = phi <4 x float> [ [[MINMAX_IDENT_SPLAT]], [[VECTOR_PH]] ], [ [[TMP6:%.*]], [[VECTOR_BODY]] ]
59 ; CHECK-NEXT:    [[OFFSET_IDX:%.*]] = add i64 1, [[INDEX]]
60 ; CHECK-NEXT:    [[BROADCAST_SPLATINSERT:%.*]] = insertelement <4 x i64> undef, i64 [[OFFSET_IDX]], i32 0
61 ; CHECK-NEXT:    [[BROADCAST_SPLAT:%.*]] = shufflevector <4 x i64> [[BROADCAST_SPLATINSERT]], <4 x i64> undef, <4 x i32> zeroinitializer
62 ; CHECK-NEXT:    [[INDUCTION:%.*]] = add <4 x i64> [[BROADCAST_SPLAT]], <i64 0, i64 1, i64 2, i64 3>
63 ; CHECK-NEXT:    [[TMP0:%.*]] = add i64 [[OFFSET_IDX]], 0
64 ; CHECK-NEXT:    [[TMP1:%.*]] = getelementptr float, float* [[ARG]], i64 [[TMP0]]
65 ; CHECK-NEXT:    [[TMP2:%.*]] = getelementptr float, float* [[TMP1]], i32 0
66 ; CHECK-NEXT:    [[TMP3:%.*]] = bitcast float* [[TMP2]] to <4 x float>*
67 ; CHECK-NEXT:    [[WIDE_LOAD:%.*]] = load <4 x float>, <4 x float>* [[TMP3]], align 4
68 ; CHECK-NEXT:    [[TMP4:%.*]] = fcmp olt <4 x float> [[VEC_PHI]], [[WIDE_LOAD]]
69 ; CHECK-NEXT:    [[TMP5:%.*]] = extractelement <4 x i1> [[TMP4]], i32 0
70 ; CHECK-NEXT:    [[TMP6]] = select <4 x i1> [[TMP4]], <4 x float> [[VEC_PHI]], <4 x float> [[WIDE_LOAD]]
71 ; CHECK-NEXT:    [[INDEX_NEXT]] = add i64 [[INDEX]], 4
72 ; CHECK-NEXT:    [[TMP7:%.*]] = icmp eq i64 [[INDEX_NEXT]], 65536
73 ; CHECK-NEXT:    br i1 [[TMP7]], label [[MIDDLE_BLOCK:%.*]], label [[VECTOR_BODY]], !llvm.loop !0
74 ; CHECK:       middle.block:
75 ; CHECK-NEXT:    [[RDX_SHUF:%.*]] = shufflevector <4 x float> [[TMP6]], <4 x float> undef, <4 x i32> <i32 2, i32 3, i32 undef, i32 undef>
76 ; CHECK-NEXT:    [[RDX_MINMAX_CMP:%.*]] = fcmp fast olt <4 x float> [[TMP6]], [[RDX_SHUF]]
77 ; CHECK-NEXT:    [[RDX_MINMAX_SELECT:%.*]] = select fast <4 x i1> [[RDX_MINMAX_CMP]], <4 x float> [[TMP6]], <4 x float> [[RDX_SHUF]]
78 ; CHECK-NEXT:    [[RDX_SHUF1:%.*]] = shufflevector <4 x float> [[RDX_MINMAX_SELECT]], <4 x float> undef, <4 x i32> <i32 1, i32 undef, i32 undef, i32 undef>
79 ; CHECK-NEXT:    [[RDX_MINMAX_CMP2:%.*]] = fcmp fast olt <4 x float> [[RDX_MINMAX_SELECT]], [[RDX_SHUF1]]
80 ; CHECK-NEXT:    [[RDX_MINMAX_SELECT3:%.*]] = select fast <4 x i1> [[RDX_MINMAX_CMP2]], <4 x float> [[RDX_MINMAX_SELECT]], <4 x float> [[RDX_SHUF1]]
81 ; CHECK-NEXT:    [[TMP8:%.*]] = extractelement <4 x float> [[RDX_MINMAX_SELECT3]], i32 0
82 ; CHECK-NEXT:    [[CMP_N:%.*]] = icmp eq i64 65536, 65536
83 ; CHECK-NEXT:    br i1 [[CMP_N]], label [[OUT:%.*]], label [[SCALAR_PH]]
84 ; CHECK:       scalar.ph:
85 ; CHECK-NEXT:    [[BC_RESUME_VAL:%.*]] = phi i64 [ 65537, [[MIDDLE_BLOCK]] ], [ 1, [[TOP:%.*]] ]
86 ; CHECK-NEXT:    [[BC_MERGE_RDX:%.*]] = phi float [ [[T]], [[TOP]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]
87 ; CHECK-NEXT:    br label [[LOOP:%.*]]
88 ; CHECK:       loop:
89 ; CHECK-NEXT:    [[T1:%.*]] = phi i64 [ [[T7:%.*]], [[LOOP]] ], [ [[BC_RESUME_VAL]], [[SCALAR_PH]] ]
90 ; CHECK-NEXT:    [[T2:%.*]] = phi float [ [[T6:%.*]], [[LOOP]] ], [ [[BC_MERGE_RDX]], [[SCALAR_PH]] ]
91 ; CHECK-NEXT:    [[T3:%.*]] = getelementptr float, float* [[ARG]], i64 [[T1]]
92 ; CHECK-NEXT:    [[T4:%.*]] = load float, float* [[T3]], align 4
93 ; CHECK-NEXT:    [[T5:%.*]] = fcmp olt float [[T2]], [[T4]]
94 ; CHECK-NEXT:    [[T6]] = select i1 [[T5]], float [[T2]], float [[T4]]
95 ; CHECK-NEXT:    [[T7]] = add i64 [[T1]], 1
96 ; CHECK-NEXT:    [[T8:%.*]] = icmp eq i64 [[T7]], 65537
97 ; CHECK-NEXT:    br i1 [[T8]], label [[OUT]], label [[LOOP]], !llvm.loop !2
98 ; CHECK:       out:
99 ; CHECK-NEXT:    [[T6_LCSSA:%.*]] = phi float [ [[T6]], [[LOOP]] ], [ [[TMP8]], [[MIDDLE_BLOCK]] ]
100 ; CHECK-NEXT:    ret float [[T6_LCSSA]]
102 top:
103   %t = load float, float* %arg
104   br label %loop
106 loop:                                             ; preds = %loop, %top
107   %t1 = phi i64 [ %t7, %loop ], [ 1, %top ]
108   %t2 = phi float [ %t6, %loop ], [ %t, %top ]
109   %t3 = getelementptr float, float* %arg, i64 %t1
110   %t4 = load float, float* %t3, align 4
111   %t5 = fcmp olt float %t2, %t4
112   %t6 = select i1 %t5, float %t2, float %t4
113   %t7 = add i64 %t1, 1
114   %t8 = icmp eq i64 %t7, 65537
115   br i1 %t8, label %out, label %loop
117 out:                                              ; preds = %loop
118   ret float %t6
121 ; Check if vectorization is prevented without the flag or attribute.
123 define float @minloopnovec(float* nocapture readonly %arg) {
124 ; CHECK-LABEL: @minloopnovec(
125 ; CHECK-NEXT:  top:
126 ; CHECK-NEXT:    [[T:%.*]] = load float, float* [[ARG:%.*]]
127 ; CHECK-NEXT:    br label [[LOOP:%.*]]
128 ; CHECK:       loop:
129 ; CHECK-NEXT:    [[T1:%.*]] = phi i64 [ [[T7:%.*]], [[LOOP]] ], [ 1, [[TOP:%.*]] ]
130 ; CHECK-NEXT:    [[T2:%.*]] = phi float [ [[T6:%.*]], [[LOOP]] ], [ [[T]], [[TOP]] ]
131 ; CHECK-NEXT:    [[T3:%.*]] = getelementptr float, float* [[ARG]], i64 [[T1]]
132 ; CHECK-NEXT:    [[T4:%.*]] = load float, float* [[T3]], align 4
133 ; CHECK-NEXT:    [[T5:%.*]] = fcmp olt float [[T2]], [[T4]]
134 ; CHECK-NEXT:    [[T6]] = select i1 [[T5]], float [[T2]], float [[T4]]
135 ; CHECK-NEXT:    [[T7]] = add i64 [[T1]], 1
136 ; CHECK-NEXT:    [[T8:%.*]] = icmp eq i64 [[T7]], 65537
137 ; CHECK-NEXT:    br i1 [[T8]], label [[OUT:%.*]], label [[LOOP]]
138 ; CHECK:       out:
139 ; CHECK-NEXT:    [[T6_LCSSA:%.*]] = phi float [ [[T6]], [[LOOP]] ]
140 ; CHECK-NEXT:    ret float [[T6_LCSSA]]
142 top:
143   %t = load float, float* %arg
144   br label %loop
146 loop:                                             ; preds = %loop, %top
147   %t1 = phi i64 [ %t7, %loop ], [ 1, %top ]
148   %t2 = phi float [ %t6, %loop ], [ %t, %top ]
149   %t3 = getelementptr float, float* %arg, i64 %t1
150   %t4 = load float, float* %t3, align 4
151   %t5 = fcmp olt float %t2, %t4
152   %t6 = select i1 %t5, float %t2, float %t4
153   %t7 = add i64 %t1, 1
154   %t8 = icmp eq i64 %t7, 65537
155   br i1 %t8, label %out, label %loop
157 out:                                              ; preds = %loop
158   ret float %t6
161 attributes #0 = { "no-nans-fp-math"="true" }