Re-land [openmp] Fix warnings when building on Windows with latest MSVC or Clang...
[llvm-project.git] / llvm / test / Transforms / LoopVectorize / vplan-widen-call-instruction.ll
blob3335c21c8d745718a2b7a834fcce2306f8903dad
1 ; RUN: opt -passes=loop-vectorize -force-vector-width=4 -enable-vplan-native-path -S %s | FileCheck %s
3 ; Test that VPlan native path is able to widen call intructions like
4 ; llvm.sqrt.* intrincis calls.
6 declare double @llvm.sqrt.f64(double %0)
7 define void @widen_call_instruction(ptr noalias nocapture readonly %a.in, ptr noalias nocapture readonly %b.in, ptr noalias nocapture %c.out) {
8 ; CHECK-LABEL: @widen_call_instruction(
10 ; CHECK: vector.body:
11 ; CHECK-NEXT: %[[FOR1_INDEX:.*]] = phi i64 [ 0, %[[LABEL_PR:.*]] ], [ %{{.*}}, %[[LABEL_FOR1_LATCH:.*]] ]
12 ; CHECK: %[[VEC_INDEX:.*]] = phi <4 x i64> [ <i64 0, i64 1, i64 2, i64 3>, %[[LABEL_PR]] ], [ %{{.*}}, %[[LABEL_FOR1_LATCH]] ]
13 ; CHECK-NEXT: %[[A_PTR:.*]] = getelementptr inbounds double, ptr %a.in, <4 x i64> %[[VEC_INDEX]]
14 ; CHECK-NEXT: %[[MASKED_GATHER1:.*]] = call <4 x double> @llvm.masked.gather.v4f64.v4p0(<4 x ptr> %[[A_PTR]], i32 8, <4 x i1> <i1 true, i1 true, i1 true, i1 true>, <4 x double> poison)
15 ; CHECK-NEXT: %[[B_PTR:.*]] = getelementptr inbounds double, ptr %b.in, <4 x i64> %[[VEC_INDEX]]
16 ; CHECK-NEXT: %[[MASKED_GATHER2:.*]] = call <4 x double> @llvm.masked.gather.v4f64.v4p0(<4 x ptr> %[[B_PTR]], i32 8, <4 x i1> <i1 true, i1 true, i1 true, i1 true>, <4 x double> poison)
17 ; CHECK-NEXT: %[[B_SQRT:.*]] = call <4 x double> @llvm.sqrt.v4f64(<4 x double> %[[MASKED_GATHER2]])
18 ; CHECK-NEXT: br label %[[FOR2_HEADER:.*]]
20 ; CHECK: [[FOR2_HEADER]]:
21 ; CHECK-NEXT: %[[FOR2_INDEX:.*]] = phi <4 x i32> [ zeroinitializer, %vector.body ], [ %[[FOR2_INDEX_NEXT:.*]], %[[FOR2_HEADER]] ]
22 ; CHECK-NEXT: %[[REDUCTION:.*]] = phi <4 x double> [ %[[MASKED_GATHER1]], %vector.body ], [ %[[REDUCTION_NEXT:.*]], %[[FOR2_HEADER]] ]
23 ; CHECK-NEXT: %[[REDUCTION_NEXT]] = fadd <4 x double> %[[B_SQRT]], %[[REDUCTION]]
24 ; CHECK-NEXT: %[[FOR2_INDEX_NEXT]] = add nuw nsw <4 x i32> %[[FOR2_INDEX]], <i32 1, i32 1, i32 1, i32 1>
25 ; CHECK-NEXT: %[[VEC_PTR:.*]] = icmp eq <4 x i32> %[[FOR2_INDEX_NEXT]], <i32 10000, i32 10000, i32 10000, i32 10000>
26 ; CHECK-NEXT: %[[EXIT_COND:.*]] = extractelement <4 x i1> %[[VEC_PTR]], i32 0
27 ; CHECK-NEXT: br i1 %[[EXIT_COND]], label %[[FOR1_LATCH:.*]], label %{{.*}}
29 ; CHECK: [[FOR1_LATCH]]:
30 ; CHECK-NEXT: %[[REDUCTION:.*]] = phi <4 x double> [ %[[REDUCTION_NEXT]], %[[FOR2_HEADER]] ]
31 ; CHECK-NEXT: %[[C_PTR:.*]] = getelementptr inbounds double, ptr %c.out, <4 x i64> %[[VEC_INDEX]]
32 ; CHECK-NEXT: call void @llvm.masked.scatter.v4f64.v4p0(<4 x double> %[[REDUCTION]], <4 x ptr> %[[C_PTR]], i32 8, <4 x i1> <i1 true, i1 true, i1 true, i1 true>)
33 ; CHECK-NEXT: %[[VEC_INDEX_NEXT:.*]] = add nuw nsw <4 x i64> %[[VEC_INDEX]], <i64 1, i64 1, i64 1, i64 1>
34 ; CHECK-NEXT: %[[VEC_PTR:.*]] = icmp eq <4 x i64> %[[VEC_INDEX_NEXT]], <i64 1000, i64 1000, i64 1000, i64 1000>
35 ; CHECK-NEXT: %[[FOR1_INDEX_NEXT:.*]] = add nuw i64 %[[FOR1_INDEX]], 4
36 ; CHECK-NEXT: %{{.*}} = add <4 x i64> %[[VEC_INDEX]], <i64 4, i64 4, i64 4, i64 4>
37 ; CHECK-NEXT: %[[EXIT_COND:.*]] = icmp eq i64 %[[FOR1_INDEX_NEXT]], 1000
38 ; CHECK-NEXT: br i1 %[[EXIT_COND]], label %{{.*}}, label %vector.body
40 entry:
41   br label %for1.header
43 for1.header:
44   %indvar1 = phi i64 [ 0, %entry ], [ %indvar11, %for1.latch ]
45   %a.ptr = getelementptr inbounds double, ptr %a.in, i64 %indvar1
46   %a = load double, ptr %a.ptr, align 8
47   %b.ptr = getelementptr inbounds double, ptr %b.in, i64 %indvar1
48   %b = load double, ptr %b.ptr, align 8
49   %b.sqrt = call double @llvm.sqrt.f64(double %b)
50   br label %for2.header
52 for2.header:
53   %indvar2 = phi i32 [ 0, %for1.header ], [ %indvar21, %for2.header ]
54   %a.reduction = phi double [ %a, %for1.header ], [ %a.reduction1, %for2.header ]
55   %a.reduction1 = fadd double %b.sqrt, %a.reduction
56   %indvar21 = add nuw nsw i32 %indvar2, 1
57   %for2.cond = icmp eq i32 %indvar21, 10000
58   br i1 %for2.cond, label %for1.latch, label %for2.header
60 for1.latch:
61   %c.ptr = getelementptr inbounds double, ptr %c.out, i64 %indvar1
62   store double %a.reduction1, ptr %c.ptr, align 8
63   %indvar11 = add nuw nsw i64 %indvar1, 1
64   %for1.cond = icmp eq i64 %indvar11, 1000
65   br i1 %for1.cond, label %exit, label %for1.header, !llvm.loop !0
67 exit:
68   ret void
71 !0 = distinct !{!0, !1}
72 !1 = !{!"llvm.loop.vectorize.enable", i1 true}