[clang][modules] Don't prevent translation of FW_Private includes when explicitly...
[llvm-project.git] / llvm / test / Transforms / PhaseOrdering / X86 / pr38280.ll
blob70b002f766b7537a36e4a5f005630e18590f368e
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt -O2 -S -mtriple=x86_64-- -mattr=+sse2 < %s | FileCheck %s
3 ; RUN: opt -O2 -S -mtriple=x86_64-- -mattr=+avx2 < %s | FileCheck %s
5 ; PR38280 / Issue #37628
6 define void @apply_delta(ptr nocapture noundef %dst, ptr nocapture noundef readonly %src, i64 noundef %neg_offs, i64 noundef %count) {
7 ; CHECK-LABEL: @apply_delta(
8 ; CHECK-NEXT:  entry:
9 ; CHECK-NEXT:    [[CMP21:%.*]] = icmp ugt i64 [[COUNT:%.*]], 7
10 ; CHECK-NEXT:    br i1 [[CMP21]], label [[WHILE_BODY:%.*]], label [[WHILE_COND3_PREHEADER:%.*]]
11 ; CHECK:       while.cond3.preheader:
12 ; CHECK-NEXT:    [[COUNT_ADDR_0_LCSSA:%.*]] = phi i64 [ [[COUNT]], [[ENTRY:%.*]] ], [ [[SUB:%.*]], [[WHILE_BODY]] ]
13 ; CHECK-NEXT:    [[SRC_ADDR_0_LCSSA:%.*]] = phi ptr [ [[SRC:%.*]], [[ENTRY]] ], [ [[ADD_PTR2:%.*]], [[WHILE_BODY]] ]
14 ; CHECK-NEXT:    [[DST_ADDR_0_LCSSA:%.*]] = phi ptr [ [[DST:%.*]], [[ENTRY]] ], [ [[ADD_PTR1:%.*]], [[WHILE_BODY]] ]
15 ; CHECK-NEXT:    [[TOBOOL_NOT27:%.*]] = icmp eq i64 [[COUNT_ADDR_0_LCSSA]], 0
16 ; CHECK-NEXT:    br i1 [[TOBOOL_NOT27]], label [[WHILE_END9:%.*]], label [[WHILE_BODY4:%.*]]
17 ; CHECK:       while.body:
18 ; CHECK-NEXT:    [[DST_ADDR_024:%.*]] = phi ptr [ [[ADD_PTR1]], [[WHILE_BODY]] ], [ [[DST]], [[ENTRY]] ]
19 ; CHECK-NEXT:    [[SRC_ADDR_023:%.*]] = phi ptr [ [[ADD_PTR2]], [[WHILE_BODY]] ], [ [[SRC]], [[ENTRY]] ]
20 ; CHECK-NEXT:    [[COUNT_ADDR_022:%.*]] = phi i64 [ [[SUB]], [[WHILE_BODY]] ], [ [[COUNT]], [[ENTRY]] ]
21 ; CHECK-NEXT:    [[TMP0:%.*]] = load <8 x i8>, ptr [[SRC_ADDR_023]], align 1
22 ; CHECK-NEXT:    [[ADD_PTR:%.*]] = getelementptr inbounds i8, ptr [[DST_ADDR_024]], i64 [[NEG_OFFS:%.*]]
23 ; CHECK-NEXT:    [[TMP1:%.*]] = load <8 x i8>, ptr [[ADD_PTR]], align 1
24 ; CHECK-NEXT:    [[ADD:%.*]] = add <8 x i8> [[TMP1]], [[TMP0]]
25 ; CHECK-NEXT:    store <8 x i8> [[ADD]], ptr [[DST_ADDR_024]], align 1
26 ; CHECK-NEXT:    [[ADD_PTR1]] = getelementptr inbounds i8, ptr [[DST_ADDR_024]], i64 8
27 ; CHECK-NEXT:    [[ADD_PTR2]] = getelementptr inbounds i8, ptr [[SRC_ADDR_023]], i64 8
28 ; CHECK-NEXT:    [[SUB]] = add i64 [[COUNT_ADDR_022]], -8
29 ; CHECK-NEXT:    [[CMP:%.*]] = icmp ugt i64 [[SUB]], 7
30 ; CHECK-NEXT:    br i1 [[CMP]], label [[WHILE_BODY]], label [[WHILE_COND3_PREHEADER]]
31 ; CHECK:       while.body4:
32 ; CHECK-NEXT:    [[DST_ADDR_130:%.*]] = phi ptr [ [[INCDEC_PTR:%.*]], [[WHILE_BODY4]] ], [ [[DST_ADDR_0_LCSSA]], [[WHILE_COND3_PREHEADER]] ]
33 ; CHECK-NEXT:    [[SRC_ADDR_129:%.*]] = phi ptr [ [[INCDEC_PTR8:%.*]], [[WHILE_BODY4]] ], [ [[SRC_ADDR_0_LCSSA]], [[WHILE_COND3_PREHEADER]] ]
34 ; CHECK-NEXT:    [[COUNT_ADDR_128:%.*]] = phi i64 [ [[DEC:%.*]], [[WHILE_BODY4]] ], [ [[COUNT_ADDR_0_LCSSA]], [[WHILE_COND3_PREHEADER]] ]
35 ; CHECK-NEXT:    [[DEC]] = add i64 [[COUNT_ADDR_128]], -1
36 ; CHECK-NEXT:    [[TMP2:%.*]] = load i8, ptr [[SRC_ADDR_129]], align 1
37 ; CHECK-NEXT:    [[ARRAYIDX:%.*]] = getelementptr inbounds i8, ptr [[DST_ADDR_130]], i64 [[NEG_OFFS]]
38 ; CHECK-NEXT:    [[TMP3:%.*]] = load i8, ptr [[ARRAYIDX]], align 1
39 ; CHECK-NEXT:    [[ADD6:%.*]] = add i8 [[TMP3]], [[TMP2]]
40 ; CHECK-NEXT:    store i8 [[ADD6]], ptr [[DST_ADDR_130]], align 1
41 ; CHECK-NEXT:    [[INCDEC_PTR]] = getelementptr inbounds i8, ptr [[DST_ADDR_130]], i64 1
42 ; CHECK-NEXT:    [[INCDEC_PTR8]] = getelementptr inbounds i8, ptr [[SRC_ADDR_129]], i64 1
43 ; CHECK-NEXT:    [[TOBOOL_NOT:%.*]] = icmp eq i64 [[DEC]], 0
44 ; CHECK-NEXT:    br i1 [[TOBOOL_NOT]], label [[WHILE_END9]], label [[WHILE_BODY4]], !llvm.loop [[LOOP0:![0-9]+]]
45 ; CHECK:       while.end9:
46 ; CHECK-NEXT:    ret void
48 entry:
49   %cmp21 = icmp ugt i64 %count, 7
50   br i1 %cmp21, label %while.body.preheader, label %while.cond3.preheader
52 while.body.preheader:
53   br label %while.body
55 while.cond3.preheader.loopexit:
56   %add.ptr1.lcssa = phi ptr [ %add.ptr1, %while.body ]
57   %add.ptr2.lcssa = phi ptr [ %add.ptr2, %while.body ]
58   %sub.lcssa = phi i64 [ %sub, %while.body ]
59   br label %while.cond3.preheader
61 while.cond3.preheader:
62   %count.addr.0.lcssa = phi i64 [ %count, %entry ], [ %sub.lcssa, %while.cond3.preheader.loopexit ]
63   %src.addr.0.lcssa = phi ptr [ %src, %entry ], [ %add.ptr2.lcssa, %while.cond3.preheader.loopexit ]
64   %dst.addr.0.lcssa = phi ptr [ %dst, %entry ], [ %add.ptr1.lcssa, %while.cond3.preheader.loopexit ]
65   %tobool.not27 = icmp eq i64 %count.addr.0.lcssa, 0
66   br i1 %tobool.not27, label %while.end9, label %while.body4.preheader
68 while.body4.preheader:
69   br label %while.body4
71 while.body:
72   %dst.addr.024 = phi ptr [ %add.ptr1, %while.body ], [ %dst, %while.body.preheader ]
73   %src.addr.023 = phi ptr [ %add.ptr2, %while.body ], [ %src, %while.body.preheader ]
74   %count.addr.022 = phi i64 [ %sub, %while.body ], [ %count, %while.body.preheader ]
75   %0 = load <8 x i8>, ptr %src.addr.023, align 1
76   %add.ptr = getelementptr inbounds i8, ptr %dst.addr.024, i64 %neg_offs
77   %1 = load <8 x i8>, ptr %add.ptr, align 1
78   %add = add <8 x i8> %1, %0
79   store <8 x i8> %add, ptr %dst.addr.024, align 1
80   %add.ptr1 = getelementptr inbounds i8, ptr %dst.addr.024, i64 8
81   %add.ptr2 = getelementptr inbounds i8, ptr %src.addr.023, i64 8
82   %sub = add i64 %count.addr.022, -8
83   %cmp = icmp ugt i64 %sub, 7
84   br i1 %cmp, label %while.body, label %while.cond3.preheader.loopexit
86 while.body4:
87   %dst.addr.130 = phi ptr [ %incdec.ptr, %while.body4 ], [ %dst.addr.0.lcssa, %while.body4.preheader ]
88   %src.addr.129 = phi ptr [ %incdec.ptr8, %while.body4 ], [ %src.addr.0.lcssa, %while.body4.preheader ]
89   %count.addr.128 = phi i64 [ %dec, %while.body4 ], [ %count.addr.0.lcssa, %while.body4.preheader ]
90   %dec = add i64 %count.addr.128, -1
91   %2 = load i8, ptr %src.addr.129, align 1
92   %arrayidx = getelementptr inbounds i8, ptr %dst.addr.130, i64 %neg_offs
93   %3 = load i8, ptr %arrayidx, align 1
94   %add6 = add i8 %3, %2
95   store i8 %add6, ptr %dst.addr.130, align 1
96   %incdec.ptr = getelementptr inbounds i8, ptr %dst.addr.130, i64 1
97   %incdec.ptr8 = getelementptr inbounds i8, ptr %src.addr.129, i64 1
98   %tobool.not = icmp eq i64 %dec, 0
99   br i1 %tobool.not, label %while.end9.loopexit, label %while.body4
101 while.end9.loopexit:
102   br label %while.end9
104 while.end9:
105   ret void