[X86] combineTargetShuffle - commute VPERMV3 shuffles so any load is on the RHS
[llvm-project.git] / llvm / test / CodeGen / SystemZ / int-sub-04.ll
blob5215a32a8967d4d8ab2c5474fb7a8135d62fe332
1 ; Test 64-bit subtraction in which the second operand is variable.
3 ; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z10 | FileCheck %s
4 ; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z196 | FileCheck %s
6 declare i64 @foo()
8 ; Check SGR.
9 define i64 @f1(i64 %a, i64 %b) {
10 ; CHECK-LABEL: f1:
11 ; CHECK: sgr %r2, %r3
12 ; CHECK: br %r14
13   %sub = sub i64 %a, %b
14   ret i64 %sub
17 ; Check SG with no displacement.
18 define i64 @f2(i64 %a, ptr %src) {
19 ; CHECK-LABEL: f2:
20 ; CHECK: sg %r2, 0(%r3)
21 ; CHECK: br %r14
22   %b = load i64, ptr %src
23   %sub = sub i64 %a, %b
24   ret i64 %sub
27 ; Check the high end of the aligned SG range.
28 define i64 @f3(i64 %a, ptr %src) {
29 ; CHECK-LABEL: f3:
30 ; CHECK: sg %r2, 524280(%r3)
31 ; CHECK: br %r14
32   %ptr = getelementptr i64, ptr %src, i64 65535
33   %b = load i64, ptr %ptr
34   %sub = sub i64 %a, %b
35   ret i64 %sub
38 ; Check the next doubleword up, which needs separate address logic.
39 ; Other sequences besides this one would be OK.
40 define i64 @f4(i64 %a, ptr %src) {
41 ; CHECK-LABEL: f4:
42 ; CHECK: agfi %r3, 524288
43 ; CHECK: sg %r2, 0(%r3)
44 ; CHECK: br %r14
45   %ptr = getelementptr i64, ptr %src, i64 65536
46   %b = load i64, ptr %ptr
47   %sub = sub i64 %a, %b
48   ret i64 %sub
51 ; Check the high end of the negative aligned SG range.
52 define i64 @f5(i64 %a, ptr %src) {
53 ; CHECK-LABEL: f5:
54 ; CHECK: sg %r2, -8(%r3)
55 ; CHECK: br %r14
56   %ptr = getelementptr i64, ptr %src, i64 -1
57   %b = load i64, ptr %ptr
58   %sub = sub i64 %a, %b
59   ret i64 %sub
62 ; Check the low end of the SG range.
63 define i64 @f6(i64 %a, ptr %src) {
64 ; CHECK-LABEL: f6:
65 ; CHECK: sg %r2, -524288(%r3)
66 ; CHECK: br %r14
67   %ptr = getelementptr i64, ptr %src, i64 -65536
68   %b = load i64, ptr %ptr
69   %sub = sub i64 %a, %b
70   ret i64 %sub
73 ; Check the next doubleword down, which needs separate address logic.
74 ; Other sequences besides this one would be OK.
75 define i64 @f7(i64 %a, ptr %src) {
76 ; CHECK-LABEL: f7:
77 ; CHECK: agfi %r3, -524296
78 ; CHECK: sg %r2, 0(%r3)
79 ; CHECK: br %r14
80   %ptr = getelementptr i64, ptr %src, i64 -65537
81   %b = load i64, ptr %ptr
82   %sub = sub i64 %a, %b
83   ret i64 %sub
86 ; Check that SG allows an index.
87 define i64 @f8(i64 %a, i64 %src, i64 %index) {
88 ; CHECK-LABEL: f8:
89 ; CHECK: sg %r2, 524280({{%r4,%r3|%r3,%r4}})
90 ; CHECK: br %r14
91   %add1 = add i64 %src, %index
92   %add2 = add i64 %add1, 524280
93   %ptr = inttoptr i64 %add2 to ptr
94   %b = load i64, ptr %ptr
95   %sub = sub i64 %a, %b
96   ret i64 %sub
99 ; Check that subtractions of spilled values can use SG rather than SGR.
100 define i64 @f9(ptr %ptr0) {
101 ; CHECK-LABEL: f9:
102 ; CHECK: brasl %r14, foo@PLT
103 ; CHECK: sg %r2, 160(%r15)
104 ; CHECK: br %r14
105   %ptr1 = getelementptr i64, ptr %ptr0, i64 2
106   %ptr2 = getelementptr i64, ptr %ptr0, i64 4
107   %ptr3 = getelementptr i64, ptr %ptr0, i64 6
108   %ptr4 = getelementptr i64, ptr %ptr0, i64 8
109   %ptr5 = getelementptr i64, ptr %ptr0, i64 10
110   %ptr6 = getelementptr i64, ptr %ptr0, i64 12
111   %ptr7 = getelementptr i64, ptr %ptr0, i64 14
112   %ptr8 = getelementptr i64, ptr %ptr0, i64 16
113   %ptr9 = getelementptr i64, ptr %ptr0, i64 18
115   %val0 = load i64, ptr %ptr0
116   %val1 = load i64, ptr %ptr1
117   %val2 = load i64, ptr %ptr2
118   %val3 = load i64, ptr %ptr3
119   %val4 = load i64, ptr %ptr4
120   %val5 = load i64, ptr %ptr5
121   %val6 = load i64, ptr %ptr6
122   %val7 = load i64, ptr %ptr7
123   %val8 = load i64, ptr %ptr8
124   %val9 = load i64, ptr %ptr9
126   %ret = call i64 @foo()
128   %sub0 = sub i64 %ret, %val0
129   %sub1 = sub i64 %sub0, %val1
130   %sub2 = sub i64 %sub1, %val2
131   %sub3 = sub i64 %sub2, %val3
132   %sub4 = sub i64 %sub3, %val4
133   %sub5 = sub i64 %sub4, %val5
134   %sub6 = sub i64 %sub5, %val6
135   %sub7 = sub i64 %sub6, %val7
136   %sub8 = sub i64 %sub7, %val8
137   %sub9 = sub i64 %sub8, %val9
139   ret i64 %sub9