1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-unknown | FileCheck %s
4 define i128 @sub128(i128 %a, i128 %b) nounwind {
6 ; CHECK: # %bb.0: # %entry
7 ; CHECK-NEXT: movq %rdi, %rax
8 ; CHECK-NEXT: subq %rdx, %rax
9 ; CHECK-NEXT: sbbq %rcx, %rsi
10 ; CHECK-NEXT: movq %rsi, %rdx
17 define i256 @sub256(i256 %a, i256 %b) nounwind {
18 ; CHECK-LABEL: sub256:
19 ; CHECK: # %bb.0: # %entry
20 ; CHECK-NEXT: movq %rdi, %rax
21 ; CHECK-NEXT: subq %r9, %rsi
22 ; CHECK-NEXT: sbbq {{[0-9]+}}(%rsp), %rdx
23 ; CHECK-NEXT: sbbq {{[0-9]+}}(%rsp), %rcx
24 ; CHECK-NEXT: sbbq {{[0-9]+}}(%rsp), %r8
25 ; CHECK-NEXT: movq %rdx, 8(%rdi)
26 ; CHECK-NEXT: movq %rsi, (%rdi)
27 ; CHECK-NEXT: movq %rcx, 16(%rdi)
28 ; CHECK-NEXT: movq %r8, 24(%rdi)
35 %S = type { [4 x i64] }
37 define %S @negate(%S* nocapture readonly %this) {
38 ; CHECK-LABEL: negate:
39 ; CHECK: # %bb.0: # %entry
40 ; CHECK-NEXT: movq %rdi, %rax
41 ; CHECK-NEXT: xorl %r8d, %r8d
42 ; CHECK-NEXT: xorl %edx, %edx
43 ; CHECK-NEXT: subq (%rsi), %rdx
44 ; CHECK-NEXT: movl $0, %edi
45 ; CHECK-NEXT: sbbq 8(%rsi), %rdi
46 ; CHECK-NEXT: movl $0, %ecx
47 ; CHECK-NEXT: sbbq 16(%rsi), %rcx
48 ; CHECK-NEXT: sbbq 24(%rsi), %r8
49 ; CHECK-NEXT: movq %rdx, (%rax)
50 ; CHECK-NEXT: movq %rdi, 8(%rax)
51 ; CHECK-NEXT: movq %rcx, 16(%rax)
52 ; CHECK-NEXT: movq %r8, 24(%rax)
55 %0 = getelementptr inbounds %S, %S* %this, i64 0, i32 0, i64 0
56 %1 = load i64, i64* %0, align 8
58 %3 = zext i64 %2 to i128
59 %4 = add nuw nsw i128 %3, 1
60 %5 = trunc i128 %4 to i64
62 %7 = getelementptr inbounds %S, %S* %this, i64 0, i32 0, i64 1
63 %8 = load i64, i64* %7, align 8
65 %10 = zext i64 %9 to i128
66 %11 = add nuw nsw i128 %6, %10
67 %12 = trunc i128 %11 to i64
68 %13 = lshr i128 %11, 64
69 %14 = getelementptr inbounds %S, %S* %this, i64 0, i32 0, i64 2
70 %15 = load i64, i64* %14, align 8
72 %17 = zext i64 %16 to i128
73 %18 = add nuw nsw i128 %13, %17
74 %19 = lshr i128 %18, 64
75 %20 = trunc i128 %18 to i64
76 %21 = getelementptr inbounds %S, %S* %this, i64 0, i32 0, i64 3
77 %22 = load i64, i64* %21, align 8
79 %24 = zext i64 %23 to i128
80 %25 = add nuw nsw i128 %19, %24
81 %26 = trunc i128 %25 to i64
82 %27 = insertvalue [4 x i64] undef, i64 %5, 0
83 %28 = insertvalue [4 x i64] %27, i64 %12, 1
84 %29 = insertvalue [4 x i64] %28, i64 %20, 2
85 %30 = insertvalue [4 x i64] %29, i64 %26, 3
86 %31 = insertvalue %S undef, [4 x i64] %30, 0
90 define %S @sub(%S* nocapture readonly %this, %S %arg.b) local_unnamed_addr {
92 ; CHECK: # %bb.0: # %entry
93 ; CHECK-NEXT: movq %rdi, %rax
94 ; CHECK-NEXT: movq (%rsi), %r10
95 ; CHECK-NEXT: movq 8(%rsi), %rdi
96 ; CHECK-NEXT: subq %rdx, %r10
97 ; CHECK-NEXT: setae %dl
98 ; CHECK-NEXT: addb $-1, %dl
99 ; CHECK-NEXT: adcq $0, %rdi
100 ; CHECK-NEXT: setb %dl
101 ; CHECK-NEXT: movzbl %dl, %r11d
102 ; CHECK-NEXT: notq %rcx
103 ; CHECK-NEXT: addq %rdi, %rcx
104 ; CHECK-NEXT: adcq 16(%rsi), %r11
105 ; CHECK-NEXT: setb %dl
106 ; CHECK-NEXT: movzbl %dl, %edx
107 ; CHECK-NEXT: notq %r8
108 ; CHECK-NEXT: addq %r11, %r8
109 ; CHECK-NEXT: adcq 24(%rsi), %rdx
110 ; CHECK-NEXT: notq %r9
111 ; CHECK-NEXT: addq %rdx, %r9
112 ; CHECK-NEXT: movq %r10, (%rax)
113 ; CHECK-NEXT: movq %rcx, 8(%rax)
114 ; CHECK-NEXT: movq %r8, 16(%rax)
115 ; CHECK-NEXT: movq %r9, 24(%rax)
118 %0 = extractvalue %S %arg.b, 0
119 %.elt6 = extractvalue [4 x i64] %0, 1
120 %.elt8 = extractvalue [4 x i64] %0, 2
121 %.elt10 = extractvalue [4 x i64] %0, 3
122 %.elt = extractvalue [4 x i64] %0, 0
123 %1 = getelementptr inbounds %S, %S* %this, i64 0, i32 0, i64 0
124 %2 = load i64, i64* %1, align 8
125 %3 = zext i64 %2 to i128
126 %4 = add nuw nsw i128 %3, 1
127 %5 = xor i64 %.elt, -1
128 %6 = zext i64 %5 to i128
129 %7 = add nuw nsw i128 %4, %6
130 %8 = trunc i128 %7 to i64
131 %9 = lshr i128 %7, 64
132 %10 = getelementptr inbounds %S, %S* %this, i64 0, i32 0, i64 1
133 %11 = load i64, i64* %10, align 8
134 %12 = zext i64 %11 to i128
135 %13 = add nuw nsw i128 %9, %12
136 %14 = xor i64 %.elt6, -1
137 %15 = zext i64 %14 to i128
138 %16 = add nuw nsw i128 %13, %15
139 %17 = trunc i128 %16 to i64
140 %18 = lshr i128 %16, 64
141 %19 = getelementptr inbounds %S, %S* %this, i64 0, i32 0, i64 2
142 %20 = load i64, i64* %19, align 8
143 %21 = zext i64 %20 to i128
144 %22 = add nuw nsw i128 %18, %21
145 %23 = xor i64 %.elt8, -1
146 %24 = zext i64 %23 to i128
147 %25 = add nuw nsw i128 %22, %24
148 %26 = lshr i128 %25, 64
149 %27 = trunc i128 %25 to i64
150 %28 = getelementptr inbounds %S, %S* %this, i64 0, i32 0, i64 3
151 %29 = load i64, i64* %28, align 8
152 %30 = zext i64 %29 to i128
153 %31 = add nuw nsw i128 %26, %30
154 %32 = xor i64 %.elt10, -1
155 %33 = zext i64 %32 to i128
156 %34 = add nuw nsw i128 %31, %33
157 %35 = trunc i128 %34 to i64
158 %36 = insertvalue [4 x i64] undef, i64 %8, 0
159 %37 = insertvalue [4 x i64] %36, i64 %17, 1
160 %38 = insertvalue [4 x i64] %37, i64 %27, 2
161 %39 = insertvalue [4 x i64] %38, i64 %35, 3
162 %40 = insertvalue %S undef, [4 x i64] %39, 0
166 declare {i64, i1} @llvm.uadd.with.overflow(i64, i64)
167 declare {i64, i1} @llvm.usub.with.overflow(i64, i64)
169 define i64 @sub_from_carry(i64 %x, i64 %y, i64* %valout, i64 %z) {
170 ; CHECK-LABEL: sub_from_carry:
172 ; CHECK-NEXT: movq %rcx, %rax
173 ; CHECK-NEXT: negq %rax
174 ; CHECK-NEXT: addq %rsi, %rdi
175 ; CHECK-NEXT: movq %rdi, (%rdx)
176 ; CHECK-NEXT: adcq $0, %rax
178 %agg = call {i64, i1} @llvm.uadd.with.overflow(i64 %x, i64 %y)
179 %val = extractvalue {i64, i1} %agg, 0
180 %ov = extractvalue {i64, i1} %agg, 1
181 store i64 %val, i64* %valout, align 4
182 %carry = zext i1 %ov to i64
183 %res = sub i64 %carry, %z