[ORC] Add std::tuple support to SimplePackedSerialization.
[llvm-project.git] / llvm / test / CodeGen / NVPTX / fast-math.ll
bloba29d70a0b55bd61bb08d1e80221c641a4b92b88d
1 ; RUN: llc < %s -march=nvptx -mcpu=sm_20 | FileCheck %s
3 declare float @llvm.sqrt.f32(float)
4 declare double @llvm.sqrt.f64(double)
6 ; CHECK-LABEL: sqrt_div(
7 ; CHECK: sqrt.rn.f32
8 ; CHECK: div.rn.f32
9 define float @sqrt_div(float %a, float %b) {
10   %t1 = tail call float @llvm.sqrt.f32(float %a)
11   %t2 = fdiv float %t1, %b
12   ret float %t2
15 ; CHECK-LABEL: sqrt_div_fast(
16 ; CHECK: sqrt.rn.f32
17 ; CHECK: div.approx.f32
18 define float @sqrt_div_fast(float %a, float %b) #0 {
19   %t1 = tail call float @llvm.sqrt.f32(float %a)
20   %t2 = fdiv float %t1, %b
21   ret float %t2
24 ; CHECK-LABEL: sqrt_div_fast_ninf(
25 ; CHECK: sqrt.approx.f32
26 ; CHECK: div.approx.f32
27 define float @sqrt_div_fast_ninf(float %a, float %b) #0 {
28   %t1 = tail call ninf afn float @llvm.sqrt.f32(float %a)
29   %t2 = fdiv float %t1, %b
30   ret float %t2
33 ; CHECK-LABEL: sqrt_div_ftz(
34 ; CHECK: sqrt.rn.ftz.f32
35 ; CHECK: div.rn.ftz.f32
36 define float @sqrt_div_ftz(float %a, float %b) #1 {
37   %t1 = tail call float @llvm.sqrt.f32(float %a)
38   %t2 = fdiv float %t1, %b
39   ret float %t2
42 ; CHECK-LABEL: sqrt_div_fast_ftz(
43 ; CHECK: sqrt.rn.ftz.f32
44 ; CHECK: div.approx.ftz.f32
45 define float @sqrt_div_fast_ftz(float %a, float %b) #0 #1 {
46   %t1 = tail call float @llvm.sqrt.f32(float %a)
47   %t2 = fdiv float %t1, %b
48   ret float %t2
51 ; CHECK-LABEL: sqrt_div_fast_ftz_ninf(
52 ; CHECK: sqrt.approx.ftz.f32
53 ; CHECK: div.approx.ftz.f32
54 define float @sqrt_div_fast_ftz_ninf(float %a, float %b) #0 #1 {
55   %t1 = tail call ninf afn float @llvm.sqrt.f32(float %a)
56   %t2 = fdiv float %t1, %b
57   ret float %t2
60 ; There are no fast-math or ftz versions of sqrt and div for f64.  We use
61 ; reciprocal(rsqrt(x)) for sqrt(x), and emit a vanilla divide.
63 ; CHECK-LABEL: sqrt_div_fast_ftz_f64(
64 ; CHECK: sqrt.rn.f64
65 ; CHECK: div.rn.f64
66 define double @sqrt_div_fast_ftz_f64(double %a, double %b) #0 #1 {
67   %t1 = tail call double @llvm.sqrt.f64(double %a)
68   %t2 = fdiv double %t1, %b
69   ret double %t2
72 ; CHECK-LABEL: sqrt_div_fast_ftz_f64_ninf(
73 ; CHECK: rsqrt.approx.f64
74 ; CHECK: rcp.approx.ftz.f64
75 ; CHECK: div.rn.f64
76 define double @sqrt_div_fast_ftz_f64_ninf(double %a, double %b) #0 #1 {
77   %t1 = tail call ninf afn double @llvm.sqrt.f64(double %a)
78   %t2 = fdiv double %t1, %b
79   ret double %t2
82 ; CHECK-LABEL: rsqrt(
83 ; CHECK-NOT: rsqrt.approx
84 ; CHECK: sqrt.rn.f32
85 ; CHECK-NOT: rsqrt.approx
86 define float @rsqrt(float %a) {
87   %b = tail call float @llvm.sqrt.f32(float %a)
88   %ret = fdiv float 1.0, %b
89   ret float %ret
92 ; CHECK-LABEL: rsqrt_fast(
93 ; CHECK-NOT: div.
94 ; CHECK-NOT: sqrt.
95 ; CHECK: rsqrt.approx.f32
96 ; CHECK-NOT: div.
97 ; CHECK-NOT: sqrt.
98 define float @rsqrt_fast(float %a) #0 {
99   %b = tail call float @llvm.sqrt.f32(float %a)
100   %ret = fdiv float 1.0, %b
101   ret float %ret
104 ; CHECK-LABEL: rsqrt_fast_ftz(
105 ; CHECK-NOT: div.
106 ; CHECK-NOT: sqrt.
107 ; CHECK: rsqrt.approx.ftz.f32
108 ; CHECK-NOT: div.
109 ; CHECK-NOT: sqrt.
110 define float @rsqrt_fast_ftz(float %a) #0 #1 {
111   %b = tail call float @llvm.sqrt.f32(float %a)
112   %ret = fdiv float 1.0, %b
113   ret float %ret
116 ; CHECK-LABEL: fadd
117 ; CHECK: add.rn.f32
118 define float @fadd(float %a, float %b) {
119   %t1 = fadd float %a, %b
120   ret float %t1
123 ; CHECK-LABEL: fadd_ftz
124 ; CHECK: add.rn.ftz.f32
125 define float @fadd_ftz(float %a, float %b) #1 {
126   %t1 = fadd float %a, %b
127   ret float %t1
130 declare float @llvm.sin.f32(float)
131 declare float @llvm.cos.f32(float)
133 ; CHECK-LABEL: fsin_approx
134 ; CHECK:       sin.approx.f32
135 define float @fsin_approx(float %a) #0 {
136   %r = tail call float @llvm.sin.f32(float %a)
137   ret float %r
140 ; CHECK-LABEL: fcos_approx
141 ; CHECK:       cos.approx.f32
142 define float @fcos_approx(float %a) #0 {
143   %r = tail call float @llvm.cos.f32(float %a)
144   ret float %r
147 ; CHECK-LABEL: repeated_div_recip_allowed
148 define float @repeated_div_recip_allowed(i1 %pred, float %a, float %b, float %divisor) {
149 ; CHECK: rcp.rn.f32
150 ; CHECK: mul.rn.f32
151 ; CHECK: mul.rn.f32
152 ; CHECK: mul.rn.f32
153 ; CHECK: selp.f32
154   %x = fdiv arcp float %a, %divisor
155   %y = fdiv arcp float %b, %divisor
156   %z = fmul float %x, %y
157   %w = select i1 %pred, float %z, float %y
158   ret float %w
161 ; CHECK-LABEL: repeated_div_recip_allowed_sel
162 define float @repeated_div_recip_allowed_sel(i1 %pred, float %a, float %b, float %divisor) {
163 ; CHECK: selp.f32
164 ; CHECK: div.rn.f32
165   %x = fdiv arcp float %a, %divisor
166   %y = fdiv arcp float %b, %divisor
167   %w = select i1 %pred, float %x, float %y
168   ret float %w
171 ; CHECK-LABEL: repeated_div_recip_allowed_ftz
172 define float @repeated_div_recip_allowed_ftz(i1 %pred, float %a, float %b, float %divisor) #1 {
173 ; CHECK: rcp.rn.ftz.f32
174 ; CHECK: mul.rn.ftz.f32
175 ; CHECK: mul.rn.ftz.f32
176 ; CHECK: mul.rn.ftz.f32
177 ; CHECK: selp.f32
178   %x = fdiv arcp float %a, %divisor
179   %y = fdiv arcp float %b, %divisor
180   %z = fmul float %x, %y
181   %w = select i1 %pred, float %z, float %y
182   ret float %w
185 ; CHECK-LABEL: repeated_div_recip_allowed_ftz_sel
186 define float @repeated_div_recip_allowed_ftz_sel(i1 %pred, float %a, float %b, float %divisor) #1 {
187 ; CHECK: selp.f32
188 ; CHECK: div.rn.ftz.f32
189   %x = fdiv arcp float %a, %divisor
190   %y = fdiv arcp float %b, %divisor
191   %w = select i1 %pred, float %x, float %y
192   ret float %w
195 ; CHECK-LABEL: repeated_div_fast
196 define float @repeated_div_fast(i1 %pred, float %a, float %b, float %divisor) #0 {
197 ; CHECK: rcp.approx.f32
198 ; CHECK: mul.f32
199 ; CHECK: mul.f32
200 ; CHECK: mul.f32
201 ; CHECK: selp.f32
202   %x = fdiv float %a, %divisor
203   %y = fdiv float %b, %divisor
204   %z = fmul float %x, %y
205   %w = select i1 %pred, float %z, float %y
206   ret float %w
209 ; CHECK-LABEL: repeated_div_fast_sel
210 define float @repeated_div_fast_sel(i1 %pred, float %a, float %b, float %divisor) #0 {
211 ; CHECK: selp.f32
212 ; CHECK: div.approx.f32
213   %x = fdiv float %a, %divisor
214   %y = fdiv float %b, %divisor
215   %w = select i1 %pred, float %x, float %y
216   ret float %w
219 ; CHECK-LABEL: repeated_div_fast_ftz
220 define float @repeated_div_fast_ftz(i1 %pred, float %a, float %b, float %divisor) #0 #1 {
221 ; CHECK: rcp.approx.ftz.f32
222 ; CHECK: mul.ftz.f32
223 ; CHECK: mul.ftz.f32
224 ; CHECK: mul.ftz.f32
225 ; CHECK: selp.f32
226   %x = fdiv float %a, %divisor
227   %y = fdiv float %b, %divisor
228   %z = fmul float %x, %y
229   %w = select i1 %pred, float %z, float %y
230   ret float %w
233 ; CHECK-LABEL: repeated_div_fast_ftz_sel
234 define float @repeated_div_fast_ftz_sel(i1 %pred, float %a, float %b, float %divisor) #0 #1 {
235 ; CHECK: selp.f32
236 ; CHECK: div.approx.ftz.f32
237   %x = fdiv float %a, %divisor
238   %y = fdiv float %b, %divisor
239   %w = select i1 %pred, float %x, float %y
240   ret float %w
243 attributes #0 = { "unsafe-fp-math" = "true" }
244 attributes #1 = { "denormal-fp-math-f32" = "preserve-sign" }