Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / packetizer.ll
blob23b72ce458f50515206bf87ae23ea7021180e269
1 ; RUN: llc < %s -march=r600 -mcpu=redwood | FileCheck %s
2 ; RUN: llc < %s -march=r600 -mcpu=cayman | FileCheck %s
4 ; CHECK: {{^}}test:
5 ; CHECK: BIT_ALIGN_INT T{{[0-9]}}.X
6 ; CHECK: BIT_ALIGN_INT T{{[0-9]}}.Y
7 ; CHECK: BIT_ALIGN_INT T{{[0-9]}}.Z
8 ; CHECK: BIT_ALIGN_INT * T{{[0-9]}}.W
10 define amdgpu_kernel void @test(ptr addrspace(1) %out, i32 %x_arg, i32 %y_arg, i32 %z_arg, i32 %w_arg, i32 %e) {
11 entry:
12   %shl = sub i32 32, %e
13   %x = add i32 %x_arg, 1
14   %x.0 = shl i32 %x, %shl
15   %x.1 = lshr i32 %x, %e
16   %x.2 = or i32 %x.0, %x.1
17   %y = add i32 %y_arg, 1
18   %y.0 = shl i32 %y, %shl
19   %y.1 = lshr i32 %y, %e
20   %y.2 = or i32 %y.0, %y.1
21   %z = add i32 %z_arg, 1
22   %z.0 = shl i32 %z, %shl
23   %z.1 = lshr i32 %z, %e
24   %z.2 = or i32 %z.0, %z.1
25   %w = add i32 %w_arg, 1
26   %w.0 = shl i32 %w, %shl
27   %w.1 = lshr i32 %w, %e
28   %w.2 = or i32 %w.0, %w.1
29   %xy = or i32 %x.2, %y.2
30   %zw = or i32 %z.2, %w.2
31   %xyzw = or i32 %xy, %zw
32   store i32 %xyzw, ptr addrspace(1) %out
33   ret void