[clang][modules] Don't prevent translation of FW_Private includes when explicitly...
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / llvm.amdgcn.permlane64.ll
blob9d878ccc40978290689ae022fdac6e3bdbe34a89
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -march=amdgcn -mcpu=gfx1100 -verify-machineinstrs < %s | FileCheck -check-prefixes=GFX11,GFX11-SDAG %s
3 ; RUN: llc -global-isel -march=amdgcn -mcpu=gfx1100 -verify-machineinstrs < %s | FileCheck -check-prefixes=GFX11,GFX11-GISEL %s
5 declare i32 @llvm.amdgcn.permlane64(i32)
6 declare i32 @llvm.amdgcn.workitem.id.x()
8 define amdgpu_kernel void @test_s(ptr addrspace(1) %out, i32 %src0) {
9 ; GFX11-LABEL: test_s:
10 ; GFX11:       ; %bb.0:
11 ; GFX11-NEXT:    s_clause 0x1
12 ; GFX11-NEXT:    s_load_b32 s2, s[0:1], 0x2c
13 ; GFX11-NEXT:    s_load_b64 s[0:1], s[0:1], 0x24
14 ; GFX11-NEXT:    s_waitcnt lgkmcnt(0)
15 ; GFX11-NEXT:    v_dual_mov_b32 v1, 0 :: v_dual_mov_b32 v0, s2
16 ; GFX11-NEXT:    s_delay_alu instid0(VALU_DEP_1)
17 ; GFX11-NEXT:    v_permlane64_b32 v0, v0
18 ; GFX11-NEXT:    global_store_b32 v1, v0, s[0:1]
19 ; GFX11-NEXT:    s_nop 0
20 ; GFX11-NEXT:    s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
21 ; GFX11-NEXT:    s_endpgm
22   %v = call i32 @llvm.amdgcn.permlane64(i32 %src0)
23   store i32 %v, ptr addrspace(1) %out
24   ret void
27 define amdgpu_kernel void @test_i(ptr addrspace(1) %out) {
28 ; GFX11-LABEL: test_i:
29 ; GFX11:       ; %bb.0:
30 ; GFX11-NEXT:    s_load_b64 s[0:1], s[0:1], 0x24
31 ; GFX11-NEXT:    v_dual_mov_b32 v0, 0x63 :: v_dual_mov_b32 v1, 0
32 ; GFX11-NEXT:    s_delay_alu instid0(VALU_DEP_1)
33 ; GFX11-NEXT:    v_permlane64_b32 v0, v0
34 ; GFX11-NEXT:    s_waitcnt lgkmcnt(0)
35 ; GFX11-NEXT:    global_store_b32 v1, v0, s[0:1]
36 ; GFX11-NEXT:    s_nop 0
37 ; GFX11-NEXT:    s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
38 ; GFX11-NEXT:    s_endpgm
39   %v = call i32 @llvm.amdgcn.permlane64(i32 99)
40   store i32 %v, ptr addrspace(1) %out
41   ret void
44 define amdgpu_kernel void @test_v(ptr addrspace(1) %out, i32 %src0) #1 {
45 ; GFX11-SDAG-LABEL: test_v:
46 ; GFX11-SDAG:       ; %bb.0:
47 ; GFX11-SDAG-NEXT:    s_load_b64 s[0:1], s[0:1], 0x24
48 ; GFX11-SDAG-NEXT:    v_mov_b32_e32 v1, 0
49 ; GFX11-SDAG-NEXT:    v_permlane64_b32 v0, v0
50 ; GFX11-SDAG-NEXT:    s_waitcnt lgkmcnt(0)
51 ; GFX11-SDAG-NEXT:    global_store_b32 v1, v0, s[0:1]
52 ; GFX11-SDAG-NEXT:    s_nop 0
53 ; GFX11-SDAG-NEXT:    s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
54 ; GFX11-SDAG-NEXT:    s_endpgm
56 ; GFX11-GISEL-LABEL: test_v:
57 ; GFX11-GISEL:       ; %bb.0:
58 ; GFX11-GISEL-NEXT:    s_load_b64 s[0:1], s[0:1], 0x24
59 ; GFX11-GISEL-NEXT:    v_permlane64_b32 v0, v0
60 ; GFX11-GISEL-NEXT:    v_mov_b32_e32 v1, 0
61 ; GFX11-GISEL-NEXT:    s_waitcnt lgkmcnt(0)
62 ; GFX11-GISEL-NEXT:    global_store_b32 v1, v0, s[0:1]
63 ; GFX11-GISEL-NEXT:    s_nop 0
64 ; GFX11-GISEL-NEXT:    s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
65 ; GFX11-GISEL-NEXT:    s_endpgm
66   %tidx = call i32 @llvm.amdgcn.workitem.id.x()
67   %v = call i32 @llvm.amdgcn.permlane64(i32 %tidx)
68   store i32 %v, ptr addrspace(1) %out
69   ret void