Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / lower-module-lds-used-list.ll
blob6c504315e8d7aed254e25d1234a0a7ef2e13c25e
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 3
2 ; RUN: opt -S -mtriple=amdgcn-- -amdgpu-lower-module-lds --amdgpu-lower-module-lds-strategy=module < %s | FileCheck %s
3 ; RUN: opt -S -mtriple=amdgcn-- -passes=amdgpu-lower-module-lds --amdgpu-lower-module-lds-strategy=module < %s | FileCheck %s
5 ; Check new struct is added to compiler.used and that the replaced variable is removed
7 ; CHECK: %llvm.amdgcn.module.lds.t = type { float }
8 ; CHECK: @ignored = addrspace(1) global i64 0
10 ; @ignored still in list, @tolower removed, llvm.amdgcn.module.lds appended
11 ; Start with one value to replace and one to ignore in the .use list
13 ; @ignored still in list, @tolower removed
14 ; CHECK: @llvm.used = appending global [1 x ptr] [ptr addrspacecast (ptr addrspace(1) @ignored to ptr)], section "llvm.metadata"
16 ; CHECK: @llvm.amdgcn.module.lds = internal addrspace(3) global %llvm.amdgcn.module.lds.t poison, align 8
18 ; CHECK-NOT: @tolower
20 @tolower = addrspace(3) global float poison, align 8
22 ; A variable that is unchanged by pass
23 @ignored = addrspace(1) global i64 0
26 @llvm.used = appending global [2 x ptr] [ptr addrspacecast (ptr addrspace(3) @tolower to ptr), ptr addrspacecast (ptr addrspace(1) @ignored to ptr)], section "llvm.metadata"
28 ; @ignored still in list, @tolower removed, llvm.amdgcn.module.lds appended
29 ; CHECK: @llvm.compiler.used = appending addrspace(1) global [2 x ptr] [ptr addrspacecast (ptr addrspace(1) @ignored to ptr), ptr addrspacecast (ptr addrspace(3) @llvm.amdgcn.module.lds to ptr)], section "llvm.metadata"
31 @llvm.compiler.used = appending global [2 x ptr] [ptr addrspacecast (ptr addrspace(3) @tolower to ptr), ptr addrspacecast (ptr addrspace(1) @ignored to ptr)], section "llvm.metadata"
34 ; Functions that are not called are ignored by the lowering
35 define amdgpu_kernel void @call_func() {
36 ; CHECK-LABEL: define amdgpu_kernel void @call_func(
37 ; CHECK-SAME: ) #[[ATTR0:[0-9]+]] {
38 ; CHECK-NEXT:    call void @llvm.donothing() [ "ExplicitUse"(ptr addrspace(3) @llvm.amdgcn.module.lds) ]
39 ; CHECK-NEXT:    call void @func()
40 ; CHECK-NEXT:    ret void
42   call void @func()
43   ret void
46 define void @func() {
47 ; CHECK-LABEL: define void @func() {
48 ; CHECK-NEXT:    [[DEC:%.*]] = atomicrmw fsub ptr addrspace(3) @llvm.amdgcn.module.lds, float 1.000000e+00 monotonic, align 8
49 ; CHECK-NEXT:    [[UNUSED0:%.*]] = atomicrmw add ptr addrspace(1) @ignored, i64 1 monotonic, align 8
50 ; CHECK-NEXT:    ret void
52   %dec = atomicrmw fsub ptr addrspace(3) @tolower, float 1.0 monotonic
53   %unused0 = atomicrmw add ptr addrspace(1) @ignored, i64 1 monotonic
54   ret void