Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / hsa-metadata-agpr-small.ll
blob5ec1502899edf1c57b85261f5cd0fcb5286e5065
1 ; RUN: llc -mtriple=amdgcn--amdhsa -mcpu=gfx908 < %s | FileCheck -check-prefixes=CHECK,GFX908 %s
2 ; RUN: llc -mtriple=amdgcn--amdhsa -mcpu=gfx90a < %s | FileCheck -check-prefixes=CHECK,GFX90A %s
3 ; RUN: llc -mtriple=amdgcn--amdhsa -mcpu=gfx801 < %s | FileCheck -check-prefixes=CHECK,GFX801 %s
5 ; COM: Comments for each kernel
6 ; CHECK: kernel_32_agprs
7 ; GFX908:   ; NumVgprs: 9
8 ; GFX908    ; NumAgprs: 32
9 ; GFX908    ; TotalNumVgprs: 32
11 ; GFX90A:   ; NumVgprs: 9
12 ; GFX90A    ; NumAgprs: 32
13 ; GFX90A    ; TotalNumVgprs: 44
15 ; GFX801:   ; NumVgprs: 9
17 ; CHECK: kernel_40_vgprs
18 ; GFX908:   ; NumVgprs: 40
19 ; GFX908    ; NumAgprs: 16
20 ; GFX908    ; TotalNumVgprs: 40
22 ; GFX90A:   ; NumVgprs: 40
23 ; GFX90A    ; NumAgprs: 16
24 ; GFX90A    ; TotalNumVgprs: 56
26 ; GFX801:   ; NumVgprs: 40
28 ; COM: Metadata
29 ; GFX908:    - .agpr_count:    32
30 ; GFX908:      .vgpr_count:    32
32 ; GFX90A:    - .agpr_count:    32
33 ; GFX90A:      .vgpr_count:    44
35 ; GFX801:      .vgpr_count:    9
36 define amdgpu_kernel void @kernel_32_agprs() #0 {
37 bb:
38   call void asm sideeffect "", "~{v8}" ()
39   call void asm sideeffect "", "~{a31}" ()
40   ret void
43 ; GFX908:    - .agpr_count:    16
44 ; GFX908:      .vgpr_count:    40
46 ; GFX90A:    - .agpr_count:    16
47 ; GFX90A:      .vgpr_count:    56
49 ; GFX801:      .vgpr_count:    40
50 define amdgpu_kernel void @kernel_40_vgprs() #0 {
51 bb:
52   call void asm sideeffect "", "~{v39}" ()
53   call void asm sideeffect "", "~{a15}" ()
54   ret void
57 attributes #0 = { nounwind noinline "amdgpu-flat-work-group-size"="1,512" }