Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / NVPTX / nvvm-reflect-ocl.ll
blob2c9ea4742de84f9074dd5fd4c6af5abc891c8d98
1 ; Verify that __nvvm_reflect_ocl() is replaced with an appropriate value
3 ; RUN: opt %s -S -passes='default<O2>' -mtriple=nvptx64 -mcpu=sm_20 \
4 ; RUN:   | FileCheck %s --check-prefixes=COMMON,SM20
5 ; RUN: opt %s -S -passes='default<O2>' -mtriple=nvptx64 -mcpu=sm_35 \
6 ; RUN:   | FileCheck %s --check-prefixes=COMMON,SM35
8 @"$str" = private addrspace(4) constant [12 x i8] c"__CUDA_ARCH\00"
10 declare i32 @__nvvm_reflect_ocl(ptr addrspace(4) noundef)
12 ; COMMON-LABEL: @foo
13 define i32 @foo(float %a, float %b) {
14 ; COMMON-NOT: call i32 @__nvvm_reflect_ocl
15   %reflect = tail call i32 @__nvvm_reflect_ocl(ptr addrspace(4) noundef getelementptr inbounds ([12 x i8], [12 x i8] addrspace(4)* @"$str", i64 0, i64 0))
16 ; SM20: ret i32 200
17 ; SM35: ret i32 350
18   ret i32 %reflect