[AMDGPU] Add True16 register classes.
[llvm-project.git] / llvm / test / Transforms / Inline / byval-align.ll
blob11a3330fc6d7a19f68ef4dec890f0bcb25cf14dc
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --function-signature
2 ; RUN: opt -passes=inline -preserve-alignment-assumptions-during-inlining -S < %s | FileCheck %s
3 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
4 target triple = "x86_64-unknown-linux-gnu"
6 ; Test behavior of inserted alignment assumptions with byval. No
7 ; assume should be inserted.
8 define void @byval_callee(ptr byval(float) align 128 nocapture %a, ptr %b) #0 {
9 ; CHECK-LABEL: define {{[^@]+}}@byval_callee
10 ; CHECK-SAME: (ptr nocapture byval(float) align 128 [[A:%.*]], ptr [[B:%.*]]) #0
11 ; CHECK-NEXT:  entry:
12 ; CHECK-NEXT:    [[LOAD:%.*]] = load float, ptr [[A]], align 4
13 ; CHECK-NEXT:    [[B_IDX:%.*]] = getelementptr inbounds float, ptr [[B]], i64 8
14 ; CHECK-NEXT:    [[ADD:%.*]] = fadd float [[LOAD]], 2.000000e+00
15 ; CHECK-NEXT:    store float [[ADD]], ptr [[B_IDX]], align 4
16 ; CHECK-NEXT:    ret void
18 entry:
19   %load = load float, ptr %a, align 4
20   %b.idx = getelementptr inbounds float, ptr %b, i64 8
21   %add = fadd float %load, 2.0
22   store float %add, ptr %b.idx, align 4
23   ret void
26 define void @byval_caller(ptr nocapture align 64 %a, ptr %b) #0 {
27 ; CHECK-LABEL: define {{[^@]+}}@byval_caller
28 ; CHECK-SAME: (ptr nocapture align 64 [[A:%.*]], ptr [[B:%.*]]) #0
29 ; CHECK-NEXT:  entry:
30 ; CHECK-NEXT:    [[A1:%.*]] = alloca float, align 128
31 ; CHECK-NEXT:    call void @llvm.lifetime.start.p0(i64 4, ptr [[A1]])
32 ; CHECK-NEXT:    call void @llvm.memcpy.p0.p0.i64(ptr align 1 [[A1]], ptr align 1 [[A]], i64 4, i1 false)
33 ; CHECK-NEXT:    [[LOAD_I:%.*]] = load float, ptr [[A1]], align 4
34 ; CHECK-NEXT:    [[B_IDX_I:%.*]] = getelementptr inbounds float, ptr [[B]], i64 8
35 ; CHECK-NEXT:    [[ADD_I:%.*]] = fadd float [[LOAD_I]], 2.000000e+00
36 ; CHECK-NEXT:    store float [[ADD_I]], ptr [[B_IDX_I]], align 4
37 ; CHECK-NEXT:    call void @llvm.lifetime.end.p0(i64 4, ptr [[A1]])
38 ; CHECK-NEXT:    [[CALLER_LOAD:%.*]] = load float, ptr [[B]], align 4
39 ; CHECK-NEXT:    [[ARRAYIDX:%.*]] = getelementptr inbounds float, ptr [[A]], i64 7
40 ; CHECK-NEXT:    store float [[CALLER_LOAD]], ptr [[ARRAYIDX]], align 4
41 ; CHECK-NEXT:    ret void
43 entry:
44   call void @byval_callee(ptr byval(float) align 128 %a, ptr %b)
45   %caller.load = load float, ptr %b, align 4
46   %arrayidx = getelementptr inbounds float, ptr %a, i64 7
47   store float %caller.load, ptr %arrayidx, align 4
48   ret void
51 attributes #0 = { nounwind uwtable }