Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / ARM / fp16-vldlane-vstlane.ll
blob0cdff238414756a4f6636baa0c56fe92c30a76dc
1 ; RUN: llc -mtriple=arm-eabi -mattr=+armv8.2-a,+fullfp16,+neon -float-abi=hard -O1 < %s | FileCheck %s
2 ; RUN: llc -mtriple=arm-eabi -mattr=+armv8.2-a,+fullfp16,+neon -float-abi=soft -O1 < %s | FileCheck %s
4 define <4 x half> @vld1d_lane_f16(ptr %pa, <4 x half> %v4) nounwind {
5 ; CHECK-LABEL: vld1d_lane_f16:
6 ; CHECK: vld1.16 {d{{[0-9]+}}[3]}, [r0:16]
7 entry:
8   %a = load half, ptr %pa
9   %res = insertelement <4 x half> %v4, half %a, i32 3
10   ret <4 x half> %res
13 define <8 x half> @vld1q_lane_f16_1(ptr %pa, <8 x half> %v8) nounwind {
14 ; CHECK-LABEL: vld1q_lane_f16_1:
15 ; CHECK: vld1.16 {d{{[0-9]+}}[1]}, [r0:16]
16 entry:
17   %a = load half, ptr %pa
18   %res = insertelement <8 x half> %v8, half %a, i32 1
19   ret <8 x half> %res
22 define <8 x half> @vld1q_lane_f16_7(ptr %pa, <8 x half> %v8) nounwind {
23 ; CHECK-LABEL: vld1q_lane_f16_7:
24 ; CHECK: vld1.16 {d{{[0-9]+}}[3]}, [r0:16]
25 entry:
26   %a = load half, ptr %pa
27   %res = insertelement <8 x half> %v8, half %a, i32 7
28   ret <8 x half> %res
31 define void @vst1d_lane_f16(ptr %pa, <4 x half> %v4) nounwind {
32 ; CHECK-LABEL: vst1d_lane_f16:
33 ; CHECK: vst1.16 {d{{[0-9]+}}[3]}, [r0:16]
34 entry:
35   %a = extractelement <4 x half> %v4, i32 3
36   store half %a, ptr %pa
37   ret void
40 define void @vst1q_lane_f16_7(ptr %pa, <8 x half> %v8) nounwind {
41 ; CHECK-LABEL: vst1q_lane_f16_7:
42 ; CHECK: vst1.16 {d{{[0-9]+}}[3]}, [r0:16]
43 entry:
44   %a = extractelement <8 x half> %v8, i32 7
45   store half %a, ptr %pa
46   ret void
49 define void @vst1q_lane_f16_1(ptr %pa, <8 x half> %v8) nounwind {
50 ; CHECK-LABEL: vst1q_lane_f16_1:
51 ; CHECK: vst1.16 {d{{[0-9]+}}[1]}, [r0:16]
52 entry:
53   %a = extractelement <8 x half> %v8, i32 1
54   store half %a, ptr %pa
55   ret void