[ARM] Adjust how NEON shifts are lowered
[llvm-core.git] / test / CodeGen / ARM / arm-vld1.ll
blobf1229789c3004d0619027cdd94a3848751f329a9
1 ; RUN: llc < %s -mtriple=armv8-linux-gnueabi -verify-machineinstrs \
2 ; RUN:     -asm-verbose=false | FileCheck %s
4 %struct.uint16x4x2_t = type { <4 x i16>, <4 x i16> }
5 %struct.uint16x4x3_t = type { <4 x i16>, <4 x i16>, <4 x i16> }
6 %struct.uint16x4x4_t = type { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }
8 %struct.uint32x2x2_t = type { <2 x i32>, <2 x i32> }
9 %struct.uint32x2x3_t = type { <2 x i32>, <2 x i32>, <2 x i32> }
10 %struct.uint32x2x4_t = type { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> }
12 %struct.uint64x1x2_t = type { <1 x i64>, <1 x i64> }
13 %struct.uint64x1x3_t = type { <1 x i64>, <1 x i64>, <1 x i64> }
14 %struct.uint64x1x4_t = type { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> }
16 %struct.uint8x8x2_t = type { <8 x i8>, <8 x i8> }
17 %struct.uint8x8x3_t = type { <8 x i8>, <8 x i8>, <8 x i8> }
18 %struct.uint8x8x4_t = type { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }
20 %struct.uint16x8x2_t = type { <8 x i16>, <8 x i16> }
21 %struct.uint16x8x3_t = type { <8 x i16>, <8 x i16>, <8 x i16> }
22 %struct.uint16x8x4_t = type { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }
24 %struct.uint32x4x2_t = type { <4 x i32>, <4 x i32> }
25 %struct.uint32x4x3_t = type { <4 x i32>, <4 x i32>, <4 x i32> }
26 %struct.uint32x4x4_t = type { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> }
28 %struct.uint64x2x2_t = type { <2 x i64>, <2 x i64> }
29 %struct.uint64x2x3_t = type { <2 x i64>, <2 x i64>, <2 x i64> }
30 %struct.uint64x2x4_t = type { <2 x i64>, <2 x i64>, <2 x i64>, <2 x i64> }
32 %struct.uint8x16x2_t = type { <16 x i8>, <16 x i8> }
33 %struct.uint8x16x3_t = type { <16 x i8>, <16 x i8>, <16 x i8> }
34 %struct.uint8x16x4_t = type { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }
36 declare %struct.uint16x4x2_t @llvm.arm.neon.vld1x2.v4i16.p0i16(i16*) nounwind readonly
37 declare %struct.uint16x4x3_t @llvm.arm.neon.vld1x3.v4i16.p0i16(i16*) nounwind readonly
38 declare %struct.uint16x4x4_t @llvm.arm.neon.vld1x4.v4i16.p0i16(i16*) nounwind readonly
40 declare %struct.uint32x2x2_t @llvm.arm.neon.vld1x2.v2i32.p0i32(i32*) nounwind readonly
41 declare %struct.uint32x2x3_t @llvm.arm.neon.vld1x3.v2i32.p0i32(i32*) nounwind readonly
42 declare %struct.uint32x2x4_t @llvm.arm.neon.vld1x4.v2i32.p0i32(i32*) nounwind readonly
44 declare %struct.uint64x1x2_t @llvm.arm.neon.vld1x2.v1i64.p0i64(i64*) nounwind readonly
45 declare %struct.uint64x1x3_t @llvm.arm.neon.vld1x3.v1i64.p0i64(i64*) nounwind readonly
46 declare %struct.uint64x1x4_t @llvm.arm.neon.vld1x4.v1i64.p0i64(i64*) nounwind readonly
48 declare %struct.uint8x8x2_t @llvm.arm.neon.vld1x2.v8i8.p0i8(i8*) nounwind readonly
49 declare %struct.uint8x8x3_t @llvm.arm.neon.vld1x3.v8i8.p0i8(i8*) nounwind readonly
50 declare %struct.uint8x8x4_t @llvm.arm.neon.vld1x4.v8i8.p0i8(i8*) nounwind readonly
52 declare %struct.uint16x8x2_t @llvm.arm.neon.vld1x2.v8i16.p0i16(i16*) nounwind readonly
53 declare %struct.uint16x8x3_t @llvm.arm.neon.vld1x3.v8i16.p0i16(i16*) nounwind readonly
54 declare %struct.uint16x8x4_t @llvm.arm.neon.vld1x4.v8i16.p0i16(i16*) nounwind readonly
56 declare %struct.uint32x4x2_t @llvm.arm.neon.vld1x2.v4i32.p0i32(i32*) nounwind readonly
57 declare %struct.uint32x4x3_t @llvm.arm.neon.vld1x3.v4i32.p0i32(i32*) nounwind readonly
58 declare %struct.uint32x4x4_t @llvm.arm.neon.vld1x4.v4i32.p0i32(i32*) nounwind readonly
60 declare %struct.uint64x2x2_t @llvm.arm.neon.vld1x2.v2i64.p0i64(i64*) nounwind readonly
61 declare %struct.uint64x2x3_t @llvm.arm.neon.vld1x3.v2i64.p0i64(i64*) nounwind readonly
62 declare %struct.uint64x2x4_t @llvm.arm.neon.vld1x4.v2i64.p0i64(i64*) nounwind readonly
64 declare %struct.uint8x16x2_t @llvm.arm.neon.vld1x2.v16i8.p0i8(i8*) nounwind readonly
65 declare %struct.uint8x16x3_t @llvm.arm.neon.vld1x3.v16i8.p0i8(i8*) nounwind readonly
66 declare %struct.uint8x16x4_t @llvm.arm.neon.vld1x4.v16i8.p0i8(i8*) nounwind readonly
68 ; CHECK-LABEL: test_vld1_u16_x2
69 ; CHECK: vld1.16 {d16, d17}, [r0:64]
70 define %struct.uint16x4x2_t @test_vld1_u16_x2(i16* %a) nounwind {
71   %tmp = tail call %struct.uint16x4x2_t @llvm.arm.neon.vld1x2.v4i16.p0i16(i16* %a)
72   ret %struct.uint16x4x2_t %tmp
75 ; CHECK-LABEL: test_vld1_u16_x3
76 ; CHECK: vld1.16 {d16, d17, d18}, [r1:64]
77 define %struct.uint16x4x3_t @test_vld1_u16_x3(i16* %a) nounwind {
78   %tmp = tail call %struct.uint16x4x3_t @llvm.arm.neon.vld1x3.v4i16.p0i16(i16* %a)
79   ret %struct.uint16x4x3_t %tmp
82 ; CHECK-LABEL: test_vld1_u16_x4
83 ; CHECK: vld1.16 {d16, d17, d18, d19}, [r1:256]
84 define %struct.uint16x4x4_t @test_vld1_u16_x4(i16* %a) nounwind {
85   %tmp = tail call %struct.uint16x4x4_t @llvm.arm.neon.vld1x4.v4i16.p0i16(i16* %a)
86   ret %struct.uint16x4x4_t %tmp
89 ; CHECK-LABEL: test_vld1_u32_x2
90 ; CHECK: vld1.32 {d16, d17}, [r0:64]
91 define %struct.uint32x2x2_t @test_vld1_u32_x2(i32* %a) nounwind {
92   %tmp = tail call %struct.uint32x2x2_t @llvm.arm.neon.vld1x2.v2i32.p0i32(i32* %a)
93   ret %struct.uint32x2x2_t %tmp
96 ; CHECK-LABEL: test_vld1_u32_x3
97 ; CHECK: vld1.32 {d16, d17, d18}, [r1:64]
98 define %struct.uint32x2x3_t @test_vld1_u32_x3(i32* %a) nounwind {
99   %tmp = tail call %struct.uint32x2x3_t @llvm.arm.neon.vld1x3.v2i32.p0i32(i32* %a)
100   ret %struct.uint32x2x3_t %tmp
103 ; CHECK-LABEL: test_vld1_u32_x4
104 ; CHECK: vld1.32 {d16, d17, d18, d19}, [r1:256]
105 define %struct.uint32x2x4_t @test_vld1_u32_x4(i32* %a) nounwind {
106   %tmp = tail call %struct.uint32x2x4_t @llvm.arm.neon.vld1x4.v2i32.p0i32(i32* %a)
107   ret %struct.uint32x2x4_t %tmp
110 ; CHECK-LABEL: test_vld1_u64_x2
111 ; CHECK: vld1.64 {d16, d17}, [r0:64]
112 define %struct.uint64x1x2_t @test_vld1_u64_x2(i64* %a) nounwind {
113   %tmp = tail call %struct.uint64x1x2_t @llvm.arm.neon.vld1x2.v1i64.p0i64(i64* %a)
114   ret %struct.uint64x1x2_t %tmp
117 ; CHECK-LABEL: test_vld1_u64_x3
118 ; CHECK: vld1.64 {d16, d17, d18}, [r1:64]
119 define %struct.uint64x1x3_t @test_vld1_u64_x3(i64* %a) nounwind {
120   %tmp = tail call %struct.uint64x1x3_t @llvm.arm.neon.vld1x3.v1i64.p0i64(i64* %a)
121   ret %struct.uint64x1x3_t %tmp
124 ; CHECK-LABEL: test_vld1_u64_x4
125 ; CHECK: vld1.64 {d16, d17, d18, d19}, [r1:256]
126 define %struct.uint64x1x4_t @test_vld1_u64_x4(i64* %a) nounwind {
127   %tmp = tail call %struct.uint64x1x4_t @llvm.arm.neon.vld1x4.v1i64.p0i64(i64* %a)
128   ret %struct.uint64x1x4_t %tmp
131 ; CHECK-LABEL: test_vld1_u8_x2
132 ; CHECK: vld1.8 {d16, d17}, [r0:64]
133 define %struct.uint8x8x2_t @test_vld1_u8_x2(i8* %a) nounwind {
134   %tmp = tail call %struct.uint8x8x2_t @llvm.arm.neon.vld1x2.v8i8.p0i8(i8* %a)
135   ret %struct.uint8x8x2_t %tmp
138 ; CHECK-LABEL: test_vld1_u8_x3
139 ; CHECK: vld1.8 {d16, d17, d18}, [r1:64]
140 define %struct.uint8x8x3_t @test_vld1_u8_x3(i8* %a) nounwind {
141   %tmp = tail call %struct.uint8x8x3_t @llvm.arm.neon.vld1x3.v8i8.p0i8(i8* %a)
142   ret %struct.uint8x8x3_t %tmp
145 ; CHECK-LABEL: test_vld1_u8_x4
146 ; CHECK: vld1.8 {d16, d17, d18, d19}, [r1:256]
147 define %struct.uint8x8x4_t @test_vld1_u8_x4(i8* %a) nounwind {
148   %tmp = tail call %struct.uint8x8x4_t @llvm.arm.neon.vld1x4.v8i8.p0i8(i8* %a)
149   ret %struct.uint8x8x4_t %tmp
152 ; CHECK-LABEL: test_vld1q_u16_x2
153 ; CHECK: vld1.16 {d16, d17, d18, d19}, [r1:256]
154 define %struct.uint16x8x2_t @test_vld1q_u16_x2(i16* %a) nounwind {
155   %tmp = tail call %struct.uint16x8x2_t @llvm.arm.neon.vld1x2.v8i16.p0i16(i16* %a)
156   ret %struct.uint16x8x2_t %tmp
159 ; CHECK-LABEL: test_vld1q_u16_x3
160 ; CHECK: vld1.16 {d16, d17, d18}, [r1:64]!
161 ; CHECK: vld1.16 {d19, d20, d21}, [r1:64]
162 define %struct.uint16x8x3_t @test_vld1q_u16_x3(i16* %a) nounwind {
163   %tmp = tail call %struct.uint16x8x3_t @llvm.arm.neon.vld1x3.v8i16.p0i16(i16* %a)
164   ret %struct.uint16x8x3_t %tmp
167 ; CHECK-LABEL: test_vld1q_u16_x4
168 ; CHECK: vld1.16 {d16, d17, d18, d19}, [r1:256]!
169 ; CHECK: vld1.16 {d20, d21, d22, d23}, [r1:256]
170 define %struct.uint16x8x4_t @test_vld1q_u16_x4(i16* %a) nounwind {
171   %tmp = tail call %struct.uint16x8x4_t @llvm.arm.neon.vld1x4.v8i16.p0i16(i16* %a)
172   ret %struct.uint16x8x4_t %tmp
175 ; CHECK-LABEL: test_vld1q_u32_x2
176 ; CHECK: vld1.32 {d16, d17, d18, d19}, [r1:256]
177 define %struct.uint32x4x2_t @test_vld1q_u32_x2(i32* %a) nounwind {
178   %tmp = tail call %struct.uint32x4x2_t @llvm.arm.neon.vld1x2.v4i32.p0i32(i32* %a)
179   ret %struct.uint32x4x2_t %tmp
182 ; CHECK-LABEL: test_vld1q_u32_x3
183 ; CHECK: vld1.32 {d16, d17, d18}, [r1:64]!
184 ; CHECK: vld1.32 {d19, d20, d21}, [r1:64]
185 define %struct.uint32x4x3_t @test_vld1q_u32_x3(i32* %a) nounwind {
186   %tmp = tail call %struct.uint32x4x3_t @llvm.arm.neon.vld1x3.v4i32.p0i32(i32* %a)
187   ret %struct.uint32x4x3_t %tmp
190 ; CHECK-LABEL: test_vld1q_u32_x4
191 ; CHECK: vld1.32 {d16, d17, d18, d19}, [r1:256]!
192 ; CHECK: vld1.32 {d20, d21, d22, d23}, [r1:256]
193 define %struct.uint32x4x4_t @test_vld1q_u32_x4(i32* %a) nounwind {
194   %tmp = tail call %struct.uint32x4x4_t @llvm.arm.neon.vld1x4.v4i32.p0i32(i32* %a)
195   ret %struct.uint32x4x4_t %tmp
198 ; CHECK-LABEL: test_vld1q_u64_x2
199 ; CHECK: vld1.64 {d16, d17, d18, d19}, [r1:256]
200 define %struct.uint64x2x2_t @test_vld1q_u64_x2(i64* %a) nounwind {
201   %tmp = tail call %struct.uint64x2x2_t @llvm.arm.neon.vld1x2.v2i64.p0i64(i64* %a)
202   ret %struct.uint64x2x2_t %tmp
205 ; CHECK-LABEL: test_vld1q_u64_x3
206 ; CHECK: vld1.64 {d16, d17, d18}, [r1:64]!
207 ; CHECK: vld1.64 {d19, d20, d21}, [r1:64]
208 define %struct.uint64x2x3_t @test_vld1q_u64_x3(i64* %a) nounwind {
209   %tmp = tail call %struct.uint64x2x3_t @llvm.arm.neon.vld1x3.v2i64.p0i64(i64* %a)
210   ret %struct.uint64x2x3_t %tmp
213 ; CHECK-LABEL: test_vld1q_u64_x4
214 ; CHECK: vld1.64 {d16, d17, d18, d19}, [r1:256]!
215 ; CHECK: vld1.64 {d20, d21, d22, d23}, [r1:256]
216 define %struct.uint64x2x4_t @test_vld1q_u64_x4(i64* %a) nounwind {
217   %tmp = tail call %struct.uint64x2x4_t @llvm.arm.neon.vld1x4.v2i64.p0i64(i64* %a)
218   ret %struct.uint64x2x4_t %tmp
221 ; CHECK-LABEL: test_vld1q_u8_x2
222 ; CHECK: vld1.8 {d16, d17, d18, d19}, [r1:256]
223 define %struct.uint8x16x2_t @test_vld1q_u8_x2(i8* %a) nounwind {
224   %tmp = tail call %struct.uint8x16x2_t @llvm.arm.neon.vld1x2.v16i8.p0i8(i8* %a)
225   ret %struct.uint8x16x2_t %tmp
228 ; CHECK-LABEL: test_vld1q_u8_x3
229 ; CHECK: vld1.8 {d16, d17, d18}, [r1:64]!
230 ; CHECK: vld1.8 {d19, d20, d21}, [r1:64]
231 define %struct.uint8x16x3_t @test_vld1q_u8_x3(i8* %a) nounwind {
232   %tmp = tail call %struct.uint8x16x3_t @llvm.arm.neon.vld1x3.v16i8.p0i8(i8* %a)
233   ret %struct.uint8x16x3_t %tmp
236 ; CHECK-LABEL: test_vld1q_u8_x4
237 ; CHECK: vld1.8 {d16, d17, d18, d19}, [r1:256]!
238 ; CHECK: vld1.8 {d20, d21, d22, d23}, [r1:256]
239 define %struct.uint8x16x4_t @test_vld1q_u8_x4(i8* %a) nounwind {
240   %tmp = tail call %struct.uint8x16x4_t @llvm.arm.neon.vld1x4.v16i8.p0i8(i8* %a)
241   ret %struct.uint8x16x4_t %tmp