Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / x86-upgrade-avx-vbroadcast.ll
blobd9a97d2a128e5a426402d86aaffb3e3df0eb4ce9
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-apple-macosx10.9.0 -mattr=+avx | FileCheck %s
4 ; Check that we properly upgrade the AVX vbroadcast intrinsics to IR.  The
5 ; expectation is that we should still get the original instruction back that
6 ; maps to the intrinsic.
8 target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"
10 define <4 x float> @test_mm_broadcast_ss(ptr readonly %__a){
11 ; CHECK-LABEL: test_mm_broadcast_ss:
12 ; CHECK:       ## %bb.0: ## %entry
13 ; CHECK-NEXT:    vbroadcastss (%rdi), %xmm0
14 ; CHECK-NEXT:    retq
15 entry:
16   %0 = tail call <4 x float> @llvm.x86.avx.vbroadcast.ss(ptr %__a)
17   ret <4 x float> %0
19 declare <8 x float> @llvm.x86.avx.vbroadcast.ss.256(ptr)
21 define <4 x double> @test_mm256_broadcast_sd(ptr readonly %__a) {
22 ; CHECK-LABEL: test_mm256_broadcast_sd:
23 ; CHECK:       ## %bb.0: ## %entry
24 ; CHECK-NEXT:    vbroadcastsd (%rdi), %ymm0
25 ; CHECK-NEXT:    retq
26 entry:
27   %0 = tail call <4 x double> @llvm.x86.avx.vbroadcast.sd.256(ptr %__a)
28   ret <4 x double> %0
30 declare <4 x double> @llvm.x86.avx.vbroadcast.sd.256(ptr)
32 define <8 x float> @test_mm256_broadcast_ss(ptr readonly %__a) {
33 ; CHECK-LABEL: test_mm256_broadcast_ss:
34 ; CHECK:       ## %bb.0: ## %entry
35 ; CHECK-NEXT:    vbroadcastss (%rdi), %ymm0
36 ; CHECK-NEXT:    retq
37 entry:
38   %0 = tail call <8 x float> @llvm.x86.avx.vbroadcast.ss.256(ptr %__a)
39   ret <8 x float> %0
41 declare <4 x float> @llvm.x86.avx.vbroadcast.ss(ptr)