Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / sse4a-upgrade.ll
blob3befbbf031cf74394340d0e76ba36e9f2889bbf1
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i386-unknown-unknown -mattr=+sse4a -show-mc-encoding | FileCheck %s --check-prefixes=X86
3 ; RUN: llc < %s -mtriple=i386-unknown-unknown -mattr=+sse4a,+avx -show-mc-encoding | FileCheck %s --check-prefixes=X86
4 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4a -show-mc-encoding | FileCheck %s --check-prefixes=X64
5 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4a,+avx -show-mc-encoding | FileCheck %s --check-prefixes=X64
7 define void @test_movntss(ptr %p, <4 x float> %a) nounwind optsize ssp {
8 ; X86-LABEL: test_movntss:
9 ; X86:       # %bb.0:
10 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
11 ; X86-NEXT:    movntss %xmm0, (%eax) # encoding: [0xf3,0x0f,0x2b,0x00]
12 ; X86-NEXT:    retl # encoding: [0xc3]
14 ; X64-LABEL: test_movntss:
15 ; X64:       # %bb.0:
16 ; X64-NEXT:    movntss %xmm0, (%rdi) # encoding: [0xf3,0x0f,0x2b,0x07]
17 ; X64-NEXT:    retq # encoding: [0xc3]
18   tail call void @llvm.x86.sse4a.movnt.ss(ptr %p, <4 x float> %a) nounwind
19   ret void
22 declare void @llvm.x86.sse4a.movnt.ss(ptr, <4 x float>)
24 define void @test_movntsd(ptr %p, <2 x double> %a) nounwind optsize ssp {
25 ; X86-LABEL: test_movntsd:
26 ; X86:       # %bb.0:
27 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax # encoding: [0x8b,0x44,0x24,0x04]
28 ; X86-NEXT:    movntsd %xmm0, (%eax) # encoding: [0xf2,0x0f,0x2b,0x00]
29 ; X86-NEXT:    retl # encoding: [0xc3]
31 ; X64-LABEL: test_movntsd:
32 ; X64:       # %bb.0:
33 ; X64-NEXT:    movntsd %xmm0, (%rdi) # encoding: [0xf2,0x0f,0x2b,0x07]
34 ; X64-NEXT:    retq # encoding: [0xc3]
35   tail call void @llvm.x86.sse4a.movnt.sd(ptr %p, <2 x double> %a) nounwind
36   ret void
39 declare void @llvm.x86.sse4a.movnt.sd(ptr, <2 x double>)