Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / lwp-intrinsics.ll
blobd3ce7f5dbc4d66e10cc9f0a1bee32a434462b0a4
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-unknown -mattr=+lwp | FileCheck %s --check-prefixes=X86,X86_LWP
3 ; RUN: llc < %s -mtriple=i686-unknown -mcpu=bdver1 | FileCheck %s --check-prefixes=X86,X86_BDVER1
4 ; RUN: llc < %s -mtriple=i686-unknown -mcpu=bdver2 | FileCheck %s --check-prefixes=X86,X86_BDVER2
5 ; RUN: llc < %s -mtriple=i686-unknown -mcpu=bdver3 | FileCheck %s --check-prefixes=X86,X86_BDVER3
6 ; RUN: llc < %s -mtriple=i686-unknown -mcpu=bdver4 | FileCheck %s --check-prefixes=X86,X86_BDVER4
7 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+lwp | FileCheck %s --check-prefix=X64
8 ; RUN: llc < %s -mtriple=x86_64-unknown -mcpu=bdver1 | FileCheck %s --check-prefix=X64
9 ; RUN: llc < %s -mtriple=x86_64-unknown -mcpu=bdver2 | FileCheck %s --check-prefix=X64
10 ; RUN: llc < %s -mtriple=x86_64-unknown -mcpu=bdver3 | FileCheck %s --check-prefix=X64
11 ; RUN: llc < %s -mtriple=x86_64-unknown -mcpu=bdver4 | FileCheck %s --check-prefix=X64
13 define void @test_llwpcb(ptr%a0) nounwind {
14 ; X86-LABEL: test_llwpcb:
15 ; X86:       # %bb.0:
16 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
17 ; X86-NEXT:    llwpcb %eax
18 ; X86-NEXT:    retl
20 ; X64-LABEL: test_llwpcb:
21 ; X64:       # %bb.0:
22 ; X64-NEXT:    llwpcb %rdi
23 ; X64-NEXT:    retq
24   tail call void @llvm.x86.llwpcb(ptr%a0)
25   ret void
28 define ptr @test_slwpcb(ptr%a0) nounwind {
29 ; X86-LABEL: test_slwpcb:
30 ; X86:       # %bb.0:
31 ; X86-NEXT:    slwpcb %eax
32 ; X86-NEXT:    retl
34 ; X64-LABEL: test_slwpcb:
35 ; X64:       # %bb.0:
36 ; X64-NEXT:    slwpcb %rax
37 ; X64-NEXT:    retq
38   %1 = tail call ptr @llvm.x86.slwpcb()
39   ret ptr%1
42 define i8 @test_lwpins32_rri(i32 %a0, i32 %a1) nounwind {
43 ; X86_LWP-LABEL: test_lwpins32_rri:
44 ; X86_LWP:       # %bb.0:
45 ; X86_LWP-NEXT:    movl {{[0-9]+}}(%esp), %eax
46 ; X86_LWP-NEXT:    movl {{[0-9]+}}(%esp), %ecx
47 ; X86_LWP-NEXT:    addl %ecx, %ecx
48 ; X86_LWP-NEXT:    lwpins $-1985229329, %ecx, %eax # imm = 0x89ABCDEF
49 ; X86_LWP-NEXT:    setb %al
50 ; X86_LWP-NEXT:    retl
52 ; X86_BDVER1-LABEL: test_lwpins32_rri:
53 ; X86_BDVER1:       # %bb.0:
54 ; X86_BDVER1-NEXT:    movl {{[0-9]+}}(%esp), %ecx
55 ; X86_BDVER1-NEXT:    movl {{[0-9]+}}(%esp), %eax
56 ; X86_BDVER1-NEXT:    addl %ecx, %ecx
57 ; X86_BDVER1-NEXT:    lwpins $-1985229329, %ecx, %eax # imm = 0x89ABCDEF
58 ; X86_BDVER1-NEXT:    setb %al
59 ; X86_BDVER1-NEXT:    retl
61 ; X86_BDVER2-LABEL: test_lwpins32_rri:
62 ; X86_BDVER2:       # %bb.0:
63 ; X86_BDVER2-NEXT:    movl {{[0-9]+}}(%esp), %ecx
64 ; X86_BDVER2-NEXT:    movl {{[0-9]+}}(%esp), %eax
65 ; X86_BDVER2-NEXT:    addl %ecx, %ecx
66 ; X86_BDVER2-NEXT:    lwpins $-1985229329, %ecx, %eax # imm = 0x89ABCDEF
67 ; X86_BDVER2-NEXT:    setb %al
68 ; X86_BDVER2-NEXT:    retl
70 ; X86_BDVER3-LABEL: test_lwpins32_rri:
71 ; X86_BDVER3:       # %bb.0:
72 ; X86_BDVER3-NEXT:    movl {{[0-9]+}}(%esp), %eax
73 ; X86_BDVER3-NEXT:    movl {{[0-9]+}}(%esp), %ecx
74 ; X86_BDVER3-NEXT:    addl %ecx, %ecx
75 ; X86_BDVER3-NEXT:    lwpins $-1985229329, %ecx, %eax # imm = 0x89ABCDEF
76 ; X86_BDVER3-NEXT:    setb %al
77 ; X86_BDVER3-NEXT:    retl
79 ; X86_BDVER4-LABEL: test_lwpins32_rri:
80 ; X86_BDVER4:       # %bb.0:
81 ; X86_BDVER4-NEXT:    movl {{[0-9]+}}(%esp), %eax
82 ; X86_BDVER4-NEXT:    movl {{[0-9]+}}(%esp), %ecx
83 ; X86_BDVER4-NEXT:    addl %ecx, %ecx
84 ; X86_BDVER4-NEXT:    lwpins $-1985229329, %ecx, %eax # imm = 0x89ABCDEF
85 ; X86_BDVER4-NEXT:    setb %al
86 ; X86_BDVER4-NEXT:    retl
88 ; X64-LABEL: test_lwpins32_rri:
89 ; X64:       # %bb.0:
90 ; X64-NEXT:    addl %esi, %esi
91 ; X64-NEXT:    lwpins $-1985229329, %esi, %edi # imm = 0x89ABCDEF
92 ; X64-NEXT:    setb %al
93 ; X64-NEXT:    retq
94   %1 = add i32 %a1, %a1
95   %2 = tail call i8 @llvm.x86.lwpins32(i32 %a0, i32 %1, i32 2309737967)
96   ret i8 %2
99 define i8 @test_lwpins32_rmi(i32 %a0, ptr%p1) nounwind {
100 ; X86-LABEL: test_lwpins32_rmi:
101 ; X86:       # %bb.0:
102 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
103 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
104 ; X86-NEXT:    lwpins $1985229328, (%eax), %ecx # imm = 0x76543210
105 ; X86-NEXT:    setb %al
106 ; X86-NEXT:    retl
108 ; X64-LABEL: test_lwpins32_rmi:
109 ; X64:       # %bb.0:
110 ; X64-NEXT:    lwpins $1985229328, (%rsi), %edi # imm = 0x76543210
111 ; X64-NEXT:    setb %al
112 ; X64-NEXT:    retq
113   %a1 = load i32, ptr%p1
114   %1 = tail call i8 @llvm.x86.lwpins32(i32 %a0, i32 %a1, i32 1985229328)
115   ret i8 %1
118 define void @test_lwpval32_rri(i32 %a0, i32 %a1) nounwind {
119 ; X86_LWP-LABEL: test_lwpval32_rri:
120 ; X86_LWP:       # %bb.0:
121 ; X86_LWP-NEXT:    movl {{[0-9]+}}(%esp), %eax
122 ; X86_LWP-NEXT:    movl {{[0-9]+}}(%esp), %ecx
123 ; X86_LWP-NEXT:    addl %ecx, %ecx
124 ; X86_LWP-NEXT:    lwpval $-19088744, %ecx, %eax # imm = 0xFEDCBA98
125 ; X86_LWP-NEXT:    retl
127 ; X86_BDVER1-LABEL: test_lwpval32_rri:
128 ; X86_BDVER1:       # %bb.0:
129 ; X86_BDVER1-NEXT:    movl {{[0-9]+}}(%esp), %ecx
130 ; X86_BDVER1-NEXT:    movl {{[0-9]+}}(%esp), %eax
131 ; X86_BDVER1-NEXT:    addl %ecx, %ecx
132 ; X86_BDVER1-NEXT:    lwpval $-19088744, %ecx, %eax # imm = 0xFEDCBA98
133 ; X86_BDVER1-NEXT:    retl
135 ; X86_BDVER2-LABEL: test_lwpval32_rri:
136 ; X86_BDVER2:       # %bb.0:
137 ; X86_BDVER2-NEXT:    movl {{[0-9]+}}(%esp), %ecx
138 ; X86_BDVER2-NEXT:    movl {{[0-9]+}}(%esp), %eax
139 ; X86_BDVER2-NEXT:    addl %ecx, %ecx
140 ; X86_BDVER2-NEXT:    lwpval $-19088744, %ecx, %eax # imm = 0xFEDCBA98
141 ; X86_BDVER2-NEXT:    retl
143 ; X86_BDVER3-LABEL: test_lwpval32_rri:
144 ; X86_BDVER3:       # %bb.0:
145 ; X86_BDVER3-NEXT:    movl {{[0-9]+}}(%esp), %eax
146 ; X86_BDVER3-NEXT:    movl {{[0-9]+}}(%esp), %ecx
147 ; X86_BDVER3-NEXT:    addl %ecx, %ecx
148 ; X86_BDVER3-NEXT:    lwpval $-19088744, %ecx, %eax # imm = 0xFEDCBA98
149 ; X86_BDVER3-NEXT:    retl
151 ; X86_BDVER4-LABEL: test_lwpval32_rri:
152 ; X86_BDVER4:       # %bb.0:
153 ; X86_BDVER4-NEXT:    movl {{[0-9]+}}(%esp), %eax
154 ; X86_BDVER4-NEXT:    movl {{[0-9]+}}(%esp), %ecx
155 ; X86_BDVER4-NEXT:    addl %ecx, %ecx
156 ; X86_BDVER4-NEXT:    lwpval $-19088744, %ecx, %eax # imm = 0xFEDCBA98
157 ; X86_BDVER4-NEXT:    retl
159 ; X64-LABEL: test_lwpval32_rri:
160 ; X64:       # %bb.0:
161 ; X64-NEXT:    addl %esi, %esi
162 ; X64-NEXT:    lwpval $-19088744, %esi, %edi # imm = 0xFEDCBA98
163 ; X64-NEXT:    retq
164   %1 = add i32 %a1, %a1
165   tail call void @llvm.x86.lwpval32(i32 %a0, i32 %1, i32 4275878552)
166   ret void
169 define void @test_lwpval32_rmi(i32 %a0, ptr%p1) nounwind {
170 ; X86-LABEL: test_lwpval32_rmi:
171 ; X86:       # %bb.0:
172 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
173 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
174 ; X86-NEXT:    lwpval $305419896, (%eax), %ecx # imm = 0x12345678
175 ; X86-NEXT:    retl
177 ; X64-LABEL: test_lwpval32_rmi:
178 ; X64:       # %bb.0:
179 ; X64-NEXT:    lwpval $305419896, (%rsi), %edi # imm = 0x12345678
180 ; X64-NEXT:    retq
181   %a1 = load i32, ptr%p1
182   tail call void @llvm.x86.lwpval32(i32 %a0, i32 %a1, i32 305419896)
183   ret void
186 declare void @llvm.x86.llwpcb(ptr) nounwind
187 declare ptr @llvm.x86.slwpcb() nounwind
188 declare i8 @llvm.x86.lwpins32(i32, i32, i32) nounwind
189 declare void @llvm.x86.lwpval32(i32, i32, i32) nounwind