Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / crc32-intrinsics-fast-isel-x86.ll
blob056d79f379fd10901dbbde3609cfb634e465eccc
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --no-generate-body-for-unused-prefixes
2 ; i686 uses -fast-isel-abort=1 only as argument lowering is not supported, so check that FastISel didn't miss the call.
3 ; RUN: llc < %s -fast-isel -pass-remarks-missed=sdagisel -mtriple=i686-unknown-unknown -mattr=+crc32 2>&1 >/dev/null | FileCheck %s -check-prefix=STDERR-X86 -allow-empty
4 ; RUN: llc < %s -fast-isel -fast-isel-abort=1 -mtriple=i686-unknown-unknown -mattr=-sse4.2,+crc32 | FileCheck %s -check-prefix=X86
5 ; RUN: llc < %s -fast-isel -fast-isel-abort=1 -mtriple=i686-unknown-unknown -mattr=+crc32 | FileCheck %s -check-prefix=X86
6 ; RUN: llc < %s -fast-isel -fast-isel-abort=3 -mtriple=x86_64-unknown-unknown -mattr=-sse4.2,+crc32 | FileCheck %s -check-prefix=X64
7 ; RUN: llc < %s -fast-isel -fast-isel-abort=3 -mtriple=x86_64-unknown-unknown -mattr=+crc32 | FileCheck %s -check-prefix=X64
9 ; NOTE: This should use IR equivalent to what is generated by clang/test/CodeGen/sse42-builtins.c
11 ; STDERR-X86-NOT: FastISel missed call:   %res = call i32 @llvm.x86.sse42.crc32
13 ; Note: %a1 is i32 as FastISel can't handle i8/i16 arguments.
14 define i32 @test_mm_crc32_u8(i32 %a0, i32 %a1) nounwind {
15 ; X86-LABEL: test_mm_crc32_u8:
16 ; X86:       # %bb.0:
17 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
18 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
19 ; X86-NEXT:    crc32b %cl, %eax
20 ; X86-NEXT:    retl
22 ; X64-LABEL: test_mm_crc32_u8:
23 ; X64:       # %bb.0:
24 ; X64-NEXT:    movl %edi, %eax
25 ; X64-NEXT:    crc32b %sil, %eax
26 ; X64-NEXT:    retq
27   %trunc = trunc i32 %a1 to i8
28   %res = call i32 @llvm.x86.sse42.crc32.32.8(i32 %a0, i8 %trunc)
29   ret i32 %res
31 declare i32 @llvm.x86.sse42.crc32.32.8(i32, i8) nounwind readnone
33 ; Note: %a1 is i32 as FastISel can't handle i8/i16 arguments.
34 define i32 @test_mm_crc32_u16(i32 %a0, i32 %a1) nounwind {
35 ; X86-LABEL: test_mm_crc32_u16:
36 ; X86:       # %bb.0:
37 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
38 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
39 ; X86-NEXT:    crc32w %cx, %eax
40 ; X86-NEXT:    retl
42 ; X64-LABEL: test_mm_crc32_u16:
43 ; X64:       # %bb.0:
44 ; X64-NEXT:    movl %edi, %eax
45 ; X64-NEXT:    crc32w %si, %eax
46 ; X64-NEXT:    retq
47   %trunc = trunc i32 %a1 to i16
48   %res = call i32 @llvm.x86.sse42.crc32.32.16(i32 %a0, i16 %trunc)
49   ret i32 %res
51 declare i32 @llvm.x86.sse42.crc32.32.16(i32, i16) nounwind readnone
53 define i32 @test_mm_crc32_u32(i32 %a0, i32 %a1) nounwind {
54 ; X86-LABEL: test_mm_crc32_u32:
55 ; X86:       # %bb.0:
56 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
57 ; X86-NEXT:    crc32l {{[0-9]+}}(%esp), %eax
58 ; X86-NEXT:    retl
60 ; X64-LABEL: test_mm_crc32_u32:
61 ; X64:       # %bb.0:
62 ; X64-NEXT:    movl %edi, %eax
63 ; X64-NEXT:    crc32l %esi, %eax
64 ; X64-NEXT:    retq
65   %res = call i32 @llvm.x86.sse42.crc32.32.32(i32 %a0, i32 %a1)
66   ret i32 %res
68 declare i32 @llvm.x86.sse42.crc32.32.32(i32, i32) nounwind readnone