Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / Analysis / CostModel / X86 / scalarize.ll
blob8f118bf705e9e62d24ae2dcba46922f3a6daea6d
1 ; RUN: opt < %s  -passes="print<cost-model>" 2>&1 -disable-output -mtriple=i386 -mcpu=corei7-avx | FileCheck %s -check-prefix=CHECK32
2 ; RUN: opt < %s  -passes="print<cost-model>" 2>&1 -disable-output -mtriple=x86_64-apple-macosx10.8.0 -mcpu=corei7-avx | FileCheck %s -check-prefix=CHECK64
4 ; Test vector scalarization costs.
5 ; RUN: llc < %s -march=x86 -mcpu=i386
6 ; RUN: llc < %s -march=x86 -mcpu=yonah
8 %i4 = type <4 x i32>
9 %i8 = type <2 x i64>
11 ;;; TEST HANDLING OF VARIOUS VECTOR SIZES
13 declare %i4 @llvm.bswap.v4i32(%i4)
14 declare %i8 @llvm.bswap.v2i64(%i8)
16 declare %i4 @llvm.cttz.v4i32(%i4)
17 declare %i8 @llvm.cttz.v2i64(%i8)
19 ; CHECK32-LABEL: test_scalarized_intrinsics
20 ; CHECK64-LABEL: test_scalarized_intrinsics
21 define void @test_scalarized_intrinsics() {
22         %r1 = add %i8 undef, undef
24 ; CHECK32: cost of 2 {{.*}}bswap.v4i32
25 ; CHECK64: cost of 2 {{.*}}bswap.v4i32
26         %r2 = call %i4 @llvm.bswap.v4i32(%i4 undef)
27 ; CHECK32: cost of 2 {{.*}}bswap.v2i64
28 ; CHECK64: cost of 2 {{.*}}bswap.v2i64
29         %r3 = call %i8 @llvm.bswap.v2i64(%i8 undef)
31 ; CHECK32: cost of 11 {{.*}}cttz.v4i32
32 ; CHECK64: cost of 11 {{.*}}cttz.v4i32
33         %r4 = call %i4 @llvm.cttz.v4i32(%i4 undef)
34 ; CHECK32: cost of 9 {{.*}}cttz.v2i64
35 ; CHECK64: cost of 9 {{.*}}cttz.v2i64
36         %r5 = call %i8 @llvm.cttz.v2i64(%i8 undef)
38 ; CHECK32: ret
39 ; CHECK64: ret
40         ret void