[TTI] getTypeBasedIntrinsicInstrCost - add basic handling for strided load/store...
[llvm-project.git] / llvm / test / Transforms / SLPVectorizer / NVPTX / vectorizable-intrinsic.ll
blob114bf585b016355c0fb32bf1f19995f32e848f51
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 5
2 ; RUN: opt < %s -passes=slp-vectorizer -o - -S -slp-threshold=-1000 | FileCheck %s
4 target datalayout = "e-p:32:32-i64:64-v16:16-v32:32-n16:32:64"
5 target triple = "nvptx--nvidiacl"
7 ; Test that CTLZ can be vectorized currently even though the second argument is a scalar
9 define <2 x i8> @cltz_test(<2 x i8> %x) #0 {
10 ; CHECK-LABEL: define <2 x i8> @cltz_test(
11 ; CHECK-SAME: <2 x i8> [[X:%.*]]) #[[ATTR0:[0-9]+]] {
12 ; CHECK-NEXT:  [[ENTRY:.*:]]
13 ; CHECK-NEXT:    [[VEC:%.*]] = call <2 x i8> @llvm.ctlz.v2i8(<2 x i8> [[X]], i1 false)
14 ; CHECK-NEXT:    ret <2 x i8> [[VEC]]
16 entry:
17   %0 = extractelement <2 x i8> %x, i32 0
18   %call.i = call i8 @llvm.ctlz.i8(i8 %0, i1 false)
19   %vecinit = insertelement <2 x i8> zeroinitializer, i8 %call.i, i32 0
20   %1 = extractelement <2 x i8> %x, i32 1
21   %call.i4 = call i8 @llvm.ctlz.i8(i8 %1, i1 false)
22   %vecinit2 = insertelement <2 x i8> %vecinit, i8 %call.i4, i32 1
23   ret <2 x i8> %vecinit2
27 define <2 x i8> @cltz_test_poison(<2 x i8> %x) #0 {
28 ; CHECK-LABEL: define <2 x i8> @cltz_test_poison(
29 ; CHECK-SAME: <2 x i8> [[X:%.*]]) #[[ATTR0]] {
30 ; CHECK-NEXT:  [[ENTRY:.*:]]
31 ; CHECK-NEXT:    [[VEC:%.*]] = call <2 x i8> @llvm.ctlz.v2i8(<2 x i8> [[X]], i1 false)
32 ; CHECK-NEXT:    ret <2 x i8> [[VEC]]
34 entry:
35   %0 = extractelement <2 x i8> %x, i32 0
36   %call.i = call i8 @llvm.ctlz.i8(i8 %0, i1 false)
37   %vecinit = insertelement <2 x i8> poison, i8 %call.i, i32 0
38   %1 = extractelement <2 x i8> %x, i32 1
39   %call.i4 = call i8 @llvm.ctlz.i8(i8 %1, i1 false)
40   %vecinit2 = insertelement <2 x i8> %vecinit, i8 %call.i4, i32 1
41   ret <2 x i8> %vecinit2
44 declare i8 @llvm.ctlz.i8(i8, i1) #3
46 attributes #0 = { alwaysinline nounwind "less-precise-fpmad"="false" "frame-pointer"="all" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "unsafe-fp-math"="false" "use-soft-float"="false" }
47 attributes #1 = { nounwind readnone }