[docs] Add LICENSE.txt to the root of the mono-repo
[llvm-project.git] / llvm / test / Transforms / SLPVectorizer / NVPTX / non-vectorizable-intrinsic.ll
blobff8778f31e4038f12be83fc452d72e384a5e56b3
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt < %s -slp-vectorizer -o - -S -slp-threshold=-1000 | FileCheck %s
4 target datalayout = "e-p:32:32-i64:64-v16:16-v32:32-n16:32:64"
5 target triple = "nvptx--nvidiacl"
7 ; CTLZ cannot be vectorized currently because the second argument is a scalar
8 ; for both the scalar and vector forms of the intrinsic. In the future it
9 ; should be possible to vectorize such functions.
10 ; Test causes an assert if LLVM tries to vectorize CTLZ.
12 define <2 x i8> @cltz_test(<2 x i8> %x) #0 {
13 ; CHECK-LABEL: @cltz_test(
14 ; CHECK-NEXT:  entry:
15 ; CHECK-NEXT:    [[TMP0:%.*]] = extractelement <2 x i8> [[X:%.*]], i32 0
16 ; CHECK-NEXT:    [[CALL_I:%.*]] = call i8 @llvm.ctlz.i8(i8 [[TMP0]], i1 false)
17 ; CHECK-NEXT:    [[VECINIT:%.*]] = insertelement <2 x i8> undef, i8 [[CALL_I]], i32 0
18 ; CHECK-NEXT:    [[TMP1:%.*]] = extractelement <2 x i8> [[X]], i32 1
19 ; CHECK-NEXT:    [[CALL_I4:%.*]] = call i8 @llvm.ctlz.i8(i8 [[TMP1]], i1 false)
20 ; CHECK-NEXT:    [[VECINIT2:%.*]] = insertelement <2 x i8> [[VECINIT]], i8 [[CALL_I4]], i32 1
21 ; CHECK-NEXT:    ret <2 x i8> [[VECINIT2]]
23 entry:
24   %0 = extractelement <2 x i8> %x, i32 0
25   %call.i = call i8 @llvm.ctlz.i8(i8 %0, i1 false)
26   %vecinit = insertelement <2 x i8> undef, i8 %call.i, i32 0
27   %1 = extractelement <2 x i8> %x, i32 1
28   %call.i4 = call i8 @llvm.ctlz.i8(i8 %1, i1 false)
29   %vecinit2 = insertelement <2 x i8> %vecinit, i8 %call.i4, i32 1
30   ret <2 x i8> %vecinit2
33 define <2 x i8> @cltz_test2(<2 x i8> %x) #1 {
34 ; CHECK-LABEL: @cltz_test2(
35 ; CHECK-NEXT:  entry:
36 ; CHECK-NEXT:    [[TMP0:%.*]] = extractelement <2 x i8> [[X:%.*]], i32 0
37 ; CHECK-NEXT:    [[TMP1:%.*]] = extractelement <2 x i8> [[X]], i32 1
38 ; CHECK-NEXT:    [[CALL_I:%.*]] = call i8 @llvm.ctlz.i8(i8 [[TMP0]], i1 false)
39 ; CHECK-NEXT:    [[CALL_I4:%.*]] = call i8 @llvm.ctlz.i8(i8 [[TMP1]], i1 false)
40 ; CHECK-NEXT:    [[VECINIT:%.*]] = insertelement <2 x i8> undef, i8 [[CALL_I]], i32 0
41 ; CHECK-NEXT:    [[VECINIT2:%.*]] = insertelement <2 x i8> [[VECINIT]], i8 [[CALL_I4]], i32 1
42 ; CHECK-NEXT:    ret <2 x i8> [[VECINIT2]]
44 entry:
45   %0 = extractelement <2 x i8> %x, i32 0
46   %1 = extractelement <2 x i8> %x, i32 1
47   %call.i = call i8 @llvm.ctlz.i8(i8 %0, i1 false)
48   %call.i4 = call i8 @llvm.ctlz.i8(i8 %1, i1 false)
49   %vecinit = insertelement <2 x i8> undef, i8 %call.i, i32 0
50   %vecinit2 = insertelement <2 x i8> %vecinit, i8 %call.i4, i32 1
51   ret <2 x i8> %vecinit2
54 declare i8 @llvm.ctlz.i8(i8, i1) #3
56 attributes #0 = { alwaysinline nounwind "less-precise-fpmad"="false" "frame-pointer"="all" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "unsafe-fp-math"="false" "use-soft-float"="false" }
57 attributes #1 = { nounwind readnone }