Bump version to 19.1.0-rc3
[llvm-project.git] / llvm / test / Transforms / SLPVectorizer / X86 / extract-scalar-from-undef.ll
blobd326c855a1091280058688c8b9ad79bd829d12d6
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt -S -passes=slp-vectorizer -mtriple=x86_64-apple-macosx -mattr=+avx2 < %s | FileCheck %s
4 define i64 @foo(i32 %tmp7) {
5 ; CHECK-LABEL: @foo(
6 ; CHECK-NEXT:  bb:
7 ; CHECK-NEXT:    [[TMP0:%.*]] = insertelement <4 x i32> <i32 0, i32 0, i32 poison, i32 0>, i32 [[TMP7:%.*]], i32 2
8 ; CHECK-NEXT:    [[TMP1:%.*]] = sub <4 x i32> [[TMP0]], zeroinitializer
9 ; CHECK-NEXT:    [[TMP24:%.*]] = sub i32 undef, 0
10 ; CHECK-NEXT:    [[TMP2:%.*]] = insertelement <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 poison, i32 poison, i32 undef, i32 0>, i32 [[TMP24]], i32 4
11 ; CHECK-NEXT:    [[TMP3:%.*]] = insertelement <8 x i32> [[TMP2]], i32 0, i32 5
12 ; CHECK-NEXT:    [[TMP4:%.*]] = shufflevector <4 x i32> [[TMP1]], <4 x i32> undef, <8 x i32> <i32 0, i32 1, i32 4, i32 2, i32 3, i32 5, i32 poison, i32 6>
13 ; CHECK-NEXT:    [[TMP5:%.*]] = insertelement <8 x i32> [[TMP4]], i32 [[TMP24]], i32 6
14 ; CHECK-NEXT:    [[TMP6:%.*]] = add nsw <8 x i32> [[TMP3]], [[TMP5]]
15 ; CHECK-NEXT:    [[TMP77:%.*]] = sub nsw <8 x i32> [[TMP3]], [[TMP5]]
16 ; CHECK-NEXT:    [[TMP8:%.*]] = shufflevector <8 x i32> [[TMP6]], <8 x i32> [[TMP77]], <8 x i32> <i32 0, i32 9, i32 10, i32 11, i32 4, i32 5, i32 14, i32 15>
17 ; CHECK-NEXT:    [[TMP9:%.*]] = add <8 x i32> zeroinitializer, [[TMP8]]
18 ; CHECK-NEXT:    [[TMP10:%.*]] = xor <8 x i32> [[TMP9]], zeroinitializer
19 ; CHECK-NEXT:    [[TMP11:%.*]] = call i32 @llvm.vector.reduce.add.v8i32(<8 x i32> [[TMP10]])
20 ; CHECK-NEXT:    [[OP_RDX:%.*]] = add i32 [[TMP11]], 0
21 ; CHECK-NEXT:    [[TMP64:%.*]] = zext i32 [[OP_RDX]] to i64
22 ; CHECK-NEXT:    ret i64 [[TMP64]]
24 bb:
25   %tmp = sub i32 0, 0
26   %tmp2 = sub nsw i32 0, %tmp
27   %tmp3 = add i32 0, %tmp2
28   %tmp4 = xor i32 %tmp3, 0
29   %tmp6 = sub i32 0, 0
30   %tmp8 = sub i32 %tmp7, 0
31   %tmp9 = sub nsw i32 0, undef
32   %tmp10 = add nsw i32 0, %tmp6
33   %tmp11 = sub nsw i32 0, %tmp8
34   %tmp12 = add i32 0, %tmp10
35   %tmp13 = xor i32 %tmp12, 0
36   %tmp14 = add i32 0, %tmp9
37   %tmp15 = xor i32 %tmp14, 0
38   %tmp16 = add i32 0, %tmp11
39   %tmp17 = xor i32 %tmp16, 0
40   %tmp18 = add i32 %tmp13, %tmp4
41   %tmp19 = add i32 %tmp18, 0
42   %tmp20 = add i32 %tmp19, %tmp15
43   %tmp21 = add i32 %tmp20, %tmp17
44   %tmp22 = sub i32 0, 0
45   %tmp23 = add i32 0, 0
46   %tmp24 = sub i32 undef, 0
47   %tmp25 = add nsw i32 %tmp23, undef
48   %tmp26 = add nsw i32 %tmp24, %tmp22
49   %tmp27 = sub nsw i32 undef, %tmp24
50   %tmp28 = add i32 0, %tmp25
51   %tmp29 = xor i32 %tmp28, 0
52   %tmp30 = add i32 0, %tmp26
53   %tmp31 = xor i32 %tmp30, 0
54   %tmp32 = add i32 0, %tmp27
55   %tmp33 = xor i32 %tmp32, 0
56   %tmp34 = add i32 %tmp31, %tmp21
57   %tmp35 = add i32 %tmp34, %tmp29
58   %tmp36 = add i32 %tmp35, 0
59   %tmp37 = add i32 %tmp36, %tmp33
60   %tmp38 = sub nsw i32 0, undef
61   %tmp39 = add i32 0, %tmp38
62   %tmp40 = xor i32 %tmp39, 0
63   %tmp41 = add i32 0, %tmp37
64   %tmp42 = add i32 %tmp41, 0
65   %tmp43 = add i32 %tmp42, %tmp40
66   %tmp64 = zext i32 %tmp43 to i64
67   ret i64 %tmp64