Bump version to 19.1.0-rc3
[llvm-project.git] / llvm / test / Transforms / SLPVectorizer / X86 / reduced-gathered-vectorized.ll
blob4dea52357e04f3ef838f0f6dba6e0d7592d39a94
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt -passes=slp-vectorizer -S -mtriple=x86_64-unknown-linux-gnu < %s | FileCheck %s
4 define i16 @test() {
5 ; CHECK-LABEL: @test(
6 ; CHECK-NEXT:  entry:
7 ; CHECK-NEXT:    [[A:%.*]] = getelementptr [1000 x i64], ptr null, i64 0, i64 5
8 ; CHECK-NEXT:    [[A1:%.*]] = getelementptr [1000 x i64], ptr null, i64 0, i64 6
9 ; CHECK-NEXT:    [[A2:%.*]] = getelementptr [1000 x i64], ptr null, i64 0, i64 7
10 ; CHECK-NEXT:    br label [[WHILE:%.*]]
11 ; CHECK:       while:
12 ; CHECK-NEXT:    [[PH:%.*]] = phi i64 [ 0, [[ENTRY:%.*]] ], [ [[OP_RDX5:%.*]], [[WHILE]] ]
13 ; CHECK-NEXT:    [[TMP0:%.*]] = load i64, ptr null, align 8
14 ; CHECK-NEXT:    [[TMP1:%.*]] = load i64, ptr [[A1]], align 16
15 ; CHECK-NEXT:    [[TMP2:%.*]] = load <2 x i64>, ptr [[A2]], align 8
16 ; CHECK-NEXT:    [[TMP3:%.*]] = load i64, ptr null, align 8
17 ; CHECK-NEXT:    [[TMP4:%.*]] = load <4 x i64>, ptr [[A]], align 8
18 ; CHECK-NEXT:    [[TMP5:%.*]] = shufflevector <2 x i64> [[TMP2]], <2 x i64> poison, <8 x i32> <i32 0, i32 1, i32 poison, i32 poison, i32 poison, i32 poison, i32 poison, i32 poison>
19 ; CHECK-NEXT:    [[TMP6:%.*]] = insertelement <8 x i64> [[TMP5]], i64 [[TMP0]], i32 2
20 ; CHECK-NEXT:    [[TMP7:%.*]] = insertelement <8 x i64> [[TMP6]], i64 [[TMP1]], i32 3
21 ; CHECK-NEXT:    [[TMP8:%.*]] = shufflevector <4 x i64> [[TMP4]], <4 x i64> poison, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 poison, i32 poison, i32 poison, i32 poison>
22 ; CHECK-NEXT:    [[TMP9:%.*]] = shufflevector <8 x i64> [[TMP7]], <8 x i64> [[TMP8]], <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 8, i32 9, i32 10, i32 11>
23 ; CHECK-NEXT:    [[TMP10:%.*]] = shufflevector <8 x i64> [[TMP9]], <8 x i64> zeroinitializer, <8 x i32> <i32 8, i32 8, i32 2, i32 3, i32 4, i32 5, i32 8, i32 8>
24 ; CHECK-NEXT:    [[TMP11:%.*]] = call i64 @llvm.vector.reduce.xor.v8i64(<8 x i64> [[TMP10]])
25 ; CHECK-NEXT:    [[OP_RDX5]] = xor i64 [[TMP3]], [[TMP11]]
26 ; CHECK-NEXT:    br label [[WHILE]]
28 entry:
29   %a = getelementptr [1000 x i64], ptr null, i64 0, i64 5
30   %a1 = getelementptr [1000 x i64], ptr null, i64 0, i64 6
31   %a2 = getelementptr [1000 x i64], ptr null, i64 0, i64 7
32   %a3 = getelementptr [1000 x i64], ptr null, i64 0, i64 8
33   br label %while
35 while:
36   %ph = phi i64 [ 0, %entry ], [ %xor, %while ]
37   %0 = load i64, ptr null, align 8
38   %1 = load i64, ptr %a1, align 16
39   %2 = load i64, ptr %a2, align 8
40   %3 = load i64, ptr %a3, align 16
41   %4 = load i64, ptr null, align 8
42   %5 = load i64, ptr %a, align 8
43   %6 = load i64, ptr %a1, align 16
44   %7 = load i64, ptr %a2, align 8
45   %8 = load i64, ptr %a3, align 16
46   %9 = xor i64 %0, %1
47   %10 = xor i64 %9, %2
48   %11 = xor i64 %10, %3
49   %12 = xor i64 %11, %4
50   %13 = xor i64 %12, %0
51   %14 = xor i64 %13, %1
52   %15 = xor i64 %14, %2
53   %16 = xor i64 %15, %3
54   %17 = xor i64 %16, %4
55   %18 = xor i64 %17, %0
56   %19 = xor i64 %18, %1
57   %20 = xor i64 %19, %2
58   %21 = xor i64 %20, %3
59   %22 = xor i64 %21, %4
60   %23 = xor i64 %22, %5
61   %24 = xor i64 %23, %6
62   %25 = xor i64 %24, %2
63   %26 = xor i64 %25, %3
64   %27 = xor i64 %26, %4
65   %28 = xor i64 %27, %5
66   %29 = xor i64 %28, %6
67   %30 = xor i64 %29, %7
68   %31 = xor i64 %30, %8
69   %32 = xor i64 %31, %4
70   %33 = xor i64 %32, %5
71   %34 = xor i64 %33, %6
72   %35 = xor i64 %34, %7
73   %xor = xor i64 %35, %8
74   br label %while