Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AArch64 / new-load-requires-renaming-in-mssa.ll
blob6ba29a664be12f4ae5ce970618fe75f14449d7f5
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt -interleaved-load-combine -S -verify-memoryssa %s | FileCheck %s
4 target triple = "arm64-apple-darwin"
6 declare void @clobber(<2 x double>)
8 define void @rename_uses(ptr %src, i1 %c.1, i1 %c.2) {
9 ; CHECK-LABEL: @rename_uses(
10 ; CHECK-NEXT:  bb:
11 ; CHECK-NEXT:    br label [[OUTER_HEADER:%.*]]
12 ; CHECK:       outer.header:
13 ; CHECK-NEXT:    br label [[INNER:%.*]]
14 ; CHECK:       inner:
15 ; CHECK-NEXT:    br i1 [[C_1:%.*]], label [[OUTER_LATCH:%.*]], label [[INNER]]
16 ; CHECK:       outer.latch:
17 ; CHECK-NEXT:    br i1 [[C_2:%.*]], label [[EXIT:%.*]], label [[OUTER_HEADER]]
18 ; CHECK:       exit:
19 ; CHECK-NEXT:    [[GEP_0:%.*]] = getelementptr inbounds [12 x double], ptr [[SRC:%.*]], i64 0, i64 0
20 ; CHECK-NEXT:    [[GEP_4:%.*]] = getelementptr [12 x double], ptr [[SRC]], i64 0, i64 4
21 ; CHECK-NEXT:    [[INTERLEAVED_WIDE_LOAD:%.*]] = load <8 x double>, ptr [[GEP_0]], align 8
22 ; CHECK-NEXT:    [[L_0:%.*]] = load <4 x double>, ptr [[GEP_0]], align 8
23 ; CHECK-NEXT:    [[L_4:%.*]] = load <4 x double>, ptr [[GEP_4]], align 8
24 ; CHECK-NEXT:    [[INTERLEAVED_SHUFFLE:%.*]] = shufflevector <8 x double> [[INTERLEAVED_WIDE_LOAD]], <8 x double> poison, <2 x i32> <i32 0, i32 4>
25 ; CHECK-NEXT:    [[S_0:%.*]] = shufflevector <4 x double> [[L_0]], <4 x double> [[L_4]], <2 x i32> <i32 0, i32 4>
26 ; CHECK-NEXT:    [[INTERLEAVED_SHUFFLE1:%.*]] = shufflevector <8 x double> [[INTERLEAVED_WIDE_LOAD]], <8 x double> poison, <2 x i32> <i32 1, i32 5>
27 ; CHECK-NEXT:    [[S_1:%.*]] = shufflevector <4 x double> [[L_0]], <4 x double> [[L_4]], <2 x i32> <i32 1, i32 5>
28 ; CHECK-NEXT:    [[INTERLEAVED_SHUFFLE2:%.*]] = shufflevector <8 x double> [[INTERLEAVED_WIDE_LOAD]], <8 x double> poison, <2 x i32> <i32 2, i32 6>
29 ; CHECK-NEXT:    [[S_2:%.*]] = shufflevector <4 x double> [[L_0]], <4 x double> [[L_4]], <2 x i32> <i32 2, i32 6>
30 ; CHECK-NEXT:    [[INTERLEAVED_SHUFFLE3:%.*]] = shufflevector <8 x double> [[INTERLEAVED_WIDE_LOAD]], <8 x double> poison, <2 x i32> <i32 3, i32 7>
31 ; CHECK-NEXT:    [[S_3:%.*]] = shufflevector <4 x double> [[L_0]], <4 x double> [[L_4]], <2 x i32> <i32 3, i32 7>
32 ; CHECK-NEXT:    call void @clobber(<2 x double> [[INTERLEAVED_SHUFFLE]])
33 ; CHECK-NEXT:    call void @clobber(<2 x double> [[INTERLEAVED_SHUFFLE1]])
34 ; CHECK-NEXT:    call void @clobber(<2 x double> [[INTERLEAVED_SHUFFLE2]])
35 ; CHECK-NEXT:    call void @clobber(<2 x double> [[INTERLEAVED_SHUFFLE3]])
36 ; CHECK-NEXT:    ret void
38 bb:
39   br label %outer.header
41 outer.header:
42   br label %inner
44 inner:
45   br i1 %c.1, label %outer.latch, label %inner
47 outer.latch:
48   br i1 %c.2, label %exit, label %outer.header
50 exit:
51   %gep.0 = getelementptr inbounds [ 12 x double ], ptr %src, i64 0, i64 0
52   %gep.4 = getelementptr [ 12 x double ], ptr %src, i64 0, i64 4
53   %l.0 = load <4 x double>, ptr %gep.0, align 8
54   %l.4 = load <4 x double>, ptr %gep.4, align 8
55   %s.0 = shufflevector <4 x double> %l.0, <4 x double> %l.4, <2 x i32> <i32 0, i32 4>
56   %s.1 = shufflevector <4 x double> %l.0, <4 x double> %l.4, <2 x i32> <i32 1, i32 5>
57   %s.2 = shufflevector <4 x double> %l.0, <4 x double> %l.4, <2 x i32> <i32 2, i32 6>
58   %s.3 = shufflevector <4 x double> %l.0, <4 x double> %l.4, <2 x i32> <i32 3, i32 7>
59   call void @clobber(<2 x double> %s.0)
60   call void @clobber(<2 x double> %s.1)
61   call void @clobber(<2 x double> %s.2)
62   call void @clobber(<2 x double> %s.3)
63   ret void