Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / Hexagon / loop-idiom / memmove-rt-check.ll
blob7a7d1d9b1a86593afae20abbb0aaebea4ef74326
1 ; RUN: opt -hexagon-loop-idiom -S < %s | FileCheck %s
3 ; Make sure that we generate correct runtime checks.
5 ; CHECK: b7.old:
6 ; CHECK:   [[LEN:%[0-9]+]] = shl nuw i32 %len, 3
7 ; CHECK:   [[SRC:%[0-9]+]] = ptrtoint ptr %src to i32
8 ; CHECK:   [[DST:%[0-9]+]] = ptrtoint ptr %dst to i32
9 ; CHECK:   [[ULT:%[0-9]+]] = icmp ult i32 [[DST]], [[SRC]]
10 ; CHECK:   [[SUB:%[0-9]+]] = sub i32 [[DST]], [[SRC]]
11 ; CHECK:   [[SLT:%[0-9]+]] = icmp sle i32 [[LEN]], [[SUB]]
12 ; CHECK:   [[CND:%[0-9]+]] = or i1 [[ULT]], [[SLT]]
13 ; CHECK:   br i1 [[CND]], label %b8.rtli, label %b8.rtli.ph
15 target datalayout = "e-m:e-p:32:32:32-a:0-n16:32-i64:64:64-i32:32:32-i16:16:16-i1:8:8-f32:32:32-f64:64:64-v32:32:32-v64:64:64-v512:512:512-v1024:1024:1024-v2048:2048:2048"
16 target triple = "hexagon"
18 define void @fred(ptr %dst, ptr %src, i32 %len) #0 {
19 b3:
20   %v6 = icmp slt i32 0, %len
21   br i1 %v6, label %b7, label %b16
23 b7:                                               ; preds = %b3
24   br label %b8
26 b8:                                               ; preds = %b13, %b7
27   %v9 = phi i32 [ 0, %b7 ], [ %v14, %b13 ]
28   %v10 = getelementptr inbounds i64, ptr %src, i32 %v9
29   %v11 = load i64, ptr %v10, align 8
30   %v12 = getelementptr inbounds i64, ptr %dst, i32 %v9
31   store i64 %v11, ptr %v12, align 8
32   br label %b13
34 b13:                                              ; preds = %b8
35   %v14 = add nsw i32 %v9, 1
36   %v15 = icmp slt i32 %v14, %len
37   br i1 %v15, label %b8, label %b16
39 b16:                                              ; preds = %b13, %b3
40   ret void
43 attributes #0 = { noinline nounwind "target-cpu"="hexagonv60" }