[AMDGPU] Add True16 register classes.
[llvm-project.git] / llvm / test / Transforms / LoopIdiom / ctpop-multiple-users-crash.ll
blob3287d65f6b1697e3896a4c8b4c82862707a8879e
1 ; RUN: opt -passes=loop-idiom -S < %s | FileCheck %s
3 target datalayout = "e-m:o-i64:64-i128:128-n32:64-S128"
4 target triple = "arm64-apple-ios8.0.0"
6 ; When we replace the precondition with a ctpop, we need to ensure
7 ; that only the first branch reads the ctpop.  The store prior
8 ; to that should continue to read from the original compare.
10 ; CHECK: %tobool.5 = icmp ne i32 %num, 0
11 ; CHECK: store i1 %tobool.5, ptr %ptr
13 define internal fastcc i32 @num_bits_set(i32 %num, ptr %ptr) #1 {
14 entry:
15   %tobool.5 = icmp ne i32 %num, 0
16   store i1 %tobool.5, ptr %ptr
17   br i1 %tobool.5, label %for.body.lr.ph, label %for.end
19 for.body.lr.ph:                                   ; preds = %entry
20   br label %for.body
22 for.body:                                         ; preds = %for.body.lr.ph, %for.body
23   %count.07 = phi i32 [ 0, %for.body.lr.ph ], [ %inc, %for.body ]
24   %num.addr.06 = phi i32 [ %num, %for.body.lr.ph ], [ %and, %for.body ]
25   %sub = add i32 %num.addr.06, -1
26   %and = and i32 %sub, %num.addr.06
27   %inc = add nsw i32 %count.07, 1
28   %tobool = icmp ne i32 %and, 0
29   br i1 %tobool, label %for.body, label %for.end
31 for.end:                                          ; preds = %for.cond.for.end_crit_edge, %entry
32   %count.0.lcssa = phi i32 [ %inc, %for.body ], [ 0, %entry ]
33   ret i32 %count.0.lcssa