Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / ctpop-combine.ll
bloba33319e66d5f111dc4a6478ec8f2e572be9fb5ea
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+popcnt | FileCheck %s -check-prefixes=CHECK,POPCOUNT
3 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=-popcnt | FileCheck %s -check-prefixes=CHECK,NO-POPCOUNT
5 declare i8 @llvm.ctpop.i8(i8) nounwind readnone
6 declare i64 @llvm.ctpop.i64(i64) nounwind readnone
8 define i32 @test1(i64 %x) nounwind readnone {
9 ; CHECK-LABEL: test1:
10 ; CHECK:       # %bb.0:
11 ; CHECK-NEXT:    leaq -1(%rdi), %rcx
12 ; CHECK-NEXT:    xorl %eax, %eax
13 ; CHECK-NEXT:    testq %rcx, %rdi
14 ; CHECK-NEXT:    setne %al
15 ; CHECK-NEXT:    retq
16   %count = tail call i64 @llvm.ctpop.i64(i64 %x)
17   %cast = trunc i64 %count to i32
18   %cmp = icmp ugt i32 %cast, 1
19   %conv = zext i1 %cmp to i32
20   ret i32 %conv
24 define i32 @test2(i64 %x) nounwind readnone {
25 ; CHECK-LABEL: test2:
26 ; CHECK:       # %bb.0:
27 ; CHECK-NEXT:    leaq -1(%rdi), %rcx
28 ; CHECK-NEXT:    xorl %eax, %eax
29 ; CHECK-NEXT:    testq %rcx, %rdi
30 ; CHECK-NEXT:    sete %al
31 ; CHECK-NEXT:    retq
32   %count = tail call i64 @llvm.ctpop.i64(i64 %x)
33   %cmp = icmp ult i64 %count, 2
34   %conv = zext i1 %cmp to i32
35   ret i32 %conv
38 define i32 @test3(i64 %x) nounwind readnone {
39 ; POPCOUNT-LABEL: test3:
40 ; POPCOUNT:       # %bb.0:
41 ; POPCOUNT-NEXT:    popcntq %rdi, %rcx
42 ; POPCOUNT-NEXT:    andb $63, %cl
43 ; POPCOUNT-NEXT:    xorl %eax, %eax
44 ; POPCOUNT-NEXT:    cmpb $2, %cl
45 ; POPCOUNT-NEXT:    setb %al
46 ; POPCOUNT-NEXT:    retq
48 ; NO-POPCOUNT-LABEL: test3:
49 ; NO-POPCOUNT:       # %bb.0:
50 ; NO-POPCOUNT-NEXT:    movq %rdi, %rax
51 ; NO-POPCOUNT-NEXT:    shrq %rax
52 ; NO-POPCOUNT-NEXT:    movabsq $6148914691236517205, %rcx # imm = 0x5555555555555555
53 ; NO-POPCOUNT-NEXT:    andq %rax, %rcx
54 ; NO-POPCOUNT-NEXT:    subq %rcx, %rdi
55 ; NO-POPCOUNT-NEXT:    movabsq $3689348814741910323, %rax # imm = 0x3333333333333333
56 ; NO-POPCOUNT-NEXT:    movq %rdi, %rcx
57 ; NO-POPCOUNT-NEXT:    andq %rax, %rcx
58 ; NO-POPCOUNT-NEXT:    shrq $2, %rdi
59 ; NO-POPCOUNT-NEXT:    andq %rax, %rdi
60 ; NO-POPCOUNT-NEXT:    addq %rcx, %rdi
61 ; NO-POPCOUNT-NEXT:    movq %rdi, %rax
62 ; NO-POPCOUNT-NEXT:    shrq $4, %rax
63 ; NO-POPCOUNT-NEXT:    addq %rdi, %rax
64 ; NO-POPCOUNT-NEXT:    movabsq $1085102592571150095, %rcx # imm = 0xF0F0F0F0F0F0F0F
65 ; NO-POPCOUNT-NEXT:    andq %rax, %rcx
66 ; NO-POPCOUNT-NEXT:    movabsq $72340172838076673, %rdx # imm = 0x101010101010101
67 ; NO-POPCOUNT-NEXT:    imulq %rcx, %rdx
68 ; NO-POPCOUNT-NEXT:    shrq $56, %rdx
69 ; NO-POPCOUNT-NEXT:    andb $63, %dl
70 ; NO-POPCOUNT-NEXT:    xorl %eax, %eax
71 ; NO-POPCOUNT-NEXT:    cmpb $2, %dl
72 ; NO-POPCOUNT-NEXT:    setb %al
73 ; NO-POPCOUNT-NEXT:    retq
74   %count = tail call i64 @llvm.ctpop.i64(i64 %x)
75   %cast = trunc i64 %count to i6 ; Too small for 0-64
76   %cmp = icmp ult i6 %cast, 2
77   %conv = zext i1 %cmp to i32
78   ret i32 %conv
81 define i8 @test4(i8 %x) nounwind readnone {
82 ; POPCOUNT-LABEL: test4:
83 ; POPCOUNT:       # %bb.0:
84 ; POPCOUNT-NEXT:    andl $127, %edi
85 ; POPCOUNT-NEXT:    popcntl %edi, %eax
86 ; POPCOUNT-NEXT:    # kill: def $al killed $al killed $eax
87 ; POPCOUNT-NEXT:    retq
89 ; NO-POPCOUNT-LABEL: test4:
90 ; NO-POPCOUNT:       # %bb.0:
91 ; NO-POPCOUNT-NEXT:    movl %edi, %ecx
92 ; NO-POPCOUNT-NEXT:    andb $127, %cl
93 ; NO-POPCOUNT-NEXT:    shrb %dil
94 ; NO-POPCOUNT-NEXT:    andb $21, %dil
95 ; NO-POPCOUNT-NEXT:    subb %dil, %cl
96 ; NO-POPCOUNT-NEXT:    movl %ecx, %eax
97 ; NO-POPCOUNT-NEXT:    andb $51, %al
98 ; NO-POPCOUNT-NEXT:    shrb $2, %cl
99 ; NO-POPCOUNT-NEXT:    andb $51, %cl
100 ; NO-POPCOUNT-NEXT:    addb %al, %cl
101 ; NO-POPCOUNT-NEXT:    movl %ecx, %eax
102 ; NO-POPCOUNT-NEXT:    shrb $4, %al
103 ; NO-POPCOUNT-NEXT:    addb %cl, %al
104 ; NO-POPCOUNT-NEXT:    andb $15, %al
105 ; NO-POPCOUNT-NEXT:    retq
106   %x2 = and i8 %x, 127
107   %count = tail call i8 @llvm.ctpop.i8(i8 %x2)
108   %and = and i8 %count, 7
109   ret i8 %and
112 define i32 @ctpop_eq_one(i64 %x) nounwind readnone {
113 ; POPCOUNT-LABEL: ctpop_eq_one:
114 ; POPCOUNT:       # %bb.0:
115 ; POPCOUNT-NEXT:    popcntq %rdi, %rcx
116 ; POPCOUNT-NEXT:    xorl %eax, %eax
117 ; POPCOUNT-NEXT:    cmpl $1, %ecx
118 ; POPCOUNT-NEXT:    sete %al
119 ; POPCOUNT-NEXT:    retq
121 ; NO-POPCOUNT-LABEL: ctpop_eq_one:
122 ; NO-POPCOUNT:       # %bb.0:
123 ; NO-POPCOUNT-NEXT:    leaq -1(%rdi), %rax
124 ; NO-POPCOUNT-NEXT:    testq %rax, %rdi
125 ; NO-POPCOUNT-NEXT:    sete %al
126 ; NO-POPCOUNT-NEXT:    testq %rdi, %rdi
127 ; NO-POPCOUNT-NEXT:    setne %cl
128 ; NO-POPCOUNT-NEXT:    andb %al, %cl
129 ; NO-POPCOUNT-NEXT:    movzbl %cl, %eax
130 ; NO-POPCOUNT-NEXT:    retq
131   %count = tail call i64 @llvm.ctpop.i64(i64 %x)
132   %cmp = icmp eq i64 %count, 1
133   %conv = zext i1 %cmp to i32
134   ret i32 %conv
137 define i32 @ctpop_ne_one(i64 %x) nounwind readnone {
138 ; POPCOUNT-LABEL: ctpop_ne_one:
139 ; POPCOUNT:       # %bb.0:
140 ; POPCOUNT-NEXT:    popcntq %rdi, %rcx
141 ; POPCOUNT-NEXT:    xorl %eax, %eax
142 ; POPCOUNT-NEXT:    cmpl $1, %ecx
143 ; POPCOUNT-NEXT:    setne %al
144 ; POPCOUNT-NEXT:    retq
146 ; NO-POPCOUNT-LABEL: ctpop_ne_one:
147 ; NO-POPCOUNT:       # %bb.0:
148 ; NO-POPCOUNT-NEXT:    leaq -1(%rdi), %rax
149 ; NO-POPCOUNT-NEXT:    testq %rax, %rdi
150 ; NO-POPCOUNT-NEXT:    setne %al
151 ; NO-POPCOUNT-NEXT:    testq %rdi, %rdi
152 ; NO-POPCOUNT-NEXT:    sete %cl
153 ; NO-POPCOUNT-NEXT:    orb %al, %cl
154 ; NO-POPCOUNT-NEXT:    movzbl %cl, %eax
155 ; NO-POPCOUNT-NEXT:    retq
156   %count = tail call i64 @llvm.ctpop.i64(i64 %x)
157   %cmp = icmp ne i64 %count, 1
158   %conv = zext i1 %cmp to i32
159   ret i32 %conv
162 define i1 @ctpop_trunc_non_power2(i255 %x) nounwind {
163 ; CHECK-LABEL: ctpop_trunc_non_power2:
164 ; CHECK:       # %bb.0:
165 ; CHECK-NEXT:    movabsq $9223372036854775807, %rax # imm = 0x7FFFFFFFFFFFFFFF
166 ; CHECK-NEXT:    movq %rcx, %r8
167 ; CHECK-NEXT:    andq %rax, %r8
168 ; CHECK-NEXT:    movq %rdi, %r9
169 ; CHECK-NEXT:    addq $-1, %r9
170 ; CHECK-NEXT:    movq %rsi, %r10
171 ; CHECK-NEXT:    adcq $-1, %r10
172 ; CHECK-NEXT:    movq %rdx, %r11
173 ; CHECK-NEXT:    adcq $-1, %r11
174 ; CHECK-NEXT:    adcq %rax, %rcx
175 ; CHECK-NEXT:    andq %rdi, %r9
176 ; CHECK-NEXT:    andq %rdx, %r11
177 ; CHECK-NEXT:    orq %r9, %r11
178 ; CHECK-NEXT:    andq %r8, %rcx
179 ; CHECK-NEXT:    andq %rsi, %r10
180 ; CHECK-NEXT:    orq %rcx, %r10
181 ; CHECK-NEXT:    orq %r11, %r10
182 ; CHECK-NEXT:    sete %cl
183 ; CHECK-NEXT:    orq %rdx, %rdi
184 ; CHECK-NEXT:    orq %rsi, %r8
185 ; CHECK-NEXT:    orq %rdi, %r8
186 ; CHECK-NEXT:    setne %al
187 ; CHECK-NEXT:    andb %cl, %al
188 ; CHECK-NEXT:    retq
189   %a = call i255 @llvm.ctpop.i255(i255 %x)
190   %b = trunc i255 %a to i8 ; largest value from ctpop is 255, fits in 8 bits.
191   %c = icmp eq i8 %b, 1
192   ret i1 %c
194 declare i255 @llvm.ctpop.i255(i255)