Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / h-registers-1.ll
blob07d85d260a37a770e6f18d2974e326c5f6a5d782
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-linux -mattr=-bmi | FileCheck %s --check-prefix=CHECK
3 ; RUN: llc < %s -mtriple=x86_64-linux-gnux32 -mattr=-bmi | FileCheck %s --check-prefix=GNUX32
5 ; LLVM creates virtual registers for values live across blocks
6 ; based on the type of the value. Make sure that the extracts
7 ; here use the GR64_NOREX register class for their result,
8 ; instead of plain GR64.
10 define i64 @foo(i64 %a, i64 %b, i64 %c, i64 %d, i64 %e, i64 %f, i64 %g, i64 %h) {
11 ; CHECK-LABEL: foo:
12 ; CHECK:       # %bb.0:
13 ; CHECK-NEXT:    pushq %rbp
14 ; CHECK-NEXT:    .cfi_def_cfa_offset 16
15 ; CHECK-NEXT:    pushq %rbx
16 ; CHECK-NEXT:    .cfi_def_cfa_offset 24
17 ; CHECK-NEXT:    .cfi_offset %rbx, -24
18 ; CHECK-NEXT:    .cfi_offset %rbp, -16
19 ; CHECK-NEXT:    movq %rsi, %rax
20 ; CHECK-NEXT:    movq %rdi, %rbx
21 ; CHECK-NEXT:    movzbl %bh, %esi
22 ; CHECK-NEXT:    movzbl %ah, %edi
23 ; CHECK-NEXT:    movzbl %dh, %edx
24 ; CHECK-NEXT:    movzbl %ch, %ebp
25 ; CHECK-NEXT:    movq %r8, %rax
26 ; CHECK-NEXT:    movzbl %ah, %ecx
27 ; CHECK-NEXT:    movq %r9, %rax
28 ; CHECK-NEXT:    movzbl %ah, %ebx
29 ; CHECK-NEXT:    movzbl {{[0-9]+}}(%rsp), %eax
30 ; CHECK-NEXT:    movzbl {{[0-9]+}}(%rsp), %r8d
31 ; CHECK-NEXT:    addq %rdi, %rsi
32 ; CHECK-NEXT:    addq %rbp, %rdx
33 ; CHECK-NEXT:    addq %rsi, %rdx
34 ; CHECK-NEXT:    addq %rbx, %rcx
35 ; CHECK-NEXT:    addq %r8, %rax
36 ; CHECK-NEXT:    addq %rcx, %rax
37 ; CHECK-NEXT:    addq %rdx, %rax
38 ; CHECK-NEXT:    popq %rbx
39 ; CHECK-NEXT:    .cfi_def_cfa_offset 16
40 ; CHECK-NEXT:    popq %rbp
41 ; CHECK-NEXT:    .cfi_def_cfa_offset 8
42 ; CHECK-NEXT:    retq
44 ; GNUX32-LABEL: foo:
45 ; GNUX32:       # %bb.0:
46 ; GNUX32-NEXT:    pushq %rbp
47 ; GNUX32-NEXT:    .cfi_def_cfa_offset 16
48 ; GNUX32-NEXT:    pushq %rbx
49 ; GNUX32-NEXT:    .cfi_def_cfa_offset 24
50 ; GNUX32-NEXT:    .cfi_offset %rbx, -24
51 ; GNUX32-NEXT:    .cfi_offset %rbp, -16
52 ; GNUX32-NEXT:    movq %rsi, %rax
53 ; GNUX32-NEXT:    movq %rdi, %rbx
54 ; GNUX32-NEXT:    movzbl %bh, %esi
55 ; GNUX32-NEXT:    movzbl %ah, %edi
56 ; GNUX32-NEXT:    movzbl %dh, %edx
57 ; GNUX32-NEXT:    movzbl %ch, %ebp
58 ; GNUX32-NEXT:    movq %r8, %rax
59 ; GNUX32-NEXT:    movzbl %ah, %ecx
60 ; GNUX32-NEXT:    movq %r9, %rax
61 ; GNUX32-NEXT:    movzbl %ah, %ebx
62 ; GNUX32-NEXT:    movzbl {{[0-9]+}}(%esp), %eax
63 ; GNUX32-NEXT:    movzbl {{[0-9]+}}(%esp), %r8d
64 ; GNUX32-NEXT:    addq %rdi, %rsi
65 ; GNUX32-NEXT:    addq %rbp, %rdx
66 ; GNUX32-NEXT:    addq %rsi, %rdx
67 ; GNUX32-NEXT:    addq %rbx, %rcx
68 ; GNUX32-NEXT:    addq %r8, %rax
69 ; GNUX32-NEXT:    addq %rcx, %rax
70 ; GNUX32-NEXT:    addq %rdx, %rax
71 ; GNUX32-NEXT:    popq %rbx
72 ; GNUX32-NEXT:    .cfi_def_cfa_offset 16
73 ; GNUX32-NEXT:    popq %rbp
74 ; GNUX32-NEXT:    .cfi_def_cfa_offset 8
75 ; GNUX32-NEXT:    retq
76   %sa = lshr i64 %a, 8
77   %A = and i64 %sa, 255
78   %sb = lshr i64 %b, 8
79   %B = and i64 %sb, 255
80   %sc = lshr i64 %c, 8
81   %C = and i64 %sc, 255
82   %sd = lshr i64 %d, 8
83   %D = and i64 %sd, 255
84   %se = lshr i64 %e, 8
85   %E = and i64 %se, 255
86   %sf = lshr i64 %f, 8
87   %F = and i64 %sf, 255
88   %sg = lshr i64 %g, 8
89   %G = and i64 %sg, 255
90   %sh = lshr i64 %h, 8
91   %H = and i64 %sh, 255
92   br label %next
94 next:
95   %u = add i64 %A, %B
96   %v = add i64 %C, %D
97   %w = add i64 %E, %F
98   %x = add i64 %G, %H
99   %y = add i64 %u, %v
100   %z = add i64 %w, %x
101   %t = add i64 %y, %z
102   ret i64 %t