[X86] combineTargetShuffle - commute VPERMV3 shuffles so any load is on the RHS
[llvm-project.git] / llvm / test / CodeGen / SystemZ / bswap-10.ll
blob6de2970b80e2ea7076ff57ed6ad90ea10e259ac0
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
2 ; Test i128 byteswaps on z15 and higher.
4 ; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z15 | FileCheck %s
6 declare i128 @llvm.bswap.i128(i128 %a)
8 ; Check 128-bit register-to-register byteswaps.
9 define i128 @f1(i128 %a, i128 %b, i128 %c) {
10 ; CHECK-LABEL: f1:
11 ; CHECK:       # %bb.0:
12 ; CHECK-NEXT:    vl %v1, 0(%r4), 3
13 ; CHECK-NEXT:    vl %v2, 0(%r3), 3
14 ; CHECK-NEXT:    larl %r1, .LCPI0_0
15 ; CHECK-NEXT:    vaq %v1, %v2, %v1
16 ; CHECK-NEXT:    vl %v2, 0(%r1), 3
17 ; CHECK-NEXT:    vl %v0, 0(%r5), 3
18 ; CHECK-NEXT:    vperm %v1, %v1, %v1, %v2
19 ; CHECK-NEXT:    vaq %v0, %v1, %v0
20 ; CHECK-NEXT:    vst %v0, 0(%r2), 3
21 ; CHECK-NEXT:    br %r14
22   %in = add i128 %a, %b
23   %swapped = call i128 @llvm.bswap.i128(i128 %in)
24   %out = add i128 %swapped, %c
25   ret i128 %out
28 ; Check 128-bit register-to-memory byteswaps.
29 define i128 @f2(i128 %a, i128 %b) {
30 ; CHECK-LABEL: f2:
31 ; CHECK:       # %bb.0:
32 ; CHECK-NEXT:    vl %v0, 0(%r4), 3
33 ; CHECK-NEXT:    vl %v1, 0(%r3), 3
34 ; CHECK-NEXT:    vaq %v0, %v1, %v0
35 ; CHECK-NEXT:    vstbrq %v0, 0(%r2)
36 ; CHECK-NEXT:    br %r14
37   %in = add i128 %a, %b
38   %swapped = call i128 @llvm.bswap.i128(i128 %in)
39   ret i128 %swapped
42 ; Check 128-bit memory-to-register byteswaps.
43 define i128 @f3(i128 %a, i128 %b) {
44 ; CHECK-LABEL: f3:
45 ; CHECK:       # %bb.0:
46 ; CHECK-NEXT:    vl %v0, 0(%r4), 3
47 ; CHECK-NEXT:    vlbrq %v1, 0(%r3)
48 ; CHECK-NEXT:    vaq %v0, %v1, %v0
49 ; CHECK-NEXT:    vst %v0, 0(%r2), 3
50 ; CHECK-NEXT:    br %r14
51   %swapped = call i128 @llvm.bswap.i128(i128 %a)
52   %out = add i128 %swapped, %b
53   ret i128 %out