[x86] fix assert with horizontal math + broadcast of vector (PR43402)
[llvm-core.git] / test / CodeGen / X86 / pr35763.ll
blobf99cbcdeaa9a02d53958ec006ff3ac2d8c1b57ab
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=x86_64-linux-gnu %s -o - | FileCheck %s
4 %struct.S = type <{ i16, i24, [5 x i8], i8, i16, [2 x i8] }>
6 @z = global { i16, i8, i8, i8, i8, i8, i8, i8, i8, i8, [5 x i8] } { i16 -724, i8 94, i8 -18, i8 5, i8 undef, i8 96, i8 104, i8 -24, i8 10, i8 0, [5 x i8] undef }, align 8
7 @tf_3_var_136 = global i64 0, align 8
8 @.str = private unnamed_addr constant [6 x i8] c"%llu\0A\00", align 1
10 define void @PR35763() {
11 ; CHECK-LABEL: PR35763:
12 ; CHECK:       # %bb.0: # %entry
13 ; CHECK-NEXT:    movl {{.*}}(%rip), %eax
14 ; CHECK-NEXT:    orl z+{{.*}}(%rip), %eax
15 ; CHECK-NEXT:    movzwl %ax, %eax
16 ; CHECK-NEXT:    movq %rax, {{.*}}(%rip)
17 ; CHECK-NEXT:    movl z+{{.*}}(%rip), %eax
18 ; CHECK-NEXT:    movzbl z+{{.*}}(%rip), %ecx
19 ; CHECK-NEXT:    shlq $32, %rcx
20 ; CHECK-NEXT:    orq %rax, %rcx
21 ; CHECK-NEXT:    movabsq $1090921758719, %rax # imm = 0xFE0000FFFF
22 ; CHECK-NEXT:    andq %rcx, %rax
23 ; CHECK-NEXT:    movl %eax, z+{{.*}}(%rip)
24 ; CHECK-NEXT:    shrq $32, %rax
25 ; CHECK-NEXT:    movb %al, z+{{.*}}(%rip)
26 ; CHECK-NEXT:    retq
27 entry:
28   %0 = load i16, i16* getelementptr inbounds (%struct.S, %struct.S* bitcast ({ i16, i8, i8, i8, i8, i8, i8, i8, i8, i8, [5 x i8] }* @z to %struct.S*), i32 0, i32 0), align 8
29   %conv = sext i16 %0 to i32
30   %bf.load = load i32, i32* bitcast (i24* getelementptr inbounds (%struct.S, %struct.S* bitcast ({ i16, i8, i8, i8, i8, i8, i8, i8, i8, i8, [5 x i8] }* @z to %struct.S*), i32 0, i32 1) to i32*), align 2
31   %bf.clear = and i32 %bf.load, 2097151
32   %bf.cast = zext i32 %bf.clear to i64
33   %conv1 = trunc i64 %bf.cast to i32
34   %or = or i32 %conv, %conv1
35   %conv2 = trunc i32 %or to i16
36   %conv3 = zext i16 %conv2 to i64
37   store i64 %conv3, i64* @tf_3_var_136, align 8
38   %bf.load4 = load i40, i40* bitcast ([5 x i8]* getelementptr inbounds (%struct.S, %struct.S* bitcast ({ i16, i8, i8, i8, i8, i8, i8, i8, i8, i8, [5 x i8] }* @z to %struct.S*), i32 0, i32 2) to i40*), align 2
39   %bf.clear5 = and i40 %bf.load4, -8589869057
40   store i40 %bf.clear5, i40* bitcast ([5 x i8]* getelementptr inbounds (%struct.S, %struct.S* bitcast ({ i16, i8, i8, i8, i8, i8, i8, i8, i8, i8, [5 x i8] }* @z to %struct.S*), i32 0, i32 2) to i40*), align 2
41   ret void