[x86] fix assert with horizontal math + broadcast of vector (PR43402)
[llvm-core.git] / test / CodeGen / X86 / pr32451.ll
blob4754d8e4cf6cb6019f2a4c60e91c18d0c8833867
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -fast-isel -mtriple=i686-unknown-unknown -O0 -mcpu=knl | FileCheck %s
4 ; ModuleID = 'convert'
5 source_filename = "convert"
6 target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
7 target triple = "x86_64-unknown-linux-gnu"
9 define i8** @japi1_convert_690(i8**, i8***, i32) {
10 ; CHECK-LABEL: japi1_convert_690:
11 ; CHECK:       # %bb.0: # %top
12 ; CHECK-NEXT:    pushl %ebx
13 ; CHECK-NEXT:    .cfi_def_cfa_offset 8
14 ; CHECK-NEXT:    subl $16, %esp
15 ; CHECK-NEXT:    .cfi_def_cfa_offset 24
16 ; CHECK-NEXT:    .cfi_offset %ebx, -8
17 ; CHECK-NEXT:    movl {{[0-9]+}}(%esp), %eax
18 ; CHECK-NEXT:    movl %eax, {{[0-9]+}}(%esp) # 4-byte Spill
19 ; CHECK-NEXT:    calll julia.gc_root_decl
20 ; CHECK-NEXT:    movl %eax, {{[0-9]+}}(%esp) # 4-byte Spill
21 ; CHECK-NEXT:    calll jl_get_ptls_states
22 ; CHECK-NEXT:    movl {{[0-9]+}}(%esp), %ecx # 4-byte Reload
23 ; CHECK-NEXT:    movl 4(%ecx), %edx
24 ; CHECK-NEXT:    movb (%edx), %bl
25 ; CHECK-NEXT:    andb $1, %bl
26 ; CHECK-NEXT:    movzbl %bl, %edx
27 ; CHECK-NEXT:    movl %edx, (%esp)
28 ; CHECK-NEXT:    movl %eax, {{[0-9]+}}(%esp) # 4-byte Spill
29 ; CHECK-NEXT:    calll jl_box_int32
30 ; CHECK-NEXT:    movl {{[0-9]+}}(%esp), %ecx # 4-byte Reload
31 ; CHECK-NEXT:    movl %eax, (%ecx)
32 ; CHECK-NEXT:    addl $16, %esp
33 ; CHECK-NEXT:    .cfi_def_cfa_offset 8
34 ; CHECK-NEXT:    popl %ebx
35 ; CHECK-NEXT:    .cfi_def_cfa_offset 4
36 ; CHECK-NEXT:    retl
37 top:
38   %3 = alloca i8***
39   store volatile i8*** %1, i8**** %3
40   %4 = call i8*** @julia.gc_root_decl()
41   %5 = call i8**** @jl_get_ptls_states()
42   %6 = bitcast i8**** %5 to i8***
43   %7 = getelementptr i8**, i8*** %6, i64 3
44   %8 = bitcast i8*** %7 to i64**
45   %9 = load i64*, i64** %8
46   %10 = getelementptr i8**, i8*** %1, i64 1
47   %11 = load i8**, i8*** %10
48   %12 = bitcast i8** %11 to i8*
49   %13 = load i8, i8* %12
50   %14 = trunc i8 %13 to i1
51   %15 = zext i1 %14 to i8
52   %16 = zext i8 %15 to i32
53   %17 = call i8** @jl_box_int32(i32 signext %16)
54   store i8** %17, i8*** %4
55   ret i8** %17
58 declare i8**** @jl_get_ptls_states()
60 declare i8** @jl_box_int32(i32)
62 declare i8*** @julia.gc_root_decl()