[ARM] More MVE compare vector splat combines for ANDs
[llvm-complete.git] / test / Instrumentation / MemorySanitizer / vector_cmp.ll
blob6031dddccc4c7dd81abdaf667a4840a04c71c060
1 ; RUN: opt < %s -msan-check-access-address=0 -S -passes=msan 2>&1 | FileCheck  \
2 ; RUN: %s
3 ; RUN: opt < %s -msan -msan-check-access-address=0 -S | FileCheck %s
4 ; REQUIRES: x86-registered-target
6 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
7 target triple = "x86_64-unknown-linux-gnu"
9 declare <4 x float> @llvm.x86.sse.cmp.ss(<4 x float>, <4 x float>, i8) nounwind readnone
10 declare <4 x float> @llvm.x86.sse.cmp.ps(<4 x float>, <4 x float>, i8) nounwind readnone
11 declare <2 x double> @llvm.x86.sse2.cmp.sd(<2 x double>, <2 x double>, i8) nounwind readnone
12 declare i32 @llvm.x86.sse.comineq.ss(<4 x float>, <4 x float>) nounwind readnone
13 declare i32 @llvm.x86.sse2.ucomilt.sd(<2 x double>, <2 x double>) nounwind readnone
16 define <4 x float> @test_sse_cmp_ss(<4 x float> %a, <4 x float> %b) sanitize_memory {
17 entry:
18   %0 = tail call <4 x float> @llvm.x86.sse.cmp.ss(<4 x float> %a, <4 x float> %b, i8 4)
19   ret <4 x float> %0
22 ; CHECK-LABEL: @test_sse_cmp_ss
23 ; CHECK: %[[A:.*]] = or <4 x i32>
24 ; CHECK: %[[B:.*]] = extractelement <4 x i32> %[[A]], i64 0
25 ; CHECK: %[[C:.*]] = icmp ne i32 %[[B]], 0
26 ; CHECK: %[[D:.*]] = sext i1 %[[C]] to i128
27 ; CHECK: %[[E:.*]] = bitcast i128 %[[D]] to <4 x i32>
28 ; CHECK: store <4 x i32> %[[E]]
31 define <4 x float> @test_sse_cmp_ps(<4 x float> %a, <4 x float> %b) sanitize_memory {
32 entry:
33   %0 = tail call <4 x float> @llvm.x86.sse.cmp.ps(<4 x float> %a, <4 x float> %b, i8 4)
34   ret <4 x float> %0
37 ; CHECK-LABEL: @test_sse_cmp_ps
38 ; CHECK: %[[A:.*]] = or <4 x i32>
39 ; CHECK: %[[B:.*]] = icmp ne <4 x i32> %[[A]], zeroinitializer
40 ; CHECK: %[[C:.*]] = sext <4 x i1> %[[B]] to <4 x i32>
41 ; CHECK: store <4 x i32> %[[C]]
44 define <2 x double> @test_sse2_cmp_sd(<2 x double> %a, <2 x double> %b) sanitize_memory {
45 entry:
46   %0 = tail call <2 x double> @llvm.x86.sse2.cmp.sd(<2 x double> %a, <2 x double> %b, i8 4)
47   ret <2 x double> %0
50 ; CHECK-LABEL: @test_sse2_cmp_sd
51 ; CHECK: %[[A:.*]] = or <2 x i64>
52 ; CHECK: %[[B:.*]] = extractelement <2 x i64> %[[A]], i64 0
53 ; CHECK: %[[C:.*]] = icmp ne i64 %[[B]], 0
54 ; CHECK: %[[D:.*]] = sext i1 %[[C]] to i128
55 ; CHECK: %[[E:.*]] = bitcast i128 %[[D]] to <2 x i64>
56 ; CHECK: store <2 x i64> %[[E]]
59 define i32 @test_sse_comineq_ss(<4 x float> %a, <4 x float> %b) sanitize_memory {
60 entry:
61   %0 = tail call i32 @llvm.x86.sse.comineq.ss(<4 x float> %a, <4 x float> %b)
62   ret i32 %0
65 ; CHECK-LABEL: @test_sse_comineq_ss
66 ; CHECK: %[[A:.*]] = or <4 x i32>
67 ; CHECK: %[[B:.*]] = extractelement <4 x i32> %[[A]], i64 0
68 ; CHECK: %[[C:.*]] = icmp ne i32 %[[B]], 0
69 ; CHECK: %[[D:.*]] = sext i1 %[[C]] to i32
70 ; CHECK: store i32 %[[D]]
73 define i32 @test_sse2_ucomilt_sd(<2 x double> %a, <2 x double> %b) sanitize_memory {
74 entry:
75   %0 = tail call i32 @llvm.x86.sse2.ucomilt.sd(<2 x double> %a, <2 x double> %b)
76   ret i32 %0
79 ; CHECK-LABEL: @test_sse2_ucomilt_sd
80 ; CHECK: %[[A:.*]] = or <2 x i64>
81 ; CHECK: %[[B:.*]] = extractelement <2 x i64> %[[A]], i64 0
82 ; CHECK: %[[C:.*]] = icmp ne i64 %[[B]], 0
83 ; CHECK: %[[D:.*]] = sext i1 %[[C]] to i32
84 ; CHECK: store i32 %[[D]]