test/Instrumentation/MemorySanitizer/vector_cmp.ll

   1 ; RUN: opt < %s -msan-check-access-address=0 -S -passes=msan 2>&1 | FileCheck  \
   2 ; RUN: %s
   3 ; RUN: opt < %s -msan -msan-check-access-address=0 -S | FileCheck %s
   4 ; REQUIRES: x86-registered-target
   5
   6 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
   7 target triple = "x86_64-unknown-linux-gnu"
   8
   9 declare <4 x float> @llvm.x86.sse.cmp.ss(<4 x float>, <4 x float>, i8) nounwind readnone
  10 declare <4 x float> @llvm.x86.sse.cmp.ps(<4 x float>, <4 x float>, i8) nounwind readnone
  11 declare <2 x double> @llvm.x86.sse2.cmp.sd(<2 x double>, <2 x double>, i8) nounwind readnone
  12 declare i32 @llvm.x86.sse.comineq.ss(<4 x float>, <4 x float>) nounwind readnone
  13 declare i32 @llvm.x86.sse2.ucomilt.sd(<2 x double>, <2 x double>) nounwind readnone
  14
  15
  16 define <4 x float> @test_sse_cmp_ss(<4 x float> %a, <4 x float> %b) sanitize_memory {
  17 entry:
  18   %0 = tail call <4 x float> @llvm.x86.sse.cmp.ss(<4 x float> %a, <4 x float> %b, i8 4)
  19   ret <4 x float> %0
  20 }
  21
  22 ; CHECK-LABEL: @test_sse_cmp_ss
  23 ; CHECK: %[[A:.*]] = or <4 x i32>
  24 ; CHECK: %[[B:.*]] = extractelement <4 x i32> %[[A]], i64 0
  25 ; CHECK: %[[C:.*]] = icmp ne i32 %[[B]], 0
  26 ; CHECK: %[[D:.*]] = sext i1 %[[C]] to i128
  27 ; CHECK: %[[E:.*]] = bitcast i128 %[[D]] to <4 x i32>
  28 ; CHECK: store <4 x i32> %[[E]]
  29
  30
  31 define <4 x float> @test_sse_cmp_ps(<4 x float> %a, <4 x float> %b) sanitize_memory {
  32 entry:
  33   %0 = tail call <4 x float> @llvm.x86.sse.cmp.ps(<4 x float> %a, <4 x float> %b, i8 4)
  34   ret <4 x float> %0
  35 }
  36
  37 ; CHECK-LABEL: @test_sse_cmp_ps
  38 ; CHECK: %[[A:.*]] = or <4 x i32>
  39 ; CHECK: %[[B:.*]] = icmp ne <4 x i32> %[[A]], zeroinitializer
  40 ; CHECK: %[[C:.*]] = sext <4 x i1> %[[B]] to <4 x i32>
  41 ; CHECK: store <4 x i32> %[[C]]
  42
  43
  44 define <2 x double> @test_sse2_cmp_sd(<2 x double> %a, <2 x double> %b) sanitize_memory {
  45 entry:
  46   %0 = tail call <2 x double> @llvm.x86.sse2.cmp.sd(<2 x double> %a, <2 x double> %b, i8 4)
  47   ret <2 x double> %0
  48 }
  49
  50 ; CHECK-LABEL: @test_sse2_cmp_sd
  51 ; CHECK: %[[A:.*]] = or <2 x i64>
  52 ; CHECK: %[[B:.*]] = extractelement <2 x i64> %[[A]], i64 0
  53 ; CHECK: %[[C:.*]] = icmp ne i64 %[[B]], 0
  54 ; CHECK: %[[D:.*]] = sext i1 %[[C]] to i128
  55 ; CHECK: %[[E:.*]] = bitcast i128 %[[D]] to <2 x i64>
  56 ; CHECK: store <2 x i64> %[[E]]
  57
  58
  59 define i32 @test_sse_comineq_ss(<4 x float> %a, <4 x float> %b) sanitize_memory {
  60 entry:
  61   %0 = tail call i32 @llvm.x86.sse.comineq.ss(<4 x float> %a, <4 x float> %b)
  62   ret i32 %0
  63 }
  64
  65 ; CHECK-LABEL: @test_sse_comineq_ss
  66 ; CHECK: %[[A:.*]] = or <4 x i32>
  67 ; CHECK: %[[B:.*]] = extractelement <4 x i32> %[[A]], i64 0
  68 ; CHECK: %[[C:.*]] = icmp ne i32 %[[B]], 0
  69 ; CHECK: %[[D:.*]] = sext i1 %[[C]] to i32
  70 ; CHECK: store i32 %[[D]]
  71
  72
  73 define i32 @test_sse2_ucomilt_sd(<2 x double> %a, <2 x double> %b) sanitize_memory {
  74 entry:
  75   %0 = tail call i32 @llvm.x86.sse2.ucomilt.sd(<2 x double> %a, <2 x double> %b)
  76   ret i32 %0
  77 }
  78
  79 ; CHECK-LABEL: @test_sse2_ucomilt_sd
  80 ; CHECK: %[[A:.*]] = or <2 x i64>
  81 ; CHECK: %[[B:.*]] = extractelement <2 x i64> %[[A]], i64 0
  82 ; CHECK: %[[C:.*]] = icmp ne i64 %[[B]], 0
  83 ; CHECK: %[[D:.*]] = sext i1 %[[C]] to i32
  84 ; CHECK: store i32 %[[D]]