llvm/test/ExecutionEngine/test-interp-vec-loadstore.ll

   1 ; RUN: %lli -jit-kind=mcjit -force-interpreter=true %s | FileCheck %s
   2 ; CHECK: int test passed
   3 ; CHECK: double test passed
   4 ; CHECK: float test passed
   5
   6 @msg_int = internal global [17 x i8] c"int test passed\0A\00"
   7 @msg_double = internal global [20 x i8] c"double test passed\0A\00"
   8 @msg_float = internal global [19 x i8] c"float test passed\0A\00"
   9
  10 declare i32 @printf(ptr, ...)
  11
  12 define i32 @main() {
  13   %a = alloca <4 x i32>, align 16
  14   %b = alloca <4 x double>, align 16
  15   %c = alloca <4 x float>, align 16
  16   %pint_0 = alloca i32
  17   %pint_1 = alloca i32
  18   %pint_2 = alloca i32
  19   %pint_3 = alloca i32
  20   %pdouble_0 = alloca double
  21   %pdouble_1 = alloca double
  22   %pdouble_2 = alloca double
  23   %pdouble_3 = alloca double
  24   %pfloat_0 = alloca float
  25   %pfloat_1 = alloca float
  26   %pfloat_2 = alloca float
  27   %pfloat_3 = alloca float
  28
  29   ; store constants 1,2,3,4 as vector
  30   store <4 x i32> <i32 1, i32 2, i32 3, i32 4>, ptr %a, align 16
  31   ; store constants 1,2,3,4 as scalars
  32   store i32 1, ptr %pint_0
  33   store i32 2, ptr %pint_1
  34   store i32 3, ptr %pint_2
  35   store i32 4, ptr %pint_3
  36
  37   ; load stored scalars
  38   %val_int0 = load i32, ptr %pint_0
  39   %val_int1 = load i32, ptr %pint_1
  40   %val_int2 = load i32, ptr %pint_2
  41   %val_int3 = load i32, ptr %pint_3
  42
  43   ; load stored vector
  44   %val0 = load <4 x i32> , ptr %a, align 16
  45
  46   ; extract integers from the loaded vector
  47   %res_i32_0 = extractelement <4 x i32> %val0, i32 0
  48   %res_i32_1 = extractelement <4 x i32> %val0, i32 1
  49   %res_i32_2 = extractelement <4 x i32> %val0, i32 2
  50   %res_i32_3 = extractelement <4 x i32> %val0, i32 3
  51
  52   ; compare extracted data with stored constants
  53   %test_result_int_0 = icmp eq i32 %res_i32_0, %val_int0
  54   %test_result_int_1 = icmp eq i32 %res_i32_1, %val_int1
  55   %test_result_int_2 = icmp eq i32 %res_i32_2, %val_int2
  56   %test_result_int_3 = icmp eq i32 %res_i32_3, %val_int3
  57
  58   %test_result_int_4 = icmp eq i32 %res_i32_0, %val_int3
  59   %test_result_int_5 = icmp eq i32 %res_i32_1, %val_int2
  60   %test_result_int_6 = icmp eq i32 %res_i32_2, %val_int1
  61   %test_result_int_7 = icmp eq i32 %res_i32_3, %val_int0
  62
  63   ; it should be TRUE
  64   %A_i = or i1 %test_result_int_0, %test_result_int_4
  65   %B_i = or i1 %test_result_int_1, %test_result_int_5
  66   %C_i = or i1 %test_result_int_2, %test_result_int_6
  67   %D_i = or i1 %test_result_int_3, %test_result_int_7
  68   %E_i = and i1 %A_i, %B_i
  69   %F_i = and i1 %C_i, %D_i
  70   %res_i = and i1 %E_i, %F_i
  71
  72   ; if TRUE print message
  73   br i1 %res_i, label %Print_int, label %Double
  74 Print_int:
  75   call i32 (ptr,...) @printf(ptr @msg_int)
  76   br label %Double
  77 Double:
  78   store <4 x double> <double 5.0, double 6.0, double 7.0, double 8.0>, ptr %b, align 16
  79   ; store constants as scalars
  80   store double 5.0, ptr %pdouble_0
  81   store double 6.0, ptr %pdouble_1
  82   store double 7.0, ptr %pdouble_2
  83   store double 8.0, ptr %pdouble_3
  84
  85   ; load stored vector
  86   %val1 = load <4 x double> , ptr %b, align 16
  87   ; load stored scalars
  88   %val_double0 = load double, ptr %pdouble_0
  89   %val_double1 = load double, ptr %pdouble_1
  90   %val_double2 = load double, ptr %pdouble_2
  91   %val_double3 = load double, ptr %pdouble_3
  92
  93   %res_double_0 = extractelement <4 x double> %val1, i32 0
  94   %res_double_1 = extractelement <4 x double> %val1, i32 1
  95   %res_double_2 = extractelement <4 x double> %val1, i32 2
  96   %res_double_3 = extractelement <4 x double> %val1, i32 3
  97
  98   %test_result_double_0 = fcmp oeq double %res_double_0, %val_double0
  99   %test_result_double_1 = fcmp oeq double %res_double_1, %val_double1
 100   %test_result_double_2 = fcmp oeq double %res_double_2, %val_double2
 101   %test_result_double_3 = fcmp oeq double %res_double_3, %val_double3
 102
 103   %test_result_double_4 = fcmp oeq double %res_double_0, %val_double3
 104   %test_result_double_5 = fcmp oeq double %res_double_1, %val_double2
 105   %test_result_double_6 = fcmp oeq double %res_double_2, %val_double1
 106   %test_result_double_7 = fcmp oeq double %res_double_3, %val_double0
 107
 108   %A_double = or i1 %test_result_double_0, %test_result_double_4
 109   %B_double = or i1 %test_result_double_1, %test_result_double_5
 110   %C_double = or i1 %test_result_double_2, %test_result_double_6
 111   %D_double = or i1 %test_result_double_3, %test_result_double_7
 112   %E_double = and i1 %A_double, %B_double
 113   %F_double = and i1 %C_double, %D_double
 114   %res_double = and i1 %E_double, %F_double
 115
 116   br i1 %res_double, label %Print_double, label %Float
 117 Print_double:
 118   call i32 (ptr,...) @printf(ptr @msg_double)
 119   br label %Float
 120 Float:
 121   store <4 x float> <float 9.0, float 10.0, float 11.0, float 12.0>, ptr %c, align 16
 122
 123   store float 9.0, ptr %pfloat_0
 124   store float 10.0, ptr %pfloat_1
 125   store float 11.0, ptr %pfloat_2
 126   store float 12.0, ptr %pfloat_3
 127
 128   ; load stored vector
 129   %val2 = load <4 x float> , ptr %c, align 16
 130   ; load stored scalars
 131   %val_float0 = load float, ptr %pfloat_0
 132   %val_float1 = load float, ptr %pfloat_1
 133   %val_float2 = load float, ptr %pfloat_2
 134   %val_float3 = load float, ptr %pfloat_3
 135
 136   %res_float_0 = extractelement <4 x float> %val2, i32 0
 137   %res_float_1 = extractelement <4 x float> %val2, i32 1
 138   %res_float_2 = extractelement <4 x float> %val2, i32 2
 139   %res_float_3 = extractelement <4 x float> %val2, i32 3
 140
 141   %test_result_float_0 = fcmp oeq float %res_float_0, %val_float0
 142   %test_result_float_1 = fcmp oeq float %res_float_1, %val_float1
 143   %test_result_float_2 = fcmp oeq float %res_float_2, %val_float2
 144   %test_result_float_3 = fcmp oeq float %res_float_3, %val_float3
 145
 146   %test_result_float_4 = fcmp oeq float %res_float_0, %val_float3
 147   %test_result_float_5 = fcmp oeq float %res_float_1, %val_float2
 148   %test_result_float_6 = fcmp oeq float %res_float_2, %val_float1
 149   %test_result_float_7 = fcmp oeq float %res_float_3, %val_float0
 150
 151   %A_float = or i1 %test_result_float_0, %test_result_float_4
 152   %B_float = or i1 %test_result_float_1, %test_result_float_5
 153   %C_float = or i1 %test_result_float_2, %test_result_float_6
 154   %D_float = or i1 %test_result_float_3, %test_result_float_7
 155   %E_float = and i1 %A_float, %B_float
 156   %F_float = and i1 %C_float, %D_float
 157   %res_float = and i1 %E_float, %F_float
 158
 159   br i1 %res_float, label %Print_float, label %Exit
 160 Print_float:
 161   call i32 (ptr,...) @printf(ptr @msg_float)
 162   br label %Exit
 163 Exit:
 164
 165   ret i32 0
 166 }