1 ; RUN: llc < %s -mtriple=aarch64-linux-gnu | FileCheck %s
5 define <4 x i32> @t1(<4 x i32> %a, <4 x i32> %b) {
6 %t1 = icmp sgt <4 x i32> %a, %b
7 %t2 = select <4 x i1> %t1, <4 x i32> %a, <4 x i32> %b
13 define <4 x i32> @t2(<4 x i32> %a, <4 x i32> %b) {
14 %t1 = icmp slt <4 x i32> %a, %b
15 %t2 = select <4 x i1> %t1, <4 x i32> %a, <4 x i32> %b
21 define <4 x i32> @t3(<4 x i32> %a, <4 x i32> %b) {
22 %t1 = icmp ugt <4 x i32> %a, %b
23 %t2 = select <4 x i1> %t1, <4 x i32> %a, <4 x i32> %b
29 define <8 x i8> @t4(<8 x i8> %a, <8 x i8> %b) {
30 %t1 = icmp ult <8 x i8> %a, %b
31 %t2 = select <8 x i1> %t1, <8 x i8> %a, <8 x i8> %b
37 define <4 x i16> @t5(<4 x i16> %a, <4 x i16> %b) {
38 %t1 = icmp sgt <4 x i16> %b, %a
39 %t2 = select <4 x i1> %t1, <4 x i16> %a, <4 x i16> %b
45 define <2 x i32> @t6(<2 x i32> %a, <2 x i32> %b) {
46 %t1 = icmp slt <2 x i32> %b, %a
47 %t2 = select <2 x i1> %t1, <2 x i32> %a, <2 x i32> %b
53 define <16 x i8> @t7(<16 x i8> %a, <16 x i8> %b) {
54 %t1 = icmp ugt <16 x i8> %b, %a
55 %t2 = select <16 x i1> %t1, <16 x i8> %a, <16 x i8> %b
61 define <8 x i16> @t8(<8 x i16> %a, <8 x i16> %b) {
62 %t1 = icmp ult <8 x i16> %b, %a
63 %t2 = select <8 x i1> %t1, <8 x i16> %a, <8 x i16> %b
70 define <4 x i32> @t9(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {
71 %t1 = icmp ugt <4 x i32> %b, %a
72 %t2 = select <4 x i1> %t1, <4 x i32> %a, <4 x i32> %b
73 %t3 = icmp sge <4 x i32> %t2, %c
74 %t4 = select <4 x i1> %t3, <4 x i32> %t2, <4 x i32> %c
81 define <8 x i32> @t10(<8 x i32> %a, <8 x i32> %b) {
82 %t1 = icmp sgt <8 x i32> %a, %b
83 %t2 = select <8 x i1> %t1, <8 x i32> %a, <8 x i32> %b
92 define <16 x i32> @t11(<16 x i32> %a, <16 x i32> %b) {
93 %t1 = icmp sle <16 x i32> %a, %b
94 %t2 = select <16 x i1> %t1, <16 x i32> %a, <16 x i32> %b
100 ; The icmp is used by two instructions, so don't produce a umin node.
101 define <16 x i8> @t12(<16 x i8> %a, <16 x i8> %b) {
102 %t1 = icmp ugt <16 x i8> %b, %a
103 %t2 = select <16 x i1> %t1, <16 x i8> %a, <16 x i8> %b
104 %t3 = zext <16 x i1> %t1 to <16 x i8>
105 %t4 = add <16 x i8> %t3, %t2