Fixed some bugs in register stack pass.
[llvm/zpu.git] / test / CodeGen / X86 / commute-intrinsic.ll
blobd810cb1eff78455faa1ce9b063cfa9821a41491c
1 ; RUN: llc < %s -mtriple=i386-apple-darwin -mattr=+sse2 -relocation-model=static | not grep movaps
3 @a = external global <2 x i64>          ; <<2 x i64>*> [#uses=1]
5 define <2 x i64> @madd(<2 x i64> %b) nounwind  {
6 entry:
7         %tmp2 = load <2 x i64>* @a, align 16            ; <<2 x i64>> [#uses=1]
8         %tmp6 = bitcast <2 x i64> %b to <8 x i16>               ; <<8 x i16>> [#uses=1]
9         %tmp9 = bitcast <2 x i64> %tmp2 to <8 x i16>            ; <<8 x i16>> [#uses=1]
10         %tmp11 = tail call <4 x i32> @llvm.x86.sse2.pmadd.wd( <8 x i16> %tmp9, <8 x i16> %tmp6 ) nounwind readnone              ; <<4 x i32>> [#uses=1]
11         %tmp14 = bitcast <4 x i32> %tmp11 to <2 x i64>          ; <<2 x i64>> [#uses=1]
12         ret <2 x i64> %tmp14
15 declare <4 x i32> @llvm.x86.sse2.pmadd.wd(<8 x i16>, <8 x i16>) nounwind readnone