2 ! ***** BEGIN LICENSE BLOCK
*****
3 ! Version
: MPL
1.1/GPL
2.0/LGPL
2.1
5 ! The contents of this file are subject to the Mozilla Public License Version
6 ! 1.1 (the
"License"); you may
not use this file except in compliance with
7 ! the License. You may obtain
a copy of the License at
8 ! http
://www.mozilla.org
/MPL
/
10 ! Software distributed under the License is distributed on an
"AS IS" basis
,
11 ! WITHOUT WARRANTY OF ANY KIND
, either express
or implied. See the License
12 ! for the specific language governing rights
and limitations under the
15 ! The Original Code is SPARC hand-optimized Montgomery multiply functions.
17 ! The Initial Developer of the Original Code is
18 ! Sun Microsystems Inc.
19 ! Portions created by the Initial Developer are Copyright
(C
) 1999-2000
20 ! the Initial Developer. All Rights Reserved.
24 ! Alternatively
, the contents of this file may
be used under the terms of
25 ! either the GNU General Public License Version
2 or later
(the
"GPL"), or
26 ! the GNU Lesser General Public License Version
2.1 or later
(the
"LGPL"),
27 ! in which case the provisions of the GPL
or the LGPL are applicable instead
28 ! of those above. If you wish to allow use of your version of this file only
29 ! under the terms of either the GPL
or the LGPL
, and not to allow others to
30 ! use your version of this file under the terms of the MPL
, indicate your
31 ! decision by deleting the provisions above
and replace them with the notice
32 ! and other provisions required by the GPL
or the LGPL. If you do
not delete
33 ! the provisions above
, a recipient may use your version of this file under
34 ! the terms of any one of the MPL
, the GPL
or the LGPL.
36 ! ***** END LICENSE BLOCK
*****
38 .section ".text",#alloc,#execinstr
41 .section ".rodata",#alloc
61 .type TwoToMinus16,#object
91 .type TwoToMinus32,#object
94 .section ".text",#alloc,#execinstr
95 /* 000000 0 */ .register %g3,#scratch
96 /* 000000 */ .register %g2,#scratch
97 /* 000000 0 */ .align 8
99 ! SUBROUTINE conv_d16_to_i32
101 ! OFFSET SOURCE LINE LABEL INSTRUCTION
103 .global conv_d16_to_i32
105 /* 000000 */ save
%sp
,-208,%sp
109 ! 2 ! * The contents of this file are subject to the Mozilla Public
110 ! 3 ! * License Version 1.1 (the "License"); you may not use this file
111 ! 4 ! * except in compliance with the License. You may obtain a copy of
112 ! 5 ! * the License at http://www.mozilla.org/MPL/
114 ! 7 ! * Software distributed under the License is distributed on an "AS
115 ! 8 ! * IS" basis, WITHOUT WARRANTY OF ANY KIND, either express or
116 ! 9 ! * implied. See the License for the specific language governing
117 ! 10 ! * rights and limitations under the License.
119 ! 12 ! * The Original Code is SPARC optimized Montgomery multiply functions.
121 ! 14 ! * The Initial Developer of the Original Code is Sun Microsystems Inc.
122 ! 15 ! * Portions created by Sun Microsystems Inc. are
123 ! 16 ! * Copyright (C) 1999-2000 Sun Microsystems Inc. All Rights Reserved.
125 ! 18 ! * Contributor(s):
126 ! 19 ! * Netscape Communications Corporation
128 ! 21 ! * Alternatively, the contents of this file may be used under the
129 ! 22 ! * terms of the GNU General Public License Version 2 or later (the
130 ! 23 ! * "GPL"), in which case the provisions of the GPL are applicable
131 ! 24 ! * instead of those above. If you wish to allow use of your
132 ! 25 ! * version of this file only under the terms of the GPL and not to
133 ! 26 ! * allow others to use your version of this file under the MPL,
134 ! 27 ! * indicate your decision by deleting the provisions above and
135 ! 28 ! * replace them with the notice and other provisions required by
136 ! 29 ! * the GPL. If you do not delete the provisions above, a recipient
137 ! 30 ! * may use your version of this file under either the MPL or the
140 ! 33 ! * $Id: montmulfv9.s,v 1.5 2006/12/11 09:45:32 gerv%gerv.net Exp $
142 ! 36 !#define RF_INLINE_MACROS
143 ! 38 !static const double TwoTo16
=65536.0;
144 ! 39 !static const double TwoToMinus16
=1.0/65536.0;
145 ! 40 !static const double Zero
=0.0;
146 ! 41 !static const double TwoTo32
=65536.0*65536.0;
147 ! 42 !static const double TwoToMinus32
=1.0/(65536.0*65536.0);
148 ! 44 !#ifdef RF_INLINE_MACROS
149 ! 46 !double upper32
(double
);
150 ! 47 !double lower32
(double
, double
);
151 ! 48 !double mod
(double
, double
, double
);
152 ! 50 !void i16_to_d16_and_d32x4
(const double
* /*1/(2^16)*/,
153 ! 51 ! const double
* /* 2^16*/,
154 ! 52 ! const double
* /* 0 */,
155 ! 53 ! double
* /*result16*/,
156 ! 54 ! double
* /* result32 */,
157 ! 55 ! float
* /*source - should be unsigned int*
158 ! 56 ! converted to float* */);
160 ! 60 !static double upper32
(double x
)
162 ! 62 ! return floor
(x
*TwoToMinus32
);
164 ! 65 !static double lower32
(double x
, double y
)
166 ! 67 ! return x-TwoTo32
*floor
(x
*TwoToMinus32
);
168 ! 70 !static double mod
(double x
, double oneoverm
, double m
)
170 ! 72 ! return x-m
*floor
(x
*oneoverm
);
173 ! 78 !static void cleanup
(double
*dt
, int from
, int tlen
)
176 ! 81 ! double tmp
,tmp1
,x
,x1;
177 ! 83 ! tmp
=tmp1
=Zero;
178 ! 84 ! /* original code **
179 ! 85 ! for(i=2*from;i<2*tlen-2;i++)
182 ! 88 ! dt[i]=lower32(x,Zero)+tmp1;
184 ! 90 ! tmp=upper32(x);
186 ! 92 ! dt[tlen-2]+=tmp1;
187 ! 93 ! dt[tlen-1]+=tmp;
188 ! 94 ! **end original code ***/
189 ! 95 ! /* new code ***/
190 ! 96 ! for
(i
=2*from;i
<2*tlen;i+
=2)
194 ! 100 ! dt
[i
]=lower32
(x
,Zero
)+tmp;
195 ! 101 ! dt
[i+
1]=lower32
(x1
,Zero
)+tmp1;
196 ! 102 ! tmp
=upper32
(x
);
197 ! 103 ! tmp1
=upper32
(x1
);
199 ! 105 ! /** end new code **/
201 ! 109 !void conv_d16_to_i32
(unsigned int
*i32
, double
*d16
, long long
*tmp
, int ilen
)
204 ! 112 !long long
t, t1
, a, b, c
, d;
206 ! 115 ! a=(long long
)d16
[0];
208 /* 0x0004 115 */ ldd
[%i1
],%f2
210 ! 116 ! b=(long long
)d16
[1];
211 ! 117 ! for
(i
=0; i
<ilen-
1; i+
+)
213 /* 0x0008 117 */ sub %i3
,1,%o1
214 /* 0x000c 110 */ or %g0
,%i0
,%g1
215 /* 0x0010 116 */ ldd
[%i1+
8],%f4
216 /* 0x0014 117 */ cmp %o1
,0
217 /* 0x0018 114 */ or %g0
,0,%g5
218 /* 0x001c 115 */ fdtox
%f2,%f2
219 /* 0x0020 */ std %f2,[%sp+
2247]
220 /* 0x0024 117 */ or %g0
,0,%o0
221 /* 0x0028 116 */ fdtox
%f4,%f2
222 /* 0x002c */ std %f2,[%sp+
2239]
223 /* 0x0030 110 */ sub %o1
,1,%o7
224 /* 0x0034 */ or %g0
,%i1
,%o4
225 /* 0x0038 */ sethi
%hi
(0xfc00),%o3
226 /* 0x003c */ or %g0
,-1,%o1
227 /* 0x0040 */ or %g0
,2,%i1
228 /* 0x0044 */ srl
%o1
,0,%g3
229 /* 0x0048 */ or %g0
,%o4
,%g4
230 /* 0x004c 116 */ ldx [%sp+
2239],%i2
231 /* 0x0050 */ add %o3
,1023,%o5
232 /* 0x0054 117 */ sub %o7
,1,%o2
233 /* 0x0058 115 */ ldx [%sp+
2247],%i3
234 /* 0x005c 117 */ ble,pt
%icc
,.L900000113
235 /* 0x0060 */ sethi
%hi
(0xfc00),%g2
236 /* 0x0064 */ add %o7
,1,%g2
239 ! 119 ! c
=(long long
)d16
[2*i+
2];
240 ! 120 ! t1+
=a&0xffffffff;
242 ! 122 ! d
=(long long
)d16
[2*i+
3];
243 ! 123 ! t1+
=(b&0xffff)<<16;
245 /* 0x0068 123 */ and %i2
,%o5
,%i4
246 /* 0x006c */ sllx
%i4
,16,%o1
247 /* 0x0070 117 */ cmp %g2
,6
248 /* 0x0074 */ bl,pn
%icc
,.L77000134
249 /* 0x0078 */ or %g0
,3,%i0
250 /* 0x007c 119 */ ldd
[%o4+
16],%f0
251 /* 0x0080 120 */ and %i3
,%g3
,%o3
253 ! 124 ! t+
=(b>>16)+(t1
>>32);
255 /* 0x0084 124 */ srax
%i2
,16,%i5
256 /* 0x0088 117 */ add %o3
,%o1
,%i4
257 /* 0x008c 121 */ srax
%i3
,32,%i3
258 /* 0x0090 119 */ fdtox
%f0,%f0
259 /* 0x0094 */ std %f0,[%sp+
2231]
261 ! 125 ! i32
[i
]=t1
&0xffffffff;
263 /* 0x0098 125 */ and %i4
,%g3
,%l0
264 /* 0x009c 117 */ or %g0
,72,%o3
265 /* 0x00a0 122 */ ldd
[%g4+
24],%f0
266 /* 0x00a4 117 */ or %g0
,64,%o4
267 /* 0x00a8 */ or %g0
,4,%o1
273 /* 0x00ac 128 */ or %g0
,5,%i0
274 /* 0x00b0 */ or %g0
,4,%i1
275 /* 0x00b4 119 */ ldx [%sp+
2231],%g2
276 /* 0x00b8 122 */ fdtox
%f0,%f0
277 /* 0x00bc 128 */ or %g0
,4,%o0
278 /* 0x00c0 122 */ std %f0,[%sp+
2223]
279 /* 0x00c4 */ ldd
[%g4+
40],%f2
280 /* 0x00c8 120 */ and %g2
,%g3
,%i2
281 /* 0x00cc 119 */ ldd
[%g4+
32],%f0
282 /* 0x00d0 121 */ srax
%g2
,32,%g2
283 /* 0x00d4 122 */ ldd
[%g4+
56],%f4
284 /* 0x00d8 */ fdtox
%f2,%f2
285 /* 0x00dc */ ldx [%sp+
2223],%g5
286 /* 0x00e0 119 */ fdtox
%f0,%f0
287 /* 0x00e4 125 */ st %l0
,[%g1
]
288 /* 0x00e8 124 */ srax
%i4
,32,%l0
289 /* 0x00ec 122 */ fdtox
%f4,%f4
290 /* 0x00f0 */ std %f2,[%sp+
2223]
291 /* 0x00f4 123 */ and %g5
,%o5
,%i4
292 /* 0x00f8 124 */ add %i5
,%l0
,%i5
293 /* 0x00fc 119 */ std %f0,[%sp+
2231]
294 /* 0x0100 123 */ sllx
%i4
,16,%i4
295 /* 0x0104 124 */ add %i3
,%i5
,%i3
296 /* 0x0108 119 */ ldd
[%g4+
48],%f2
297 /* 0x010c 124 */ srax
%g5
,16,%g5
298 /* 0x0110 117 */ add %i2
,%i4
,%i2
299 /* 0x0114 122 */ ldd
[%g4+
72],%f0
300 /* 0x0118 117 */ add %i2
,%i3
,%i4
301 /* 0x011c 124 */ srax
%i4
,32,%i5
302 /* 0x0120 119 */ fdtox
%f2,%f2
303 /* 0x0124 125 */ and %i4
,%g3
,%i4
304 /* 0x0128 122 */ ldx [%sp+
2223],%i2
305 /* 0x012c 124 */ add %g5
,%i5
,%g5
306 /* 0x0130 119 */ ldx [%sp+
2231],%i3
307 /* 0x0134 124 */ add %g2
,%g5
,%g5
308 /* 0x0138 119 */ std %f2,[%sp+
2231]
309 /* 0x013c 122 */ std %f4,[%sp+
2223]
310 /* 0x0140 119 */ ldd
[%g4+
64],%f2
311 /* 0x0144 125 */ st %i4
,[%g1+
4]
313 /* 0x0148 122 */ ldx [%sp+
2223],%i4
314 /* 0x014c 128 */ add %o0
,2,%o0
315 /* 0x0150 */ add %i0
,4,%i0
316 /* 0x0154 119 */ ldx [%sp+
2231],%l0
317 /* 0x0158 117 */ add %o3
,16,%o3
318 /* 0x015c 123 */ and %i2
,%o5
,%g2
319 /* 0x0160 */ sllx
%g2
,16,%i5
320 /* 0x0164 120 */ and %i3
,%g3
,%g2
321 /* 0x0168 122 */ ldd
[%g4+
%o3
],%f4
322 /* 0x016c */ fdtox
%f0,%f0
323 /* 0x0170 */ std %f0,[%sp+
2223]
324 /* 0x0174 124 */ srax
%i2
,16,%i2
325 /* 0x0178 117 */ add %g2
,%i5
,%g2
326 /* 0x017c 119 */ fdtox
%f2,%f0
327 /* 0x0180 117 */ add %o4
,16,%o4
328 /* 0x0184 119 */ std %f0,[%sp+
2231]
329 /* 0x0188 117 */ add %g2
,%g5
,%g2
330 /* 0x018c 119 */ ldd
[%g4+
%o4
],%f2
331 /* 0x0190 124 */ srax
%g2
,32,%i5
332 /* 0x0194 128 */ cmp %o0
,%o2
333 /* 0x0198 121 */ srax
%i3
,32,%g5
334 /* 0x019c 124 */ add %i2
,%i5
,%i2
335 /* 0x01a0 */ add %g5
,%i2
,%i5
336 /* 0x01a4 117 */ add %o1
,4,%o1
337 /* 0x01a8 125 */ and %g2
,%g3
,%g2
338 /* 0x01ac 127 */ or %g0
,%l0
,%g5
339 /* 0x01b0 125 */ st %g2
,[%g1+
%o1
]
340 /* 0x01b4 128 */ add %i1
,4,%i1
341 /* 0x01b8 122 */ ldx [%sp+
2223],%i2
342 /* 0x01bc 119 */ ldx [%sp+
2231],%i3
343 /* 0x01c0 117 */ add %o3
,16,%o3
344 /* 0x01c4 123 */ and %i4
,%o5
,%g2
345 /* 0x01c8 */ sllx
%g2
,16,%l0
346 /* 0x01cc 120 */ and %g5
,%g3
,%g2
347 /* 0x01d0 122 */ ldd
[%g4+
%o3
],%f0
348 /* 0x01d4 */ fdtox
%f4,%f4
349 /* 0x01d8 */ std %f4,[%sp+
2223]
350 /* 0x01dc 124 */ srax
%i4
,16,%i4
351 /* 0x01e0 117 */ add %g2
,%l0
,%g2
352 /* 0x01e4 119 */ fdtox
%f2,%f2
353 /* 0x01e8 117 */ add %o4
,16,%o4
354 /* 0x01ec 119 */ std %f2,[%sp+
2231]
355 /* 0x01f0 117 */ add %g2
,%i5
,%g2
356 /* 0x01f4 119 */ ldd
[%g4+
%o4
],%f2
357 /* 0x01f8 124 */ srax
%g2
,32,%i5
358 /* 0x01fc 121 */ srax
%g5
,32,%g5
359 /* 0x0200 124 */ add %i4
,%i5
,%i4
360 /* 0x0204 */ add %g5
,%i4
,%g5
361 /* 0x0208 117 */ add %o1
,4,%o1
362 /* 0x020c 125 */ and %g2
,%g3
,%g2
363 /* 0x0210 128 */ ble,pt
%icc
,.L900000108
364 /* 0x0214 */ st %g2
,[%g1+
%o1
]
366 /* 0x0218 122 */ ldx [%sp+
2223],%o2
367 /* 0x021c 123 */ and %i2
,%o5
,%i4
368 /* 0x0220 120 */ and %i3
,%g3
,%g2
369 /* 0x0224 123 */ sllx
%i4
,16,%i4
370 /* 0x0228 119 */ ldx [%sp+
2231],%i5
371 /* 0x022c 128 */ cmp %o0
,%o7
372 /* 0x0230 124 */ srax
%i2
,16,%i2
373 /* 0x0234 117 */ add %g2
,%i4
,%g2
374 /* 0x0238 122 */ fdtox
%f0,%f4
375 /* 0x023c */ std %f4,[%sp+
2223]
376 /* 0x0240 117 */ add %g2
,%g5
,%g5
377 /* 0x0244 123 */ and %o2
,%o5
,%l0
378 /* 0x0248 124 */ srax
%g5
,32,%l1
379 /* 0x024c 120 */ and %i5
,%g3
,%i4
380 /* 0x0250 119 */ fdtox
%f2,%f0
381 /* 0x0254 121 */ srax
%i3
,32,%g2
382 /* 0x0258 119 */ std %f0,[%sp+
2231]
383 /* 0x025c 124 */ add %i2
,%l1
,%i2
384 /* 0x0260 123 */ sllx
%l0
,16,%i3
385 /* 0x0264 124 */ add %g2
,%i2
,%i2
386 /* 0x0268 */ srax
%o2
,16,%o2
387 /* 0x026c 117 */ add %o1
,4,%g2
388 /* 0x0270 */ add %i4
,%i3
,%o1
389 /* 0x0274 125 */ and %g5
,%g3
,%g5
390 /* 0x0278 */ st %g5
,[%g1+
%g2
]
391 /* 0x027c 119 */ ldx [%sp+
2231],%i3
392 /* 0x0280 117 */ add %o1
,%i2
,%o1
393 /* 0x0284 */ add %g2
,4,%g2
394 /* 0x0288 124 */ srax
%o1
,32,%i4
395 /* 0x028c 122 */ ldx [%sp+
2223],%i2
396 /* 0x0290 125 */ and %o1
,%g3
,%g5
397 /* 0x0294 121 */ srax
%i5
,32,%o1
398 /* 0x0298 124 */ add %o2
,%i4
,%o2
399 /* 0x029c 125 */ st %g5
,[%g1+
%g2
]
400 /* 0x02a0 128 */ bg
,pn
%icc
,.L77000127
401 /* 0x02a4 */ add %o1
,%o2
,%g5
402 /* 0x02a8 */ add %i0
,6,%i0
403 /* 0x02ac */ add %i1
,6,%i1
405 /* 0x02b0 119 */ sra %i1
,0,%o2
407 /* 0x02b4 119 */ sllx
%o2
,3,%o3
408 /* 0x02b8 120 */ and %i3
,%g3
,%o1
409 /* 0x02bc 119 */ ldd
[%g4+
%o3
],%f0
410 /* 0x02c0 122 */ sra %i0
,0,%o3
411 /* 0x02c4 123 */ and %i2
,%o5
,%o2
412 /* 0x02c8 122 */ sllx
%o3
,3,%o3
413 /* 0x02cc 120 */ add %g5
,%o1
,%o1
414 /* 0x02d0 119 */ fdtox
%f0,%f0
415 /* 0x02d4 */ std %f0,[%sp+
2231]
416 /* 0x02d8 123 */ sllx
%o2
,16,%o2
417 /* 0x02dc */ add %o1
,%o2
,%o2
418 /* 0x02e0 128 */ add %i1
,2,%i1
419 /* 0x02e4 122 */ ldd
[%g4+
%o3
],%f0
420 /* 0x02e8 124 */ srax
%o2
,32,%g2
421 /* 0x02ec 125 */ and %o2
,%g3
,%o3
422 /* 0x02f0 124 */ srax
%i2
,16,%o1
423 /* 0x02f4 128 */ add %i0
,2,%i0
424 /* 0x02f8 122 */ fdtox
%f0,%f0
425 /* 0x02fc */ std %f0,[%sp+
2223]
426 /* 0x0300 125 */ sra %o0
,0,%o2
427 /* 0x0304 */ sllx
%o2
,2,%o2
428 /* 0x0308 124 */ add %o1
,%g2
,%g5
429 /* 0x030c 121 */ srax
%i3
,32,%g2
430 /* 0x0310 128 */ add %o0
,1,%o0
431 /* 0x0314 124 */ add %g2
,%g5
,%g5
432 /* 0x0318 128 */ cmp %o0
,%o7
433 /* 0x031c 119 */ ldx [%sp+
2231],%o4
434 /* 0x0320 122 */ ldx [%sp+
2223],%i2
435 /* 0x0324 125 */ st %o3
,[%g1+
%o2
]
436 /* 0x0328 127 */ or %g0
,%o4
,%i3
437 /* 0x032c 128 */ ble,pt
%icc
,.L900000112
438 /* 0x0330 */ sra %i1
,0,%o2
442 ! 130 ! t1+
=a&0xffffffff;
444 ! 132 ! t1+
=(b&0xffff)<<16;
445 ! 133 ! i32
[i
]=t1
&0xffffffff;
447 /* 0x0334 133 */ sethi
%hi
(0xfc00),%g2
449 /* 0x0338 133 */ or %g0
,-1,%g3
450 /* 0x033c */ add %g2
,1023,%g2
451 /* 0x0340 */ srl
%g3
,0,%g3
452 /* 0x0344 */ and %i2
,%g2
,%g2
453 /* 0x0348 */ and %i3
,%g3
,%g4
454 /* 0x034c */ sllx
%g2
,16,%g2
455 /* 0x0350 */ add %g5
,%g4
,%g4
456 /* 0x0354 */ sra %o0
,0,%g5
457 /* 0x0358 */ add %g4
,%g2
,%g4
458 /* 0x035c */ sllx
%g5
,2,%g2
459 /* 0x0360 */ and %g4
,%g3
,%g3
460 /* 0x0364 */ st %g3
,[%g1+
%g2
]
461 /* 0x0368 */ ret
! Result
=
462 /* 0x036c */ restore
%g0
,%g0
,%g0
463 /* 0x0370 0 */ .type conv_d16_to_i32,2
464 /* 0x0370 */ .size conv_d16_to_i32,(.-conv_d16_to_i32)
466 .section ".text",#alloc,#execinstr
467 /* 000000 0 */ .align 8
471 .L_const_seg_900000201:
472 /* 000000 0 */ .word 1127219200,0
473 /* 0x0008 0 */ .align 8
474 /* 0x0008 */ .skip 24
476 ! SUBROUTINE conv_i32_to_d32
478 ! OFFSET SOURCE LINE LABEL INSTRUCTION
480 .global conv_i32_to_d32
482 /* 000000 */ or %g0
,%o7
,%g3
485 ! 137 !void conv_i32_to_d32
(double
*d32
, unsigned int
*i32
, int len
)
488 ! 141 !#pragma pipeloop(0)
489 ! 142 ! for
(i
=0;i
<len;i+
+) d32
[i
]=(double
)(i32
[i
]);
491 /* 0x0004 142 */ cmp %o2
,0
493 /* 0x0008 */ call
.+8
494 /* 0x000c */ sethi
/*X*/%hi
(_GLOBAL_OFFSET_TABLE_-
(.L900000210-.)),%g4
495 /* 0x0010 142 */ or %g0
,0,%o3
496 /* 0x0014 138 */ add %g4
,/*X*/%lo
(_GLOBAL_OFFSET_TABLE_-
(.L900000210-.)),%g4
497 /* 0x0018 142 */ sub %o2
,1,%o4
498 /* 0x001c 138 */ add %g4
,%o7
,%g1
499 /* 0x0020 142 */ ble,pt
%icc
,.L77000140
500 /* 0x0024 */ or %g0
,%g3
,%o7
501 /* 0x0028 */ sethi
%hi
(.L_const_seg_900000201),%g3
502 /* 0x002c */ cmp %o2
,12
503 /* 0x0030 */ add %g3
,%lo
(.L_const_seg_900000201),%g2
504 /* 0x0034 */ or %g0
,%o1
,%g5
505 /* 0x0038 */ ldx [%g1+
%g2
],%g4
506 /* 0x003c */ or %g0
,0,%g1
507 /* 0x0040 */ or %g0
,24,%g2
508 /* 0x0044 */ bl,pn
%icc
,.L77000144
509 /* 0x0048 */ or %g0
,0,%g3
510 /* 0x004c */ ld [%o1
],%f13
511 /* 0x0050 */ or %g0
,7,%o3
512 /* 0x0054 */ ldd
[%g4
],%f8
513 /* 0x0058 */ sub %o2
,5,%g3
514 /* 0x005c */ or %g0
,8,%g1
515 /* 0x0060 */ ld [%o1+
4],%f11
516 /* 0x0064 */ ld [%o1+
8],%f7
517 /* 0x0068 */ fmovs
%f8,%f12
518 /* 0x006c */ ld [%o1+
12],%f5
519 /* 0x0070 */ fmovs
%f8,%f10
520 /* 0x0074 */ ld [%o1+
16],%f3
521 /* 0x0078 */ fmovs
%f8,%f6
522 /* 0x007c */ ld [%o1+
20],%f1
523 /* 0x0080 */ fsubd
%f12,%f8,%f12
524 /* 0x0084 */ std %f12,[%o0
]
525 /* 0x0088 */ fsubd
%f10,%f8,%f10
526 /* 0x008c */ std %f10,[%o0+
8]
528 /* 0x0090 */ ld [%o1+
%g2
],%f11
529 /* 0x0094 */ add %g1
,8,%g1
530 /* 0x0098 */ add %o3
,5,%o3
531 /* 0x009c */ fsubd
%f6,%f8,%f6
532 /* 0x00a0 */ add %g2
,4,%g2
533 /* 0x00a4 */ std %f6,[%o0+
%g1
]
534 /* 0x00a8 */ cmp %o3
,%g3
535 /* 0x00ac */ fmovs
%f8,%f4
536 /* 0x00b0 */ ld [%o1+
%g2
],%f7
537 /* 0x00b4 */ fsubd
%f4,%f8,%f12
538 /* 0x00b8 */ add %g1
,8,%g1
539 /* 0x00bc */ add %g2
,4,%g2
540 /* 0x00c0 */ fmovs
%f8,%f2
541 /* 0x00c4 */ std %f12,[%o0+
%g1
]
542 /* 0x00c8 */ ld [%o1+
%g2
],%f5
543 /* 0x00cc */ fsubd
%f2,%f8,%f12
544 /* 0x00d0 */ add %g1
,8,%g1
545 /* 0x00d4 */ add %g2
,4,%g2
546 /* 0x00d8 */ fmovs
%f8,%f0
547 /* 0x00dc */ std %f12,[%o0+
%g1
]
548 /* 0x00e0 */ ld [%o1+
%g2
],%f3
549 /* 0x00e4 */ fsubd
%f0,%f8,%f12
550 /* 0x00e8 */ add %g1
,8,%g1
551 /* 0x00ec */ add %g2
,4,%g2
552 /* 0x00f0 */ fmovs
%f8,%f10
553 /* 0x00f4 */ std %f12,[%o0+
%g1
]
554 /* 0x00f8 */ ld [%o1+
%g2
],%f1
555 /* 0x00fc */ fsubd
%f10,%f8,%f10
556 /* 0x0100 */ add %g1
,8,%g1
557 /* 0x0104 */ add %g2
,4,%g2
558 /* 0x0108 */ std %f10,[%o0+
%g1
]
559 /* 0x010c */ ble,pt
%icc
,.L900000205
560 /* 0x0110 */ fmovs
%f8,%f6
562 /* 0x0114 */ fmovs
%f8,%f4
563 /* 0x0118 */ ld [%o1+
%g2
],%f11
564 /* 0x011c */ add %g1
,8,%g3
565 /* 0x0120 */ fmovs
%f8,%f2
566 /* 0x0124 */ add %g1
,16,%g1
567 /* 0x0128 */ cmp %o3
,%o4
568 /* 0x012c */ fmovs
%f8,%f0
569 /* 0x0130 */ add %g1
,8,%o1
570 /* 0x0134 */ add %g1
,16,%o2
571 /* 0x0138 */ fmovs
%f8,%f10
572 /* 0x013c */ add %g1
,24,%g2
573 /* 0x0140 */ fsubd
%f6,%f8,%f6
574 /* 0x0144 */ std %f6,[%o0+
%g3
]
575 /* 0x0148 */ fsubd
%f4,%f8,%f4
576 /* 0x014c */ std %f4,[%o0+
%g1
]
577 /* 0x0150 */ sra %o3
,0,%g1
578 /* 0x0154 */ fsubd
%f2,%f8,%f2
579 /* 0x0158 */ std %f2,[%o0+
%o1
]
580 /* 0x015c */ sllx
%g1
,2,%g3
581 /* 0x0160 */ fsubd
%f0,%f8,%f0
582 /* 0x0164 */ std %f0,[%o0+
%o2
]
583 /* 0x0168 */ fsubd
%f10,%f8,%f0
584 /* 0x016c */ bg
,pn
%icc
,.L77000140
585 /* 0x0170 */ std %f0,[%o0+
%g2
]
587 /* 0x0174 */ ldd
[%g4
],%f8
589 /* 0x0178 */ ld [%g5+
%g3
],%f13
590 /* 0x017c */ sllx
%g1
,3,%g2
591 /* 0x0180 */ add %o3
,1,%o3
592 /* 0x0184 */ sra %o3
,0,%g1
593 /* 0x0188 */ cmp %o3
,%o4
594 /* 0x018c */ fmovs
%f8,%f12
595 /* 0x0190 */ sllx
%g1
,2,%g3
596 /* 0x0194 */ fsubd
%f12,%f8,%f0
597 /* 0x0198 */ std %f0,[%o0+
%g2
]
598 /* 0x019c */ ble,a,pt
%icc
,.L900000211
599 /* 0x01a0 */ ldd
[%g4
],%f8
601 /* 0x01a4 */ retl
! Result
=
603 /* 0x01ac 0 */ .type conv_i32_to_d32,2
604 /* 0x01ac */ .size conv_i32_to_d32,(.-conv_i32_to_d32)
606 .section ".text",#alloc,#execinstr
607 /* 000000 0 */ .align 8
611 .L_const_seg_900000301:
612 /* 000000 0 */ .word 1127219200,0
613 /* 0x0008 0 */ .align 8
614 /* 0x0008 */ .skip 24
616 ! SUBROUTINE conv_i32_to_d16
618 ! OFFSET SOURCE LINE LABEL INSTRUCTION
620 .global conv_i32_to_d16
622 /* 000000 */ save
%sp
,-192,%sp
624 /* 0x0004 */ call
.+8
625 /* 0x0008 */ sethi
/*X*/%hi
(_GLOBAL_OFFSET_TABLE_-
(.L900000310-.)),%g3
628 ! 146 !void conv_i32_to_d16
(double
*d16
, unsigned int
*i32
, int len
)
631 ! 149 !unsigned int
a;
632 ! 151 !#pragma pipeloop(0)
633 ! 152 ! for
(i
=0;i
<len;i+
+)
635 /* 0x000c 152 */ cmp %i2
,0
636 /* 0x0010 147 */ add %g3
,/*X*/%lo
(_GLOBAL_OFFSET_TABLE_-
(.L900000310-.)),%g3
637 /* 0x0014 152 */ ble,pt
%icc
,.L77000150
638 /* 0x0018 */ add %g3
,%o7
,%o0
642 ! 155 ! d16
[2*i
]=(double
)(a&0xffff);
643 ! 156 ! d16
[2*i+
1]=(double
)(a>>16);
645 /* 0x001c 156 */ sethi
%hi
(.L_const_seg_900000301),%g2
646 /* 0x0020 147 */ or %g0
,%i2
,%o1
647 /* 0x0024 152 */ sethi
%hi
(0xfc00),%g3
648 /* 0x0028 156 */ add %g2
,%lo
(.L_const_seg_900000301),%g2
649 /* 0x002c 152 */ or %g0
,%o1
,%g4
650 /* 0x0030 156 */ ldx [%o0+
%g2
],%o5
651 /* 0x0034 152 */ add %g3
,1023,%g1
652 /* 0x0038 147 */ or %g0
,%i1
,%o7
653 /* 0x003c 152 */ or %g0
,0,%i2
654 /* 0x0040 */ sub %o1
,1,%g5
655 /* 0x0044 */ or %g0
,0,%g3
656 /* 0x0048 */ or %g0
,1,%g2
657 /* 0x004c 154 */ or %g0
,0,%o2
658 /* 0x0050 */ cmp %g4
,6
659 /* 0x0054 152 */ bl,pn
%icc
,.L77000154
660 /* 0x0058 */ ldd
[%o5
],%f0
661 /* 0x005c */ sub %o1
,2,%o3
662 /* 0x0060 */ or %g0
,16,%o2
663 /* 0x0064 154 */ ld [%i1
],%o4
664 /* 0x0068 156 */ or %g0
,3,%g2
665 /* 0x006c */ or %g0
,2,%g3
666 /* 0x0070 155 */ fmovs
%f0,%f2
667 /* 0x0074 156 */ or %g0
,4,%i2
668 /* 0x0078 155 */ and %o4
,%g1
,%o0
669 /* 0x007c */ st %o0
,[%sp+
2227]
670 /* 0x0080 */ fmovs
%f0,%f4
671 /* 0x0084 156 */ srl
%o4
,16,%i4
672 /* 0x0088 152 */ or %g0
,12,%o4
673 /* 0x008c */ or %g0
,24,%o0
674 /* 0x0090 155 */ ld [%sp+
2227],%f3
675 /* 0x0094 */ fsubd
%f2,%f0,%f2
676 /* 0x0098 */ std %f2,[%i0
]
677 /* 0x009c 156 */ st %i4
,[%sp+
2223]
678 /* 0x00a0 154 */ ld [%o7+
4],%o1
679 /* 0x00a4 156 */ fmovs
%f0,%f2
680 /* 0x00a8 155 */ and %o1
,%g1
,%i1
681 /* 0x00ac 156 */ ld [%sp+
2223],%f3
682 /* 0x00b0 */ srl
%o1
,16,%o1
683 /* 0x00b4 */ fsubd
%f2,%f0,%f2
684 /* 0x00b8 */ std %f2,[%i0+
8]
685 /* 0x00bc */ st %o1
,[%sp+
2223]
686 /* 0x00c0 155 */ st %i1
,[%sp+
2227]
687 /* 0x00c4 154 */ ld [%o7+
8],%o1
688 /* 0x00c8 156 */ fmovs
%f0,%f2
689 /* 0x00cc 155 */ and %o1
,%g1
,%g4
690 /* 0x00d0 */ ld [%sp+
2227],%f5
691 /* 0x00d4 156 */ srl
%o1
,16,%o1
692 /* 0x00d8 */ ld [%sp+
2223],%f3
693 /* 0x00dc */ st %o1
,[%sp+
2223]
694 /* 0x00e0 155 */ fsubd
%f4,%f0,%f4
695 /* 0x00e4 */ st %g4
,[%sp+
2227]
696 /* 0x00e8 156 */ fsubd
%f2,%f0,%f2
697 /* 0x00ec 154 */ ld [%o7+
12],%o1
698 /* 0x00f0 155 */ std %f4,[%i0+
16]
699 /* 0x00f4 156 */ std %f2,[%i0+
24]
701 /* 0x00f8 155 */ ld [%sp+
2227],%f5
702 /* 0x00fc 156 */ add %i2
,2,%i2
703 /* 0x0100 */ add %g2
,4,%g2
704 /* 0x0104 */ ld [%sp+
2223],%f3
705 /* 0x0108 */ cmp %i2
,%o3
706 /* 0x010c */ add %g3
,4,%g3
707 /* 0x0110 155 */ and %o1
,%g1
,%g4
708 /* 0x0114 156 */ srl
%o1
,16,%o1
709 /* 0x0118 155 */ st %g4
,[%sp+
2227]
710 /* 0x011c 156 */ st %o1
,[%sp+
2223]
711 /* 0x0120 152 */ add %o4
,4,%o1
712 /* 0x0124 154 */ ld [%o7+
%o1
],%o4
713 /* 0x0128 156 */ fmovs
%f0,%f2
714 /* 0x012c 155 */ fmovs
%f0,%f4
715 /* 0x0130 */ fsubd
%f4,%f0,%f4
716 /* 0x0134 152 */ add %o2
,16,%o2
717 /* 0x0138 156 */ fsubd
%f2,%f0,%f2
718 /* 0x013c 155 */ std %f4,[%i0+
%o2
]
719 /* 0x0140 152 */ add %o0
,16,%o0
720 /* 0x0144 156 */ std %f2,[%i0+
%o0
]
721 /* 0x0148 155 */ ld [%sp+
2227],%f5
722 /* 0x014c 156 */ ld [%sp+
2223],%f3
723 /* 0x0150 155 */ and %o4
,%g1
,%g4
724 /* 0x0154 156 */ srl
%o4
,16,%o4
725 /* 0x0158 155 */ st %g4
,[%sp+
2227]
726 /* 0x015c 156 */ st %o4
,[%sp+
2223]
727 /* 0x0160 152 */ add %o1
,4,%o4
728 /* 0x0164 154 */ ld [%o7+
%o4
],%o1
729 /* 0x0168 156 */ fmovs
%f0,%f2
730 /* 0x016c 155 */ fmovs
%f0,%f4
731 /* 0x0170 */ fsubd
%f4,%f0,%f4
732 /* 0x0174 152 */ add %o2
,16,%o2
733 /* 0x0178 156 */ fsubd
%f2,%f0,%f2
734 /* 0x017c 155 */ std %f4,[%i0+
%o2
]
735 /* 0x0180 152 */ add %o0
,16,%o0
736 /* 0x0184 156 */ ble,pt
%icc
,.L900000306
737 /* 0x0188 */ std %f2,[%i0+
%o0
]
739 /* 0x018c 155 */ ld [%sp+
2227],%f5
740 /* 0x0190 156 */ fmovs
%f0,%f2
741 /* 0x0194 */ srl
%o1
,16,%o3
742 /* 0x0198 */ ld [%sp+
2223],%f3
743 /* 0x019c 155 */ and %o1
,%g1
,%i1
744 /* 0x01a0 152 */ add %o2
,16,%g4
745 /* 0x01a4 155 */ fmovs
%f0,%f4
746 /* 0x01a8 */ st %i1
,[%sp+
2227]
747 /* 0x01ac 152 */ add %o0
,16,%o2
748 /* 0x01b0 156 */ st %o3
,[%sp+
2223]
749 /* 0x01b4 154 */ sra %i2
,0,%o3
750 /* 0x01b8 152 */ add %g4
,16,%o1
751 /* 0x01bc 155 */ fsubd
%f4,%f0,%f4
752 /* 0x01c0 */ std %f4,[%i0+
%g4
]
753 /* 0x01c4 152 */ add %o0
,32,%o0
754 /* 0x01c8 156 */ fsubd
%f2,%f0,%f2
755 /* 0x01cc */ std %f2,[%i0+
%o2
]
756 /* 0x01d0 */ sllx
%o3
,2,%o2
757 /* 0x01d4 155 */ ld [%sp+
2227],%f5
758 /* 0x01d8 156 */ cmp %i2
,%g5
759 /* 0x01dc */ add %g2
,6,%g2
760 /* 0x01e0 */ ld [%sp+
2223],%f3
761 /* 0x01e4 */ add %g3
,6,%g3
762 /* 0x01e8 155 */ fmovs
%f0,%f4
763 /* 0x01ec 156 */ fmovs
%f0,%f2
764 /* 0x01f0 155 */ fsubd
%f4,%f0,%f4
765 /* 0x01f4 */ std %f4,[%i0+
%o1
]
766 /* 0x01f8 156 */ fsubd
%f2,%f0,%f0
767 /* 0x01fc */ bg
,pn
%icc
,.L77000150
768 /* 0x0200 */ std %f0,[%i0+
%o0
]
770 /* 0x0204 155 */ ldd
[%o5
],%f0
772 /* 0x0208 154 */ ld [%o7+
%o2
],%o0
773 /* 0x020c 155 */ sra %g3
,0,%o1
774 /* 0x0210 */ fmovs
%f0,%f2
775 /* 0x0214 */ sllx
%o1
,3,%o2
776 /* 0x0218 156 */ add %i2
,1,%i2
777 /* 0x021c 155 */ and %o0
,%g1
,%o1
778 /* 0x0220 */ st %o1
,[%sp+
2227]
779 /* 0x0224 156 */ add %g3
,2,%g3
780 /* 0x0228 */ srl
%o0
,16,%o1
781 /* 0x022c */ cmp %i2
,%g5
782 /* 0x0230 */ sra %g2
,0,%o0
783 /* 0x0234 */ add %g2
,2,%g2
784 /* 0x0238 */ sllx
%o0
,3,%o0
785 /* 0x023c 155 */ ld [%sp+
2227],%f3
786 /* 0x0240 154 */ sra %i2
,0,%o3
787 /* 0x0244 155 */ fsubd
%f2,%f0,%f2
788 /* 0x0248 */ std %f2,[%i0+
%o2
]
789 /* 0x024c */ sllx
%o3
,2,%o2
790 /* 0x0250 156 */ st %o1
,[%sp+
2223]
791 /* 0x0254 */ fmovs
%f0,%f2
792 /* 0x0258 */ ld [%sp+
2223],%f3
793 /* 0x025c */ fsubd
%f2,%f0,%f0
794 /* 0x0260 */ std %f0,[%i0+
%o0
]
795 /* 0x0264 */ ble,a,pt
%icc
,.L900000311
796 /* 0x0268 */ ldd
[%o5
],%f0
798 /* 0x026c */ ret
! Result
=
799 /* 0x0270 */ restore
%g0
,%g0
,%g0
800 /* 0x0274 0 */ .type conv_i32_to_d16,2
801 /* 0x0274 */ .size conv_i32_to_d16,(.-conv_i32_to_d16)
803 .section ".text",#alloc,#execinstr
804 /* 000000 0 */ .align 8
808 .L_const_seg_900000401:
809 /* 000000 0 */ .word 1127219200,0
810 /* 0x0008 0 */ .align 8
811 /* 0x0008 */ .skip 24
813 ! SUBROUTINE conv_i32_to_d32_and_d16
815 ! OFFSET SOURCE LINE LABEL INSTRUCTION
817 .global conv_i32_to_d32_and_d16
818 conv_i32_to_d32_and_d16
:
819 /* 000000 */ save
%sp
,-192,%sp
821 /* 0x0004 */ call
.+8
822 /* 0x0008 */ sethi
/*X*/%hi
(_GLOBAL_OFFSET_TABLE_-
(.L900000415-.)),%g3
826 ! 161 !void conv_i32_to_d32_and_d16
(double
*d32
, double
*d16
,
827 ! 162 ! unsigned int
*i32
, int len
)
830 ! 165 !unsigned int
a;
831 ! 167 !#pragma pipeloop(0)
832 ! 168 !#ifdef RF_INLINE_MACROS
833 ! 169 ! for
(;i
<len-
3;i+
=4)
835 ! 171 ! i16_to_d16_and_d32x4
(&TwoToMinus16
, &TwoTo16
, &Zero
,
836 ! 172 ! &(d16
[2*i
]), &(d32
[i
]), (float
*)(&(i32
[i
])));
838 /* 0x000c 172 */ sethi
%hi
(Zero
),%g2
839 /* 0x0010 163 */ add %g3
,/*X*/%lo
(_GLOBAL_OFFSET_TABLE_-
(.L900000415-.)),%g3
840 /* 0x0014 */ or %g0
,%i3
,%g5
841 /* 0x0018 */ add %g3
,%o7
,%o3
842 /* 0x001c 172 */ add %g2
,%lo
(Zero
),%g2
843 /* 0x0020 */ ldx [%o3+
%g2
],%o0
844 /* 0x0024 */ sethi
%hi
(TwoToMinus16
),%g3
845 /* 0x0028 163 */ or %g0
,%i0
,%i3
846 /* 0x002c 169 */ sub %g5
,3,%o1
847 /* 0x0030 172 */ sethi
%hi
(TwoTo16
),%g4
848 /* 0x0034 163 */ or %g0
,%i2
,%i0
849 /* 0x0038 172 */ add %g3
,%lo
(TwoToMinus16
),%g2
850 /* 0x003c */ ldx [%o3+
%g2
],%o2
851 /* 0x0040 169 */ cmp %o1
,0
852 /* 0x0044 164 */ or %g0
,0,%i2
853 /* 0x0048 169 */ ble,pt
%icc
,.L900000418
854 /* 0x004c */ cmp %i2
,%g5
855 /* 0x0050 */ ldd
[%o0
],%f2
856 /* 0x0054 172 */ add %g4
,%lo
(TwoTo16
),%g3
857 /* 0x0058 */ ldx [%o3+
%g3
],%o1
858 /* 0x005c 169 */ sub %g5
,4,%o4
859 /* 0x0060 */ or %g0
,0,%o5
861 /* 0x0064 172 */ sra %i2
,0,%g2
862 /* 0x0068 */ fmovd
%f2,%f14
863 /* 0x006c */ ldd
[%o2
],%f0
864 /* 0x0070 */ sllx
%g2
,2,%g3
865 /* 0x0074 */ fmovd
%f2,%f10
866 /* 0x0078 */ ldd
[%o1
],%f16
867 /* 0x007c */ ld [%g3+
%i0
],%f15
868 /* 0x0080 */ add %i0
,%g3
,%g3
869 /* 0x0084 */ fmovd
%f2,%f6
870 /* 0x0088 */ ld [%g3+
4],%f11
871 /* 0x008c */ sra %o5
,0,%g4
872 /* 0x0090 */ add %i2
,4,%i2
873 /* 0x0094 */ ld [%g3+
8],%f7
874 /* 0x0098 */ fxtod
%f14,%f14
875 /* 0x009c */ sllx
%g2
,3,%g2
876 /* 0x00a0 */ ld [%g3+
12],%f3
877 /* 0x00a4 */ fxtod
%f10,%f10
878 /* 0x00a8 */ sllx
%g4
,3,%g3
879 /* 0x00ac */ fxtod
%f6,%f6
880 /* 0x00b0 */ std %f14,[%g2+
%i3
]
881 /* 0x00b4 */ add %i3
,%g2
,%g4
882 /* 0x00b8 */ fxtod
%f2,%f2
883 /* 0x00bc */ fmuld
%f0,%f14,%f12
884 /* 0x00c0 */ std %f2,[%g4+
24]
885 /* 0x00c4 */ fmuld
%f0,%f10,%f8
886 /* 0x00c8 */ std %f10,[%g4+
8]
887 /* 0x00cc */ add %i1
,%g3
,%g2
888 /* 0x00d0 */ fmuld
%f0,%f6,%f4
889 /* 0x00d4 */ std %f6,[%g4+
16]
890 /* 0x00d8 */ cmp %i2
,%o4
891 /* 0x00dc */ fmuld
%f0,%f2,%f0
892 /* 0x00e0 */ fdtox
%f12,%f12
893 /* 0x00e4 */ add %o5
,8,%o5
894 /* 0x00e8 */ fdtox
%f8,%f8
895 /* 0x00ec */ fdtox
%f4,%f4
896 /* 0x00f0 */ fdtox
%f0,%f0
897 /* 0x00f4 */ fxtod
%f12,%f12
898 /* 0x00f8 */ std %f12,[%g2+
8]
899 /* 0x00fc */ fxtod
%f8,%f8
900 /* 0x0100 */ std %f8,[%g2+
24]
901 /* 0x0104 */ fxtod
%f4,%f4
902 /* 0x0108 */ std %f4,[%g2+
40]
903 /* 0x010c */ fxtod
%f0,%f0
904 /* 0x0110 */ std %f0,[%g2+
56]
905 /* 0x0114 */ fmuld
%f12,%f16,%f12
906 /* 0x0118 */ fmuld
%f8,%f16,%f8
907 /* 0x011c */ fmuld
%f4,%f16,%f4
908 /* 0x0120 */ fsubd
%f14,%f12,%f12
909 /* 0x0124 */ std %f12,[%g3+
%i1
]
910 /* 0x0128 */ fmuld
%f0,%f16,%f0
911 /* 0x012c */ fsubd
%f10,%f8,%f8
912 /* 0x0130 */ std %f8,[%g2+
16]
913 /* 0x0134 */ fsubd
%f6,%f4,%f4
914 /* 0x0138 */ std %f4,[%g2+
32]
915 /* 0x013c */ fsubd
%f2,%f0,%f0
916 /* 0x0140 */ std %f0,[%g2+
48]
917 /* 0x0144 */ ble,a,pt
%icc
,.L900000417
918 /* 0x0148 */ ldd
[%o0
],%f2
923 ! 175 ! for
(;i
<len;i+
+)
925 /* 0x014c 175 */ cmp %i2
,%g5
927 /* 0x0150 175 */ bge,pt
%icc
,.L77000164
932 ! 178 ! d32
[i
]=(double
)(i32
[i
]);
933 ! 179 ! d16
[2*i
]=(double
)(a&0xffff);
934 ! 180 ! d16
[2*i+
1]=(double
)(a>>16);
936 /* 0x0158 180 */ sethi
%hi
(.L_const_seg_900000401),%g2
937 /* 0x015c */ add %g2
,%lo
(.L_const_seg_900000401),%g2
938 /* 0x0160 175 */ sethi
%hi
(0xfc00),%g3
939 /* 0x0164 180 */ ldx [%o3+
%g2
],%g1
940 /* 0x0168 175 */ sll
%i2
,1,%i4
941 /* 0x016c */ sub %g5
,%i2
,%g4
942 /* 0x0170 177 */ sra %i2
,0,%o3
943 /* 0x0174 175 */ add %g3
,1023,%g3
944 /* 0x0178 178 */ ldd
[%g1
],%f2
945 /* 0x017c */ sllx
%o3
,2,%o2
946 /* 0x0180 175 */ add %i4
,1,%g2
947 /* 0x0184 177 */ or %g0
,%o3
,%o1
948 /* 0x0188 */ cmp %g4
,6
949 /* 0x018c 175 */ bl,pn
%icc
,.L77000161
950 /* 0x0190 */ sra %i2
,0,%o3
951 /* 0x0194 177 */ or %g0
,%o2
,%o0
952 /* 0x0198 178 */ ld [%i0+
%o2
],%f5
953 /* 0x019c 179 */ fmovs
%f2,%f8
954 /* 0x01a0 175 */ add %o0
,4,%o3
955 /* 0x01a4 177 */ ld [%i0+
%o0
],%o7
956 /* 0x01a8 180 */ fmovs
%f2,%f6
957 /* 0x01ac 178 */ fmovs
%f2,%f4
958 /* 0x01b0 */ sllx
%o1
,3,%o2
959 /* 0x01b4 175 */ add %o3
,4,%o5
960 /* 0x01b8 179 */ sra %i4
,0,%o0
961 /* 0x01bc 175 */ add %o3
,8,%o4
962 /* 0x01c0 178 */ fsubd
%f4,%f2,%f4
963 /* 0x01c4 */ std %f4,[%i3+
%o2
]
964 /* 0x01c8 179 */ sllx
%o0
,3,%i5
965 /* 0x01cc */ and %o7
,%g3
,%o0
966 /* 0x01d0 */ st %o0
,[%sp+
2227]
967 /* 0x01d4 175 */ add %i5
,16,%o1
968 /* 0x01d8 180 */ srl
%o7
,16,%g4
969 /* 0x01dc */ add %i2
,1,%i2
970 /* 0x01e0 */ sra %g2
,0,%o0
971 /* 0x01e4 175 */ add %o2
,8,%o2
972 /* 0x01e8 179 */ fmovs
%f2,%f4
973 /* 0x01ec 180 */ sllx
%o0
,3,%l0
974 /* 0x01f0 */ add %i4
,3,%g2
975 /* 0x01f4 179 */ ld [%sp+
2227],%f5
976 /* 0x01f8 175 */ add %l0
,16,%o0
977 /* 0x01fc 180 */ add %i4
,2,%i4
978 /* 0x0200 175 */ sub %g5
,1,%o7
979 /* 0x0204 180 */ add %i2
,3,%i2
980 /* 0x0208 179 */ fsubd
%f4,%f2,%f4
981 /* 0x020c */ std %f4,[%i1+
%i5
]
982 /* 0x0210 180 */ st %g4
,[%sp+
2223]
983 /* 0x0214 177 */ ld [%i0+
%o3
],%i5
984 /* 0x0218 180 */ fmovs
%f2,%f4
985 /* 0x021c */ srl
%i5
,16,%g4
986 /* 0x0220 179 */ and %i5
,%g3
,%i5
987 /* 0x0224 180 */ ld [%sp+
2223],%f5
988 /* 0x0228 */ fsubd
%f4,%f2,%f4
989 /* 0x022c */ std %f4,[%i1+
%l0
]
990 /* 0x0230 */ st %g4
,[%sp+
2223]
991 /* 0x0234 177 */ ld [%i0+
%o5
],%g4
992 /* 0x0238 179 */ st %i5
,[%sp+
2227]
993 /* 0x023c 178 */ fmovs
%f2,%f4
994 /* 0x0240 180 */ srl
%g4
,16,%i5
995 /* 0x0244 179 */ and %g4
,%g3
,%g4
996 /* 0x0248 180 */ ld [%sp+
2223],%f7
997 /* 0x024c */ st %i5
,[%sp+
2223]
998 /* 0x0250 178 */ ld [%i0+
%o3
],%f5
999 /* 0x0254 180 */ fsubd
%f6,%f2,%f6
1000 /* 0x0258 177 */ ld [%i0+
%o4
],%o3
1001 /* 0x025c 178 */ fsubd
%f4,%f2,%f4
1002 /* 0x0260 179 */ ld [%sp+
2227],%f9
1003 /* 0x0264 180 */ ld [%sp+
2223],%f1
1004 /* 0x0268 179 */ st %g4
,[%sp+
2227]
1005 /* 0x026c */ fsubd
%f8,%f2,%f8
1006 /* 0x0270 */ std %f8,[%i1+
%o1
]
1007 /* 0x0274 180 */ std %f6,[%i1+
%o0
]
1008 /* 0x0278 178 */ std %f4,[%i3+
%o2
]
1010 /* 0x027c 179 */ ld [%sp+
2227],%f13
1011 /* 0x0280 180 */ srl
%o3
,16,%g4
1012 /* 0x0284 */ add %i2
,2,%i2
1013 /* 0x0288 */ st %g4
,[%sp+
2223]
1014 /* 0x028c */ cmp %i2
,%o7
1015 /* 0x0290 */ add %g2
,4,%g2
1016 /* 0x0294 178 */ ld [%i0+
%o5
],%f11
1017 /* 0x0298 180 */ add %i4
,4,%i4
1018 /* 0x029c 175 */ add %o4
,4,%o5
1019 /* 0x02a0 177 */ ld [%i0+
%o5
],%g4
1020 /* 0x02a4 179 */ and %o3
,%g3
,%o3
1021 /* 0x02a8 */ st %o3
,[%sp+
2227]
1022 /* 0x02ac 180 */ fmovs
%f2,%f0
1023 /* 0x02b0 179 */ fmovs
%f2,%f12
1024 /* 0x02b4 180 */ fsubd
%f0,%f2,%f8
1025 /* 0x02b8 179 */ fsubd
%f12,%f2,%f4
1026 /* 0x02bc 175 */ add %o1
,16,%o1
1027 /* 0x02c0 180 */ ld [%sp+
2223],%f7
1028 /* 0x02c4 178 */ fmovs
%f2,%f10
1029 /* 0x02c8 179 */ std %f4,[%i1+
%o1
]
1030 /* 0x02cc 175 */ add %o0
,16,%o0
1031 /* 0x02d0 178 */ fsubd
%f10,%f2,%f4
1032 /* 0x02d4 175 */ add %o2
,8,%o2
1033 /* 0x02d8 180 */ std %f8,[%i1+
%o0
]
1034 /* 0x02dc 178 */ std %f4,[%i3+
%o2
]
1035 /* 0x02e0 179 */ ld [%sp+
2227],%f9
1036 /* 0x02e4 180 */ srl
%g4
,16,%o3
1037 /* 0x02e8 */ st %o3
,[%sp+
2223]
1038 /* 0x02ec 178 */ ld [%i0+
%o4
],%f5
1039 /* 0x02f0 175 */ add %o4
,8,%o4
1040 /* 0x02f4 177 */ ld [%i0+
%o4
],%o3
1041 /* 0x02f8 179 */ and %g4
,%g3
,%g4
1042 /* 0x02fc */ st %g4
,[%sp+
2227]
1043 /* 0x0300 180 */ fmovs
%f2,%f6
1044 /* 0x0304 179 */ fmovs
%f2,%f8
1045 /* 0x0308 180 */ fsubd
%f6,%f2,%f6
1046 /* 0x030c 179 */ fsubd
%f8,%f2,%f8
1047 /* 0x0310 175 */ add %o1
,16,%o1
1048 /* 0x0314 180 */ ld [%sp+
2223],%f1
1049 /* 0x0318 178 */ fmovs
%f2,%f4
1050 /* 0x031c 179 */ std %f8,[%i1+
%o1
]
1051 /* 0x0320 175 */ add %o0
,16,%o0
1052 /* 0x0324 178 */ fsubd
%f4,%f2,%f4
1053 /* 0x0328 175 */ add %o2
,8,%o2
1054 /* 0x032c 180 */ std %f6,[%i1+
%o0
]
1055 /* 0x0330 */ bl,pt
%icc
,.L900000411
1056 /* 0x0334 */ std %f4,[%i3+
%o2
]
1058 /* 0x0338 180 */ srl
%o3
,16,%o7
1059 /* 0x033c */ st %o7
,[%sp+
2223]
1060 /* 0x0340 179 */ fmovs
%f2,%f12
1061 /* 0x0344 178 */ ld [%i0+
%o5
],%f11
1062 /* 0x0348 180 */ fmovs
%f2,%f0
1063 /* 0x034c 179 */ and %o3
,%g3
,%g4
1064 /* 0x0350 180 */ fmovs
%f2,%f6
1065 /* 0x0354 175 */ add %o1
,16,%o3
1066 /* 0x0358 */ add %o0
,16,%o7
1067 /* 0x035c 178 */ fmovs
%f2,%f10
1068 /* 0x0360 175 */ add %o2
,8,%o2
1069 /* 0x0364 */ add %o1
,32,%o5
1070 /* 0x0368 179 */ ld [%sp+
2227],%f13
1071 /* 0x036c 178 */ fmovs
%f2,%f4
1072 /* 0x0370 175 */ add %o0
,32,%o1
1073 /* 0x0374 180 */ ld [%sp+
2223],%f7
1074 /* 0x0378 175 */ add %o2
,8,%o0
1075 /* 0x037c 180 */ cmp %i2
,%g5
1076 /* 0x0380 179 */ st %g4
,[%sp+
2227]
1077 /* 0x0384 */ fsubd
%f12,%f2,%f8
1078 /* 0x0388 180 */ add %g2
,6,%g2
1079 /* 0x038c 179 */ std %f8,[%i1+
%o3
]
1080 /* 0x0390 180 */ fsubd
%f0,%f2,%f0
1081 /* 0x0394 177 */ sra %i2
,0,%o3
1082 /* 0x0398 180 */ std %f0,[%i1+
%o7
]
1083 /* 0x039c 178 */ fsubd
%f10,%f2,%f0
1084 /* 0x03a0 180 */ add %i4
,6,%i4
1085 /* 0x03a4 178 */ std %f0,[%i3+
%o2
]
1086 /* 0x03a8 */ sllx
%o3
,2,%o2
1087 /* 0x03ac 179 */ ld [%sp+
2227],%f9
1088 /* 0x03b0 178 */ ld [%i0+
%o4
],%f5
1089 /* 0x03b4 179 */ fmovs
%f2,%f8
1090 /* 0x03b8 */ fsubd
%f8,%f2,%f0
1091 /* 0x03bc */ std %f0,[%i1+
%o5
]
1092 /* 0x03c0 180 */ fsubd
%f6,%f2,%f0
1093 /* 0x03c4 */ std %f0,[%i1+
%o1
]
1094 /* 0x03c8 178 */ fsubd
%f4,%f2,%f0
1095 /* 0x03cc 180 */ bge,pn
%icc
,.L77000164
1096 /* 0x03d0 */ std %f0,[%i3+
%o0
]
1098 /* 0x03d4 178 */ ldd
[%g1
],%f2
1100 /* 0x03d8 178 */ ld [%i0+
%o2
],%f5
1101 /* 0x03dc 179 */ sra %i4
,0,%o0
1102 /* 0x03e0 180 */ add %i2
,1,%i2
1103 /* 0x03e4 177 */ ld [%i0+
%o2
],%o1
1104 /* 0x03e8 178 */ sllx
%o3
,3,%o3
1105 /* 0x03ec 180 */ add %i4
,2,%i4
1106 /* 0x03f0 178 */ fmovs
%f2,%f4
1107 /* 0x03f4 179 */ sllx
%o0
,3,%o4
1108 /* 0x03f8 180 */ cmp %i2
,%g5
1109 /* 0x03fc 179 */ and %o1
,%g3
,%o0
1110 /* 0x0400 178 */ fsubd
%f4,%f2,%f0
1111 /* 0x0404 */ std %f0,[%i3+
%o3
]
1112 /* 0x0408 180 */ srl
%o1
,16,%o1
1113 /* 0x040c 179 */ st %o0
,[%sp+
2227]
1114 /* 0x0410 180 */ sra %g2
,0,%o0
1115 /* 0x0414 */ add %g2
,2,%g2
1116 /* 0x0418 177 */ sra %i2
,0,%o3
1117 /* 0x041c 180 */ sllx
%o0
,3,%o0
1118 /* 0x0420 179 */ fmovs
%f2,%f4
1119 /* 0x0424 */ sllx
%o3
,2,%o2
1120 /* 0x0428 */ ld [%sp+
2227],%f5
1121 /* 0x042c */ fsubd
%f4,%f2,%f0
1122 /* 0x0430 */ std %f0,[%i1+
%o4
]
1123 /* 0x0434 180 */ st %o1
,[%sp+
2223]
1124 /* 0x0438 */ fmovs
%f2,%f4
1125 /* 0x043c */ ld [%sp+
2223],%f5
1126 /* 0x0440 */ fsubd
%f4,%f2,%f0
1127 /* 0x0444 */ std %f0,[%i1+
%o0
]
1128 /* 0x0448 */ bl,a,pt
%icc
,.L900000416
1129 /* 0x044c */ ldd
[%g1
],%f2
1131 /* 0x0450 */ ret
! Result
=
1132 /* 0x0454 */ restore
%g0
,%g0
,%g0
1133 /* 0x0458 0 */ .type conv_i32_to_d32_and_d16,2
1134 /* 0x0458 */ .size conv_i32_to_d32_and_d16,(.-conv_i32_to_d32_and_d16)
1136 .section ".text",#alloc,#execinstr
1137 /* 000000 0 */ .align 8
1139 ! SUBROUTINE adjust_montf_result
1141 ! OFFSET SOURCE LINE LABEL INSTRUCTION
1143 .global adjust_montf_result
1144 adjust_montf_result
:
1145 /* 000000 */ save
%sp
,-176,%sp
1146 /* 0x0004 */ or %g0
,%i2
,%o1
1147 /* 0x0008 */ or %g0
,%i0
,%i2
1151 ! 185 !void adjust_montf_result
(unsigned int
*i32
, unsigned int
*nint
, int len
)
1153 ! 187 !long long acc;
1155 ! 190 ! if
(i32
[len
]>0) i
=-1;
1157 /* 0x000c 190 */ sra %o1
,0,%g2
1158 /* 0x0010 */ or %g0
,-1,%o2
1159 /* 0x0014 */ sllx
%g2
,2,%g2
1160 /* 0x0018 */ ld [%i2+
%g2
],%g2
1161 /* 0x001c */ cmp %g2
,0
1162 /* 0x0020 */ bleu
,pn
%icc
,.L77000175
1163 /* 0x0024 */ or %g0
,%i1
,%i0
1164 /* 0x0028 */ ba .L900000511
1165 /* 0x002c */ cmp %o2
,0
1170 ! 193 ! for
(i
=len-
1; i
>=0; i-
-)
1172 /* 0x0030 193 */ sub %o1
,1,%o2
1173 /* 0x0034 */ cmp %o2
,0
1174 /* 0x0038 */ bl,pn
%icc
,.L77000182
1175 /* 0x003c */ sra %o2
,0,%g2
1179 ! 195 ! if
(i32
[i
]!=nint
[i
]) break;
1181 /* 0x0040 195 */ sllx
%g2
,2,%g2
1182 /* 0x0044 */ sub %o2
,1,%o0
1183 /* 0x0048 */ ld [%i1+
%g2
],%g3
1184 /* 0x004c */ ld [%i2+
%g2
],%g2
1185 /* 0x0050 */ cmp %g2
,%g3
1186 /* 0x0054 */ bne,pn
%icc
,.L77000182
1188 /* 0x005c 0 */ or %g0
,%o0
,%o2
1189 /* 0x0060 195 */ cmp %o0
,0
1190 /* 0x0064 */ bge,pt
%icc
,.L900000510
1191 /* 0x0068 */ sra %o2
,0,%g2
1196 ! 198 ! if
((i
<0)||
(i32
[i
]>nint
[i
]))
1198 /* 0x006c 198 */ cmp %o2
,0
1200 /* 0x0070 198 */ bl,pn
%icc
,.L77000198
1201 /* 0x0074 */ sra %o2
,0,%g2
1202 /* 0x0078 */ sllx
%g2
,2,%g2
1203 /* 0x007c */ ld [%i1+
%g2
],%g3
1204 /* 0x0080 */ ld [%i2+
%g2
],%g2
1205 /* 0x0084 */ cmp %g2
,%g3
1206 /* 0x0088 */ bleu
,pt
%icc
,.L77000191
1212 ! 201 ! for
(i
=0;i
<len;i+
+)
1214 /* 0x0090 201 */ cmp %o1
,0
1215 /* 0x0094 */ ble,pt
%icc
,.L77000191
1217 /* 0x009c 198 */ or %g0
,-1,%g2
1218 /* 0x00a0 201 */ or %g0
,%o1
,%g3
1219 /* 0x00a4 198 */ srl
%g2
,0,%g2
1220 /* 0x00a8 */ sub %o1
,1,%g4
1221 /* 0x00ac */ cmp %o1
,9
1222 /* 0x00b0 201 */ or %g0
,0,%i1
1223 /* 0x00b4 200 */ or %g0
,0,%g5
1226 ! 203 ! acc
=acc+
(unsigned long long
)(i32
[i
])-(unsigned long long
)(nint
[i
]);
1228 /* 0x00b8 203 */ or %g0
,0,%o1
1229 /* 0x00bc 201 */ bl,pn
%icc
,.L77000199
1230 /* 0x00c0 */ sub %g3
,4,%o7
1231 /* 0x00c4 203 */ ld [%i2
],%o1
1233 ! 204 ! i32
[i
]=acc
&0xffffffff;
1234 ! 205 ! acc
=acc
>>32;
1236 /* 0x00c8 205 */ or %g0
,5,%i1
1237 /* 0x00cc 203 */ ld [%i0
],%o2
1238 /* 0x00d0 201 */ or %g0
,8,%o5
1239 /* 0x00d4 */ or %g0
,12,%o4
1240 /* 0x00d8 203 */ ld [%i0+
4],%o3
1241 /* 0x00dc 201 */ or %g0
,16,%g1
1242 /* 0x00e0 203 */ ld [%i2+
4],%o0
1243 /* 0x00e4 201 */ sub %o1
,%o2
,%o1
1244 /* 0x00e8 203 */ ld [%i0+
8],%i3
1245 /* 0x00ec 204 */ and %o1
,%g2
,%g5
1246 /* 0x00f0 */ st %g5
,[%i2
]
1247 /* 0x00f4 205 */ srax
%o1
,32,%g5
1248 /* 0x00f8 201 */ sub %o0
,%o3
,%o0
1249 /* 0x00fc 203 */ ld [%i0+
12],%o2
1250 /* 0x0100 201 */ add %o0
,%g5
,%o0
1251 /* 0x0104 204 */ and %o0
,%g2
,%g5
1252 /* 0x0108 */ st %g5
,[%i2+
4]
1253 /* 0x010c 205 */ srax
%o0
,32,%o0
1254 /* 0x0110 203 */ ld [%i2+
8],%o1
1255 /* 0x0114 */ ld [%i2+
12],%o3
1256 /* 0x0118 201 */ sub %o1
,%i3
,%o1
1258 /* 0x011c */ add %g1
,4,%g3
1259 /* 0x0120 203 */ ld [%g1+
%i2
],%g5
1260 /* 0x0124 201 */ add %o1
,%o0
,%o0
1261 /* 0x0128 203 */ ld [%i0+
%g1
],%i3
1262 /* 0x012c 201 */ sub %o3
,%o2
,%o1
1263 /* 0x0130 204 */ and %o0
,%g2
,%o2
1264 /* 0x0134 */ st %o2
,[%o5+
%i2
]
1265 /* 0x0138 205 */ srax
%o0
,32,%o2
1266 /* 0x013c */ add %i1
,4,%i1
1267 /* 0x0140 201 */ add %g1
,8,%o5
1268 /* 0x0144 203 */ ld [%g3+
%i2
],%o0
1269 /* 0x0148 201 */ add %o1
,%o2
,%o1
1270 /* 0x014c 203 */ ld [%i0+
%g3
],%o3
1271 /* 0x0150 201 */ sub %g5
,%i3
,%o2
1272 /* 0x0154 204 */ and %o1
,%g2
,%g5
1273 /* 0x0158 */ st %g5
,[%o4+
%i2
]
1274 /* 0x015c 205 */ srax
%o1
,32,%g5
1275 /* 0x0160 */ cmp %i1
,%o7
1276 /* 0x0164 201 */ add %g1
,12,%o4
1277 /* 0x0168 203 */ ld [%o5+
%i2
],%o1
1278 /* 0x016c 201 */ add %o2
,%g5
,%o2
1279 /* 0x0170 203 */ ld [%i0+
%o5
],%i3
1280 /* 0x0174 201 */ sub %o0
,%o3
,%o0
1281 /* 0x0178 204 */ and %o2
,%g2
,%o3
1282 /* 0x017c */ st %o3
,[%g1+
%i2
]
1283 /* 0x0180 205 */ srax
%o2
,32,%g5
1284 /* 0x0184 203 */ ld [%o4+
%i2
],%o3
1285 /* 0x0188 201 */ add %g1
,16,%g1
1286 /* 0x018c */ add %o0
,%g5
,%o0
1287 /* 0x0190 203 */ ld [%i0+
%o4
],%o2
1288 /* 0x0194 201 */ sub %o1
,%i3
,%o1
1289 /* 0x0198 204 */ and %o0
,%g2
,%g5
1290 /* 0x019c */ st %g5
,[%g3+
%i2
]
1291 /* 0x01a0 205 */ ble,pt
%icc
,.L900000505
1292 /* 0x01a4 */ srax
%o0
,32,%o0
1294 /* 0x01a8 */ add %o1
,%o0
,%g3
1295 /* 0x01ac */ sub %o3
,%o2
,%o1
1296 /* 0x01b0 203 */ ld [%g1+
%i2
],%o0
1297 /* 0x01b4 */ ld [%i0+
%g1
],%o2
1298 /* 0x01b8 205 */ srax
%g3
,32,%o7
1299 /* 0x01bc 204 */ and %g3
,%g2
,%o3
1300 /* 0x01c0 201 */ add %o1
,%o7
,%o1
1301 /* 0x01c4 204 */ st %o3
,[%o5+
%i2
]
1302 /* 0x01c8 205 */ cmp %i1
,%g4
1303 /* 0x01cc 201 */ sub %o0
,%o2
,%o0
1304 /* 0x01d0 204 */ and %o1
,%g2
,%o2
1305 /* 0x01d4 */ st %o2
,[%o4+
%i2
]
1306 /* 0x01d8 205 */ srax
%o1
,32,%o1
1307 /* 0x01dc 203 */ sra %i1
,0,%o2
1308 /* 0x01e0 201 */ add %o0
,%o1
,%o0
1309 /* 0x01e4 205 */ srax
%o0
,32,%g5
1310 /* 0x01e8 204 */ and %o0
,%g2
,%o1
1311 /* 0x01ec */ st %o1
,[%g1+
%i2
]
1312 /* 0x01f0 205 */ bg
,pn
%icc
,.L77000191
1313 /* 0x01f4 */ sllx
%o2
,2,%o1
1315 /* 0x01f8 0 */ or %g0
,%o1
,%g1
1317 /* 0x01fc 203 */ ld [%o1+
%i2
],%o0
1318 /* 0x0200 205 */ add %i1
,1,%i1
1319 /* 0x0204 203 */ ld [%i0+
%o1
],%o1
1320 /* 0x0208 */ sra %i1
,0,%o2
1321 /* 0x020c 205 */ cmp %i1
,%g4
1322 /* 0x0210 203 */ add %g5
,%o0
,%o0
1323 /* 0x0214 */ sub %o0
,%o1
,%o0
1324 /* 0x0218 205 */ srax
%o0
,32,%g5
1325 /* 0x021c 204 */ and %o0
,%g2
,%o1
1326 /* 0x0220 */ st %o1
,[%g1+
%i2
]
1327 /* 0x0224 */ sllx
%o2
,2,%o1
1328 /* 0x0228 205 */ ble,pt
%icc
,.L900000509
1329 /* 0x022c */ or %g0
,%o1
,%g1
1331 /* 0x0230 */ ret
! Result
=
1332 /* 0x0234 */ restore
%g0
,%g0
,%g0
1333 /* 0x0238 0 */ .type adjust_montf_result,2
1334 /* 0x0238 */ .size adjust_montf_result,(.-adjust_montf_result)
1336 .section ".text",#alloc,#execinstr
1337 /* 000000 0 */ .align 8
1338 /* 000000 */ .skip 24
1340 ! SUBROUTINE mont_mulf_noconv
1342 ! OFFSET SOURCE LINE LABEL INSTRUCTION
1344 .global mont_mulf_noconv
1346 /* 000000 */ save
%sp
,-224,%sp
1348 /* 0x0004 */ call
.+8
1349 /* 0x0008 */ sethi
/*X*/%hi
(_GLOBAL_OFFSET_TABLE_-
(.L900000643-.)),%g5
1350 /* 0x000c */ ldx [%fp+
2223],%l0
1356 ! 214 !** the lengths of the input arrays should be at least the following:
1357 ! 215 !** result[nlen+1], dm1[nlen], dm2[2*nlen+1], dt[4*nlen+2], dn[nlen], nint[nlen]
1358 ! 216 !** all of them should be different from one another
1361 ! 219 !void mont_mulf_noconv
(unsigned int
*result
,
1362 ! 220 ! double
*dm1
, double
*dm2
, double
*dt
,
1363 ! 221 ! double
*dn
, unsigned int
*nint
,
1364 ! 222 ! int nlen
, double dn0
)
1366 ! 224 ! int i
, j
, jj;
1368 ! 226 ! double digit
, m2j
, nextm2j
, a, b;
1369 ! 227 ! double
*dptmp
, *pdm1
, *pdm2
, *pdn
, *pdtj
, pdn_0
, pdm1_0;
1370 ! 229 ! pdm1
=&(dm1
[0]);
1371 ! 230 ! pdm2
=&(dm2
[0]);
1372 ! 231 ! pdn
=&(dn
[0]);
1373 ! 232 ! pdm2
[2*nlen
]=Zero;
1375 /* 0x0010 232 */ sethi
%hi
(Zero
),%g2
1376 /* 0x0014 223 */ fmovd
%f14,%f30
1377 /* 0x0018 */ add %g5
,/*X*/%lo
(_GLOBAL_OFFSET_TABLE_-
(.L900000643-.)),%g5
1378 /* 0x001c 232 */ add %g2
,%lo
(Zero
),%g2
1379 /* 0x0020 */ sll
%l0
,1,%o3
1380 /* 0x0024 223 */ add %g5
,%o7
,%o4
1381 /* 0x0028 232 */ sra %o3
,0,%g5
1382 /* 0x002c */ ldx [%o4+
%g2
],%o7
1384 ! 234 ! if
(nlen
!=16)
1386 ! 236 ! for
(i
=0;i
<4*nlen+
2;i+
+) dt
[i
]=Zero;
1387 ! 238 ! a=dt
[0]=pdm1
[0]*pdm2
[0];
1388 ! 239 ! digit
=mod
(lower32
(a,Zero
)*dn0
,TwoToMinus16
,TwoTo16
);
1390 /* 0x0030 239 */ sethi
%hi
(TwoToMinus16
),%g3
1391 /* 0x0034 */ sethi
%hi
(TwoTo16
),%g4
1392 /* 0x0038 */ add %g3
,%lo
(TwoToMinus16
),%g2
1393 /* 0x003c 232 */ ldd
[%o7
],%f0
1394 /* 0x0040 239 */ add %g4
,%lo
(TwoTo16
),%g3
1395 /* 0x0044 223 */ or %g0
,%i4
,%o0
1396 /* 0x0048 232 */ sllx
%g5
,3,%g4
1397 /* 0x004c 239 */ ldx [%o4+
%g2
],%o5
1398 /* 0x0050 223 */ or %g0
,%i5
,%l3
1399 /* 0x0054 */ or %g0
,%i0
,%l2
1400 /* 0x0058 239 */ ldx [%o4+
%g3
],%o4
1401 /* 0x005c 234 */ cmp %l0
,16
1402 /* 0x0060 232 */ std %f0,[%i2+
%g4
]
1403 /* 0x0064 234 */ be,pn
%icc
,.L77000279
1404 /* 0x0068 */ or %g0
,%i3
,%l4
1405 /* 0x006c 236 */ sll
%l0
,2,%g2
1406 /* 0x0070 223 */ or %g0
,%o0
,%i5
1407 /* 0x0074 236 */ add %g2
,2,%o0
1408 /* 0x0078 223 */ or %g0
,%i1
,%i4
1409 /* 0x007c 236 */ cmp %o0
,0
1410 /* 0x0080 223 */ or %g0
,%i2
,%l1
1411 /* 0x0084 236 */ ble,a,pt
%icc
,.L900000657
1412 /* 0x0088 */ ldd
[%i1
],%f6
1414 ! 241 ! pdtj
=&(dt
[0]);
1415 ! 242 ! for
(j
=jj
=0;j
<2*nlen;j+
+,jj+
+,pdtj+
+)
1417 ! 244 ! m2j
=pdm2
[j
];
1418 ! 245 ! a=pdtj
[0]+pdn
[0]*digit;
1419 ! 246 ! b=pdtj
[1]+pdm1
[0]*pdm2
[j+
1]+a*TwoToMinus16;
1421 ! 249 !#pragma pipeloop(0)
1422 ! 250 ! for
(i
=1;i
<nlen;i+
+)
1424 ! 252 ! pdtj
[2*i
]+=pdm1
[i
]*m2j+pdn
[i
]*digit;
1426 ! 254 ! if
((jj
==30)) {cleanup
(dt
,j
/2+1,2*nlen+
1); jj
=0;
}
1428 ! 256 ! digit
=mod
(lower32
(b,Zero
)*dn0
,TwoToMinus16
,TwoTo16
);
1433 ! 261 ! a=dt
[0]=pdm1
[0]*pdm2
[0];
1434 ! 263 ! dt
[65]= dt
[64]= dt
[63]= dt
[62]= dt
[61]= dt
[60]=
1435 ! 264 ! dt
[59]= dt
[58]= dt
[57]= dt
[56]= dt
[55]= dt
[54]=
1436 ! 265 ! dt
[53]= dt
[52]= dt
[51]= dt
[50]= dt
[49]= dt
[48]=
1437 ! 266 ! dt
[47]= dt
[46]= dt
[45]= dt
[44]= dt
[43]= dt
[42]=
1438 ! 267 ! dt
[41]= dt
[40]= dt
[39]= dt
[38]= dt
[37]= dt
[36]=
1439 ! 268 ! dt
[35]= dt
[34]= dt
[33]= dt
[32]= dt
[31]= dt
[30]=
1440 ! 269 ! dt
[29]= dt
[28]= dt
[27]= dt
[26]= dt
[25]= dt
[24]=
1441 ! 270 ! dt
[23]= dt
[22]= dt
[21]= dt
[20]= dt
[19]= dt
[18]=
1442 ! 271 ! dt
[17]= dt
[16]= dt
[15]= dt
[14]= dt
[13]= dt
[12]=
1443 ! 272 ! dt
[11]= dt
[10]= dt
[ 9]= dt
[ 8]= dt
[ 7]= dt
[ 6]=
1444 ! 273 ! dt
[ 5]= dt
[ 4]= dt
[ 3]= dt
[ 2]= dt
[ 1]=Zero;
1445 ! 275 ! pdn_0
=pdn
[0];
1446 ! 276 ! pdm1_0
=pdm1
[0];
1447 ! 278 ! digit
=mod
(lower32
(a,Zero
)*dn0
,TwoToMinus16
,TwoTo16
);
1448 ! 279 ! pdtj
=&(dt
[0]);
1449 ! 281 ! for
(j
=0;j
<32;j+
+,pdtj+
+)
1451 /* 0x008c 281 */ or %g0
,%o0
,%o1
1452 /* 0x0090 236 */ sub %o0
,1,%g1
1453 /* 0x0094 */ or %g0
,0,%g2
1454 /* 0x0098 281 */ cmp %o1
,5
1455 /* 0x009c */ bl,pn
%icc
,.L77000280
1456 /* 0x00a0 */ or %g0
,8,%o0
1457 /* 0x00a4 */ std %f0,[%i3
]
1458 /* 0x00a8 */ or %g0
,2,%g2
1459 /* 0x00ac */ sub %g1
,2,%o1
1461 /* 0x00b0 */ add %o0
,8,%g3
1462 /* 0x00b4 */ std %f0,[%i3+
%o0
]
1463 /* 0x00b8 */ add %g2
,3,%g2
1464 /* 0x00bc */ add %o0
,16,%o2
1465 /* 0x00c0 */ std %f0,[%i3+
%g3
]
1466 /* 0x00c4 */ cmp %g2
,%o1
1467 /* 0x00c8 */ add %o0
,24,%o0
1468 /* 0x00cc */ ble,pt
%icc
,.L900000627
1469 /* 0x00d0 */ std %f0,[%i3+
%o2
]
1471 /* 0x00d4 */ cmp %g2
,%g1
1472 /* 0x00d8 */ bg
,pn
%icc
,.L77000285
1473 /* 0x00dc */ std %f0,[%i3+
%o0
]
1475 /* 0x00e0 */ ldd
[%o7
],%f0
1477 /* 0x00e4 */ sra %g2
,0,%o0
1478 /* 0x00e8 */ add %g2
,1,%g2
1479 /* 0x00ec */ sllx
%o0
,3,%o0
1480 /* 0x00f0 */ cmp %g2
,%g1
1481 /* 0x00f4 */ std %f0,[%i3+
%o0
]
1482 /* 0x00f8 */ ble,a,pt
%icc
,.L900000656
1483 /* 0x00fc */ ldd
[%o7
],%f0
1485 /* 0x0100 238 */ ldd
[%i1
],%f6
1487 /* 0x0104 238 */ ldd
[%i2
],%f8
1488 /* 0x0108 242 */ cmp %o3
,0
1489 /* 0x010c */ sub %o3
,1,%o1
1490 /* 0x0110 239 */ ldd
[%o7
],%f10
1491 /* 0x0114 */ add %o3
,1,%o2
1492 /* 0x0118 0 */ or %g0
,0,%i2
1493 /* 0x011c 238 */ fmuld
%f6,%f8,%f6
1494 /* 0x0120 */ std %f6,[%i3
]
1495 /* 0x0124 0 */ or %g0
,0,%g3
1496 /* 0x0128 239 */ ldd
[%o5
],%f8
1497 /* 0x012c 0 */ or %g0
,%o2
,%g1
1498 /* 0x0130 236 */ sub %l0
,1,%i1
1499 /* 0x0134 239 */ ldd
[%o4
],%f12
1500 /* 0x0138 236 */ or %g0
,1,%g4
1501 /* 0x013c */ fdtox
%f6,%f0
1502 /* 0x0140 */ fmovs
%f10,%f0
1503 /* 0x0144 */ fxtod
%f0,%f6
1504 /* 0x0148 239 */ fmuld
%f6,%f14,%f6
1505 /* 0x014c */ fmuld
%f6,%f8,%f8
1506 /* 0x0150 */ fdtox
%f8,%f8
1507 /* 0x0154 */ fxtod
%f8,%f8
1508 /* 0x0158 */ fmuld
%f8,%f12,%f8
1509 /* 0x015c */ fsubd
%f6,%f8,%f20
1510 /* 0x0160 242 */ ble,pt
%icc
,.L900000650
1511 /* 0x0164 */ sllx
%g5
,3,%g2
1512 /* 0x0168 0 */ st %o1
,[%sp+
2223]
1513 /* 0x016c 246 */ ldd
[%i5
],%f6
1515 /* 0x0170 246 */ sra %g4
,0,%g2
1516 /* 0x0174 */ fmuld
%f6,%f20,%f6
1517 /* 0x0178 */ ldd
[%i3
],%f12
1518 /* 0x017c */ sllx
%g2
,3,%g2
1519 /* 0x0180 */ ldd
[%i4
],%f8
1520 /* 0x0184 250 */ cmp %l0
,1
1521 /* 0x0188 246 */ ldd
[%l1+
%g2
],%f10
1522 /* 0x018c 244 */ sra %i2
,0,%g2
1523 /* 0x0190 */ add %i2
,1,%i0
1524 /* 0x0194 246 */ faddd
%f12,%f6,%f6
1525 /* 0x0198 */ ldd
[%o5
],%f12
1526 /* 0x019c 244 */ sllx
%g2
,3,%g2
1527 /* 0x01a0 246 */ fmuld
%f8,%f10,%f8
1528 /* 0x01a4 */ ldd
[%i3+
8],%f10
1529 /* 0x01a8 */ srl
%i2
,31,%o3
1530 /* 0x01ac 244 */ ldd
[%l1+
%g2
],%f18
1531 /* 0x01b0 0 */ or %g0
,1,%l5
1532 /* 0x01b4 236 */ or %g0
,2,%g2
1533 /* 0x01b8 246 */ fmuld
%f6,%f12,%f6
1534 /* 0x01bc 250 */ or %g0
,32,%o1
1535 /* 0x01c0 */ or %g0
,48,%o2
1536 /* 0x01c4 246 */ faddd
%f10,%f8,%f8
1537 /* 0x01c8 */ faddd
%f8,%f6,%f16
1538 /* 0x01cc 250 */ ble,pn
%icc
,.L77000213
1539 /* 0x01d0 */ std %f16,[%i3+
8]
1540 /* 0x01d4 */ cmp %i1
,8
1541 /* 0x01d8 */ sub %l0
,3,%o3
1542 /* 0x01dc */ bl,pn
%icc
,.L77000284
1543 /* 0x01e0 */ or %g0
,8,%o0
1544 /* 0x01e4 252 */ ldd
[%i5+
8],%f0
1545 /* 0x01e8 */ or %g0
,6,%l5
1546 /* 0x01ec */ ldd
[%i4+
8],%f2
1547 /* 0x01f0 */ or %g0
,4,%g2
1548 /* 0x01f4 250 */ or %g0
,40,%o0
1549 /* 0x01f8 252 */ ldd
[%i5+
16],%f8
1550 /* 0x01fc */ fmuld
%f0,%f20,%f10
1551 /* 0x0200 */ ldd
[%i4+
16],%f4
1552 /* 0x0204 */ fmuld
%f2,%f18,%f2
1553 /* 0x0208 */ ldd
[%i3+
16],%f0
1554 /* 0x020c */ fmuld
%f8,%f20,%f12
1555 /* 0x0210 */ ldd
[%i4+
24],%f6
1556 /* 0x0214 */ fmuld
%f4,%f18,%f4
1557 /* 0x0218 */ ldd
[%i5+
24],%f8
1558 /* 0x021c */ faddd
%f2,%f10,%f2
1559 /* 0x0220 */ ldd
[%i4+
32],%f14
1560 /* 0x0224 */ fmuld
%f6,%f18,%f10
1561 /* 0x0228 */ ldd
[%i5+
32],%f6
1562 /* 0x022c */ faddd
%f4,%f12,%f4
1563 /* 0x0230 */ ldd
[%i4+
40],%f12
1564 /* 0x0234 */ faddd
%f0,%f2,%f0
1565 /* 0x0238 */ std %f0,[%i3+
16]
1566 /* 0x023c */ ldd
[%i3+
32],%f0
1567 /* 0x0240 */ ldd
[%i3+
48],%f2
1569 /* 0x0244 */ add %o2
,16,%l6
1570 /* 0x0248 252 */ ldd
[%i5+
%o0
],%f22
1571 /* 0x024c */ add %l5
,3,%l5
1572 /* 0x0250 */ fmuld
%f8,%f20,%f8
1573 /* 0x0254 250 */ add %o0
,8,%o0
1574 /* 0x0258 252 */ ldd
[%l6+
%i3
],%f26
1575 /* 0x025c */ cmp %l5
,%o3
1576 /* 0x0260 */ ldd
[%i4+
%o0
],%f24
1577 /* 0x0264 */ faddd
%f0,%f4,%f0
1578 /* 0x0268 */ add %g2
,6,%g2
1579 /* 0x026c */ faddd
%f10,%f8,%f10
1580 /* 0x0270 */ fmuld
%f14,%f18,%f4
1581 /* 0x0274 */ std %f0,[%o1+
%i3
]
1582 /* 0x0278 250 */ add %o2
,32,%o1
1583 /* 0x027c 252 */ ldd
[%i5+
%o0
],%f8
1584 /* 0x0280 */ fmuld
%f6,%f20,%f6
1585 /* 0x0284 250 */ add %o0
,8,%o0
1586 /* 0x0288 252 */ ldd
[%o1+
%i3
],%f0
1587 /* 0x028c */ ldd
[%i4+
%o0
],%f14
1588 /* 0x0290 */ faddd
%f2,%f10,%f2
1589 /* 0x0294 */ faddd
%f4,%f6,%f10
1590 /* 0x0298 */ fmuld
%f12,%f18,%f4
1591 /* 0x029c */ std %f2,[%o2+
%i3
]
1592 /* 0x02a0 250 */ add %o2
,48,%o2
1593 /* 0x02a4 252 */ ldd
[%i5+
%o0
],%f6
1594 /* 0x02a8 */ fmuld
%f22,%f20,%f22
1595 /* 0x02ac 250 */ add %o0
,8,%o0
1596 /* 0x02b0 252 */ ldd
[%o2+
%i3
],%f2
1597 /* 0x02b4 */ ldd
[%i4+
%o0
],%f12
1598 /* 0x02b8 */ faddd
%f26,%f10,%f10
1599 /* 0x02bc */ std %f10,[%l6+
%i3
]
1600 /* 0x02c0 */ fmuld
%f24,%f18,%f10
1601 /* 0x02c4 */ ble,pt
%icc
,.L900000639
1602 /* 0x02c8 */ faddd
%f4,%f22,%f4
1604 /* 0x02cc 252 */ fmuld
%f8,%f20,%f24
1605 /* 0x02d0 */ faddd
%f0,%f4,%f8
1606 /* 0x02d4 250 */ add %o2
,16,%o3
1607 /* 0x02d8 252 */ ldd
[%o3+
%i3
],%f4
1608 /* 0x02dc */ fmuld
%f14,%f18,%f0
1609 /* 0x02e0 */ cmp %l5
,%i1
1610 /* 0x02e4 */ std %f8,[%o1+
%i3
]
1611 /* 0x02e8 */ fmuld
%f12,%f18,%f8
1612 /* 0x02ec 250 */ add %o2
,32,%o1
1613 /* 0x02f0 252 */ faddd
%f10,%f24,%f12
1614 /* 0x02f4 */ ldd
[%i5+
%o0
],%f22
1615 /* 0x02f8 */ fmuld
%f6,%f20,%f6
1616 /* 0x02fc */ add %g2
,8,%g2
1617 /* 0x0300 */ fmuld
%f22,%f20,%f10
1618 /* 0x0304 */ faddd
%f2,%f12,%f2
1619 /* 0x0308 */ faddd
%f0,%f6,%f6
1620 /* 0x030c */ ldd
[%o1+
%i3
],%f0
1621 /* 0x0310 */ std %f2,[%o2+
%i3
]
1622 /* 0x0314 */ faddd
%f8,%f10,%f2
1623 /* 0x0318 */ sra %l5
,0,%o2
1624 /* 0x031c */ sllx
%o2
,3,%o0
1625 /* 0x0320 */ faddd
%f4,%f6,%f4
1626 /* 0x0324 */ std %f4,[%o3+
%i3
]
1627 /* 0x0328 */ faddd
%f0,%f2,%f0
1628 /* 0x032c */ std %f0,[%o1+
%i3
]
1629 /* 0x0330 */ bg
,a,pn
%icc
,.L77000213
1630 /* 0x0334 */ srl
%i2
,31,%o3
1632 /* 0x0338 252 */ ldd
[%i4+
%o0
],%f2
1634 /* 0x033c 252 */ ldd
[%i5+
%o0
],%f0
1635 /* 0x0340 */ fmuld
%f2,%f18,%f2
1636 /* 0x0344 */ sra %g2
,0,%o0
1637 /* 0x0348 */ sllx
%o0
,3,%o1
1638 /* 0x034c */ add %l5
,1,%l5
1639 /* 0x0350 */ fmuld
%f0,%f20,%f4
1640 /* 0x0354 */ ldd
[%o1+
%i3
],%f0
1641 /* 0x0358 */ sra %l5
,0,%o2
1642 /* 0x035c */ sllx
%o2
,3,%o0
1643 /* 0x0360 */ add %g2
,2,%g2
1644 /* 0x0364 */ cmp %l5
,%i1
1645 /* 0x0368 */ faddd
%f2,%f4,%f2
1646 /* 0x036c */ faddd
%f0,%f2,%f0
1647 /* 0x0370 */ std %f0,[%o1+
%i3
]
1648 /* 0x0374 */ ble,a,pt
%icc
,.L900000655
1649 /* 0x0378 */ ldd
[%i4+
%o0
],%f2
1651 /* 0x037c */ srl
%i2
,31,%o3
1652 /* 0x0380 252 */ ba .L900000654
1653 /* 0x0384 */ cmp %g3
,30
1655 /* 0x0388 254 */ cmp %g3
,30
1657 /* 0x038c */ add %i2
,%o3
,%o0
1658 /* 0x0390 254 */ bne,a,pt
%icc
,.L900000653
1659 /* 0x0394 */ fdtox
%f16,%f0
1660 /* 0x0398 281 */ sra %o0
,1,%g2
1661 /* 0x039c */ add %g2
,1,%g2
1662 /* 0x03a0 */ ldd
[%o7
],%f0
1663 /* 0x03a4 */ sll
%g2
,1,%o1
1664 /* 0x03a8 */ sll
%g1
,1,%g2
1665 /* 0x03ac */ or %g0
,%o1
,%o2
1666 /* 0x03b0 */ fmovd
%f0,%f2
1667 /* 0x03b4 */ or %g0
,%g2
,%o0
1668 /* 0x03b8 */ cmp %o1
,%o0
1669 /* 0x03bc */ sub %g2
,1,%o0
1670 /* 0x03c0 */ bge,pt
%icc
,.L77000215
1671 /* 0x03c4 */ or %g0
,0,%g3
1672 /* 0x03c8 254 */ add %o1
,1,%o1
1673 /* 0x03cc 281 */ sra %o2
,0,%g2
1675 /* 0x03d0 */ sllx
%g2
,3,%g2
1676 /* 0x03d4 */ ldd
[%o7
],%f6
1677 /* 0x03d8 */ add %o2
,2,%o2
1678 /* 0x03dc */ sra %o1
,0,%g3
1679 /* 0x03e0 */ ldd
[%g2+
%l4
],%f8
1680 /* 0x03e4 */ cmp %o2
,%o0
1681 /* 0x03e8 */ sllx
%g3
,3,%g3
1682 /* 0x03ec */ add %o1
,2,%o1
1683 /* 0x03f0 */ ldd
[%l4+
%g3
],%f10
1684 /* 0x03f4 */ fdtox
%f8,%f12
1685 /* 0x03f8 */ fdtox
%f10,%f4
1686 /* 0x03fc */ fmovd
%f12,%f8
1687 /* 0x0400 */ fmovs
%f6,%f12
1688 /* 0x0404 */ fmovs
%f6,%f4
1689 /* 0x0408 */ fxtod
%f12,%f6
1690 /* 0x040c */ fxtod
%f4,%f12
1691 /* 0x0410 */ fdtox
%f10,%f4
1692 /* 0x0414 */ faddd
%f6,%f2,%f6
1693 /* 0x0418 */ std %f6,[%g2+
%l4
]
1694 /* 0x041c */ faddd
%f12,%f0,%f6
1695 /* 0x0420 */ std %f6,[%l4+
%g3
]
1696 /* 0x0424 */ fitod
%f8,%f2
1697 /* 0x0428 */ fitod
%f4,%f0
1698 /* 0x042c */ ble,pt
%icc
,.L900000652
1699 /* 0x0430 */ sra %o2
,0,%g2
1701 /* 0x0434 */ or %g0
,0,%g3
1703 /* 0x0438 */ fdtox
%f16,%f0
1705 /* 0x043c 256 */ ldd
[%o7
],%f6
1706 /* 0x0440 */ add %g4
,1,%g4
1707 /* 0x0444 */ or %g0
,%i0
,%i2
1708 /* 0x0448 */ ldd
[%o5
],%f8
1709 /* 0x044c */ add %g3
,1,%g3
1710 /* 0x0450 */ add %i3
,8,%i3
1711 /* 0x0454 */ fmovs
%f6,%f0
1712 /* 0x0458 */ ldd
[%o4
],%f10
1713 /* 0x045c */ ld [%sp+
2223],%o0
1714 /* 0x0460 */ fxtod
%f0,%f6
1715 /* 0x0464 */ cmp %i0
,%o0
1716 /* 0x0468 */ fmuld
%f6,%f30,%f6
1717 /* 0x046c */ fmuld
%f6,%f8,%f8
1718 /* 0x0470 */ fdtox
%f8,%f8
1719 /* 0x0474 */ fxtod
%f8,%f8
1720 /* 0x0478 */ fmuld
%f8,%f10,%f8
1721 /* 0x047c */ fsubd
%f6,%f8,%f20
1722 /* 0x0480 */ ble,a,pt
%icc
,.L900000651
1723 /* 0x0484 */ ldd
[%i5
],%f6
1725 /* 0x0488 256 */ ba .L900000650
1726 /* 0x048c */ sllx
%g5
,3,%g2
1728 /* 0x0490 261 */ ldd
[%i1
],%f4
1729 /* 0x0494 */ ldd
[%i2
],%f6
1730 /* 0x0498 273 */ std %f0,[%i3+
8]
1731 /* 0x049c */ std %f0,[%i3+
16]
1732 /* 0x04a0 261 */ fmuld
%f4,%f6,%f6
1733 /* 0x04a4 */ std %f6,[%i3
]
1734 /* 0x04a8 273 */ std %f0,[%i3+
24]
1735 /* 0x04ac */ std %f0,[%i3+
32]
1736 /* 0x04b0 */ fdtox
%f6,%f2
1737 /* 0x04b4 */ std %f0,[%i3+
40]
1738 /* 0x04b8 */ std %f0,[%i3+
48]
1739 /* 0x04bc */ std %f0,[%i3+
56]
1740 /* 0x04c0 */ std %f0,[%i3+
64]
1741 /* 0x04c4 */ fmovs
%f0,%f2
1742 /* 0x04c8 */ std %f0,[%i3+
72]
1743 /* 0x04cc */ std %f0,[%i3+
80]
1744 /* 0x04d0 */ std %f0,[%i3+
88]
1745 /* 0x04d4 */ std %f0,[%i3+
96]
1746 /* 0x04d8 */ std %f0,[%i3+
104]
1747 /* 0x04dc */ std %f0,[%i3+
112]
1748 /* 0x04e0 */ std %f0,[%i3+
120]
1749 /* 0x04e4 */ std %f0,[%i3+
128]
1750 /* 0x04e8 */ std %f0,[%i3+
136]
1751 /* 0x04ec */ std %f0,[%i3+
144]
1752 /* 0x04f0 */ std %f0,[%i3+
152]
1753 /* 0x04f4 */ std %f0,[%i3+
160]
1754 /* 0x04f8 */ std %f0,[%i3+
168]
1755 /* 0x04fc */ fxtod
%f2,%f6
1756 /* 0x0500 */ std %f0,[%i3+
176]
1757 /* 0x0504 281 */ or %g0
,1,%o2
1758 /* 0x0508 273 */ std %f0,[%i3+
184]
1761 ! 284 ! m2j
=pdm2
[j
];
1762 ! 285 ! a=pdtj
[0]+pdn_0
*digit;
1763 ! 286 ! b=pdtj
[1]+pdm1_0
*pdm2
[j+
1]+a*TwoToMinus16;
1765 /* 0x050c 286 */ sra %o2
,0,%g2
1766 /* 0x0510 279 */ or %g0
,%i3
,%o3
1767 /* 0x0514 273 */ std %f0,[%i3+
192]
1768 /* 0x0518 278 */ fmuld
%f6,%f14,%f6
1769 /* 0x051c 281 */ or %g0
,0,%g1
1770 /* 0x0520 273 */ std %f0,[%i3+
200]
1771 /* 0x0524 */ std %f0,[%i3+
208]
1772 /* 0x0528 */ std %f0,[%i3+
216]
1773 /* 0x052c */ std %f0,[%i3+
224]
1774 /* 0x0530 */ std %f0,[%i3+
232]
1775 /* 0x0534 */ std %f0,[%i3+
240]
1776 /* 0x0538 */ std %f0,[%i3+
248]
1777 /* 0x053c */ std %f0,[%i3+
256]
1778 /* 0x0540 */ std %f0,[%i3+
264]
1779 /* 0x0544 */ std %f0,[%i3+
272]
1780 /* 0x0548 */ std %f0,[%i3+
280]
1781 /* 0x054c */ std %f0,[%i3+
288]
1782 /* 0x0550 */ std %f0,[%i3+
296]
1783 /* 0x0554 */ std %f0,[%i3+
304]
1784 /* 0x0558 */ std %f0,[%i3+
312]
1785 /* 0x055c */ std %f0,[%i3+
320]
1786 /* 0x0560 */ std %f0,[%i3+
328]
1787 /* 0x0564 */ std %f0,[%i3+
336]
1788 /* 0x0568 */ std %f0,[%i3+
344]
1789 /* 0x056c */ std %f0,[%i3+
352]
1790 /* 0x0570 */ std %f0,[%i3+
360]
1791 /* 0x0574 */ std %f0,[%i3+
368]
1792 /* 0x0578 */ std %f0,[%i3+
376]
1793 /* 0x057c */ std %f0,[%i3+
384]
1794 /* 0x0580 */ std %f0,[%i3+
392]
1795 /* 0x0584 */ std %f0,[%i3+
400]
1796 /* 0x0588 */ std %f0,[%i3+
408]
1797 /* 0x058c */ std %f0,[%i3+
416]
1798 /* 0x0590 */ std %f0,[%i3+
424]
1799 /* 0x0594 */ std %f0,[%i3+
432]
1800 /* 0x0598 */ std %f0,[%i3+
440]
1801 /* 0x059c */ std %f0,[%i3+
448]
1802 /* 0x05a0 */ std %f0,[%i3+
456]
1803 /* 0x05a4 */ std %f0,[%i3+
464]
1804 /* 0x05a8 */ std %f0,[%i3+
472]
1805 /* 0x05ac */ std %f0,[%i3+
480]
1806 /* 0x05b0 */ std %f0,[%i3+
488]
1807 /* 0x05b4 */ std %f0,[%i3+
496]
1808 /* 0x05b8 278 */ ldd
[%o5
],%f8
1809 /* 0x05bc */ ldd
[%o4
],%f10
1810 /* 0x05c0 */ fmuld
%f6,%f8,%f8
1811 /* 0x05c4 273 */ std %f0,[%i3+
504]
1812 /* 0x05c8 */ std %f0,[%i3+
512]
1813 /* 0x05cc */ std %f0,[%i3+
520]
1814 /* 0x05d0 */ fdtox
%f8,%f8
1815 /* 0x05d4 275 */ ldd
[%o0
],%f0
1816 /* 0x05d8 */ fxtod
%f8,%f8
1817 /* 0x05dc */ fmuld
%f8,%f10,%f8
1818 /* 0x05e0 */ fsubd
%f6,%f8,%f2
1821 ! 289 ! /**** this loop will be fully unrolled:
1822 ! 290 ! for(i=1;i<16;i++)
1824 ! 292 ! pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
1826 ! 294 ! *************************************/
1827 ! 295 ! pdtj
[2]+=pdm1
[1]*m2j+pdn
[1]*digit;
1828 ! 296 ! pdtj
[4]+=pdm1
[2]*m2j+pdn
[2]*digit;
1829 ! 297 ! pdtj
[6]+=pdm1
[3]*m2j+pdn
[3]*digit;
1830 ! 298 ! pdtj
[8]+=pdm1
[4]*m2j+pdn
[4]*digit;
1831 ! 299 ! pdtj
[10]+=pdm1
[5]*m2j+pdn
[5]*digit;
1832 ! 300 ! pdtj
[12]+=pdm1
[6]*m2j+pdn
[6]*digit;
1833 ! 301 ! pdtj
[14]+=pdm1
[7]*m2j+pdn
[7]*digit;
1834 ! 302 ! pdtj
[16]+=pdm1
[8]*m2j+pdn
[8]*digit;
1835 ! 303 ! pdtj
[18]+=pdm1
[9]*m2j+pdn
[9]*digit;
1836 ! 304 ! pdtj
[20]+=pdm1
[10]*m2j+pdn
[10]*digit;
1837 ! 305 ! pdtj
[22]+=pdm1
[11]*m2j+pdn
[11]*digit;
1838 ! 306 ! pdtj
[24]+=pdm1
[12]*m2j+pdn
[12]*digit;
1839 ! 307 ! pdtj
[26]+=pdm1
[13]*m2j+pdn
[13]*digit;
1840 ! 308 ! pdtj
[28]+=pdm1
[14]*m2j+pdn
[14]*digit;
1841 ! 309 ! pdtj
[30]+=pdm1
[15]*m2j+pdn
[15]*digit;
1842 ! 310 ! /* no need for cleenup, cannot overflow */
1843 ! 311 ! digit
=mod
(lower32
(b,Zero
)*dn0
,TwoToMinus16
,TwoTo16
);
1846 fmovd
%f2,%f0 ! hand modified
1847 fmovd
%f30,%f18 ! hand modified
1851 ldd
[%o5
],%f14 ! hand modified
1852 ldd
[%o4
],%f16 ! hand modified
1869 fmuld
%f0,%f2,%f4 !2
1871 fmuld
%f26,%f24,%f20 !3
1873 fmuld
%f28,%f0,%f22 !4
1875 fmuld
%f32
,%f24,%f32
!5
1878 fmuld
%f36
,%f0,%f36
!6
1881 fmuld
%f42
,%f24,%f42
!7
1883 faddd
%f20,%f22,%f20
1884 fmuld
%f44
,%f0,%f44
!8
1886 fmuld
%f10,%f6,%f12 !9
1888 faddd
%f32
,%f36
,%f32
1889 fmuld
%f14,%f4,%f4 !10
1891 fmuld
%f30,%f24,%f48
!11
1893 faddd
%f20,%f22,%f20
1894 fmuld
%f50
,%f0,%f50
!12
1896 faddd
%f42
,%f44
,%f42
1897 fmuld
%f52
,%f24,%f52
!13
1900 fmuld
%f56
,%f0,%f56
!14
1902 faddd
%f32
,%f36
,%f32
!15
1904 faddd
%f48
,%f50
,%f48
!16
1906 faddd
%f52
,%f56
,%f52
!17
1909 fmuld
%f20,%f24,%f20 !18
1911 faddd
%f42
,%f44
,%f42
1912 fmuld
%f22,%f0,%f22 !19
1914 faddd
%f48
,%f50
,%f48
1915 fmuld
%f34
,%f24,%f32
!20
1917 faddd
%f52
,%f56
,%f52
1918 fmuld
%f38
,%f0,%f36
!21
1922 faddd
%f20,%f22,%f20 !23
1923 ldd
[%o0+
120],%f44
!24
1925 faddd
%f32
,%f36
,%f32
1926 fmuld
%f42
,%f24,%f42
!25
1930 fmuld
%f44
,%f0,%f44
!27
1932 fmuld
%f40
,%f24,%f48
!28
1934 faddd
%f20,%f22,%f20
1935 fmuld
%f50
,%f0,%f50
!29
1938 fmuld
%f52
,%f24,%f52
!30
1940 faddd
%f42
,%f44
,%f42
1941 fmuld
%f56
,%f0,%f56
!31
1943 faddd
%f32
,%f36
,%f32
!32
1945 faddd
%f48
,%f50
,%f48
1946 fmuld
%f46
,%f24,%f20 !33
1948 fmuld
%f4,%f18,%f12 !34
1950 faddd
%f52
,%f56
,%f52
1951 fmuld
%f22,%f0,%f22 !35
1953 faddd
%f42
,%f44
,%f42
!36
1955 faddd
%f48
,%f50
,%f48
1956 fmuld
%f54
,%f24,%f32
!37
1958 fmuld
%f12,%f14,%f4 !38
1960 faddd
%f52
,%f56
,%f56
! yes
, tmp52
!
1961 fmuld
%f36
,%f0,%f36
!39
1963 faddd
%f20,%f22,%f20 !40
1965 fmuld
%f58
,%f24,%f52
!41
1968 fmuld
%f42
,%f24,%f42
!42
1969 std %f56
,[%o3+
64] ! yes
, tmp52
!
1970 faddd
%f32
,%f36
,%f32
1971 fmuld
%f44
,%f0,%f44
!43
1973 fmuld
%f48
,%f24,%f48
!44
1976 fmuld
%f50
,%f0,%f50
!45
1978 fmuld
%f60
,%f0,%f56
!46
1980 faddd
%f42
,%f44
,%f42
!47
1981 ldd
[%o3+
160-8],%f44
1982 faddd
%f20,%f22,%f20 !48
1984 faddd
%f48
,%f50
,%f48
!49
1985 ldd
[%o3+
192-8],%f50
1986 faddd
%f52
,%f56
,%f52
1987 fmuld
%f4,%f16,%f4 !50
1988 ldd
[%o3+
224-8],%f56
1989 faddd
%f32
,%f36
,%f32
!51
1990 std %f32
,[%o3+
128-8]
1991 faddd
%f42
,%f44
,%f42
!52
1993 std %f42
,[%o3+
160-8]
1994 faddd
%f48
,%f50
,%f48
!53
1996 std %f48
,[%o3+
192-8]
1997 fsubd
%f12,%f4,%f0 !54
1998 faddd
%f52
,%f56
,%f52
1999 ble,pt
%icc
,.L99999999
2000 std %f52
,[%o3+
224-8] !55
2004 ! 315 ! conv_d16_to_i32
(result
,dt+
2*nlen
,(long long
*)dt
,nlen+
1);
2006 /* 0x0844 315 */ sllx
%g5
,3,%g2
2008 /* 0x0848 315 */ ldd
[%g2+
%l4
],%f2
2009 /* 0x084c */ add %l4
,%g2
,%o0
2010 /* 0x0850 */ or %g0
,0,%g1
2011 /* 0x0854 */ ldd
[%o0+
8],%f4
2012 /* 0x0858 */ or %g0
,0,%i2
2013 /* 0x085c */ cmp %l0
,0
2014 /* 0x0860 */ fdtox
%f2,%f2
2015 /* 0x0864 */ std %f2,[%sp+
2255]
2016 /* 0x0868 311 */ sethi
%hi
(0xfc00),%o3
2017 /* 0x086c 315 */ fdtox
%f4,%f2
2018 /* 0x0870 */ std %f2,[%sp+
2247]
2019 /* 0x0874 311 */ or %g0
,-1,%o2
2020 /* 0x0878 */ srl
%o2
,0,%o5
2021 /* 0x087c */ or %g0
,2,%g5
2022 /* 0x0880 */ sub %l0
,1,%g3
2023 /* 0x0884 */ or %g0
,%o0
,%o7
2024 /* 0x0888 */ add %o3
,1023,%o4
2025 /* 0x088c 315 */ or %g0
,64,%o3
2026 /* 0x0890 */ ldx [%sp+
2255],%i0
2027 /* 0x0894 */ sub %l0
,2,%o1
2028 /* 0x0898 */ ldx [%sp+
2247],%i1
2029 /* 0x089c */ ble,pt
%icc
,.L900000648
2030 /* 0x08a0 */ sethi
%hi
(0xfc00),%g2
2031 /* 0x08a4 */ cmp %l0
,6
2032 /* 0x08a8 */ and %i0
,%o5
,%o2
2033 /* 0x08ac */ bl,pn
%icc
,.L77000287
2034 /* 0x08b0 */ or %g0
,3,%g4
2035 /* 0x08b4 */ ldd
[%o7+
16],%f0
2036 /* 0x08b8 */ and %i1
,%o4
,%i3
2037 /* 0x08bc */ sllx
%i3
,16,%o0
2038 /* 0x08c0 */ or %g0
,5,%g4
2039 /* 0x08c4 */ srax
%i1
,16,%i4
2040 /* 0x08c8 */ fdtox
%f0,%f0
2041 /* 0x08cc */ std %f0,[%sp+
2239]
2042 /* 0x08d0 */ srax
%i0
,32,%i1
2043 /* 0x08d4 */ add %o2
,%o0
,%i5
2044 /* 0x08d8 */ ldd
[%o7+
24],%f0
2045 /* 0x08dc */ and %i5
,%o5
,%l1
2046 /* 0x08e0 */ or %g0
,72,%o2
2047 /* 0x08e4 */ or %g0
,4,%o0
2048 /* 0x08e8 */ or %g0
,4,%g5
2049 /* 0x08ec */ ldx [%sp+
2239],%g1
2050 /* 0x08f0 */ fdtox
%f0,%f0
2051 /* 0x08f4 */ or %g0
,4,%i2
2052 /* 0x08f8 */ std %f0,[%sp+
2231]
2053 /* 0x08fc */ ldd
[%o7+
40],%f2
2054 /* 0x0900 */ and %g1
,%o5
,%i3
2055 /* 0x0904 */ ldd
[%o7+
32],%f0
2056 /* 0x0908 */ srax
%g1
,32,%g1
2057 /* 0x090c */ ldd
[%o7+
56],%f4
2058 /* 0x0910 */ fdtox
%f2,%f2
2059 /* 0x0914 */ ldx [%sp+
2231],%g2
2060 /* 0x0918 */ fdtox
%f0,%f0
2061 /* 0x091c */ st %l1
,[%l2
]
2062 /* 0x0920 */ srax
%i5
,32,%l1
2063 /* 0x0924 */ fdtox
%f4,%f4
2064 /* 0x0928 */ std %f2,[%sp+
2231]
2065 /* 0x092c */ and %g2
,%o4
,%i5
2066 /* 0x0930 */ add %i4
,%l1
,%i4
2067 /* 0x0934 */ std %f0,[%sp+
2239]
2068 /* 0x0938 */ sllx
%i5
,16,%i0
2069 /* 0x093c */ add %i1
,%i4
,%i1
2070 /* 0x0940 */ ldd
[%o7+
48],%f2
2071 /* 0x0944 */ srax
%g2
,16,%g2
2072 /* 0x0948 */ add %i3
,%i0
,%i0
2073 /* 0x094c */ ldd
[%o7+
72],%f0
2074 /* 0x0950 */ add %i0
,%i1
,%i3
2075 /* 0x0954 */ srax
%i3
,32,%i4
2076 /* 0x0958 */ fdtox
%f2,%f2
2077 /* 0x095c */ and %i3
,%o5
,%i3
2078 /* 0x0960 */ ldx [%sp+
2231],%i1
2079 /* 0x0964 */ add %g2
,%i4
,%g2
2080 /* 0x0968 */ ldx [%sp+
2239],%i0
2081 /* 0x096c */ add %g1
,%g2
,%g1
2082 /* 0x0970 */ std %f2,[%sp+
2239]
2083 /* 0x0974 */ std %f4,[%sp+
2231]
2084 /* 0x0978 */ ldd
[%o7+
64],%f2
2085 /* 0x097c */ st %i3
,[%l2+
4]
2087 /* 0x0980 */ ldx [%sp+
2231],%i3
2088 /* 0x0984 */ add %i2
,2,%i2
2089 /* 0x0988 */ add %g4
,4,%g4
2090 /* 0x098c */ ldx [%sp+
2239],%i5
2091 /* 0x0990 */ add %o2
,16,%o2
2092 /* 0x0994 */ and %i1
,%o4
,%g2
2093 /* 0x0998 */ sllx
%g2
,16,%i4
2094 /* 0x099c */ and %i0
,%o5
,%g2
2095 /* 0x09a0 */ ldd
[%o7+
%o2
],%f4
2096 /* 0x09a4 */ fdtox
%f0,%f0
2097 /* 0x09a8 */ std %f0,[%sp+
2231]
2098 /* 0x09ac */ srax
%i1
,16,%i1
2099 /* 0x09b0 */ add %g2
,%i4
,%g2
2100 /* 0x09b4 */ fdtox
%f2,%f0
2101 /* 0x09b8 */ add %o3
,16,%o3
2102 /* 0x09bc */ std %f0,[%sp+
2239]
2103 /* 0x09c0 */ add %g2
,%g1
,%g1
2104 /* 0x09c4 */ ldd
[%o7+
%o3
],%f2
2105 /* 0x09c8 */ srax
%g1
,32,%i4
2106 /* 0x09cc */ cmp %i2
,%o1
2107 /* 0x09d0 */ srax
%i0
,32,%g2
2108 /* 0x09d4 */ add %i1
,%i4
,%i0
2109 /* 0x09d8 */ add %g2
,%i0
,%i4
2110 /* 0x09dc */ add %o0
,4,%o0
2111 /* 0x09e0 */ and %g1
,%o5
,%g2
2112 /* 0x09e4 */ or %g0
,%i5
,%g1
2113 /* 0x09e8 */ st %g2
,[%l2+
%o0
]
2114 /* 0x09ec */ add %g5
,4,%g5
2115 /* 0x09f0 */ ldx [%sp+
2231],%i1
2116 /* 0x09f4 */ ldx [%sp+
2239],%i0
2117 /* 0x09f8 */ add %o2
,16,%o2
2118 /* 0x09fc */ and %i3
,%o4
,%g2
2119 /* 0x0a00 */ sllx
%g2
,16,%i5
2120 /* 0x0a04 */ and %g1
,%o5
,%g2
2121 /* 0x0a08 */ ldd
[%o7+
%o2
],%f0
2122 /* 0x0a0c */ fdtox
%f4,%f4
2123 /* 0x0a10 */ std %f4,[%sp+
2231]
2124 /* 0x0a14 */ srax
%i3
,16,%i3
2125 /* 0x0a18 */ add %g2
,%i5
,%g2
2126 /* 0x0a1c */ fdtox
%f2,%f2
2127 /* 0x0a20 */ add %o3
,16,%o3
2128 /* 0x0a24 */ std %f2,[%sp+
2239]
2129 /* 0x0a28 */ add %g2
,%i4
,%g2
2130 /* 0x0a2c */ ldd
[%o7+
%o3
],%f2
2131 /* 0x0a30 */ srax
%g2
,32,%i4
2132 /* 0x0a34 */ srax
%g1
,32,%g1
2133 /* 0x0a38 */ add %i3
,%i4
,%i3
2134 /* 0x0a3c */ add %g1
,%i3
,%g1
2135 /* 0x0a40 */ add %o0
,4,%o0
2136 /* 0x0a44 */ and %g2
,%o5
,%g2
2137 /* 0x0a48 */ ble,pt
%icc
,.L900000631
2138 /* 0x0a4c */ st %g2
,[%l2+
%o0
]
2140 /* 0x0a50 */ srax
%i1
,16,%i5
2141 /* 0x0a54 */ ldx [%sp+
2231],%o1
2142 /* 0x0a58 */ and %i1
,%o4
,%i3
2143 /* 0x0a5c */ sllx
%i3
,16,%i3
2144 /* 0x0a60 */ ldx [%sp+
2239],%i4
2145 /* 0x0a64 */ and %i0
,%o5
,%g2
2146 /* 0x0a68 */ add %g2
,%i3
,%g2
2147 /* 0x0a6c */ and %o1
,%o4
,%i3
2148 /* 0x0a70 */ fdtox
%f0,%f4
2149 /* 0x0a74 */ sllx
%i3
,16,%i3
2150 /* 0x0a78 */ std %f4,[%sp+
2231]
2151 /* 0x0a7c */ add %g2
,%g1
,%g2
2152 /* 0x0a80 */ srax
%g2
,32,%l1
2153 /* 0x0a84 */ and %i4
,%o5
,%i1
2154 /* 0x0a88 */ fdtox
%f2,%f0
2155 /* 0x0a8c */ srax
%i0
,32,%g1
2156 /* 0x0a90 */ std %f0,[%sp+
2239]
2157 /* 0x0a94 */ add %i5
,%l1
,%i0
2158 /* 0x0a98 */ srax
%o1
,16,%o1
2159 /* 0x0a9c */ add %g1
,%i0
,%i0
2160 /* 0x0aa0 */ add %o0
,4,%g1
2161 /* 0x0aa4 */ add %i1
,%i3
,%o0
2162 /* 0x0aa8 */ and %g2
,%o5
,%g2
2163 /* 0x0aac */ st %g2
,[%l2+
%g1
]
2164 /* 0x0ab0 */ add %o0
,%i0
,%o0
2165 /* 0x0ab4 */ srax
%o0
,32,%i3
2166 /* 0x0ab8 */ ldx [%sp+
2231],%i1
2167 /* 0x0abc */ add %g1
,4,%g1
2168 /* 0x0ac0 */ ldx [%sp+
2239],%i0
2169 /* 0x0ac4 */ and %o0
,%o5
,%g2
2170 /* 0x0ac8 */ add %o1
,%i3
,%o1
2171 /* 0x0acc */ srax
%i4
,32,%o0
2172 /* 0x0ad0 */ cmp %i2
,%g3
2173 /* 0x0ad4 */ st %g2
,[%l2+
%g1
]
2174 /* 0x0ad8 */ bg
,pn
%icc
,.L77000236
2175 /* 0x0adc */ add %o0
,%o1
,%g1
2176 /* 0x0ae0 */ add %g4
,6,%g4
2177 /* 0x0ae4 */ add %g5
,6,%g5
2179 /* 0x0ae8 */ sra %g5
,0,%o1
2181 /* 0x0aec */ sllx
%o1
,3,%o2
2182 /* 0x0af0 */ and %i0
,%o5
,%o0
2183 /* 0x0af4 */ ldd
[%o7+
%o2
],%f0
2184 /* 0x0af8 */ sra %g4
,0,%o2
2185 /* 0x0afc */ and %i1
,%o4
,%o1
2186 /* 0x0b00 */ sllx
%o2
,3,%o2
2187 /* 0x0b04 */ add %g1
,%o0
,%o0
2188 /* 0x0b08 */ fdtox
%f0,%f0
2189 /* 0x0b0c */ std %f0,[%sp+
2239]
2190 /* 0x0b10 */ sllx
%o1
,16,%o1
2191 /* 0x0b14 */ add %o0
,%o1
,%o1
2192 /* 0x0b18 */ add %g5
,2,%g5
2193 /* 0x0b1c */ ldd
[%o7+
%o2
],%f0
2194 /* 0x0b20 */ srax
%o1
,32,%g1
2195 /* 0x0b24 */ and %o1
,%o5
,%o2
2196 /* 0x0b28 */ srax
%i1
,16,%o0
2197 /* 0x0b2c */ add %g4
,2,%g4
2198 /* 0x0b30 */ fdtox
%f0,%f0
2199 /* 0x0b34 */ std %f0,[%sp+
2231]
2200 /* 0x0b38 */ sra %i2
,0,%o1
2201 /* 0x0b3c */ sllx
%o1
,2,%o1
2202 /* 0x0b40 */ add %o0
,%g1
,%g2
2203 /* 0x0b44 */ srax
%i0
,32,%g1
2204 /* 0x0b48 */ add %i2
,1,%i2
2205 /* 0x0b4c */ add %g1
,%g2
,%g1
2206 /* 0x0b50 */ cmp %i2
,%g3
2207 /* 0x0b54 */ ldx [%sp+
2239],%o3
2208 /* 0x0b58 */ ldx [%sp+
2231],%i1
2209 /* 0x0b5c */ st %o2
,[%l2+
%o1
]
2210 /* 0x0b60 */ or %g0
,%o3
,%i0
2211 /* 0x0b64 */ ble,pt
%icc
,.L900000647
2212 /* 0x0b68 */ sra %g5
,0,%o1
2214 /* 0x0b6c */ sethi
%hi
(0xfc00),%g2
2216 /* 0x0b70 */ or %g0
,-1,%o0
2217 /* 0x0b74 */ add %g2
,1023,%g2
2218 /* 0x0b78 */ srl
%o0
,0,%g3
2219 /* 0x0b7c */ and %i1
,%g2
,%g2
2220 /* 0x0b80 */ and %i0
,%g3
,%g4
2221 /* 0x0b84 */ sllx
%g2
,16,%g2
2222 /* 0x0b88 */ add %g1
,%g4
,%g4
2223 /* 0x0b8c */ sra %i2
,0,%g5
2224 /* 0x0b90 */ add %g4
,%g2
,%g4
2225 /* 0x0b94 */ sllx
%g5
,2,%g2
2226 /* 0x0b98 */ and %g4
,%g3
,%g3
2227 /* 0x0b9c */ st %g3
,[%l2+
%g2
]
2229 ! 317 ! adjust_montf_result
(result
,nint
,nlen
);
2231 /* 0x0ba0 317 */ sra %l0
,0,%g4
2232 /* 0x0ba4 */ sllx
%g4
,2,%g2
2233 /* 0x0ba8 */ ld [%l2+
%g2
],%g2
2234 /* 0x0bac */ cmp %g2
,0
2235 /* 0x0bb0 */ bleu
,pn
%icc
,.L77000241
2236 /* 0x0bb4 */ or %g0
,-1,%o1
2237 /* 0x0bb8 */ ba .L900000646
2238 /* 0x0bbc */ cmp %o1
,0
2240 /* 0x0bc0 */ sub %l0
,1,%o1
2241 /* 0x0bc4 */ cmp %o1
,0
2242 /* 0x0bc8 */ bl,pn
%icc
,.L77000244
2243 /* 0x0bcc */ sra %o1
,0,%g2
2245 /* 0x0bd0 */ sllx
%g2
,2,%g2
2246 /* 0x0bd4 */ sub %o1
,1,%o0
2247 /* 0x0bd8 */ ld [%l3+
%g2
],%g3
2248 /* 0x0bdc */ ld [%l2+
%g2
],%g2
2249 /* 0x0be0 */ cmp %g2
,%g3
2250 /* 0x0be4 */ bne,pn
%icc
,.L77000244
2252 /* 0x0bec 0 */ or %g0
,%o0
,%o1
2253 /* 0x0bf0 317 */ cmp %o0
,0
2254 /* 0x0bf4 */ bge,pt
%icc
,.L900000645
2255 /* 0x0bf8 */ sra %o1
,0,%g2
2257 /* 0x0bfc */ cmp %o1
,0
2259 /* 0x0c00 */ bl,pn
%icc
,.L77000288
2260 /* 0x0c04 */ sra %o1
,0,%g2
2261 /* 0x0c08 */ sllx
%g2
,2,%g2
2262 /* 0x0c0c */ ld [%l3+
%g2
],%g3
2263 /* 0x0c10 */ ld [%l2+
%g2
],%g2
2264 /* 0x0c14 */ cmp %g2
,%g3
2265 /* 0x0c18 */ bleu
,pt
%icc
,.L77000224
2268 /* 0x0c20 */ cmp %l0
,0
2269 /* 0x0c24 */ ble,pt
%icc
,.L77000224
2271 /* 0x0c2c 317 */ or %g0
,-1,%g2
2272 /* 0x0c30 315 */ or %g0
,0,%i0
2273 /* 0x0c34 317 */ srl
%g2
,0,%g2
2274 /* 0x0c38 315 */ or %g0
,0,%g4
2275 /* 0x0c3c */ or %g0
,0,%o1
2276 /* 0x0c40 317 */ sub %l0
,1,%g5
2277 /* 0x0c44 */ cmp %l0
,9
2278 /* 0x0c48 315 */ or %g0
,8,%o5
2279 /* 0x0c4c */ bl,pn
%icc
,.L77000289
2280 /* 0x0c50 */ sub %l0
,4,%o7
2281 /* 0x0c54 */ ld [%l2
],%o1
2282 /* 0x0c58 */ or %g0
,5,%i0
2283 /* 0x0c5c */ ld [%l3
],%o2
2284 /* 0x0c60 */ or %g0
,12,%o4
2285 /* 0x0c64 */ or %g0
,16,%g1
2286 /* 0x0c68 */ ld [%l3+
4],%o3
2287 /* 0x0c6c */ ld [%l2+
4],%o0
2288 /* 0x0c70 */ sub %o1
,%o2
,%o1
2289 /* 0x0c74 */ ld [%l3+
8],%i1
2290 /* 0x0c78 */ and %o1
,%g2
,%g4
2291 /* 0x0c7c */ st %g4
,[%l2
]
2292 /* 0x0c80 */ srax
%o1
,32,%g4
2293 /* 0x0c84 */ sub %o0
,%o3
,%o0
2294 /* 0x0c88 */ ld [%l3+
12],%o2
2295 /* 0x0c8c */ add %o0
,%g4
,%o0
2296 /* 0x0c90 */ and %o0
,%g2
,%g4
2297 /* 0x0c94 */ st %g4
,[%l2+
4]
2298 /* 0x0c98 */ srax
%o0
,32,%o0
2299 /* 0x0c9c */ ld [%l2+
8],%o1
2300 /* 0x0ca0 */ ld [%l2+
12],%o3
2301 /* 0x0ca4 */ sub %o1
,%i1
,%o1
2303 /* 0x0ca8 */ add %g1
,4,%g3
2304 /* 0x0cac */ ld [%g1+
%l2
],%g4
2305 /* 0x0cb0 */ add %o1
,%o0
,%o0
2306 /* 0x0cb4 */ ld [%l3+
%g1
],%i1
2307 /* 0x0cb8 */ sub %o3
,%o2
,%o1
2308 /* 0x0cbc */ and %o0
,%g2
,%o2
2309 /* 0x0cc0 */ st %o2
,[%o5+
%l2
]
2310 /* 0x0cc4 */ srax
%o0
,32,%o2
2311 /* 0x0cc8 */ add %i0
,4,%i0
2312 /* 0x0ccc */ add %g1
,8,%o5
2313 /* 0x0cd0 */ ld [%g3+
%l2
],%o0
2314 /* 0x0cd4 */ add %o1
,%o2
,%o1
2315 /* 0x0cd8 */ ld [%l3+
%g3
],%o3
2316 /* 0x0cdc */ sub %g4
,%i1
,%o2
2317 /* 0x0ce0 */ and %o1
,%g2
,%g4
2318 /* 0x0ce4 */ st %g4
,[%o4+
%l2
]
2319 /* 0x0ce8 */ srax
%o1
,32,%g4
2320 /* 0x0cec */ cmp %i0
,%o7
2321 /* 0x0cf0 */ add %g1
,12,%o4
2322 /* 0x0cf4 */ ld [%o5+
%l2
],%o1
2323 /* 0x0cf8 */ add %o2
,%g4
,%o2
2324 /* 0x0cfc */ ld [%l3+
%o5
],%i1
2325 /* 0x0d00 */ sub %o0
,%o3
,%o0
2326 /* 0x0d04 */ and %o2
,%g2
,%o3
2327 /* 0x0d08 */ st %o3
,[%g1+
%l2
]
2328 /* 0x0d0c */ srax
%o2
,32,%g4
2329 /* 0x0d10 */ ld [%o4+
%l2
],%o3
2330 /* 0x0d14 */ add %g1
,16,%g1
2331 /* 0x0d18 */ add %o0
,%g4
,%o0
2332 /* 0x0d1c */ ld [%l3+
%o4
],%o2
2333 /* 0x0d20 */ sub %o1
,%i1
,%o1
2334 /* 0x0d24 */ and %o0
,%g2
,%g4
2335 /* 0x0d28 */ st %g4
,[%g3+
%l2
]
2336 /* 0x0d2c */ ble,pt
%icc
,.L900000635
2337 /* 0x0d30 */ srax
%o0
,32,%o0
2339 /* 0x0d34 */ add %o1
,%o0
,%g3
2340 /* 0x0d38 */ sub %o3
,%o2
,%o1
2341 /* 0x0d3c */ ld [%g1+
%l2
],%o0
2342 /* 0x0d40 */ ld [%l3+
%g1
],%o2
2343 /* 0x0d44 */ srax
%g3
,32,%o7
2344 /* 0x0d48 */ and %g3
,%g2
,%o3
2345 /* 0x0d4c */ add %o1
,%o7
,%o1
2346 /* 0x0d50 */ st %o3
,[%o5+
%l2
]
2347 /* 0x0d54 */ cmp %i0
,%g5
2348 /* 0x0d58 */ sub %o0
,%o2
,%o0
2349 /* 0x0d5c */ and %o1
,%g2
,%o2
2350 /* 0x0d60 */ st %o2
,[%o4+
%l2
]
2351 /* 0x0d64 */ srax
%o1
,32,%o1
2352 /* 0x0d68 */ sra %i0
,0,%o2
2353 /* 0x0d6c */ add %o0
,%o1
,%o0
2354 /* 0x0d70 */ srax
%o0
,32,%g4
2355 /* 0x0d74 */ and %o0
,%g2
,%o1
2356 /* 0x0d78 */ st %o1
,[%g1+
%l2
]
2357 /* 0x0d7c */ bg
,pn
%icc
,.L77000224
2358 /* 0x0d80 */ sllx
%o2
,2,%o1
2360 /* 0x0d84 0 */ or %g0
,%o1
,%g1
2362 /* 0x0d88 */ ld [%o1+
%l2
],%o0
2363 /* 0x0d8c */ add %i0
,1,%i0
2364 /* 0x0d90 */ ld [%l3+
%o1
],%o1
2365 /* 0x0d94 */ sra %i0
,0,%o2
2366 /* 0x0d98 */ cmp %i0
,%g5
2367 /* 0x0d9c */ add %g4
,%o0
,%o0
2368 /* 0x0da0 */ sub %o0
,%o1
,%o0
2369 /* 0x0da4 */ srax
%o0
,32,%g4
2370 /* 0x0da8 */ and %o0
,%g2
,%o1
2371 /* 0x0dac */ st %o1
,[%g1+
%l2
]
2372 /* 0x0db0 */ sllx
%o2
,2,%o1
2373 /* 0x0db4 */ ble,pt
%icc
,.L900000644
2374 /* 0x0db8 */ or %g0
,%o1
,%g1
2376 /* 0x0dbc */ ret
! Result
=
2377 /* 0x0dc0 */ restore
%g0
,%g0
,%g0
2378 /* 0x0dc4 0 */ .type mont_mulf_noconv,2
2379 /* 0x0dc4 */ .size mont_mulf_noconv,(.-mont_mulf_noconv)