Sync usage with man page.
[netbsd-mini2440.git] / lib / libc / arch / sparc64 / string / memset.S
blobe1b6b3da208c6c4e035124595be6d5f909393e66
1 /*      $NetBSD: memset.S,v 1.3 2001/08/01 16:45:20 eeh Exp $   */
3 /*
4  * Copyright (c) 2001, Eduardo E. Horvath
5  *
6  * This software was developed by the Computer Systems Engineering group
7  * at Lawrence Berkeley Laboratory under DARPA contract BG 91-66 and
8  * contributed to Berkeley.
9  *
10  * Redistribution and use in source and binary forms, with or without
11  * modification, are permitted provided that the following conditions
12  * are met:
13  * 1. Redistributions of source code must retain the above copyright
14  *    notice, this list of conditions and the following disclaimer.
15  * 2. Redistributions in binary form must reproduce the above copyright
16  *    notice, this list of conditions and the following disclaimer in the
17  *    documentation and/or other materials provided with the distribution.
18  * 3. All advertising materials mentioning features or use of this software
19  *    must display the following acknowledgement:
20  *      This product includes software developed by the University of
21  *      California, Berkeley and its contributors.
22  * 4. Neither the name of the University nor the names of its contributors
23  *    may be used to endorse or promote products derived from this software
24  *    without specific prior written permission.
25  *
26  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
27  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
28  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
29  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
30  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
31  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
32  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
33  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
34  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
35  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
36  * SUCH DAMAGE.
37  *
38  * from: Header: bzero.s,v 1.1 92/06/25 12:52:46 torek Exp
39  */
41 #include <machine/asm.h>
42 #ifndef _LOCORE
43 #define _LOCORE
44 #endif
45 #include <machine/ctlreg.h>
46 #include <machine/frame.h>
47 #include <machine/psl.h>
49 #if defined(LIBC_SCCS) && !defined(lint)
50         RCSID("$NetBSD: memset.S,v 1.3 2001/08/01 16:45:20 eeh Exp $")
51 #endif  /* LIBC_SCCS and not lint */
54  * bzero(addr, len)
55  *
56  * We want to use VIS instructions if we're clearing out more than
57  * 256 bytes, but to do that we need to properly save and restore the
58  * FP registers.  Unfortunately the code to do that in the kernel needs
59  * to keep track of the current owner of the FPU, hence the different
60  * code.
61  *
62  * XXXXX To produce more efficient code, we do not allow lengths
63  * greater than 0x80000000000000000, which are negative numbers.
64  * This should not really be an issue since the VA hole should
65  * cause any such ranges to fail anyway.
66  */
67 ENTRY(bzero)
68         ! %o0 = addr, %o1 = len
69         mov     %o1, %o2
70         clr     %o1                     ! Initialize our pattern
72  * memset(addr, c, len)
73  *
74  */
75 ENTRY(memset)
76         ! %o0 = addr, %o1 = pattern, %o2 = len
77         mov     %o0, %o4                ! Save original pointer
79 Lbzero_internal:
80         btst    7, %o0                  ! Word aligned?
81         bz,pn   %xcc, 0f
82          nop
83         inc     %o0
84         deccc   %o2                     ! Store up to 7 bytes
85         bge,a,pt        %xcc, Lbzero_internal
86          stb    %o1, [%o0 - 1]
88         retl                            ! Duplicate Lbzero_done
89          mov    %o4, %o0
91         /*
92          * Duplicate the pattern so it fills 64-bits.
93          */
94         andcc   %o1, 0x0ff, %o1         ! No need to extend zero
95         bz,pt   %icc, 1f
96          sllx   %o1, 8, %o3             ! sigh.  all dependent insns.
97         or      %o1, %o3, %o1
98         sllx    %o1, 16, %o3
99         or      %o1, %o3, %o1
100         sllx    %o1, 32, %o3
101          or     %o1, %o3, %o1
102 1:      
103 #if 1
104         !! Now we are 64-bit aligned
105         cmp     %o2, 256                ! Use block clear if len > 256
106         bge,pt  %xcc, Lbzero_block      ! use block store insns
107 #endif  
108          deccc  8, %o2
109 Lbzero_longs:
110         bl,pn   %xcc, Lbzero_cleanup    ! Less than 8 bytes left
111          nop
112 3:      
113         inc     8, %o0
114         deccc   8, %o2
115         bge,pt  %xcc, 3b
116          stx    %o1, [%o0 - 8]          ! Do 1 longword at a time
118         /*
119          * Len is in [-8..-1] where -8 => done, -7 => 1 byte to zero,
120          * -6 => two bytes, etc.  Mop up this remainder, if any.
121          */
122 Lbzero_cleanup: 
123         btst    4, %o2
124         bz,pt   %xcc, 5f                ! if (len & 4) {
125          nop
126         stw     %o1, [%o0]              !       *(int *)addr = 0;
127         inc     4, %o0                  !       addr += 4;
128 5:      
129         btst    2, %o2
130         bz,pt   %xcc, 7f                ! if (len & 2) {
131          nop
132         sth     %o1, [%o0]              !       *(short *)addr = 0;
133         inc     2, %o0                  !       addr += 2;
134 7:      
135         btst    1, %o2
136         bnz,a   %icc, Lbzero_done       ! if (len & 1)
137          stb    %o1, [%o0]              !       *addr = 0;
138 Lbzero_done:
139         retl
140          mov    %o4, %o0                ! Restore ponter for memset (ugh)
142 #if 1   
143 Lbzero_block:
145  * Userland:
147  * Floating point registers are volatile.  What luck.
149  * See locore.s for the kernel version.
151  */     
152 !       wr      %g0, FPRS_FEF, %fprs                    ! Enable FPU
154         !! We are now 8-byte aligned.  We need to become 64-byte aligned.
155         btst    63, %o0
156         bz,pt   %xcc, 2f
157          nop
158 1:      
159         stx     %o1, [%o0]
160         inc     8, %o0
161         btst    63, %o0
162         bnz,pt  %xcc, 1b
163          dec    8, %o2
166         brz     %o1, 3f                                 ! Skip the memory op
167          fzero  %f0                                     ! for bzero
168         
169         stx     %o1, [%o0]                              ! Flush this puppy to RAM
170         membar  #StoreLoad
171         ldd     [%o0], %f0
172 3:      
173         fmovd   %f0, %f2                                ! Duplicate the pattern
174         fmovd   %f0, %f4
175         fmovd   %f0, %f6
176         fmovd   %f0, %f8
177         fmovd   %f0, %f10
178         fmovd   %f0, %f12
179         fmovd   %f0, %f14
180         
181         !! Remember: we were 8 bytes too far
182         dec     56, %o2                                 ! Go one iteration too far
184         stda    %f0, [%o0] ASI_BLK_P                    ! Store 64 bytes
185         deccc   64, %o2
186         bg,pn   %xcc, 5b
187          inc    64, %o0
188         
189         membar  #Sync
191  * Now we're done we need to load the FPU state from where
192  * we put it.
193  */
194         ba,pt   %xcc, Lbzero_longs      ! Finish up the remainder
195          inccc  56, %o2         ! Restore the count
196 #endif