Satellite: saving 配置服务器
[pkm.git] / pages / protocol.textile
blobc7920df81eb105a647121c61756ee5c3a093f43b
1 Protocol
2 --------
4 Clients of memcached communicate with server through TCP connections.
5 (A UDP interface is also available; details are below under "UDP
6 protocol.") A given running memcached server listens on some
7 (configurable) port; clients connect to that port, send commands to
8 the server, read responses, and eventually close the connection.
10 There is no need to send any command to end the session. A client may
11 just close the connection at any moment it no longer needs it. Note,
12 however, that clients are encouraged to cache their connections rather
13 than reopen them every time they need to store or retrieve data.  This
14 is because memcached is especially designed to work very efficiently
15 with a very large number (many hundreds, more than a thousand if
16 necessary) of open connections. Caching connections will eliminate the
17 overhead associated with establishing a TCP connection (the overhead
18 of preparing for a new connection on the server side is insignificant
19 compared to this).
21 There are two kinds of data sent in the memcache protocol: text lines
22 and unstructured data.  Text lines are used for commands from clients
23 and responses from servers. Unstructured data is sent when a client
24 wants to store or retrieve data. The server will transmit back
25 unstructured data in exactly the same way it received it, as a byte
26 stream. The server doesn't care about byte order issues in
27 unstructured data and isn't aware of them. There are no limitations on
28 characters that may appear in unstructured data; however, the reader
29 of such data (either a client or a server) will always know, from a
30 preceding text line, the exact length of the data block being
31 transmitted.
33 Text lines are always terminated by \r\n. Unstructured data is _also_
34 terminated by \r\n, even though \r, \n or any other 8-bit characters
35 may also appear inside the data. Therefore, when a client retrieves
36 data from a server, it must use the length of the data block (which it
37 will be provided with) to determine where the data block ends, and not
38 the fact that \r\n follows the end of the data block, even though it
39 does.
41 Keys
42 ----
44 Data stored by memcached is identified with the help of a key. A key
45 is a text string which should uniquely identify the data for clients
46 that are interested in storing and retrieving it.  Currently the
47 length limit of a key is set at 250 characters (of course, normally
48 clients wouldn't need to use such long keys); the key must not include
49 control characters or whitespace.
51 Commands
52 --------
54 There are three types of commands. 
56 Storage commands (there are six: "set", "add", "replace", "append"
57 "prepend" and "cas") ask the server to store some data identified by a key. The
58 client sends a command line, and then a data block; after that the
59 client expects one line of response, which will indicate success or
60 faulure.
62 Retrieval commands (there are two: "get" and "gets") ask the server to
63 retrieve data corresponding to a set of keys (one or more keys in one
64 request). The client sends a command line, which includes all the
65 requested keys; after that for each item the server finds it sends to
66 the client one response line with information about the item, and one
67 data block with the item's data; this continues until the server
68 finished with the "END" response line.
70 All other commands don't involve unstructured data. In all of them,
71 the client sends one command line, and expects (depending on the
72 command) either one line of response, or several lines of response
73 ending with "END" on the last line.
75 A command line always starts with the name of the command, followed by
76 parameters (if any) delimited by whitespace. Command names are
77 lower-case and are case-sensitive.
79 Expiration times
80 ----------------
82 Some commands involve a client sending some kind of expiration time
83 (relative to an item or to an operation requested by the client) to
84 the server. In all such cases, the actual value sent may either be
85 Unix time (number of seconds since January 1, 1970, as a 32-bit
86 value), or a number of seconds starting from current time. In the
87 latter case, this number of seconds may not exceed 60*60*24*30 (number
88 of seconds in 30 days); if the number sent by a client is larger than
89 that, the server will consider it to be real Unix time value rather
90 than an offset from current time.
93 Error strings
94 -------------
96 Each command sent by a client may be answered with an error string
97 from the server. These error strings come in three types:
99 - "ERROR\r\n" 
101   means the client sent a nonexistent command name.
103 - "CLIENT_ERROR <error>\r\n"
105   means some sort of client error in the input line, i.e. the input
106   doesn't conform to the protocol in some way. <error> is a
107   human-readable error string.
109 - "SERVER_ERROR <error>\r\n"
111   means some sort of server error prevents the server from carrying
112   out the command. <error> is a human-readable error string. In cases
113   of severe server errors, which make it impossible to continue
114   serving the client (this shouldn't normally happen), the server will
115   close the connection after sending the error line. This is the only
116   case in which the server closes a connection to a client.
119 In the descriptions of individual commands below, these error lines
120 are not again specifically mentioned, but clients must allow for their
121 possibility.
124 Storage commands
125 ----------------
127 First, the client sends a command line which looks like this:
129 <command name> <key> <flags> <exptime> <bytes> [noreply]\r\n
130 cas <key> <flags> <exptime> <bytes> <cas unqiue> [noreply]\r\n
132 - <command name> is "set", "add", "replace", "append" or "prepend"
134   "set" means "store this data".  
136   "add" means "store this data, but only if the server *doesn't* already
137   hold data for this key".  
139   "replace" means "store this data, but only if the server *does*
140   already hold data for this key".
142   "append" means "add this data to an existing key after existing data".
144   "prepend" means "add this data to an existing key before existing data".
146   The append and prepend commands do not accept flags or exptime.
147   They update existing data portions, and ignore new flag and exptime
148   settings.
150   "cas" is a check and set operation which means "store this data but
151   only if no one else has updated since I last fetched it."
153 - <key> is the key under which the client asks to store the data
155 - <flags> is an arbitrary 16-bit unsigned integer (written out in
156   decimal) that the server stores along with the data and sends back
157   when the item is retrieved. Clients may use this as a bit field to
158   store data-specific information; this field is opaque to the server.
159   Note that in memcached 1.2.1 and higher, flags may be 32-bits, instead
160   of 16, but you might want to restrict yourself to 16 bits for
161   compatibility with older versions.
163 - <exptime> is expiration time. If it's 0, the item never expires
164   (although it may be deleted from the cache to make place for other
165   items). If it's non-zero (either Unix time or offset in seconds from
166   current time), it is guaranteed that clients will not be able to
167   retrieve this item after the expiration time arrives (measured by
168   server time).  
170 - <bytes> is the number of bytes in the data block to follow, *not*
171   including the delimiting \r\n. <bytes> may be zero (in which case
172   it's followed by an empty data block).
174 - <cas unique> is a unique 64-bit value of an existing entry.
175   Clients should use the value returned from the "gets" command
176   when issuing "cas" updates.
178 - "noreply" optional parameter instructs the server to not send the
179   reply.  NOTE: if the request line is malformed, the server can't
180   parse "noreply" option reliably.  In this case it may send the error
181   to the client, and not reading it on the client side will break
182   things.  Client should construct only valid requests.
184 After this line, the client sends the data block:
186 <data block>\r\n
188 - <data block> is a chunk of arbitrary 8-bit data of length <bytes>
189   from the previous line.
191 After sending the command line and the data blockm the client awaits
192 the reply, which may be:
194 - "STORED\r\n", to indicate success.
196 - "NOT_STORED\r\n" to indicate the data was not stored, but not
197 because of an error. This normally means that either that the
198 condition for an "add" or a "replace" command wasn't met, or that the
199 item is in a delete queue (see the "delete" command below).
201 - "EXISTS\r\n" to indicate that the item you are trying to store with
202 a "cas" command has been modified since you last fetched it.
204 - "NOT_FOUND\r\n" to indicate that the item you are trying to store
205 with a "cas" command did not exist or has been deleted.
208 Retrieval command:
209 ------------------
211 The retrieval commands "get" and "gets" operates like this:
213 get <key>*\r\n
214 gets <key>*\r\n
216 - <key>* means one or more key strings separated by whitespace.
218 After this command, the client expects zero or more items, each of
219 which is received as a text line followed by a data block. After all
220 the items have been transmitted, the server sends the string
222 "END\r\n"
224 to indicate the end of response.
226 Each item sent by the server looks like this:
228 VALUE <key> <flags> <bytes> [<cas unique>]\r\n
229 <data block>\r\n
231 - <key> is the key for the item being sent
233 - <flags> is the flags value set by the storage command
235 - <bytes> is the length of the data block to follow, *not* including
236   its delimiting \r\n
238 - <cas unique> is a unique 64-bit integer that uniquely identifies
239   this specific item.
241 - <data block> is the data for this item.
243 If some of the keys appearing in a retrieval request are not sent back
244 by the server in the item list this means that the server does not
245 hold items with such keys (because they were never stored, or stored
246 but deleted to make space for more items, or expired, or explicitly
247 deleted by a client).
250 Deletion
251 --------
253 The command "delete" allows for explicit deletion of items:
255 delete <key> [<time>] [noreply]\r\n
257 - <key> is the key of the item the client wishes the server to delete
259 - <time> is the amount of time in seconds (or Unix time until which)
260   the client wishes the server to refuse "add" and "replace" commands
261   with this key. For this amount of item, the item is put into a
262   delete queue, which means that it won't possible to retrieve it by
263   the "get" command, but "add" and "replace" command with this key
264   will also fail (the "set" command will succeed, however). After the
265   time passes, the item is finally deleted from server memory.
267   The parameter <time> is optional, and, if absent, defaults to 0
268   (which means that the item will be deleted immediately and further
269   storage commands with this key will succeed).
271 - "noreply" optional parameter instructs the server to not send the
272   reply.  See the note in Storage commands regarding malformed
273   requests.
275 The response line to this command can be one of:
277 - "DELETED\r\n" to indicate success
279 - "NOT_FOUND\r\n" to indicate that the item with this key was not
280   found.
282 See the "flush_all" command below for immediate invalidation
283 of all existing items.
286 Increment/Decrement
287 -------------------
289 Commands "incr" and "decr" are used to change data for some item
290 in-place, incrementing or decrementing it. The data for the item is
291 treated as decimal representation of a 64-bit unsigned integer. If the
292 current data value does not conform to such a representation, the
293 commands behave as if the value were 0. Also, the item must already
294 exist for incr/decr to work; these commands won't pretend that a
295 non-existent key exists with value 0; instead, they will fail.
297 The client sends the command line:
299 incr <key> <value> [noreply]\r\n
303 decr <key> <value> [noreply]\r\n
305 - <key> is the key of the item the client wishes to change
307 - <value> is the amount by which the client wants to increase/decrease
308 the item. It is a decimal representation of a 64-bit unsigned integer.
310 - "noreply" optional parameter instructs the server to not send the
311   reply.  See the note in Storage commands regarding malformed
312   requests.
314 The response will be one of:
316 - "NOT_FOUND\r\n" to indicate the item with this value was not found
318 - <value>\r\n , where <value> is the new value of the item's data,
319   after the increment/decrement operation was carried out.
321 Note that underflow in the "decr" command is caught: if a client tries
322 to decrease the value below 0, the new value will be 0.  Overflow in
323 the "incr" command will wrap around the 64 bit mark.
325 Note also that decrementing a number such that it loses length isn't
326 guaranteed to decrement its returned length.  The number MAY be
327 space-padded at the end, but this is purely an implementation
328 optimization, so you also shouldn't rely on that.
330 Statistics
331 ----------
333 The command "stats" is used to query the server about statistics it
334 maintains and other internal data. It has two forms. Without
335 arguments:
337 stats\r\n
339 it causes the server to output general-purpose statistics and
340 settings, documented below.  In the other form it has some arguments:
342 stats <args>\r\n
344 Depending on <args>, various internal data is sent by the server. The
345 kinds of arguments and the data sent are not documented in this vesion
346 of the protocol, and are subject to change for the convenience of
347 memcache developers.
350 General-purpose statistics
351 --------------------------
353 Upon receiving the "stats" command without arguments, the server sents
354 a number of lines which look like this:
356 STAT <name> <value>\r\n
358 The server terminates this list with the line
360 END\r\n
362 In each line of statistics, <name> is the name of this statistic, and
363 <value> is the data.  The following is the list of all names sent in
364 response to the "stats" command, together with the type of the value
365 sent for this name, and the meaning of the value.
367 In the type column below, "32u" means a 32-bit unsigned integer, "64u"
368 means a 64-bit unsigner integer. '32u:32u' means two 32-but unsigned
369 integers separated by a colon.
372 Name              Type     Meaning
373 ----------------------------------
374 pid               32u      Process id of this server process
375 uptime            32u      Number of seconds this server has been running
376 time              32u      current UNIX time according to the server
377 version           string   Version string of this server
378 pointer_size      32       Default size of pointers on the host OS
379                            (generally 32 or 64)
380 rusage_user       32u:32u  Accumulated user time for this process 
381                            (seconds:microseconds)
382 rusage_system     32u:32u  Accumulated system time for this process 
383                            (seconds:microseconds)
384 curr_items        32u      Current number of items stored by the server
385 total_items       32u      Total number of items stored by this server 
386                            ever since it started
387 bytes             64u      Current number of bytes used by this server 
388                            to store items
389 curr_connections  32u      Number of open connections
390 total_connections 32u      Total number of connections opened since 
391                            the server started running
392 connection_structures 32u  Number of connection structures allocated 
393                            by the server
394 cmd_get           64u      Cumulative number of retrieval requests
395 cmd_set           64u      Cumulative number of storage requests
396 get_hits          64u      Number of keys that have been requested and 
397                            found present
398 get_misses        64u      Number of items that have been requested 
399                            and not found
400 evictions         64u      Number of valid items removed from cache                                                                           
401                            to free memory for new items                                                                                       
402 bytes_read        64u      Total number of bytes read by this server 
403                            from network
404 bytes_written     64u      Total number of bytes sent by this server to 
405                            network
406 limit_maxbytes    32u      Number of bytes this server is allowed to
407                            use for storage. 
408 threads           32u      Number of worker threads requested.
409                            (see doc/threads.txt)
412 Item statistics
413 ---------------
414 CAVEAT: This section describes statistics which are subject to change in the
415 future.
417 The "stats" command with the argument of "items" returns information about
418 item storage per slab class. The data is returned in the format:
420 STAT items:<slabclass>:<stat> <value>\r\n
422 The server terminates this list with the line
424 END\r\n
426 The slabclass aligns with class ids used by the "stats slabs" command. Where
427 "stats slabs" describes size and memory usage, "stats items" shows higher
428 level information.
430 The following item values are defined as of writing.
432 Name                   Meaning
433 ------------------------------
434 number                 Number of items presently stored in this class. Expired
435                        items are not automatically excluded.
436 age                    Age of the oldest item in the LRU.
437 evicted                Number of times an item had to be evicted from the LRU
438                        before it expired.
439 outofmemory            Number of times the underlying slab class was unable to
440                        store a new item. This means you are running with -M or
441                        an eviction failed.
443 Note this will only display information about slabs which exist, so an empty
444 cache will return an empty set.
447 Item size statistics
448 --------------------
449 CAVEAT: This section describes statistics which are subject to change in the
450 future.
452 The "stats" command with the argument of "sizes" returns information about the
453 general size and count of all items stored in the cache.
454 WARNING: This command WILL lock up your cache! It iterates over *every item*
455 and examines the size. While the operation is fast, if you have many items 
456 you could prevent memcached from serving requests for several seconds.
458 The data is returned in the following format:
460 <size> <count>\r\n
462 The server terminates this list with the line
464 END\r\n
466 'size' is an approximate size of the item, within 32 bytes.
467 'count' is the amount of items that exist within that 32-byte range.
469 This is essentially a display of all of your items if there was a slab class
470 for every 32 bytes. You can use this to determine if adjusting the slab growth
471 factor would save memory overhead. For example: generating more classes in the 
472 lower range could allow items to fit more snugly into their slab classes, if
473 most of your items are less than 200 bytes in size.
476 Slab statistics
477 ---------------
478 CAVEAT: This section describes statistics which are subject to change in the
479 future.
481 The "stats" command with the argument of "slabs" returns information about
482 each of the slabs created by memcached during runtime. This includes per-slab
483 information along with some totals. The data is returned in the format:
485 STAT <slabclass>:<stat> <value>\r\n
486 STAT <stat> <value>\r\n
488 The server terminates this list with the line
490 END\r\n
492 Name                   Meaning
493 ------------------------------
494 chunk_size             The amount of space each chunk uses. One item will use
495                        one chunk of the appropriate size.
496 chunks_per_page        How many chunks exist within one page. A page by
497                        default is one megabyte in size. Slabs are allocated per 
498                        page, then broken into chunks.
499 total_pages            Total number of pages allocated to the slab class.
500 total_chunks           Total number of chunks allocated to the slab class.
501 used_chunks            How many chunks have been allocated to items.
502 free_chunks            Chunks not yet allocated to items, or freed via delete.
503 free_chunks_end        Number of free chunks at the end of the last allocated
504                        page.
505 active_slabs           Total number of slab classes allocated.
506 total_malloced         Total amount of memory allocated to slab pages.
509 Other commands
510 --------------
512 "flush_all" is a command with an optional numeric argument. It always
513 succeeds, and the server sends "OK\r\n" in response (unless "noreply"
514 is given as the last parameter). Its effect is to invalidate all
515 existing items immediately (by default) or after the expiration
516 specified.  After invalidation none of the items will be returned in
517 response to a retrieval command (unless it's stored again under the
518 same key *after* flush_all has invalidated the items). flush_all
519 doesn't actually free all the memory taken up by existing items; that
520 will happen gradually as new items are stored. The most precise
521 definition of what flush_all does is the following: it causes all
522 items whose update time is earlier than the time at which flush_all
523 was set to be executed to be ignored for retrieval purposes.
525 The intent of flush_all with a delay, was that in a setting where you
526 have a pool of memcached servers, and you need to flush all content,
527 you have the option of not resetting all memcached servers at the
528 same time (which could e.g. cause a spike in database load with all
529 clients suddenly needing to recreate content that would otherwise
530 have been found in the memcached daemon).
532 The delay option allows you to have them reset in e.g. 10 second
533 intervals (by passing 0 to the first, 10 to the second, 20 to the
534 third, etc. etc.).
537 "version" is a command with no arguments:
539 version\r\n
541 In response, the server sends
543 "VERSION <version>\r\n", where <version> is the version string for the
544 server.
546 "verbosity" is a command with a numeric argument. It always succeeds,
547 and the server sends "OK\r\n" in response (unless "noreply" is given
548 as the last parameter). Its effect is to set the verbosity level of
549 the logging output.
551 "quit" is a command with no arguments:
553 quit\r\n
555 Upon receiving this command, the server closes the
556 connection. However, the client may also simply close the connection
557 when it no longer needs it, without issuing this command.
560 UDP protocol
561 ------------
563 For very large installations where the number of clients is high enough
564 that the number of TCP connections causes scaling difficulties, there is
565 also a UDP-based interface. The UDP interface does not provide guaranteed
566 delivery, so should only be used for operations that aren't required to
567 succeed; typically it is used for "get" requests where a missing or
568 incomplete response can simply be treated as a cache miss.
570 Each UDP datagram contains a simple frame header, followed by data in the
571 same format as the TCP protocol described above. In the current
572 implementation, requests must be contained in a single UDP datagram, but
573 responses may span several datagrams. (The only common requests that would
574 span multiple datagrams are huge multi-key "get" requests and "set"
575 requests, both of which are more suitable to TCP transport for reliability
576 reasons anyway.)
578 The frame header is 8 bytes long, as follows (all values are 16-bit integers
579 in network byte order, high byte first):
581 0-1 Request ID
582 2-3 Sequence number
583 4-5 Total number of datagrams in this message
584 6-7 Reserved for future use; must be 0
586 The request ID is supplied by the client. Typically it will be a
587 monotonically increasing value starting from a random seed, but the client
588 is free to use whatever request IDs it likes. The server's response will
589 contain the same ID as the incoming request. The client uses the request ID
590 to differentiate between responses to outstanding requests if there are
591 several pending from the same server; any datagrams with an unknown request
592 ID are probably delayed responses to an earlier request and should be
593 discarded.
595 The sequence number ranges from 0 to n-1, where n is the total number of
596 datagrams in the message. The client should concatenate the payloads of the
597 datagrams for a given response in sequence number order; the resulting byte
598 stream will contain a complete response in the same format as the TCP
599 protocol (including terminating \r\n sequences).