Autogenerated HTML docs for v2.47.0-318-g04eaf
[git-htmldocs.git] / technical / packfile-uri.txt
blob9d453d47651a03dd432c71a71828c1bae2234dfb
1 Packfile URIs
2 =============
4 This feature allows servers to serve part of their packfile response as URIs.
5 This allows server designs that improve scalability in bandwidth and CPU usage
6 (for example, by serving some data through a CDN), and (in the future) provides
7 some measure of resumability to clients.
9 This feature is available only in protocol version 2.
11 Protocol
12 --------
14 The server advertises the `packfile-uris` capability.
16 If the client then communicates which protocols (HTTPS, etc.) it supports with
17 a `packfile-uris` argument, the server MAY send a `packfile-uris` section
18 directly before the `packfile` section (right after `wanted-refs` if it is
19 sent) containing URIs of any of the given protocols. The URIs point to
20 packfiles that use only features that the client has declared that it supports
21 (e.g. ofs-delta and thin-pack). See linkgit:gitprotocol-v2[5] for the documentation of
22 this section.
24 Clients should then download and index all the given URIs (in addition to
25 downloading and indexing the packfile given in the `packfile` section of the
26 response) before performing the connectivity check.
28 Server design
29 -------------
31 The server can be trivially made compatible with the proposed protocol by
32 having it advertise `packfile-uris`, tolerating the client sending
33 `packfile-uris`, and never sending any `packfile-uris` section. But we should
34 include some sort of non-trivial implementation in the Minimum Viable Product,
35 at least so that we can test the client.
37 This is the implementation: a feature, marked experimental, that allows the
38 server to be configured by one or more `uploadpack.blobPackfileUri=
39 <object-hash> <pack-hash> <uri>` entries. Whenever the list of objects to be
40 sent is assembled, all such blobs are excluded, replaced with URIs. As noted
41 in "Future work" below, the server can evolve in the future to support
42 excluding other objects (or other implementations of servers could be made
43 that support excluding other objects) without needing a protocol change, so
44 clients should not expect that packfiles downloaded in this way only contain
45 single blobs.
47 Client design
48 -------------
50 The client has a config variable `fetch.uriprotocols` that determines which
51 protocols the end user is willing to use. By default, this is empty.
53 When the client downloads the given URIs, it should store them with "keep"
54 files, just like it does with the packfile in the `packfile` section. These
55 additional "keep" files can only be removed after the refs have been updated -
56 just like the "keep" file for the packfile in the `packfile` section.
58 The division of work (initial fetch + additional URIs) introduces convenient
59 points for resumption of an interrupted clone - such resumption can be done
60 after the Minimum Viable Product (see "Future work").
62 Future work
63 -----------
65 The protocol design allows some evolution of the server and client without any
66 need for protocol changes, so only a small-scoped design is included here to
67 form the MVP. For example, the following can be done:
69  * On the server, more sophisticated means of excluding objects (e.g. by
70    specifying a commit to represent that commit and all objects that it
71    references).
72  * On the client, resumption of clone. If a clone is interrupted, information
73    could be recorded in the repository's config and a "clone-resume" command
74    can resume the clone in progress. (Resumption of subsequent fetches is more
75    difficult because that must deal with the user wanting to use the repository
76    even after the fetch was interrupted.)
78 There are some possible features that will require a change in protocol:
80  * Additional HTTP headers (e.g. authentication)
81  * Byte range support
82  * Different file formats referenced by URIs (e.g. raw object)