feature: large_microzap
commit224393a3211b12c2cbac90a1d4dc730ceee1bbd0
authorRob Norris <rob.norris@klarasystems.com>
Thu, 3 Oct 2024 03:47:11 +0000 (3 13:47 +1000)
committerGitHub <noreply@github.com>
Thu, 3 Oct 2024 03:47:11 +0000 (2 20:47 -0700)
treeb0a0f84956ce1f10a6a7b55fe29c0c79d1f5f06b
parent412105977c5cb1dcdd9a0b742ceaf04c75da24d0
feature: large_microzap

In a4b21eadec we added the zap_micro_max_size tuneable to raise the size
at which "micro" (single-block) ZAPs are upgraded to "fat" (multi-block)
ZAPs. Before this, a microZAP was limited to 128KiB, which was the old
largest block size. The side effect of raising the max size past 128KiB
is that it be stored in a large block, requiring the large_blocks
feature.

Unfortunately, this means that a backup stream created without the
--large-block (-L) flag to zfs send would split the microZAP block into
smaller blocks and send those, as is normal behaviour for large blocks.
This would be received correctly, but since microZAPs are limited to the
first block in the object by definition, the entries in the later blocks
would be inaccessible. For directory ZAPs, this gives the appearance of
files being lost.

This commit adds a feature flag, large_microzap, that must be enabled
for microZAPs to grow beyond 128KiB, and which will be activated the
first time that occurs. This feature is later checked when generating
the stream and if active, the send operation will abort unless
--large-block has also been requested.

Changing the limit still requires zap_micro_max_size to be changed. The
state of this flag effectively sets the upper value for this tuneable,
that is, if the feature is disabled, the tuneable will be clamped to
128KiB.

A stream flag is also added to ensure that the receiver also activates
its own feature flag upon receiving the stream. This is not strictly
necessary to _use_ the received microZAP, since it doesn't care how
large its block is, but it is required to send the microZAP object on,
otherwise the original problem occurs again.

Because it's difficult to reliably distinguish a microZAP from a fatZAP
from outside the ZAP code, and because it seems unlikely that most
users are affected (a fairly niche tuneable combined with what should be
an uncommon use of send), and for the sake of expediency, this change
activates the feature the first time a microZAP grows to use a large
block, and is never deactivated after that. This can be improved in the
future.

This commit changes nothing for existing pools that already have large
microZAPs. The feature will not be retroactively applied, but will be
activated the next time a microZAP grows past the limit.

Don't use large_blocks feature for enable/disable tests.  The
large_microzap depends on large_blocks, so it gets enabled as a
dependency, breaking the test. Instead use feature "longname", which has
the exact same feature characteristics.

Sponsored-by: Klara, Inc.
Sponsored-by: Wasabi Technology, Inc.
Reviewed-by: Allan Jude <allan@klarasystems.com>
Reviewed-by: Brian Behlendorf <behlendorf1@llnl.gov>
Reviewed-by: Alexander Motin <mav@FreeBSD.org>
Signed-off-by: Rob Norris <rob.norris@klarasystems.com>
Closes #16593
16 files changed:
include/sys/fs/zfs.h
include/sys/zap_impl.h
include/sys/zfs_ioctl.h
include/zfeature_common.h
lib/libzfs/libzfs.abi
lib/libzfs/libzfs_sendrecv.c
man/man4/zfs.4
man/man7/zpool-features.7
man/man8/zfs-send.8
module/zcommon/zfeature_common.c
module/zfs/dmu_recv.c
module/zfs/dmu_send.c
module/zfs/dmu_tx.c
module/zfs/zap_micro.c
tests/zfs-tests/tests/functional/cli_root/zpool_create/zpool_create_features_005_pos.ksh
tests/zfs-tests/tests/functional/cli_root/zpool_get/zpool_get.cfg