]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - sys/contrib/openzfs/module/os/freebsd/zfs/sysctl_os.c
OpenZFS: MFV 2.0-rc3-gfc5966
[FreeBSD/FreeBSD.git] / sys / contrib / openzfs / module / os / freebsd / zfs / sysctl_os.c
1 /*
2  * Copyright (c) 2020 iXsystems, Inc.
3  * All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  * 1. Redistributions of source code must retain the above copyright
9  *    notice, this list of conditions and the following disclaimer.
10  * 2. Redistributions in binary form must reproduce the above copyright
11  *    notice, this list of conditions and the following disclaimer in the
12  *    documentation and/or other materials provided with the distribution.
13  *
14  * THIS SOFTWARE IS PROVIDED BY THE AUTHORS AND CONTRIBUTORS ``AS IS'' AND
15  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
16  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
17  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHORS OR CONTRIBUTORS BE LIABLE
18  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
19  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
20  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
21  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
22  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
23  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
24  * SUCH DAMAGE.
25  *
26  */
27
28 #include <sys/cdefs.h>
29 __FBSDID("$FreeBSD$");
30
31 #include <sys/types.h>
32 #include <sys/param.h>
33 #include <sys/systm.h>
34 #include <sys/conf.h>
35 #include <sys/kernel.h>
36 #include <sys/lock.h>
37 #include <sys/malloc.h>
38 #include <sys/mutex.h>
39 #include <sys/proc.h>
40 #include <sys/errno.h>
41 #include <sys/uio.h>
42 #include <sys/buf.h>
43 #include <sys/file.h>
44 #include <sys/kmem.h>
45 #include <sys/conf.h>
46 #include <sys/cmn_err.h>
47 #include <sys/stat.h>
48 #include <sys/zfs_ioctl.h>
49 #include <sys/zfs_vfsops.h>
50 #include <sys/zfs_znode.h>
51 #include <sys/zap.h>
52 #include <sys/spa.h>
53 #include <sys/spa_impl.h>
54 #include <sys/vdev.h>
55 #include <sys/vdev_impl.h>
56 #include <sys/dmu.h>
57 #include <sys/dsl_dir.h>
58 #include <sys/dsl_dataset.h>
59 #include <sys/dsl_prop.h>
60 #include <sys/dsl_deleg.h>
61 #include <sys/dmu_objset.h>
62 #include <sys/dmu_impl.h>
63 #include <sys/dmu_tx.h>
64 #include <sys/sunddi.h>
65 #include <sys/policy.h>
66 #include <sys/zone.h>
67 #include <sys/nvpair.h>
68 #include <sys/mount.h>
69 #include <sys/taskqueue.h>
70 #include <sys/sdt.h>
71 #include <sys/fs/zfs.h>
72 #include <sys/zfs_ctldir.h>
73 #include <sys/zfs_dir.h>
74 #include <sys/zfs_onexit.h>
75 #include <sys/zvol.h>
76 #include <sys/dsl_scan.h>
77 #include <sys/dmu_objset.h>
78 #include <sys/dmu_send.h>
79 #include <sys/dsl_destroy.h>
80 #include <sys/dsl_bookmark.h>
81 #include <sys/dsl_userhold.h>
82 #include <sys/zfeature.h>
83 #include <sys/zcp.h>
84 #include <sys/zio_checksum.h>
85 #include <sys/vdev_removal.h>
86 #include <sys/dsl_crypt.h>
87
88 #include <sys/zfs_ioctl_compat.h>
89 #include <sys/zfs_context.h>
90
91 #include <sys/arc_impl.h>
92 #include <sys/dsl_pool.h>
93
94
95 /* BEGIN CSTYLED */
96 SYSCTL_DECL(_vfs_zfs);
97 SYSCTL_NODE(_vfs_zfs, OID_AUTO, arc, CTLFLAG_RW, 0, "ZFS adaptive replacement cache");
98 SYSCTL_NODE(_vfs_zfs, OID_AUTO, condense, CTLFLAG_RW, 0, "ZFS condense");
99 SYSCTL_NODE(_vfs_zfs, OID_AUTO, dbuf, CTLFLAG_RW, 0, "ZFS disk buf cache");
100 SYSCTL_NODE(_vfs_zfs, OID_AUTO, dbuf_cache, CTLFLAG_RW, 0, "ZFS disk buf cache");
101 SYSCTL_NODE(_vfs_zfs, OID_AUTO, deadman, CTLFLAG_RW, 0, "ZFS deadman");
102 SYSCTL_NODE(_vfs_zfs, OID_AUTO, dedup, CTLFLAG_RW, 0, "ZFS dedup");
103 SYSCTL_NODE(_vfs_zfs, OID_AUTO, l2arc, CTLFLAG_RW, 0, "ZFS l2arc");
104 SYSCTL_NODE(_vfs_zfs, OID_AUTO, livelist, CTLFLAG_RW, 0, "ZFS livelist");
105 SYSCTL_NODE(_vfs_zfs, OID_AUTO, lua, CTLFLAG_RW, 0, "ZFS lua");
106 SYSCTL_NODE(_vfs_zfs, OID_AUTO, metaslab, CTLFLAG_RW, 0, "ZFS metaslab");
107 SYSCTL_NODE(_vfs_zfs, OID_AUTO, mg, CTLFLAG_RW, 0, "ZFS metaslab group");
108 SYSCTL_NODE(_vfs_zfs, OID_AUTO, multihost, CTLFLAG_RW, 0, "ZFS multihost protection");
109 SYSCTL_NODE(_vfs_zfs, OID_AUTO, prefetch, CTLFLAG_RW, 0, "ZFS prefetch");
110 SYSCTL_NODE(_vfs_zfs, OID_AUTO, reconstruct, CTLFLAG_RW, 0, "ZFS reconstruct");
111 SYSCTL_NODE(_vfs_zfs, OID_AUTO, recv, CTLFLAG_RW, 0, "ZFS receive");
112 SYSCTL_NODE(_vfs_zfs, OID_AUTO, send, CTLFLAG_RW, 0, "ZFS send");
113 SYSCTL_NODE(_vfs_zfs, OID_AUTO, spa, CTLFLAG_RW, 0, "ZFS space allocation");
114 SYSCTL_NODE(_vfs_zfs, OID_AUTO, trim, CTLFLAG_RW, 0, "ZFS TRIM");
115 SYSCTL_NODE(_vfs_zfs, OID_AUTO, txg, CTLFLAG_RW, 0, "ZFS transaction group");
116 SYSCTL_NODE(_vfs_zfs, OID_AUTO, vdev, CTLFLAG_RW, 0, "ZFS VDEV");
117 SYSCTL_NODE(_vfs_zfs, OID_AUTO, zevent, CTLFLAG_RW, 0, "ZFS event");
118 SYSCTL_NODE(_vfs_zfs, OID_AUTO, zil, CTLFLAG_RW, 0, "ZFS ZIL");
119 SYSCTL_NODE(_vfs_zfs, OID_AUTO, zio, CTLFLAG_RW, 0, "ZFS ZIO");
120
121 SYSCTL_NODE(_vfs_zfs_livelist, OID_AUTO, condense, CTLFLAG_RW, 0,
122     "ZFS livelist condense");
123 SYSCTL_NODE(_vfs_zfs_vdev, OID_AUTO, cache, CTLFLAG_RW, 0, "ZFS VDEV Cache");
124 SYSCTL_NODE(_vfs_zfs_vdev, OID_AUTO, file, CTLFLAG_RW, 0, "ZFS VDEV file");
125 SYSCTL_NODE(_vfs_zfs_vdev, OID_AUTO, mirror, CTLFLAG_RD, 0,
126     "ZFS VDEV mirror");
127
128 SYSCTL_DECL(_vfs_zfs_version);
129 SYSCTL_CONST_STRING(_vfs_zfs_version, OID_AUTO, module, CTLFLAG_RD,
130     (ZFS_META_VERSION "-" ZFS_META_RELEASE), "OpenZFS module version");
131
132 extern arc_state_t ARC_anon;
133 extern arc_state_t ARC_mru;
134 extern arc_state_t ARC_mru_ghost;
135 extern arc_state_t ARC_mfu;
136 extern arc_state_t ARC_mfu_ghost;
137 extern arc_state_t ARC_l2c_only;
138
139 /*
140  * minimum lifespan of a prefetch block in clock ticks
141  * (initialized in arc_init())
142  */
143
144 /* arc.c */
145
146 /* legacy compat */
147 extern uint64_t l2arc_write_max;        /* def max write size */
148 extern uint64_t l2arc_write_boost;      /* extra warmup write */
149 extern uint64_t l2arc_headroom;         /* # of dev writes */
150 extern uint64_t l2arc_headroom_boost;
151 extern uint64_t l2arc_feed_secs;        /* interval seconds */
152 extern uint64_t l2arc_feed_min_ms;      /* min interval msecs */
153 extern int l2arc_noprefetch;                    /* don't cache prefetch bufs */
154 extern int l2arc_feed_again;                    /* turbo warmup */
155 extern int l2arc_norw;                  /* no reads during writes */
156
157 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, l2arc_write_max, CTLFLAG_RW,
158     &l2arc_write_max, 0, "max write size (LEGACY)");
159 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, l2arc_write_boost, CTLFLAG_RW,
160     &l2arc_write_boost, 0, "extra write during warmup (LEGACY)");
161 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, l2arc_headroom, CTLFLAG_RW,
162     &l2arc_headroom, 0, "number of dev writes (LEGACY)");
163 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, l2arc_feed_secs, CTLFLAG_RW,
164     &l2arc_feed_secs, 0, "interval seconds (LEGACY)");
165 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, l2arc_feed_min_ms, CTLFLAG_RW,
166     &l2arc_feed_min_ms, 0, "min interval milliseconds (LEGACY)");
167
168 SYSCTL_INT(_vfs_zfs, OID_AUTO, l2arc_noprefetch, CTLFLAG_RW,
169     &l2arc_noprefetch, 0, "don't cache prefetch bufs (LEGACY)");
170 SYSCTL_INT(_vfs_zfs, OID_AUTO, l2arc_feed_again, CTLFLAG_RW,
171     &l2arc_feed_again, 0, "turbo warmup (LEGACY)");
172 SYSCTL_INT(_vfs_zfs, OID_AUTO, l2arc_norw, CTLFLAG_RW,
173     &l2arc_norw, 0, "no reads during writes (LEGACY)");
174 #if 0
175 extern int zfs_compressed_arc_enabled;
176 SYSCTL_INT(_vfs_zfs, OID_AUTO, compressed_arc_enabled, CTLFLAG_RW,
177     &zfs_compressed_arc_enabled, 1, "compressed arc buffers (LEGACY)");
178 #endif
179
180 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, anon_size, CTLFLAG_RD,
181     &ARC_anon.arcs_size.rc_count, 0, "size of anonymous state");
182 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, anon_metadata_esize, CTLFLAG_RD,
183     &ARC_anon.arcs_esize[ARC_BUFC_METADATA].rc_count, 0,
184     "size of anonymous state");
185 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, anon_data_esize, CTLFLAG_RD,
186     &ARC_anon.arcs_esize[ARC_BUFC_DATA].rc_count, 0,
187     "size of anonymous state");
188
189 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mru_size, CTLFLAG_RD,
190     &ARC_mru.arcs_size.rc_count, 0, "size of mru state");
191 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mru_metadata_esize, CTLFLAG_RD,
192     &ARC_mru.arcs_esize[ARC_BUFC_METADATA].rc_count, 0,
193     "size of metadata in mru state");
194 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mru_data_esize, CTLFLAG_RD,
195     &ARC_mru.arcs_esize[ARC_BUFC_DATA].rc_count, 0,
196     "size of data in mru state");
197
198 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mru_ghost_size, CTLFLAG_RD,
199     &ARC_mru_ghost.arcs_size.rc_count, 0, "size of mru ghost state");
200 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mru_ghost_metadata_esize, CTLFLAG_RD,
201     &ARC_mru_ghost.arcs_esize[ARC_BUFC_METADATA].rc_count, 0,
202     "size of metadata in mru ghost state");
203 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mru_ghost_data_esize, CTLFLAG_RD,
204     &ARC_mru_ghost.arcs_esize[ARC_BUFC_DATA].rc_count, 0,
205     "size of data in mru ghost state");
206
207 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mfu_size, CTLFLAG_RD,
208     &ARC_mfu.arcs_size.rc_count, 0, "size of mfu state");
209 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mfu_metadata_esize, CTLFLAG_RD,
210     &ARC_mfu.arcs_esize[ARC_BUFC_METADATA].rc_count, 0,
211     "size of metadata in mfu state");
212 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mfu_data_esize, CTLFLAG_RD,
213     &ARC_mfu.arcs_esize[ARC_BUFC_DATA].rc_count, 0,
214     "size of data in mfu state");
215
216 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mfu_ghost_size, CTLFLAG_RD,
217     &ARC_mfu_ghost.arcs_size.rc_count, 0, "size of mfu ghost state");
218 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mfu_ghost_metadata_esize, CTLFLAG_RD,
219     &ARC_mfu_ghost.arcs_esize[ARC_BUFC_METADATA].rc_count, 0,
220     "size of metadata in mfu ghost state");
221 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, mfu_ghost_data_esize, CTLFLAG_RD,
222     &ARC_mfu_ghost.arcs_esize[ARC_BUFC_DATA].rc_count, 0,
223     "size of data in mfu ghost state");
224
225 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, l2c_only_size, CTLFLAG_RD,
226     &ARC_l2c_only.arcs_size.rc_count, 0, "size of mru state");
227
228 static int
229 sysctl_vfs_zfs_arc_no_grow_shift(SYSCTL_HANDLER_ARGS)
230 {
231         uint32_t val;
232         int err;
233
234         val = arc_no_grow_shift;
235         err = sysctl_handle_32(oidp, &val, 0, req);
236         if (err != 0 || req->newptr == NULL)
237                 return (err);
238
239         if (val >= arc_shrink_shift)
240                 return (EINVAL);
241
242         arc_no_grow_shift = val;
243         return (0);
244 }
245
246 SYSCTL_PROC(_vfs_zfs, OID_AUTO, arc_no_grow_shift,
247     CTLTYPE_U32 | CTLFLAG_RWTUN | CTLFLAG_MPSAFE, 0, sizeof (uint32_t),
248     sysctl_vfs_zfs_arc_no_grow_shift, "U",
249     "log2(fraction of ARC which must be free to allow growing)");
250
251 int
252 param_set_arc_long(SYSCTL_HANDLER_ARGS)
253 {
254         int err;
255
256         err = sysctl_handle_long(oidp, arg1, 0, req);
257         if (err != 0 || req->newptr == NULL)
258                 return (err);
259
260         arc_tuning_update(B_TRUE);
261
262         return (0);
263 }
264
265 int
266 param_set_arc_int(SYSCTL_HANDLER_ARGS)
267 {
268         int err;
269
270         err = sysctl_handle_int(oidp, arg1, 0, req);
271         if (err != 0 || req->newptr == NULL)
272                 return (err);
273
274         arc_tuning_update(B_TRUE);
275
276         return (0);
277 }
278
279 SYSCTL_PROC(_vfs_zfs, OID_AUTO, arc_min,
280     CTLTYPE_ULONG | CTLFLAG_RWTUN | CTLFLAG_MPSAFE,
281     &zfs_arc_min, sizeof (zfs_arc_min), param_set_arc_long, "LU",
282     "min arc size (LEGACY)");
283 SYSCTL_PROC(_vfs_zfs, OID_AUTO, arc_max,
284     CTLTYPE_ULONG | CTLFLAG_RWTUN | CTLFLAG_MPSAFE,
285     &zfs_arc_max, sizeof (zfs_arc_max), param_set_arc_long, "LU",
286     "max arc size (LEGACY)");
287
288 /* dbuf.c */
289
290
291 /* dmu.c */
292
293 /* dmu_zfetch.c */
294 SYSCTL_NODE(_vfs_zfs, OID_AUTO, zfetch, CTLFLAG_RW, 0, "ZFS ZFETCH (LEGACY)");
295
296 /* max bytes to prefetch per stream (default 8MB) */
297 extern uint32_t zfetch_max_distance;
298 SYSCTL_UINT(_vfs_zfs_zfetch, OID_AUTO, max_distance, CTLFLAG_RWTUN,
299     &zfetch_max_distance, 0, "Max bytes to prefetch per stream (LEGACY)");
300
301 /* max bytes to prefetch indirects for per stream (default 64MB) */
302 extern uint32_t zfetch_max_idistance;
303 SYSCTL_UINT(_vfs_zfs_prefetch, OID_AUTO, max_idistance, CTLFLAG_RWTUN,
304     &zfetch_max_idistance, 0, "Max bytes to prefetch indirects for per stream");
305
306 /* dsl_pool.c */
307
308 /* dnode.c */
309 extern int zfs_default_bs;
310 SYSCTL_INT(_vfs_zfs, OID_AUTO, default_bs, CTLFLAG_RWTUN,
311     &zfs_default_bs, 0, "Default dnode block shift");
312
313 extern int zfs_default_ibs;
314 SYSCTL_INT(_vfs_zfs, OID_AUTO, default_ibs, CTLFLAG_RWTUN,
315     &zfs_default_ibs, 0, "Default dnode indirect block shift");
316
317
318 /* dsl_scan.c */
319
320 /* metaslab.c */
321
322 /*
323  * In pools where the log space map feature is not enabled we touch
324  * multiple metaslabs (and their respective space maps) with each
325  * transaction group. Thus, we benefit from having a small space map
326  * block size since it allows us to issue more I/O operations scattered
327  * around the disk. So a sane default for the space map block size
328  * is 8~16K.
329  */
330 extern int zfs_metaslab_sm_blksz_no_log;
331 SYSCTL_INT(_vfs_zfs_metaslab, OID_AUTO, sm_blksz_no_log, CTLFLAG_RDTUN,
332     &zfs_metaslab_sm_blksz_no_log, 0,
333     "Block size for space map in pools with log space map disabled.  "
334     "Power of 2 and greater than 4096.");
335
336 /*
337  * When the log space map feature is enabled, we accumulate a lot of
338  * changes per metaslab that are flushed once in a while so we benefit
339  * from a bigger block size like 128K for the metaslab space maps.
340  */
341 extern int zfs_metaslab_sm_blksz_with_log;
342 SYSCTL_INT(_vfs_zfs_metaslab, OID_AUTO, sm_blksz_with_log, CTLFLAG_RDTUN,
343     &zfs_metaslab_sm_blksz_with_log, 0,
344     "Block size for space map in pools with log space map enabled.  "
345     "Power of 2 and greater than 4096.");
346
347 /*
348  * The in-core space map representation is more compact than its on-disk form.
349  * The zfs_condense_pct determines how much more compact the in-core
350  * space map representation must be before we compact it on-disk.
351  * Values should be greater than or equal to 100.
352  */
353 extern int zfs_condense_pct;
354 SYSCTL_INT(_vfs_zfs, OID_AUTO, condense_pct, CTLFLAG_RWTUN,
355     &zfs_condense_pct, 0,
356     "Condense on-disk spacemap when it is more than this many percents"
357     " of in-memory counterpart");
358
359 extern int zfs_remove_max_segment;
360 SYSCTL_INT(_vfs_zfs, OID_AUTO, remove_max_segment, CTLFLAG_RWTUN,
361     &zfs_remove_max_segment, 0, "Largest contiguous segment ZFS will attempt to"
362     " allocate when removing a device");
363
364 extern int zfs_removal_suspend_progress;
365 SYSCTL_INT(_vfs_zfs, OID_AUTO, removal_suspend_progress, CTLFLAG_RWTUN,
366     &zfs_removal_suspend_progress, 0, "Ensures certain actions can happen while"
367     " in the middle of a removal");
368
369
370 /*
371  * Minimum size which forces the dynamic allocator to change
372  * it's allocation strategy.  Once the space map cannot satisfy
373  * an allocation of this size then it switches to using more
374  * aggressive strategy (i.e search by size rather than offset).
375  */
376 extern uint64_t metaslab_df_alloc_threshold;
377 SYSCTL_QUAD(_vfs_zfs_metaslab, OID_AUTO, df_alloc_threshold, CTLFLAG_RWTUN,
378     &metaslab_df_alloc_threshold, 0,
379     "Minimum size which forces the dynamic allocator to change it's allocation strategy");
380
381 /*
382  * The minimum free space, in percent, which must be available
383  * in a space map to continue allocations in a first-fit fashion.
384  * Once the space map's free space drops below this level we dynamically
385  * switch to using best-fit allocations.
386  */
387 extern int metaslab_df_free_pct;
388 SYSCTL_INT(_vfs_zfs_metaslab, OID_AUTO, df_free_pct, CTLFLAG_RWTUN,
389     &metaslab_df_free_pct, 0,
390     "The minimum free space, in percent, which must be available in a "
391     "space map to continue allocations in a first-fit fashion");
392
393 /*
394  * Percentage of all cpus that can be used by the metaslab taskq.
395  */
396 extern int metaslab_load_pct;
397 SYSCTL_INT(_vfs_zfs_metaslab, OID_AUTO, load_pct, CTLFLAG_RWTUN,
398     &metaslab_load_pct, 0,
399     "Percentage of cpus that can be used by the metaslab taskq");
400
401 /*
402  * Max number of metaslabs per group to preload.
403  */
404 extern int metaslab_preload_limit;
405 SYSCTL_INT(_vfs_zfs_metaslab, OID_AUTO, preload_limit, CTLFLAG_RWTUN,
406     &metaslab_preload_limit, 0,
407     "Max number of metaslabs per group to preload");
408
409 /* refcount.c */
410 extern int reference_tracking_enable;
411 SYSCTL_INT(_vfs_zfs, OID_AUTO, reference_tracking_enable, CTLFLAG_RDTUN,
412     &reference_tracking_enable, 0,
413     "Track reference holders to refcount_t objects, used mostly by ZFS");
414
415 /* spa.c */
416 extern int zfs_ccw_retry_interval;
417 SYSCTL_INT(_vfs_zfs, OID_AUTO, ccw_retry_interval, CTLFLAG_RWTUN,
418     &zfs_ccw_retry_interval, 0,
419     "Configuration cache file write, retry after failure, interval (seconds)");
420
421 extern uint64_t zfs_max_missing_tvds_cachefile;
422 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, max_missing_tvds_cachefile, CTLFLAG_RWTUN,
423     &zfs_max_missing_tvds_cachefile, 0,
424     "allow importing pools with missing top-level vdevs in cache file");
425
426 extern uint64_t zfs_max_missing_tvds_scan;
427 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, max_missing_tvds_scan, CTLFLAG_RWTUN,
428     &zfs_max_missing_tvds_scan, 0,
429     "allow importing pools with missing top-level vdevs during scan");
430
431 /* spa_misc.c */
432 extern int zfs_flags;
433 static int
434 sysctl_vfs_zfs_debug_flags(SYSCTL_HANDLER_ARGS)
435 {
436         int err, val;
437
438         val = zfs_flags;
439         err = sysctl_handle_int(oidp, &val, 0, req);
440         if (err != 0 || req->newptr == NULL)
441                 return (err);
442
443         /*
444          * ZFS_DEBUG_MODIFY must be enabled prior to boot so all
445          * arc buffers in the system have the necessary additional
446          * checksum data.  However, it is safe to disable at any
447          * time.
448          */
449         if (!(zfs_flags & ZFS_DEBUG_MODIFY))
450                 val &= ~ZFS_DEBUG_MODIFY;
451         zfs_flags = val;
452
453         return (0);
454 }
455
456 SYSCTL_PROC(_vfs_zfs, OID_AUTO, debugflags,
457     CTLTYPE_UINT | CTLFLAG_MPSAFE | CTLFLAG_RWTUN, NULL, 0,
458     sysctl_vfs_zfs_debug_flags, "IU", "Debug flags for ZFS testing.");
459
460 int
461 param_set_deadman_synctime(SYSCTL_HANDLER_ARGS)
462 {
463         unsigned long val;
464         int err;
465
466         val = zfs_deadman_synctime_ms;
467         err = sysctl_handle_long(oidp, &val, 0, req);
468         if (err != 0 || req->newptr == NULL)
469                 return (err);
470         zfs_deadman_synctime_ms = val;
471
472         spa_set_deadman_synctime(MSEC2NSEC(zfs_deadman_synctime_ms));
473
474         return (0);
475 }
476
477 int
478 param_set_deadman_ziotime(SYSCTL_HANDLER_ARGS)
479 {
480         unsigned long val;
481         int err;
482
483         val = zfs_deadman_ziotime_ms;
484         err = sysctl_handle_long(oidp, &val, 0, req);
485         if (err != 0 || req->newptr == NULL)
486                 return (err);
487         zfs_deadman_ziotime_ms = val;
488
489         spa_set_deadman_ziotime(MSEC2NSEC(zfs_deadman_synctime_ms));
490
491         return (0);
492 }
493
494 int
495 param_set_deadman_failmode(SYSCTL_HANDLER_ARGS)
496 {
497         char buf[16];
498         int rc;
499
500         if (req->newptr == NULL)
501                 strlcpy(buf, zfs_deadman_failmode, sizeof (buf));
502
503         rc = sysctl_handle_string(oidp, buf, sizeof (buf), req);
504         if (rc || req->newptr == NULL)
505                 return (rc);
506         if (strcmp(buf, zfs_deadman_failmode) == 0)
507                 return (0);
508         if (!strcmp(buf,  "wait"))
509                 zfs_deadman_failmode = "wait";
510         if (!strcmp(buf,  "continue"))
511                 zfs_deadman_failmode = "continue";
512         if (!strcmp(buf,  "panic"))
513                 zfs_deadman_failmode = "panic";
514
515         return (-param_set_deadman_failmode_common(buf));
516 }
517
518
519 /* spacemap.c */
520 extern int space_map_ibs;
521 SYSCTL_INT(_vfs_zfs, OID_AUTO, space_map_ibs, CTLFLAG_RWTUN,
522     &space_map_ibs, 0, "Space map indirect block shift");
523
524
525 /* vdev.c */
526 int
527 param_set_min_auto_ashift(SYSCTL_HANDLER_ARGS)
528 {
529         uint64_t val;
530         int err;
531
532         val = zfs_vdev_min_auto_ashift;
533         err = sysctl_handle_64(oidp, &val, 0, req);
534         if (err != 0 || req->newptr == NULL)
535                 return (SET_ERROR(err));
536
537         if (val < ASHIFT_MIN || val > zfs_vdev_max_auto_ashift)
538                 return (SET_ERROR(EINVAL));
539
540         zfs_vdev_min_auto_ashift = val;
541
542         return (0);
543 }
544
545 int
546 param_set_max_auto_ashift(SYSCTL_HANDLER_ARGS)
547 {
548         uint64_t val;
549         int err;
550
551         val = zfs_vdev_max_auto_ashift;
552         err = sysctl_handle_64(oidp, &val, 0, req);
553         if (err != 0 || req->newptr == NULL)
554                 return (SET_ERROR(err));
555
556         if (val > ASHIFT_MAX || val < zfs_vdev_min_auto_ashift)
557                 return (SET_ERROR(EINVAL));
558
559         zfs_vdev_max_auto_ashift = val;
560
561         return (0);
562 }
563
564 SYSCTL_PROC(_vfs_zfs, OID_AUTO, min_auto_ashift,
565     CTLTYPE_U64 | CTLFLAG_RWTUN | CTLFLAG_MPSAFE,
566     &zfs_vdev_min_auto_ashift, sizeof (zfs_vdev_min_auto_ashift),
567     param_set_min_auto_ashift, "QU",
568     "Min ashift used when creating new top-level vdev. (LEGACY)");
569 SYSCTL_PROC(_vfs_zfs, OID_AUTO, max_auto_ashift,
570     CTLTYPE_U64 | CTLFLAG_RWTUN | CTLFLAG_MPSAFE,
571     &zfs_vdev_max_auto_ashift, sizeof (zfs_vdev_max_auto_ashift),
572     param_set_max_auto_ashift, "QU",
573     "Max ashift used when optimizing for logical -> physical sector size on "
574     "new top-level vdevs. (LEGACY)");
575
576 /*
577  * Since the DTL space map of a vdev is not expected to have a lot of
578  * entries, we default its block size to 4K.
579  */
580 extern int zfs_vdev_dtl_sm_blksz;
581 SYSCTL_INT(_vfs_zfs, OID_AUTO, dtl_sm_blksz, CTLFLAG_RDTUN,
582     &zfs_vdev_dtl_sm_blksz, 0,
583     "Block size for DTL space map.  Power of 2 and greater than 4096.");
584
585 /*
586  * vdev-wide space maps that have lots of entries written to them at
587  * the end of each transaction can benefit from a higher I/O bandwidth
588  * (e.g. vdev_obsolete_sm), thus we default their block size to 128K.
589  */
590 extern int zfs_vdev_standard_sm_blksz;
591 SYSCTL_INT(_vfs_zfs, OID_AUTO, standard_sm_blksz, CTLFLAG_RDTUN,
592     &zfs_vdev_standard_sm_blksz, 0,
593     "Block size for standard space map.  Power of 2 and greater than 4096.");
594
595 extern int vdev_validate_skip;
596 SYSCTL_INT(_vfs_zfs, OID_AUTO, validate_skip, CTLFLAG_RDTUN,
597     &vdev_validate_skip, 0,
598     "Enable to bypass vdev_validate().");
599
600
601 /* vdev_cache.c */
602
603 /* vdev_mirror.c */
604 /*
605  * The load configuration settings below are tuned by default for
606  * the case where all devices are of the same rotational type.
607  *
608  * If there is a mixture of rotating and non-rotating media, setting
609  * non_rotating_seek_inc to 0 may well provide better results as it
610  * will direct more reads to the non-rotating vdevs which are more
611  * likely to have a higher performance.
612  */
613
614
615 /* vdev_queue.c */
616 #define ZFS_VDEV_QUEUE_KNOB_MIN(name)                                   \
617 extern uint32_t zfs_vdev_ ## name ## _min_active;                               \
618 SYSCTL_UINT(_vfs_zfs_vdev, OID_AUTO, name ## _min_active, CTLFLAG_RWTUN,\
619     &zfs_vdev_ ## name ## _min_active, 0,                               \
620     "Initial number of I/O requests of type " #name                     \
621     " active for each device");
622
623 #define ZFS_VDEV_QUEUE_KNOB_MAX(name)                                   \
624 extern uint32_t zfs_vdev_ ## name ## _max_active;                               \
625 SYSCTL_UINT(_vfs_zfs_vdev, OID_AUTO, name ## _max_active, CTLFLAG_RWTUN, \
626     &zfs_vdev_ ## name ## _max_active, 0,                               \
627     "Maximum number of I/O requests of type " #name                     \
628     " active for each device");
629
630
631 #undef ZFS_VDEV_QUEUE_KNOB
632
633 extern uint32_t zfs_vdev_max_active;
634 SYSCTL_UINT(_vfs_zfs, OID_AUTO, top_maxinflight, CTLFLAG_RWTUN,
635     &zfs_vdev_max_active, 0,
636     "The maximum number of I/Os of all types active for each device. (LEGACY)");
637
638 extern int zfs_vdev_def_queue_depth;
639 SYSCTL_INT(_vfs_zfs_vdev, OID_AUTO, def_queue_depth, CTLFLAG_RWTUN,
640     &zfs_vdev_def_queue_depth, 0,
641     "Default queue depth for each allocator");
642
643 /*extern uint64_t zfs_multihost_history;
644 SYSCTL_UQUAD(_vfs_zfs, OID_AUTO, multihost_history, CTLFLAG_RWTUN,
645     &zfs_multihost_history, 0,
646     "Historical staticists for the last N multihost updates");*/
647
648 #ifdef notyet
649 SYSCTL_INT(_vfs_zfs_vdev, OID_AUTO, trim_on_init, CTLFLAG_RW,
650     &vdev_trim_on_init, 0, "Enable/disable full vdev trim on initialisation");
651 #endif
652
653
654 /* zio.c */
655 #if defined(__LP64__)
656 int zio_use_uma = 1;
657 #else
658 int zio_use_uma = 0;
659 #endif
660
661 SYSCTL_INT(_vfs_zfs_zio, OID_AUTO, use_uma, CTLFLAG_RDTUN, &zio_use_uma, 0,
662     "Use uma(9) for ZIO allocations");
663 SYSCTL_INT(_vfs_zfs_zio, OID_AUTO, exclude_metadata, CTLFLAG_RDTUN, &zio_exclude_metadata, 0,
664     "Exclude metadata buffers from dumps as well");
665
666 int
667 param_set_slop_shift(SYSCTL_HANDLER_ARGS)
668 {
669         int val;
670         int err;
671
672         val = *(int *)arg1;
673
674         err = sysctl_handle_int(oidp, &val, 0, req);
675         if (err != 0 || req->newptr == NULL)
676                 return (err);
677
678         if (val < 1 || val > 31)
679                 return (EINVAL);
680
681         *(int *)arg1 = val;
682
683         return (0);
684 }
685
686 int
687 param_set_multihost_interval(SYSCTL_HANDLER_ARGS)
688 {
689         int err;
690
691         err = sysctl_handle_long(oidp, arg1, 0, req);
692         if (err != 0 || req->newptr == NULL)
693                 return (err);
694
695         if (spa_mode_global != SPA_MODE_UNINIT)
696                 mmp_signal_all_threads();
697
698         return (0);
699 }