]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - sys/ufs/ufs/ufs_quota.c
ssh: update to OpenSSH v8.9p1
[FreeBSD/FreeBSD.git] / sys / ufs / ufs / ufs_quota.c
1 /*-
2  * SPDX-License-Identifier: BSD-3-Clause
3  *
4  * Copyright (c) 1982, 1986, 1990, 1993, 1995
5  *      The Regents of the University of California.  All rights reserved.
6  *
7  * This code is derived from software contributed to Berkeley by
8  * Robert Elz at The University of Melbourne.
9  *
10  * Redistribution and use in source and binary forms, with or without
11  * modification, are permitted provided that the following conditions
12  * are met:
13  * 1. Redistributions of source code must retain the above copyright
14  *    notice, this list of conditions and the following disclaimer.
15  * 2. Redistributions in binary form must reproduce the above copyright
16  *    notice, this list of conditions and the following disclaimer in the
17  *    documentation and/or other materials provided with the distribution.
18  * 3. Neither the name of the University nor the names of its contributors
19  *    may be used to endorse or promote products derived from this software
20  *    without specific prior written permission.
21  *
22  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
23  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
24  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
25  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
26  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
27  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
28  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
29  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
30  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
31  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
32  * SUCH DAMAGE.
33  *
34  *      @(#)ufs_quota.c 8.5 (Berkeley) 5/20/95
35  */
36
37 #include <sys/cdefs.h>
38 __FBSDID("$FreeBSD$");
39
40 #include "opt_ffs.h"
41
42 #include <sys/param.h>
43 #include <sys/systm.h>
44 #include <sys/endian.h>
45 #include <sys/fcntl.h>
46 #include <sys/kernel.h>
47 #include <sys/lock.h>
48 #include <sys/malloc.h>
49 #include <sys/mount.h>
50 #include <sys/mutex.h>
51 #include <sys/namei.h>
52 #include <sys/priv.h>
53 #include <sys/proc.h>
54 #include <sys/socket.h>
55 #include <sys/stat.h>
56 #include <sys/sysctl.h>
57 #include <sys/vnode.h>
58
59 #include <ufs/ufs/extattr.h>
60 #include <ufs/ufs/quota.h>
61 #include <ufs/ufs/inode.h>
62 #include <ufs/ufs/ufsmount.h>
63 #include <ufs/ufs/ufs_extern.h>
64
65 CTASSERT(sizeof(struct dqblk64) == sizeof(struct dqhdr64));
66
67 static int unprivileged_get_quota = 0;
68 SYSCTL_INT(_security_bsd, OID_AUTO, unprivileged_get_quota, CTLFLAG_RW,
69     &unprivileged_get_quota, 0,
70     "Unprivileged processes may retrieve quotas for other uids and gids");
71
72 static MALLOC_DEFINE(M_DQUOT, "ufs_quota", "UFS quota entries");
73
74 /*
75  * Quota name to error message mapping.
76  */
77 static char *quotatypes[] = INITQFNAMES;
78
79 static int chkdqchg(struct inode *, ufs2_daddr_t, struct ucred *, int, int *);
80 static int chkiqchg(struct inode *, int, struct ucred *, int, int *);
81 static int dqopen(struct vnode *, struct ufsmount *, int);
82 static int dqget(struct vnode *,
83         u_long, struct ufsmount *, int, struct dquot **);
84 static int dqsync(struct vnode *, struct dquot *);
85 static int dqflush(struct vnode *);
86 static int quotaoff1(struct thread *td, struct mount *mp, int type);
87 static int quotaoff_inchange(struct thread *td, struct mount *mp, int type);
88
89 /* conversion functions - from_to() */
90 static void dqb32_dq(const struct dqblk32 *, struct dquot *);
91 static void dqb64_dq(const struct dqblk64 *, struct dquot *);
92 static void dq_dqb32(const struct dquot *, struct dqblk32 *);
93 static void dq_dqb64(const struct dquot *, struct dqblk64 *);
94 static void dqb32_dqb64(const struct dqblk32 *, struct dqblk64 *);
95 static void dqb64_dqb32(const struct dqblk64 *, struct dqblk32 *);
96
97 #ifdef DIAGNOSTIC
98 static void dqref(struct dquot *);
99 static void chkdquot(struct inode *);
100 #endif
101
102 /*
103  * Set up the quotas for an inode.
104  *
105  * This routine completely defines the semantics of quotas.
106  * If other criterion want to be used to establish quotas, the
107  * MAXQUOTAS value in quota.h should be increased, and the
108  * additional dquots set up here.
109  */
110 int
111 getinoquota(struct inode *ip)
112 {
113         struct ufsmount *ump;
114         struct vnode *vp;
115         int error;
116
117         vp = ITOV(ip);
118
119         /*
120          * Disk quotas must be turned off for system files.  Currently
121          * snapshot and quota files.
122          */
123         if ((vp->v_vflag & VV_SYSTEM) != 0)
124                 return (0);
125         /*
126          * XXX: Turn off quotas for files with a negative UID or GID.
127          * This prevents the creation of 100GB+ quota files.
128          */
129         if ((int)ip->i_uid < 0 || (int)ip->i_gid < 0)
130                 return (0);
131         ump = VFSTOUFS(vp->v_mount);
132         /*
133          * Set up the user quota based on file uid.
134          * EINVAL means that quotas are not enabled.
135          */
136         if ((error =
137                 dqget(vp, ip->i_uid, ump, USRQUOTA, &ip->i_dquot[USRQUOTA])) &&
138             error != EINVAL)
139                 return (error);
140         /*
141          * Set up the group quota based on file gid.
142          * EINVAL means that quotas are not enabled.
143          */
144         if ((error =
145                 dqget(vp, ip->i_gid, ump, GRPQUOTA, &ip->i_dquot[GRPQUOTA])) &&
146             error != EINVAL)
147                 return (error);
148         return (0);
149 }
150
151 /*
152  * Update disk usage, and take corrective action.
153  */
154 int
155 chkdq(struct inode *ip, ufs2_daddr_t change, struct ucred *cred, int flags)
156 {
157         struct dquot *dq;
158         ufs2_daddr_t ncurblocks;
159         struct vnode *vp = ITOV(ip);
160         int i, error, warn, do_check;
161
162         MPASS(cred != NOCRED || (flags & FORCE) != 0);
163         /*
164          * Disk quotas must be turned off for system files.  Currently
165          * snapshot and quota files.
166          */
167         if ((vp->v_vflag & VV_SYSTEM) != 0)
168                 return (0);
169         /*
170          * XXX: Turn off quotas for files with a negative UID or GID.
171          * This prevents the creation of 100GB+ quota files.
172          */
173         if ((int)ip->i_uid < 0 || (int)ip->i_gid < 0)
174                 return (0);
175 #ifdef DIAGNOSTIC
176         if ((flags & CHOWN) == 0)
177                 chkdquot(ip);
178 #endif
179         if (change == 0)
180                 return (0);
181         if (change < 0) {
182                 for (i = 0; i < MAXQUOTAS; i++) {
183                         if ((dq = ip->i_dquot[i]) == NODQUOT)
184                                 continue;
185                         DQI_LOCK(dq);
186                         DQI_WAIT(dq, PINOD+1, "chkdq1");
187                         ncurblocks = dq->dq_curblocks + change;
188                         if (ncurblocks >= 0)
189                                 dq->dq_curblocks = ncurblocks;
190                         else
191                                 dq->dq_curblocks = 0;
192                         dq->dq_flags &= ~DQ_BLKS;
193                         dq->dq_flags |= DQ_MOD;
194                         DQI_UNLOCK(dq);
195                 }
196                 return (0);
197         }
198         if ((flags & FORCE) == 0 &&
199             priv_check_cred(cred, PRIV_VFS_EXCEEDQUOTA))
200                 do_check = 1;
201         else
202                 do_check = 0;
203         for (i = 0; i < MAXQUOTAS; i++) {
204                 if ((dq = ip->i_dquot[i]) == NODQUOT)
205                         continue;
206                 warn = 0;
207                 DQI_LOCK(dq);
208                 DQI_WAIT(dq, PINOD+1, "chkdq2");
209                 if (do_check) {
210                         error = chkdqchg(ip, change, cred, i, &warn);
211                         if (error) {
212                                 /*
213                                  * Roll back user quota changes when
214                                  * group quota failed.
215                                  */
216                                 while (i > 0) {
217                                         --i;
218                                         dq = ip->i_dquot[i];
219                                         if (dq == NODQUOT)
220                                                 continue;
221                                         DQI_LOCK(dq);
222                                         DQI_WAIT(dq, PINOD+1, "chkdq3");
223                                         ncurblocks = dq->dq_curblocks - change;
224                                         if (ncurblocks >= 0)
225                                                 dq->dq_curblocks = ncurblocks;
226                                         else
227                                                 dq->dq_curblocks = 0;
228                                         dq->dq_flags &= ~DQ_BLKS;
229                                         dq->dq_flags |= DQ_MOD;
230                                         DQI_UNLOCK(dq);
231                                 }
232                                 return (error);
233                         }
234                 }
235                 /* Reset timer when crossing soft limit */
236                 if (dq->dq_curblocks + change >= dq->dq_bsoftlimit &&
237                     dq->dq_curblocks < dq->dq_bsoftlimit)
238                         dq->dq_btime = time_second + ITOUMP(ip)->um_btime[i];
239                 dq->dq_curblocks += change;
240                 dq->dq_flags |= DQ_MOD;
241                 DQI_UNLOCK(dq);
242                 if (warn)
243                         uprintf("\n%s: warning, %s disk quota exceeded\n",
244                             ITOVFS(ip)->mnt_stat.f_mntonname,
245                             quotatypes[i]);
246         }
247         return (0);
248 }
249
250 /*
251  * Check for a valid change to a users allocation.
252  * Issue an error message if appropriate.
253  */
254 static int
255 chkdqchg(struct inode *ip, ufs2_daddr_t change, struct ucred *cred,
256     int type, int *warn)
257 {
258         struct dquot *dq = ip->i_dquot[type];
259         ufs2_daddr_t ncurblocks = dq->dq_curblocks + change;
260
261         /*
262          * If user would exceed their hard limit, disallow space allocation.
263          */
264         if (ncurblocks >= dq->dq_bhardlimit && dq->dq_bhardlimit) {
265                 if ((dq->dq_flags & DQ_BLKS) == 0 &&
266                     ip->i_uid == cred->cr_uid) {
267                         dq->dq_flags |= DQ_BLKS;
268                         DQI_UNLOCK(dq);
269                         uprintf("\n%s: write failed, %s disk limit reached\n",
270                             ITOVFS(ip)->mnt_stat.f_mntonname,
271                             quotatypes[type]);
272                         return (EDQUOT);
273                 }
274                 DQI_UNLOCK(dq);
275                 return (EDQUOT);
276         }
277         /*
278          * If user is over their soft limit for too long, disallow space
279          * allocation. Reset time limit as they cross their soft limit.
280          */
281         if (ncurblocks >= dq->dq_bsoftlimit && dq->dq_bsoftlimit) {
282                 if (dq->dq_curblocks < dq->dq_bsoftlimit) {
283                         dq->dq_btime = time_second + ITOUMP(ip)->um_btime[type];
284                         if (ip->i_uid == cred->cr_uid)
285                                 *warn = 1;
286                         return (0);
287                 }
288                 if (time_second > dq->dq_btime) {
289                         if ((dq->dq_flags & DQ_BLKS) == 0 &&
290                             ip->i_uid == cred->cr_uid) {
291                                 dq->dq_flags |= DQ_BLKS;
292                                 DQI_UNLOCK(dq);
293                                 uprintf("\n%s: write failed, %s "
294                                     "disk quota exceeded for too long\n",
295                                     ITOVFS(ip)->mnt_stat.f_mntonname,
296                                     quotatypes[type]);
297                                 return (EDQUOT);
298                         }
299                         DQI_UNLOCK(dq);
300                         return (EDQUOT);
301                 }
302         }
303         return (0);
304 }
305
306 /*
307  * Check the inode limit, applying corrective action.
308  */
309 int
310 chkiq(struct inode *ip, int change, struct ucred *cred, int flags)
311 {
312         struct dquot *dq;
313         int i, error, warn, do_check;
314
315         MPASS(cred != NOCRED || (flags & FORCE) != 0);
316 #ifdef DIAGNOSTIC
317         if ((flags & CHOWN) == 0)
318                 chkdquot(ip);
319 #endif
320         if (change == 0)
321                 return (0);
322         if (change < 0) {
323                 for (i = 0; i < MAXQUOTAS; i++) {
324                         if ((dq = ip->i_dquot[i]) == NODQUOT)
325                                 continue;
326                         DQI_LOCK(dq);
327                         DQI_WAIT(dq, PINOD+1, "chkiq1");
328                         if (dq->dq_curinodes >= -change)
329                                 dq->dq_curinodes += change;
330                         else
331                                 dq->dq_curinodes = 0;
332                         dq->dq_flags &= ~DQ_INODS;
333                         dq->dq_flags |= DQ_MOD;
334                         DQI_UNLOCK(dq);
335                 }
336                 return (0);
337         }
338         if ((flags & FORCE) == 0 &&
339             priv_check_cred(cred, PRIV_VFS_EXCEEDQUOTA))
340                 do_check = 1;
341         else
342                 do_check = 0;
343         for (i = 0; i < MAXQUOTAS; i++) {
344                 if ((dq = ip->i_dquot[i]) == NODQUOT)
345                         continue;
346                 warn = 0;
347                 DQI_LOCK(dq);
348                 DQI_WAIT(dq, PINOD+1, "chkiq2");
349                 if (do_check) {
350                         error = chkiqchg(ip, change, cred, i, &warn);
351                         if (error) {
352                                 /*
353                                  * Roll back user quota changes when
354                                  * group quota failed.
355                                  */
356                                 while (i > 0) {
357                                         --i;
358                                         dq = ip->i_dquot[i];
359                                         if (dq == NODQUOT)
360                                                 continue;
361                                         DQI_LOCK(dq);
362                                         DQI_WAIT(dq, PINOD+1, "chkiq3");
363                                         if (dq->dq_curinodes >= change)
364                                                 dq->dq_curinodes -= change;
365                                         else
366                                                 dq->dq_curinodes = 0;
367                                         dq->dq_flags &= ~DQ_INODS;
368                                         dq->dq_flags |= DQ_MOD;
369                                         DQI_UNLOCK(dq);
370                                 }
371                                 return (error);
372                         }
373                 }
374                 /* Reset timer when crossing soft limit */
375                 if (dq->dq_curinodes + change >= dq->dq_isoftlimit &&
376                     dq->dq_curinodes < dq->dq_isoftlimit)
377                         dq->dq_itime = time_second + ITOUMP(ip)->um_itime[i];
378                 dq->dq_curinodes += change;
379                 dq->dq_flags |= DQ_MOD;
380                 DQI_UNLOCK(dq);
381                 if (warn)
382                         uprintf("\n%s: warning, %s inode quota exceeded\n",
383                             ITOVFS(ip)->mnt_stat.f_mntonname,
384                             quotatypes[i]);
385         }
386         return (0);
387 }
388
389 /*
390  * Check for a valid change to a users allocation.
391  * Issue an error message if appropriate.
392  */
393 static int
394 chkiqchg(struct inode *ip, int change, struct ucred *cred, int type, int *warn)
395 {
396         struct dquot *dq = ip->i_dquot[type];
397         ino_t ncurinodes = dq->dq_curinodes + change;
398
399         /*
400          * If user would exceed their hard limit, disallow inode allocation.
401          */
402         if (ncurinodes >= dq->dq_ihardlimit && dq->dq_ihardlimit) {
403                 if ((dq->dq_flags & DQ_INODS) == 0 &&
404                     ip->i_uid == cred->cr_uid) {
405                         dq->dq_flags |= DQ_INODS;
406                         DQI_UNLOCK(dq);
407                         uprintf("\n%s: write failed, %s inode limit reached\n",
408                             ITOVFS(ip)->mnt_stat.f_mntonname,
409                             quotatypes[type]);
410                         return (EDQUOT);
411                 }
412                 DQI_UNLOCK(dq);
413                 return (EDQUOT);
414         }
415         /*
416          * If user is over their soft limit for too long, disallow inode
417          * allocation. Reset time limit as they cross their soft limit.
418          */
419         if (ncurinodes >= dq->dq_isoftlimit && dq->dq_isoftlimit) {
420                 if (dq->dq_curinodes < dq->dq_isoftlimit) {
421                         dq->dq_itime = time_second + ITOUMP(ip)->um_itime[type];
422                         if (ip->i_uid == cred->cr_uid)
423                                 *warn = 1;
424                         return (0);
425                 }
426                 if (time_second > dq->dq_itime) {
427                         if ((dq->dq_flags & DQ_INODS) == 0 &&
428                             ip->i_uid == cred->cr_uid) {
429                                 dq->dq_flags |= DQ_INODS;
430                                 DQI_UNLOCK(dq);
431                                 uprintf("\n%s: write failed, %s "
432                                     "inode quota exceeded for too long\n",
433                                     ITOVFS(ip)->mnt_stat.f_mntonname,
434                                     quotatypes[type]);
435                                 return (EDQUOT);
436                         }
437                         DQI_UNLOCK(dq);
438                         return (EDQUOT);
439                 }
440         }
441         return (0);
442 }
443
444 #ifdef DIAGNOSTIC
445 /*
446  * On filesystems with quotas enabled, it is an error for a file to change
447  * size and not to have a dquot structure associated with it.
448  */
449 static void
450 chkdquot(struct inode *ip)
451 {
452         struct ufsmount *ump;
453         struct vnode *vp;
454         int i;
455
456         ump = ITOUMP(ip);
457         vp = ITOV(ip);
458
459         /*
460          * Disk quotas must be turned off for system files.  Currently
461          * these are snapshots and quota files.
462          */
463         if ((vp->v_vflag & VV_SYSTEM) != 0)
464                 return;
465         /*
466          * XXX: Turn off quotas for files with a negative UID or GID.
467          * This prevents the creation of 100GB+ quota files.
468          */
469         if ((int)ip->i_uid < 0 || (int)ip->i_gid < 0)
470                 return;
471
472         UFS_LOCK(ump);
473         for (i = 0; i < MAXQUOTAS; i++) {
474                 if (ump->um_quotas[i] == NULLVP ||
475                     (ump->um_qflags[i] & (QTF_OPENING|QTF_CLOSING)))
476                         continue;
477                 if (ip->i_dquot[i] == NODQUOT) {
478                         UFS_UNLOCK(ump);
479                         vn_printf(ITOV(ip), "chkdquot: missing dquot ");
480                         panic("chkdquot: missing dquot");
481                 }
482         }
483         UFS_UNLOCK(ump);
484 }
485 #endif
486
487 /*
488  * Code to process quotactl commands.
489  */
490
491 /*
492  * Q_QUOTAON - set up a quota file for a particular filesystem.
493  */
494 int
495 quotaon(struct thread *td, struct mount *mp, int type, void *fname,
496     bool *mp_busy)
497 {
498         struct ufsmount *ump;
499         struct vnode *vp, **vpp;
500         struct vnode *mvp;
501         struct dquot *dq;
502         int error, flags;
503         struct nameidata nd;
504
505         error = priv_check(td, PRIV_UFS_QUOTAON);
506         if (error != 0)
507                 return (error);
508
509         if ((mp->mnt_flag & MNT_RDONLY) != 0)
510                 return (EROFS);
511
512         ump = VFSTOUFS(mp);
513         dq = NODQUOT;
514
515         NDINIT(&nd, LOOKUP, FOLLOW, UIO_USERSPACE, fname);
516         flags = FREAD | FWRITE;
517         vfs_ref(mp);
518         KASSERT(*mp_busy, ("%s called without busied mount", __func__));
519         vfs_unbusy(mp);
520         *mp_busy = false;
521         error = vn_open(&nd, &flags, 0, NULL);
522         if (error != 0) {
523                 vfs_rel(mp);
524                 return (error);
525         }
526         NDFREE_PNBUF(&nd);
527         vp = nd.ni_vp;
528         error = vfs_busy(mp, MBF_NOWAIT);
529         vfs_rel(mp);
530         if (error == 0) {
531                 *mp_busy = true;
532                 if (vp->v_type != VREG)
533                         error = EACCES;
534         }
535         if (error != 0) {
536                 VOP_UNLOCK(vp);
537                 (void) vn_close(vp, FREAD|FWRITE, td->td_ucred, td);
538                 return (error);
539         }
540
541         UFS_LOCK(ump);
542         if ((ump->um_qflags[type] & (QTF_OPENING|QTF_CLOSING)) != 0) {
543                 UFS_UNLOCK(ump);
544                 VOP_UNLOCK(vp);
545                 (void) vn_close(vp, FREAD|FWRITE, td->td_ucred, td);
546                 return (EALREADY);
547         }
548         ump->um_qflags[type] |= QTF_OPENING|QTF_CLOSING;
549         UFS_UNLOCK(ump);
550         if ((error = dqopen(vp, ump, type)) != 0) {
551                 VOP_UNLOCK(vp);
552                 UFS_LOCK(ump);
553                 ump->um_qflags[type] &= ~(QTF_OPENING|QTF_CLOSING);
554                 UFS_UNLOCK(ump);
555                 (void) vn_close(vp, FREAD|FWRITE, td->td_ucred, td);
556                 return (error);
557         }
558         VOP_UNLOCK(vp);
559         MNT_ILOCK(mp);
560         mp->mnt_flag |= MNT_QUOTA;
561         mp->mnt_stat.f_flags |= MNT_QUOTA;
562         MNT_IUNLOCK(mp);
563
564         vpp = &ump->um_quotas[type];
565         if (*vpp != vp)
566                 quotaoff1(td, mp, type);
567
568         /*
569          * When the directory vnode containing the quota file is
570          * inactivated, due to the shared lookup of the quota file
571          * vput()ing the dvp, the qsyncvp() call for the containing
572          * directory would try to acquire the quota lock exclusive.
573          * At the same time, lookup already locked the quota vnode
574          * shared.  Mark the quota vnode lock as allowing recursion
575          * and automatically converting shared locks to exclusive.
576          *
577          * Also mark quota vnode as system.
578          */
579         vn_lock(vp, LK_EXCLUSIVE | LK_RETRY);
580         vp->v_vflag |= VV_SYSTEM;
581         VN_LOCK_AREC(vp);
582         VN_LOCK_DSHARE(vp);
583         VOP_UNLOCK(vp);
584         *vpp = vp;
585         /*
586          * Save the credential of the process that turned on quotas.
587          * Set up the time limits for this quota.
588          */
589         ump->um_cred[type] = crhold(td->td_ucred);
590         ump->um_btime[type] = MAX_DQ_TIME;
591         ump->um_itime[type] = MAX_IQ_TIME;
592         if (dqget(NULLVP, 0, ump, type, &dq) == 0) {
593                 if (dq->dq_btime > 0)
594                         ump->um_btime[type] = dq->dq_btime;
595                 if (dq->dq_itime > 0)
596                         ump->um_itime[type] = dq->dq_itime;
597                 dqrele(NULLVP, dq);
598         }
599         /*
600          * Allow the getdq from getinoquota below to read the quota
601          * from file.
602          */
603         UFS_LOCK(ump);
604         ump->um_qflags[type] &= ~QTF_CLOSING;
605         UFS_UNLOCK(ump);
606         /*
607          * Search vnodes associated with this mount point,
608          * adding references to quota file being opened.
609          * NB: only need to add dquot's for inodes being modified.
610          */
611 again:
612         MNT_VNODE_FOREACH_ALL(vp, mp, mvp) {
613                 if (vget(vp, LK_EXCLUSIVE | LK_INTERLOCK)) {
614                         MNT_VNODE_FOREACH_ALL_ABORT(mp, mvp);
615                         goto again;
616                 }
617                 if (vp->v_type == VNON || vp->v_writecount <= 0) {
618                         VOP_UNLOCK(vp);
619                         vrele(vp);
620                         continue;
621                 }
622                 error = getinoquota(VTOI(vp));
623                 VOP_UNLOCK(vp);
624                 vrele(vp);
625                 if (error) {
626                         MNT_VNODE_FOREACH_ALL_ABORT(mp, mvp);
627                         break;
628                 }
629         }
630
631         if (error)
632                 quotaoff_inchange(td, mp, type);
633         UFS_LOCK(ump);
634         ump->um_qflags[type] &= ~QTF_OPENING;
635         KASSERT((ump->um_qflags[type] & QTF_CLOSING) == 0,
636                 ("quotaon: leaking flags"));
637         UFS_UNLOCK(ump);
638
639         return (error);
640 }
641
642 /*
643  * Main code to turn off disk quotas for a filesystem. Does not change
644  * flags.
645  */
646 static int
647 quotaoff1(struct thread *td, struct mount *mp, int type)
648 {
649         struct vnode *vp;
650         struct vnode *qvp, *mvp;
651         struct ufsmount *ump;
652         struct dquot *dq;
653         struct inode *ip;
654         struct ucred *cr;
655         int error;
656
657         ump = VFSTOUFS(mp);
658
659         UFS_LOCK(ump);
660         KASSERT((ump->um_qflags[type] & QTF_CLOSING) != 0,
661                 ("quotaoff1: flags are invalid"));
662         if ((qvp = ump->um_quotas[type]) == NULLVP) {
663                 UFS_UNLOCK(ump);
664                 return (0);
665         }
666         cr = ump->um_cred[type];
667         UFS_UNLOCK(ump);
668
669         /*
670          * Search vnodes associated with this mount point,
671          * deleting any references to quota file being closed.
672          */
673 again:
674         MNT_VNODE_FOREACH_ALL(vp, mp, mvp) {
675                 if (vp->v_type == VNON) {
676                         VI_UNLOCK(vp);
677                         continue;
678                 }
679                 if (vget(vp, LK_EXCLUSIVE | LK_INTERLOCK)) {
680                         MNT_VNODE_FOREACH_ALL_ABORT(mp, mvp);
681                         goto again;
682                 }
683                 ip = VTOI(vp);
684                 dq = ip->i_dquot[type];
685                 ip->i_dquot[type] = NODQUOT;
686                 dqrele(vp, dq);
687                 VOP_UNLOCK(vp);
688                 vrele(vp);
689         }
690
691         error = dqflush(qvp);
692         if (error != 0)
693                 return (error);
694
695         /*
696          * Clear um_quotas before closing the quota vnode to prevent
697          * access to the closed vnode from dqget/dqsync
698          */
699         UFS_LOCK(ump);
700         ump->um_quotas[type] = NULLVP;
701         ump->um_cred[type] = NOCRED;
702         UFS_UNLOCK(ump);
703
704         vn_lock(qvp, LK_EXCLUSIVE | LK_RETRY);
705         qvp->v_vflag &= ~VV_SYSTEM;
706         VOP_UNLOCK(qvp);
707         error = vn_close(qvp, FREAD|FWRITE, td->td_ucred, td);
708         crfree(cr);
709
710         return (error);
711 }
712
713 static int
714 quotaoff_inchange1(struct thread *td, struct mount *mp, int type)
715 {
716         int error;
717         bool need_resume;
718
719         /*
720          * mp is already suspended on unmount.  If not, suspend it, to
721          * avoid the situation where quotaoff operation eventually
722          * failing due to SU structures still keeping references on
723          * dquots, but vnode's references are already clean.  This
724          * would cause quota accounting leak and asserts otherwise.
725          * Note that the thread has already called vn_start_write().
726          */
727         if (mp->mnt_susp_owner == td) {
728                 need_resume = false;
729         } else {
730                 error = vfs_write_suspend_umnt(mp);
731                 if (error != 0)
732                         return (error);
733                 need_resume = true;
734         }
735         error = quotaoff1(td, mp, type);
736         if (need_resume)
737                 vfs_write_resume(mp, VR_START_WRITE);
738         return (error);
739 }
740
741 /*
742  * Turns off quotas, assumes that ump->um_qflags are already checked
743  * and QTF_CLOSING is set to indicate operation in progress. Fixes
744  * ump->um_qflags and mp->mnt_flag after.
745  */
746 int
747 quotaoff_inchange(struct thread *td, struct mount *mp, int type)
748 {
749         struct ufsmount *ump;
750         int error, i;
751
752         error = quotaoff_inchange1(td, mp, type);
753
754         ump = VFSTOUFS(mp);
755         UFS_LOCK(ump);
756         ump->um_qflags[type] &= ~QTF_CLOSING;
757         for (i = 0; i < MAXQUOTAS; i++)
758                 if (ump->um_quotas[i] != NULLVP)
759                         break;
760         if (i == MAXQUOTAS) {
761                 MNT_ILOCK(mp);
762                 mp->mnt_flag &= ~MNT_QUOTA;
763                 mp->mnt_stat.f_flags &= ~MNT_QUOTA;
764                 MNT_IUNLOCK(mp);
765         }
766         UFS_UNLOCK(ump);
767         return (error);
768 }
769
770 /*
771  * Q_QUOTAOFF - turn off disk quotas for a filesystem.
772  */
773 int
774 quotaoff(struct thread *td, struct mount *mp, int type)
775 {
776         struct ufsmount *ump;
777         int error;
778
779         error = priv_check(td, PRIV_UFS_QUOTAOFF);
780         if (error)
781                 return (error);
782
783         ump = VFSTOUFS(mp);
784         UFS_LOCK(ump);
785         if ((ump->um_qflags[type] & (QTF_OPENING|QTF_CLOSING)) != 0) {
786                 UFS_UNLOCK(ump);
787                 return (EALREADY);
788         }
789         ump->um_qflags[type] |= QTF_CLOSING;
790         UFS_UNLOCK(ump);
791
792         return (quotaoff_inchange(td, mp, type));
793 }
794
795 /*
796  * Q_GETQUOTA - return current values in a dqblk structure.
797  */
798 static int
799 _getquota(struct thread *td, struct mount *mp, u_long id, int type,
800     struct dqblk64 *dqb)
801 {
802         struct dquot *dq;
803         int error;
804
805         switch (type) {
806         case USRQUOTA:
807                 if ((td->td_ucred->cr_uid != id) && !unprivileged_get_quota) {
808                         error = priv_check(td, PRIV_VFS_GETQUOTA);
809                         if (error)
810                                 return (error);
811                 }
812                 break;
813
814         case GRPQUOTA:
815                 if (!groupmember(id, td->td_ucred) &&
816                     !unprivileged_get_quota) {
817                         error = priv_check(td, PRIV_VFS_GETQUOTA);
818                         if (error)
819                                 return (error);
820                 }
821                 break;
822
823         default:
824                 return (EINVAL);
825         }
826
827         dq = NODQUOT;
828         error = dqget(NULLVP, id, VFSTOUFS(mp), type, &dq);
829         if (error)
830                 return (error);
831         *dqb = dq->dq_dqb;
832         dqrele(NULLVP, dq);
833         return (error);
834 }
835
836 /*
837  * Q_SETQUOTA - assign an entire dqblk structure.
838  */
839 static int
840 _setquota(struct thread *td, struct mount *mp, u_long id, int type,
841     struct dqblk64 *dqb)
842 {
843         struct dquot *dq;
844         struct dquot *ndq;
845         struct ufsmount *ump;
846         struct dqblk64 newlim;
847         int error;
848
849         error = priv_check(td, PRIV_VFS_SETQUOTA);
850         if (error)
851                 return (error);
852
853         newlim = *dqb;
854
855         ndq = NODQUOT;
856         ump = VFSTOUFS(mp);
857
858         error = dqget(NULLVP, id, ump, type, &ndq);
859         if (error)
860                 return (error);
861         dq = ndq;
862         DQI_LOCK(dq);
863         DQI_WAIT(dq, PINOD+1, "setqta");
864         /*
865          * Copy all but the current values.
866          * Reset time limit if previously had no soft limit or were
867          * under it, but now have a soft limit and are over it.
868          */
869         newlim.dqb_curblocks = dq->dq_curblocks;
870         newlim.dqb_curinodes = dq->dq_curinodes;
871         if (dq->dq_id != 0) {
872                 newlim.dqb_btime = dq->dq_btime;
873                 newlim.dqb_itime = dq->dq_itime;
874         }
875         if (newlim.dqb_bsoftlimit &&
876             dq->dq_curblocks >= newlim.dqb_bsoftlimit &&
877             (dq->dq_bsoftlimit == 0 || dq->dq_curblocks < dq->dq_bsoftlimit))
878                 newlim.dqb_btime = time_second + ump->um_btime[type];
879         if (newlim.dqb_isoftlimit &&
880             dq->dq_curinodes >= newlim.dqb_isoftlimit &&
881             (dq->dq_isoftlimit == 0 || dq->dq_curinodes < dq->dq_isoftlimit))
882                 newlim.dqb_itime = time_second + ump->um_itime[type];
883         dq->dq_dqb = newlim;
884         if (dq->dq_curblocks < dq->dq_bsoftlimit)
885                 dq->dq_flags &= ~DQ_BLKS;
886         if (dq->dq_curinodes < dq->dq_isoftlimit)
887                 dq->dq_flags &= ~DQ_INODS;
888         if (dq->dq_isoftlimit == 0 && dq->dq_bsoftlimit == 0 &&
889             dq->dq_ihardlimit == 0 && dq->dq_bhardlimit == 0)
890                 dq->dq_flags |= DQ_FAKE;
891         else
892                 dq->dq_flags &= ~DQ_FAKE;
893         dq->dq_flags |= DQ_MOD;
894         DQI_UNLOCK(dq);
895         dqrele(NULLVP, dq);
896         return (0);
897 }
898
899 /*
900  * Q_SETUSE - set current inode and block usage.
901  */
902 static int
903 _setuse(struct thread *td, struct mount *mp, u_long id, int type,
904     struct dqblk64 *dqb)
905 {
906         struct dquot *dq;
907         struct ufsmount *ump;
908         struct dquot *ndq;
909         struct dqblk64 usage;
910         int error;
911
912         error = priv_check(td, PRIV_UFS_SETUSE);
913         if (error)
914                 return (error);
915
916         usage = *dqb;
917
918         ump = VFSTOUFS(mp);
919         ndq = NODQUOT;
920
921         error = dqget(NULLVP, id, ump, type, &ndq);
922         if (error)
923                 return (error);
924         dq = ndq;
925         DQI_LOCK(dq);
926         DQI_WAIT(dq, PINOD+1, "setuse");
927         /*
928          * Reset time limit if have a soft limit and were
929          * previously under it, but are now over it.
930          */
931         if (dq->dq_bsoftlimit && dq->dq_curblocks < dq->dq_bsoftlimit &&
932             usage.dqb_curblocks >= dq->dq_bsoftlimit)
933                 dq->dq_btime = time_second + ump->um_btime[type];
934         if (dq->dq_isoftlimit && dq->dq_curinodes < dq->dq_isoftlimit &&
935             usage.dqb_curinodes >= dq->dq_isoftlimit)
936                 dq->dq_itime = time_second + ump->um_itime[type];
937         dq->dq_curblocks = usage.dqb_curblocks;
938         dq->dq_curinodes = usage.dqb_curinodes;
939         if (dq->dq_curblocks < dq->dq_bsoftlimit)
940                 dq->dq_flags &= ~DQ_BLKS;
941         if (dq->dq_curinodes < dq->dq_isoftlimit)
942                 dq->dq_flags &= ~DQ_INODS;
943         dq->dq_flags |= DQ_MOD;
944         DQI_UNLOCK(dq);
945         dqrele(NULLVP, dq);
946         return (0);
947 }
948
949 int
950 getquota32(struct thread *td, struct mount *mp, u_long id, int type, void *addr)
951 {
952         struct dqblk32 dqb32;
953         struct dqblk64 dqb64;
954         int error;
955
956         error = _getquota(td, mp, id, type, &dqb64);
957         if (error)
958                 return (error);
959         dqb64_dqb32(&dqb64, &dqb32);
960         error = copyout(&dqb32, addr, sizeof(dqb32));
961         return (error);
962 }
963
964 int
965 setquota32(struct thread *td, struct mount *mp, u_long id, int type, void *addr)
966 {
967         struct dqblk32 dqb32;
968         struct dqblk64 dqb64;
969         int error;
970
971         error = copyin(addr, &dqb32, sizeof(dqb32));
972         if (error)
973                 return (error);
974         dqb32_dqb64(&dqb32, &dqb64);
975         error = _setquota(td, mp, id, type, &dqb64);
976         return (error);
977 }
978
979 int
980 setuse32(struct thread *td, struct mount *mp, u_long id, int type, void *addr)
981 {
982         struct dqblk32 dqb32;
983         struct dqblk64 dqb64;
984         int error;
985
986         error = copyin(addr, &dqb32, sizeof(dqb32));
987         if (error)
988                 return (error);
989         dqb32_dqb64(&dqb32, &dqb64);
990         error = _setuse(td, mp, id, type, &dqb64);
991         return (error);
992 }
993
994 int
995 getquota(struct thread *td, struct mount *mp, u_long id, int type, void *addr)
996 {
997         struct dqblk64 dqb64;
998         int error;
999
1000         error = _getquota(td, mp, id, type, &dqb64);
1001         if (error)
1002                 return (error);
1003         error = copyout(&dqb64, addr, sizeof(dqb64));
1004         return (error);
1005 }
1006
1007 int
1008 setquota(struct thread *td, struct mount *mp, u_long id, int type, void *addr)
1009 {
1010         struct dqblk64 dqb64;
1011         int error;
1012
1013         error = copyin(addr, &dqb64, sizeof(dqb64));
1014         if (error)
1015                 return (error);
1016         error = _setquota(td, mp, id, type, &dqb64);
1017         return (error);
1018 }
1019
1020 int
1021 setuse(struct thread *td, struct mount *mp, u_long id, int type, void *addr)
1022 {
1023         struct dqblk64 dqb64;
1024         int error;
1025
1026         error = copyin(addr, &dqb64, sizeof(dqb64));
1027         if (error)
1028                 return (error);
1029         error = _setuse(td, mp, id, type, &dqb64);
1030         return (error);
1031 }
1032
1033 /*
1034  * Q_GETQUOTASIZE - get bit-size of quota file fields
1035  */
1036 int
1037 getquotasize(struct thread *td, struct mount *mp, u_long id, int type,
1038     void *sizep)
1039 {
1040         struct ufsmount *ump = VFSTOUFS(mp);
1041         int bitsize;
1042
1043         UFS_LOCK(ump);
1044         if (ump->um_quotas[type] == NULLVP ||
1045             (ump->um_qflags[type] & QTF_CLOSING)) {
1046                 UFS_UNLOCK(ump);
1047                 return (EINVAL);
1048         }
1049         if ((ump->um_qflags[type] & QTF_64BIT) != 0)
1050                 bitsize = 64;
1051         else
1052                 bitsize = 32;
1053         UFS_UNLOCK(ump);
1054         return (copyout(&bitsize, sizep, sizeof(int)));
1055 }
1056
1057 /*
1058  * Q_SYNC - sync quota files to disk.
1059  */
1060 int
1061 qsync(struct mount *mp)
1062 {
1063         struct ufsmount *ump = VFSTOUFS(mp);
1064         struct vnode *vp, *mvp;
1065         struct dquot *dq;
1066         int i, error;
1067
1068         /*
1069          * Check if the mount point has any quotas.
1070          * If not, simply return.
1071          */
1072         for (i = 0; i < MAXQUOTAS; i++)
1073                 if (ump->um_quotas[i] != NULLVP)
1074                         break;
1075         if (i == MAXQUOTAS)
1076                 return (0);
1077         /*
1078          * Search vnodes associated with this mount point,
1079          * synchronizing any modified dquot structures.
1080          */
1081 again:
1082         MNT_VNODE_FOREACH_ALL(vp, mp, mvp) {
1083                 if (vp->v_type == VNON) {
1084                         VI_UNLOCK(vp);
1085                         continue;
1086                 }
1087                 error = vget(vp, LK_EXCLUSIVE | LK_INTERLOCK);
1088                 if (error) {
1089                         if (error == ENOENT) {
1090                                 MNT_VNODE_FOREACH_ALL_ABORT(mp, mvp);
1091                                 goto again;
1092                         }
1093                         continue;
1094                 }
1095                 for (i = 0; i < MAXQUOTAS; i++) {
1096                         dq = VTOI(vp)->i_dquot[i];
1097                         if (dq != NODQUOT)
1098                                 dqsync(vp, dq);
1099                 }
1100                 vput(vp);
1101         }
1102         return (0);
1103 }
1104
1105 /*
1106  * Sync quota file for given vnode to disk.
1107  */
1108 int
1109 qsyncvp(struct vnode *vp)
1110 {
1111         struct ufsmount *ump = VFSTOUFS(vp->v_mount);
1112         struct dquot *dq;
1113         int i;
1114
1115         /*
1116          * Check if the mount point has any quotas.
1117          * If not, simply return.
1118          */
1119         for (i = 0; i < MAXQUOTAS; i++)
1120                 if (ump->um_quotas[i] != NULLVP)
1121                         break;
1122         if (i == MAXQUOTAS)
1123                 return (0);
1124         /*
1125          * Search quotas associated with this vnode
1126          * synchronizing any modified dquot structures.
1127          */
1128         for (i = 0; i < MAXQUOTAS; i++) {
1129                 dq = VTOI(vp)->i_dquot[i];
1130                 if (dq != NODQUOT)
1131                         dqsync(vp, dq);
1132         }
1133         return (0);
1134 }
1135
1136 /*
1137  * Code pertaining to management of the in-core dquot data structures.
1138  */
1139 #define DQHASH(dqvp, id) \
1140         (&dqhashtbl[((((intptr_t)(dqvp)) >> 8) + id) & dqhash])
1141 static LIST_HEAD(dqhash, dquot) *dqhashtbl;
1142 static u_long dqhash;
1143
1144 /*
1145  * Dquot free list.
1146  */
1147 #define DQUOTINC        5       /* minimum free dquots desired */
1148 static TAILQ_HEAD(dqfreelist, dquot) dqfreelist;
1149 static long numdquot, desireddquot = DQUOTINC;
1150
1151 /*
1152  * Lock to protect quota hash, dq free list and dq_cnt ref counters of
1153  * _all_ dqs.
1154  */
1155 struct mtx dqhlock;
1156
1157 #define DQH_LOCK()      mtx_lock(&dqhlock)
1158 #define DQH_UNLOCK()    mtx_unlock(&dqhlock)
1159
1160 static struct dquot *dqhashfind(struct dqhash *dqh, u_long id,
1161         struct vnode *dqvp);
1162
1163 /*
1164  * Initialize the quota system.
1165  */
1166 void
1167 dqinit(void)
1168 {
1169
1170         mtx_init(&dqhlock, "dqhlock", NULL, MTX_DEF);
1171         dqhashtbl = hashinit(desiredvnodes, M_DQUOT, &dqhash);
1172         TAILQ_INIT(&dqfreelist);
1173 }
1174
1175 /*
1176  * Shut down the quota system.
1177  */
1178 void
1179 dquninit(void)
1180 {
1181         struct dquot *dq;
1182
1183         hashdestroy(dqhashtbl, M_DQUOT, dqhash);
1184         while ((dq = TAILQ_FIRST(&dqfreelist)) != NULL) {
1185                 TAILQ_REMOVE(&dqfreelist, dq, dq_freelist);
1186                 mtx_destroy(&dq->dq_lock);
1187                 free(dq, M_DQUOT);
1188         }
1189         mtx_destroy(&dqhlock);
1190 }
1191
1192 static struct dquot *
1193 dqhashfind(struct dqhash *dqh, u_long id, struct vnode *dqvp)
1194 {
1195         struct dquot *dq;
1196
1197         mtx_assert(&dqhlock, MA_OWNED);
1198         LIST_FOREACH(dq, dqh, dq_hash) {
1199                 if (dq->dq_id != id ||
1200                     dq->dq_ump->um_quotas[dq->dq_type] != dqvp)
1201                         continue;
1202                 /*
1203                  * Cache hit with no references.  Take
1204                  * the structure off the free list.
1205                  */
1206                 if (dq->dq_cnt == 0)
1207                         TAILQ_REMOVE(&dqfreelist, dq, dq_freelist);
1208                 DQREF(dq);
1209                 return (dq);
1210         }
1211         return (NODQUOT);
1212 }
1213
1214 /*
1215  * Determine the quota file type.
1216  *
1217  * A 32-bit quota file is simply an array of struct dqblk32.
1218  *
1219  * A 64-bit quota file is a struct dqhdr64 followed by an array of struct
1220  * dqblk64.  The header contains various magic bits which allow us to be
1221  * reasonably confident that it is indeeda 64-bit quota file and not just
1222  * a 32-bit quota file that just happens to "look right".
1223  *
1224  */
1225 static int
1226 dqopen(struct vnode *vp, struct ufsmount *ump, int type)
1227 {
1228         struct dqhdr64 dqh;
1229         struct iovec aiov;
1230         struct uio auio;
1231         int error;
1232
1233         ASSERT_VOP_LOCKED(vp, "dqopen");
1234         auio.uio_iov = &aiov;
1235         auio.uio_iovcnt = 1;
1236         aiov.iov_base = &dqh;
1237         aiov.iov_len = sizeof(dqh);
1238         auio.uio_resid = sizeof(dqh);
1239         auio.uio_offset = 0;
1240         auio.uio_segflg = UIO_SYSSPACE;
1241         auio.uio_rw = UIO_READ;
1242         auio.uio_td = (struct thread *)0;
1243         error = VOP_READ(vp, &auio, 0, ump->um_cred[type]);
1244
1245         if (error != 0)
1246                 return (error);
1247         if (auio.uio_resid > 0) {
1248                 /* assume 32 bits */
1249                 return (0);
1250         }
1251
1252         UFS_LOCK(ump);
1253         if (strcmp(dqh.dqh_magic, Q_DQHDR64_MAGIC) == 0 &&
1254             be32toh(dqh.dqh_version) == Q_DQHDR64_VERSION &&
1255             be32toh(dqh.dqh_hdrlen) == (uint32_t)sizeof(struct dqhdr64) &&
1256             be32toh(dqh.dqh_reclen) == (uint32_t)sizeof(struct dqblk64)) {
1257                 /* XXX: what if the magic matches, but the sizes are wrong? */
1258                 ump->um_qflags[type] |= QTF_64BIT;
1259         } else {
1260                 ump->um_qflags[type] &= ~QTF_64BIT;
1261         }
1262         UFS_UNLOCK(ump);
1263
1264         return (0);
1265 }
1266
1267 /*
1268  * Obtain a dquot structure for the specified identifier and quota file
1269  * reading the information from the file if necessary.
1270  */
1271 static int
1272 dqget(struct vnode *vp, u_long id, struct ufsmount *ump, int type,
1273     struct dquot **dqp)
1274 {
1275         uint8_t buf[sizeof(struct dqblk64)];
1276         off_t base, recsize;
1277         struct dquot *dq, *dq1;
1278         struct dqhash *dqh;
1279         struct vnode *dqvp;
1280         struct iovec aiov;
1281         struct uio auio;
1282         int dqvplocked, error;
1283
1284 #ifdef DEBUG_VFS_LOCKS
1285         if (vp != NULLVP)
1286                 ASSERT_VOP_ELOCKED(vp, "dqget");
1287 #endif
1288
1289         if (vp != NULLVP && *dqp != NODQUOT) {
1290                 return (0);
1291         }
1292
1293         /* XXX: Disallow negative id values to prevent the
1294         * creation of 100GB+ quota data files.
1295         */
1296         if ((int)id < 0)
1297                 return (EINVAL);
1298
1299         UFS_LOCK(ump);
1300         dqvp = ump->um_quotas[type];
1301         if (dqvp == NULLVP || (ump->um_qflags[type] & QTF_CLOSING)) {
1302                 *dqp = NODQUOT;
1303                 UFS_UNLOCK(ump);
1304                 return (EINVAL);
1305         }
1306         vref(dqvp);
1307         UFS_UNLOCK(ump);
1308         error = 0;
1309         dqvplocked = 0;
1310
1311         /*
1312          * Check the cache first.
1313          */
1314         dqh = DQHASH(dqvp, id);
1315         DQH_LOCK();
1316         dq = dqhashfind(dqh, id, dqvp);
1317         if (dq != NULL) {
1318                 DQH_UNLOCK();
1319 hfound:         DQI_LOCK(dq);
1320                 DQI_WAIT(dq, PINOD+1, "dqget");
1321                 DQI_UNLOCK(dq);
1322                 if (dq->dq_ump == NULL) {
1323                         dqrele(vp, dq);
1324                         dq = NODQUOT;
1325                         error = EIO;
1326                 }
1327                 *dqp = dq;
1328                 if (dqvplocked)
1329                         vput(dqvp);
1330                 else
1331                         vrele(dqvp);
1332                 return (error);
1333         }
1334
1335         /*
1336          * Quota vnode lock is before DQ_LOCK. Acquire dqvp lock there
1337          * since new dq will appear on the hash chain DQ_LOCKed.
1338          */
1339         if (vp != dqvp) {
1340                 DQH_UNLOCK();
1341                 vn_lock(dqvp, LK_SHARED | LK_RETRY);
1342                 dqvplocked = 1;
1343                 DQH_LOCK();
1344                 /*
1345                  * Recheck the cache after sleep for quota vnode lock.
1346                  */
1347                 dq = dqhashfind(dqh, id, dqvp);
1348                 if (dq != NULL) {
1349                         DQH_UNLOCK();
1350                         goto hfound;
1351                 }
1352         }
1353
1354         /*
1355          * Not in cache, allocate a new one or take it from the
1356          * free list.
1357          */
1358         if (TAILQ_FIRST(&dqfreelist) == NODQUOT &&
1359             numdquot < MAXQUOTAS * desiredvnodes)
1360                 desireddquot += DQUOTINC;
1361         if (numdquot < desireddquot) {
1362                 numdquot++;
1363                 DQH_UNLOCK();
1364                 dq1 = malloc(sizeof *dq1, M_DQUOT, M_WAITOK | M_ZERO);
1365                 mtx_init(&dq1->dq_lock, "dqlock", NULL, MTX_DEF);
1366                 DQH_LOCK();
1367                 /*
1368                  * Recheck the cache after sleep for memory.
1369                  */
1370                 dq = dqhashfind(dqh, id, dqvp);
1371                 if (dq != NULL) {
1372                         numdquot--;
1373                         DQH_UNLOCK();
1374                         mtx_destroy(&dq1->dq_lock);
1375                         free(dq1, M_DQUOT);
1376                         goto hfound;
1377                 }
1378                 dq = dq1;
1379         } else {
1380                 if ((dq = TAILQ_FIRST(&dqfreelist)) == NULL) {
1381                         DQH_UNLOCK();
1382                         tablefull("dquot");
1383                         *dqp = NODQUOT;
1384                         if (dqvplocked)
1385                                 vput(dqvp);
1386                         else
1387                                 vrele(dqvp);
1388                         return (EUSERS);
1389                 }
1390                 if (dq->dq_cnt || (dq->dq_flags & DQ_MOD))
1391                         panic("dqget: free dquot isn't %p", dq);
1392                 TAILQ_REMOVE(&dqfreelist, dq, dq_freelist);
1393                 if (dq->dq_ump != NULL)
1394                         LIST_REMOVE(dq, dq_hash);
1395         }
1396
1397         /*
1398          * Dq is put into hash already locked to prevent parallel
1399          * usage while it is being read from file.
1400          */
1401         dq->dq_flags = DQ_LOCK;
1402         dq->dq_id = id;
1403         dq->dq_type = type;
1404         dq->dq_ump = ump;
1405         LIST_INSERT_HEAD(dqh, dq, dq_hash);
1406         DQREF(dq);
1407         DQH_UNLOCK();
1408
1409         /*
1410          * Read the requested quota record from the quota file, performing
1411          * any necessary conversions.
1412          */
1413         if (ump->um_qflags[type] & QTF_64BIT) {
1414                 recsize = sizeof(struct dqblk64);
1415                 base = sizeof(struct dqhdr64);
1416         } else {
1417                 recsize = sizeof(struct dqblk32);
1418                 base = 0;
1419         }
1420         auio.uio_iov = &aiov;
1421         auio.uio_iovcnt = 1;
1422         aiov.iov_base = buf;
1423         aiov.iov_len = recsize;
1424         auio.uio_resid = recsize;
1425         auio.uio_offset = base + id * recsize;
1426         auio.uio_segflg = UIO_SYSSPACE;
1427         auio.uio_rw = UIO_READ;
1428         auio.uio_td = (struct thread *)0;
1429
1430         error = VOP_READ(dqvp, &auio, 0, ump->um_cred[type]);
1431         if (auio.uio_resid == recsize && error == 0) {
1432                 bzero(&dq->dq_dqb, sizeof(dq->dq_dqb));
1433         } else {
1434                 if (ump->um_qflags[type] & QTF_64BIT)
1435                         dqb64_dq((struct dqblk64 *)buf, dq);
1436                 else
1437                         dqb32_dq((struct dqblk32 *)buf, dq);
1438         }
1439         if (dqvplocked)
1440                 vput(dqvp);
1441         else
1442                 vrele(dqvp);
1443         /*
1444          * I/O error in reading quota file, release
1445          * quota structure and reflect problem to caller.
1446          */
1447         if (error) {
1448                 DQH_LOCK();
1449                 dq->dq_ump = NULL;
1450                 LIST_REMOVE(dq, dq_hash);
1451                 DQH_UNLOCK();
1452                 DQI_LOCK(dq);
1453                 if (dq->dq_flags & DQ_WANT)
1454                         wakeup(dq);
1455                 dq->dq_flags = 0;
1456                 DQI_UNLOCK(dq);
1457                 dqrele(vp, dq);
1458                 *dqp = NODQUOT;
1459                 return (error);
1460         }
1461         DQI_LOCK(dq);
1462         /*
1463          * Check for no limit to enforce.
1464          * Initialize time values if necessary.
1465          */
1466         if (dq->dq_isoftlimit == 0 && dq->dq_bsoftlimit == 0 &&
1467             dq->dq_ihardlimit == 0 && dq->dq_bhardlimit == 0)
1468                 dq->dq_flags |= DQ_FAKE;
1469         if (dq->dq_id != 0) {
1470                 if (dq->dq_btime == 0) {
1471                         dq->dq_btime = time_second + ump->um_btime[type];
1472                         if (dq->dq_bsoftlimit &&
1473                             dq->dq_curblocks >= dq->dq_bsoftlimit)
1474                                 dq->dq_flags |= DQ_MOD;
1475                 }
1476                 if (dq->dq_itime == 0) {
1477                         dq->dq_itime = time_second + ump->um_itime[type];
1478                         if (dq->dq_isoftlimit &&
1479                             dq->dq_curinodes >= dq->dq_isoftlimit)
1480                                 dq->dq_flags |= DQ_MOD;
1481                 }
1482         }
1483         DQI_WAKEUP(dq);
1484         DQI_UNLOCK(dq);
1485         *dqp = dq;
1486         return (0);
1487 }
1488
1489 #ifdef DIAGNOSTIC
1490 /*
1491  * Obtain a reference to a dquot.
1492  */
1493 static void
1494 dqref(struct dquot *dq)
1495 {
1496
1497         dq->dq_cnt++;
1498 }
1499 #endif
1500
1501 /*
1502  * Release a reference to a dquot.
1503  */
1504 void
1505 dqrele(struct vnode *vp, struct dquot *dq)
1506 {
1507
1508         if (dq == NODQUOT)
1509                 return;
1510         DQH_LOCK();
1511         KASSERT(dq->dq_cnt > 0, ("Lost dq %p reference 1", dq));
1512         if (dq->dq_cnt > 1) {
1513                 dq->dq_cnt--;
1514                 DQH_UNLOCK();
1515                 return;
1516         }
1517         DQH_UNLOCK();
1518 sync:
1519         (void) dqsync(vp, dq);
1520
1521         DQH_LOCK();
1522         KASSERT(dq->dq_cnt > 0, ("Lost dq %p reference 2", dq));
1523         if (--dq->dq_cnt > 0)
1524         {
1525                 DQH_UNLOCK();
1526                 return;
1527         }
1528
1529         /*
1530          * The dq may become dirty after it is synced but before it is
1531          * put to the free list. Checking the DQ_MOD there without
1532          * locking dq should be safe since no other references to the
1533          * dq exist.
1534          */
1535         if ((dq->dq_flags & DQ_MOD) != 0) {
1536                 dq->dq_cnt++;
1537                 DQH_UNLOCK();
1538                 goto sync;
1539         }
1540         TAILQ_INSERT_TAIL(&dqfreelist, dq, dq_freelist);
1541         DQH_UNLOCK();
1542 }
1543
1544 /*
1545  * Update the disk quota in the quota file.
1546  */
1547 static int
1548 dqsync(struct vnode *vp, struct dquot *dq)
1549 {
1550         uint8_t buf[sizeof(struct dqblk64)];
1551         off_t base, recsize;
1552         struct vnode *dqvp;
1553         struct iovec aiov;
1554         struct uio auio;
1555         int error;
1556         struct mount *mp;
1557         struct ufsmount *ump;
1558
1559 #ifdef DEBUG_VFS_LOCKS
1560         if (vp != NULL)
1561                 ASSERT_VOP_ELOCKED(vp, "dqsync");
1562 #endif
1563
1564         mp = NULL;
1565         error = 0;
1566         if (dq == NODQUOT)
1567                 panic("dqsync: dquot");
1568         if ((ump = dq->dq_ump) == NULL)
1569                 return (0);
1570         UFS_LOCK(ump);
1571         if ((dqvp = ump->um_quotas[dq->dq_type]) == NULLVP) {
1572                 if (vp == NULL) {
1573                         UFS_UNLOCK(ump);
1574                         return (0);
1575                 } else
1576                         panic("dqsync: file");
1577         }
1578         vref(dqvp);
1579         UFS_UNLOCK(ump);
1580
1581         DQI_LOCK(dq);
1582         if ((dq->dq_flags & DQ_MOD) == 0) {
1583                 DQI_UNLOCK(dq);
1584                 vrele(dqvp);
1585                 return (0);
1586         }
1587         DQI_UNLOCK(dq);
1588
1589         (void) vn_start_secondary_write(dqvp, &mp, V_WAIT);
1590         if (vp != dqvp)
1591                 vn_lock(dqvp, LK_EXCLUSIVE | LK_RETRY);
1592
1593         DQI_LOCK(dq);
1594         DQI_WAIT(dq, PINOD+2, "dqsync");
1595         if ((dq->dq_flags & DQ_MOD) == 0)
1596                 goto out;
1597         dq->dq_flags |= DQ_LOCK;
1598         DQI_UNLOCK(dq);
1599
1600         /*
1601          * Write the quota record to the quota file, performing any
1602          * necessary conversions.  See dqget() for additional details.
1603          */
1604         if (ump->um_qflags[dq->dq_type] & QTF_64BIT) {
1605                 dq_dqb64(dq, (struct dqblk64 *)buf);
1606                 recsize = sizeof(struct dqblk64);
1607                 base = sizeof(struct dqhdr64);
1608         } else {
1609                 dq_dqb32(dq, (struct dqblk32 *)buf);
1610                 recsize = sizeof(struct dqblk32);
1611                 base = 0;
1612         }
1613
1614         auio.uio_iov = &aiov;
1615         auio.uio_iovcnt = 1;
1616         aiov.iov_base = buf;
1617         aiov.iov_len = recsize;
1618         auio.uio_resid = recsize;
1619         auio.uio_offset = base + dq->dq_id * recsize;
1620         auio.uio_segflg = UIO_SYSSPACE;
1621         auio.uio_rw = UIO_WRITE;
1622         auio.uio_td = (struct thread *)0;
1623         error = VOP_WRITE(dqvp, &auio, 0, dq->dq_ump->um_cred[dq->dq_type]);
1624         if (auio.uio_resid && error == 0)
1625                 error = EIO;
1626
1627         DQI_LOCK(dq);
1628         DQI_WAKEUP(dq);
1629         dq->dq_flags &= ~DQ_MOD;
1630 out:
1631         DQI_UNLOCK(dq);
1632         if (vp != dqvp)
1633                 vput(dqvp);
1634         else
1635                 vrele(dqvp);
1636         vn_finished_secondary_write(mp);
1637         return (error);
1638 }
1639
1640 /*
1641  * Flush all entries from the cache for a particular vnode.
1642  */
1643 static int
1644 dqflush(struct vnode *vp)
1645 {
1646         struct dquot *dq, *nextdq;
1647         struct dqhash *dqh;
1648         int error;
1649
1650         /*
1651          * Move all dquot's that used to refer to this quota
1652          * file off their hash chains (they will eventually
1653          * fall off the head of the free list and be re-used).
1654          */
1655         error = 0;
1656         DQH_LOCK();
1657         for (dqh = &dqhashtbl[dqhash]; dqh >= dqhashtbl; dqh--) {
1658                 for (dq = LIST_FIRST(dqh); dq; dq = nextdq) {
1659                         nextdq = LIST_NEXT(dq, dq_hash);
1660                         if (dq->dq_ump->um_quotas[dq->dq_type] != vp)
1661                                 continue;
1662                         if (dq->dq_cnt)
1663                                 error = EBUSY;
1664                         else {
1665                                 LIST_REMOVE(dq, dq_hash);
1666                                 dq->dq_ump = NULL;
1667                         }
1668                 }
1669         }
1670         DQH_UNLOCK();
1671         return (error);
1672 }
1673
1674 /*
1675  * The following three functions are provided for the adjustment of
1676  * quotas by the soft updates code.
1677  */
1678 #ifdef SOFTUPDATES
1679 /*
1680  * Acquire a reference to the quota structures associated with a vnode.
1681  * Return count of number of quota structures found.
1682  */
1683 int
1684 quotaref(vp, qrp)
1685         struct vnode *vp;
1686         struct dquot **qrp;
1687 {
1688         struct inode *ip;
1689         struct dquot *dq;
1690         int i, found;
1691
1692         for (i = 0; i < MAXQUOTAS; i++)
1693                 qrp[i] = NODQUOT;
1694         /*
1695          * Disk quotas must be turned off for system files.  Currently
1696          * snapshot and quota files.
1697          */
1698         if ((vp->v_vflag & VV_SYSTEM) != 0)
1699                 return (0);
1700         /*
1701          * Iterate through and copy active quotas.
1702          */
1703         found = 0;
1704         ip = VTOI(vp);
1705         mtx_lock(&dqhlock);
1706         for (i = 0; i < MAXQUOTAS; i++) {
1707                 if ((dq = ip->i_dquot[i]) == NODQUOT)
1708                         continue;
1709                 DQREF(dq);
1710                 qrp[i] = dq;
1711                 found++;
1712         }
1713         mtx_unlock(&dqhlock);
1714         return (found);
1715 }
1716
1717 /*
1718  * Release a set of quota structures obtained from a vnode.
1719  */
1720 void
1721 quotarele(qrp)
1722         struct dquot **qrp;
1723 {
1724         struct dquot *dq;
1725         int i;
1726
1727         for (i = 0; i < MAXQUOTAS; i++) {
1728                 if ((dq = qrp[i]) == NODQUOT)
1729                         continue;
1730                 dqrele(NULL, dq);
1731         }
1732 }
1733
1734 /*
1735  * Adjust the number of blocks associated with a quota.
1736  * Positive numbers when adding blocks; negative numbers when freeing blocks.
1737  */
1738 void
1739 quotaadj(qrp, ump, blkcount)
1740         struct dquot **qrp;
1741         struct ufsmount *ump;
1742         int64_t blkcount;
1743 {
1744         struct dquot *dq;
1745         ufs2_daddr_t ncurblocks;
1746         int i;
1747
1748         if (blkcount == 0)
1749                 return;
1750         for (i = 0; i < MAXQUOTAS; i++) {
1751                 if ((dq = qrp[i]) == NODQUOT)
1752                         continue;
1753                 DQI_LOCK(dq);
1754                 DQI_WAIT(dq, PINOD+1, "adjqta");
1755                 ncurblocks = dq->dq_curblocks + blkcount;
1756                 if (ncurblocks >= 0)
1757                         dq->dq_curblocks = ncurblocks;
1758                 else
1759                         dq->dq_curblocks = 0;
1760                 if (blkcount < 0)
1761                         dq->dq_flags &= ~DQ_BLKS;
1762                 else if (dq->dq_curblocks + blkcount >= dq->dq_bsoftlimit &&
1763                          dq->dq_curblocks < dq->dq_bsoftlimit)
1764                         dq->dq_btime = time_second + ump->um_btime[i];
1765                 dq->dq_flags |= DQ_MOD;
1766                 DQI_UNLOCK(dq);
1767         }
1768 }
1769 #endif /* SOFTUPDATES */
1770
1771 /*
1772  * 32-bit / 64-bit conversion functions.
1773  *
1774  * 32-bit quota records are stored in native byte order.  Attention must
1775  * be paid to overflow issues.
1776  *
1777  * 64-bit quota records are stored in network byte order.
1778  */
1779
1780 #define CLIP32(u64) (u64 > UINT32_MAX ? UINT32_MAX : (uint32_t)u64)
1781
1782 /*
1783  * Convert 32-bit host-order structure to dquot.
1784  */
1785 static void
1786 dqb32_dq(const struct dqblk32 *dqb32, struct dquot *dq)
1787 {
1788
1789         dq->dq_bhardlimit = dqb32->dqb_bhardlimit;
1790         dq->dq_bsoftlimit = dqb32->dqb_bsoftlimit;
1791         dq->dq_curblocks = dqb32->dqb_curblocks;
1792         dq->dq_ihardlimit = dqb32->dqb_ihardlimit;
1793         dq->dq_isoftlimit = dqb32->dqb_isoftlimit;
1794         dq->dq_curinodes = dqb32->dqb_curinodes;
1795         dq->dq_btime = dqb32->dqb_btime;
1796         dq->dq_itime = dqb32->dqb_itime;
1797 }
1798
1799 /*
1800  * Convert 64-bit network-order structure to dquot.
1801  */
1802 static void
1803 dqb64_dq(const struct dqblk64 *dqb64, struct dquot *dq)
1804 {
1805
1806         dq->dq_bhardlimit = be64toh(dqb64->dqb_bhardlimit);
1807         dq->dq_bsoftlimit = be64toh(dqb64->dqb_bsoftlimit);
1808         dq->dq_curblocks = be64toh(dqb64->dqb_curblocks);
1809         dq->dq_ihardlimit = be64toh(dqb64->dqb_ihardlimit);
1810         dq->dq_isoftlimit = be64toh(dqb64->dqb_isoftlimit);
1811         dq->dq_curinodes = be64toh(dqb64->dqb_curinodes);
1812         dq->dq_btime = be64toh(dqb64->dqb_btime);
1813         dq->dq_itime = be64toh(dqb64->dqb_itime);
1814 }
1815
1816 /*
1817  * Convert dquot to 32-bit host-order structure.
1818  */
1819 static void
1820 dq_dqb32(const struct dquot *dq, struct dqblk32 *dqb32)
1821 {
1822
1823         dqb32->dqb_bhardlimit = CLIP32(dq->dq_bhardlimit);
1824         dqb32->dqb_bsoftlimit = CLIP32(dq->dq_bsoftlimit);
1825         dqb32->dqb_curblocks = CLIP32(dq->dq_curblocks);
1826         dqb32->dqb_ihardlimit = CLIP32(dq->dq_ihardlimit);
1827         dqb32->dqb_isoftlimit = CLIP32(dq->dq_isoftlimit);
1828         dqb32->dqb_curinodes = CLIP32(dq->dq_curinodes);
1829         dqb32->dqb_btime = CLIP32(dq->dq_btime);
1830         dqb32->dqb_itime = CLIP32(dq->dq_itime);
1831 }
1832
1833 /*
1834  * Convert dquot to 64-bit network-order structure.
1835  */
1836 static void
1837 dq_dqb64(const struct dquot *dq, struct dqblk64 *dqb64)
1838 {
1839
1840         dqb64->dqb_bhardlimit = htobe64(dq->dq_bhardlimit);
1841         dqb64->dqb_bsoftlimit = htobe64(dq->dq_bsoftlimit);
1842         dqb64->dqb_curblocks = htobe64(dq->dq_curblocks);
1843         dqb64->dqb_ihardlimit = htobe64(dq->dq_ihardlimit);
1844         dqb64->dqb_isoftlimit = htobe64(dq->dq_isoftlimit);
1845         dqb64->dqb_curinodes = htobe64(dq->dq_curinodes);
1846         dqb64->dqb_btime = htobe64(dq->dq_btime);
1847         dqb64->dqb_itime = htobe64(dq->dq_itime);
1848 }
1849
1850 /*
1851  * Convert 64-bit host-order structure to 32-bit host-order structure.
1852  */
1853 static void
1854 dqb64_dqb32(const struct dqblk64 *dqb64, struct dqblk32 *dqb32)
1855 {
1856
1857         dqb32->dqb_bhardlimit = CLIP32(dqb64->dqb_bhardlimit);
1858         dqb32->dqb_bsoftlimit = CLIP32(dqb64->dqb_bsoftlimit);
1859         dqb32->dqb_curblocks = CLIP32(dqb64->dqb_curblocks);
1860         dqb32->dqb_ihardlimit = CLIP32(dqb64->dqb_ihardlimit);
1861         dqb32->dqb_isoftlimit = CLIP32(dqb64->dqb_isoftlimit);
1862         dqb32->dqb_curinodes = CLIP32(dqb64->dqb_curinodes);
1863         dqb32->dqb_btime = CLIP32(dqb64->dqb_btime);
1864         dqb32->dqb_itime = CLIP32(dqb64->dqb_itime);
1865 }
1866
1867 /*
1868  * Convert 32-bit host-order structure to 64-bit host-order structure.
1869  */
1870 static void
1871 dqb32_dqb64(const struct dqblk32 *dqb32, struct dqblk64 *dqb64)
1872 {
1873
1874         dqb64->dqb_bhardlimit = dqb32->dqb_bhardlimit;
1875         dqb64->dqb_bsoftlimit = dqb32->dqb_bsoftlimit;
1876         dqb64->dqb_curblocks = dqb32->dqb_curblocks;
1877         dqb64->dqb_ihardlimit = dqb32->dqb_ihardlimit;
1878         dqb64->dqb_isoftlimit = dqb32->dqb_isoftlimit;
1879         dqb64->dqb_curinodes = dqb32->dqb_curinodes;
1880         dqb64->dqb_btime = dqb32->dqb_btime;
1881         dqb64->dqb_itime = dqb32->dqb_itime;
1882 }