]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - sys/ufs/ufs/ufs_quota.c
rtw88: Use RF_CFGCH instead of hard coded 0x18
[FreeBSD/FreeBSD.git] / sys / ufs / ufs / ufs_quota.c
1 /*-
2  * SPDX-License-Identifier: BSD-3-Clause
3  *
4  * Copyright (c) 1982, 1986, 1990, 1993, 1995
5  *      The Regents of the University of California.  All rights reserved.
6  *
7  * This code is derived from software contributed to Berkeley by
8  * Robert Elz at The University of Melbourne.
9  *
10  * Redistribution and use in source and binary forms, with or without
11  * modification, are permitted provided that the following conditions
12  * are met:
13  * 1. Redistributions of source code must retain the above copyright
14  *    notice, this list of conditions and the following disclaimer.
15  * 2. Redistributions in binary form must reproduce the above copyright
16  *    notice, this list of conditions and the following disclaimer in the
17  *    documentation and/or other materials provided with the distribution.
18  * 3. Neither the name of the University nor the names of its contributors
19  *    may be used to endorse or promote products derived from this software
20  *    without specific prior written permission.
21  *
22  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
23  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
24  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
25  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
26  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
27  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
28  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
29  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
30  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
31  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
32  * SUCH DAMAGE.
33  *
34  *      @(#)ufs_quota.c 8.5 (Berkeley) 5/20/95
35  */
36
37 #include <sys/cdefs.h>
38 #include "opt_ffs.h"
39
40 #include <sys/param.h>
41 #include <sys/systm.h>
42 #include <sys/endian.h>
43 #include <sys/fcntl.h>
44 #include <sys/kernel.h>
45 #include <sys/lock.h>
46 #include <sys/malloc.h>
47 #include <sys/mount.h>
48 #include <sys/mutex.h>
49 #include <sys/namei.h>
50 #include <sys/priv.h>
51 #include <sys/proc.h>
52 #include <sys/socket.h>
53 #include <sys/stat.h>
54 #include <sys/sysctl.h>
55 #include <sys/vnode.h>
56
57 #include <ufs/ufs/extattr.h>
58 #include <ufs/ufs/quota.h>
59 #include <ufs/ufs/inode.h>
60 #include <ufs/ufs/ufsmount.h>
61 #include <ufs/ufs/ufs_extern.h>
62
63 CTASSERT(sizeof(struct dqblk64) == sizeof(struct dqhdr64));
64
65 static int unprivileged_get_quota = 0;
66 SYSCTL_INT(_security_bsd, OID_AUTO, unprivileged_get_quota, CTLFLAG_RW,
67     &unprivileged_get_quota, 0,
68     "Unprivileged processes may retrieve quotas for other uids and gids");
69
70 static MALLOC_DEFINE(M_DQUOT, "ufs_quota", "UFS quota entries");
71
72 /*
73  * Quota name to error message mapping.
74  */
75 static char *quotatypes[] = INITQFNAMES;
76
77 static int chkdqchg(struct inode *, ufs2_daddr_t, struct ucred *, int, int *);
78 static int chkiqchg(struct inode *, int, struct ucred *, int, int *);
79 static int dqopen(struct vnode *, struct ufsmount *, int);
80 static int dqget(struct vnode *,
81         uint64_t, struct ufsmount *, int, struct dquot **);
82 static int dqsync(struct vnode *, struct dquot *);
83 static int dqflush(struct vnode *);
84 static int quotaoff1(struct thread *td, struct mount *mp, int type);
85 static int quotaoff_inchange(struct thread *td, struct mount *mp, int type);
86
87 /* conversion functions - from_to() */
88 static void dqb32_dq(const struct dqblk32 *, struct dquot *);
89 static void dqb64_dq(const struct dqblk64 *, struct dquot *);
90 static void dq_dqb32(const struct dquot *, struct dqblk32 *);
91 static void dq_dqb64(const struct dquot *, struct dqblk64 *);
92 static void dqb32_dqb64(const struct dqblk32 *, struct dqblk64 *);
93 static void dqb64_dqb32(const struct dqblk64 *, struct dqblk32 *);
94
95 #ifdef DIAGNOSTIC
96 static void dqref(struct dquot *);
97 static void chkdquot(struct inode *);
98 #endif
99
100 /*
101  * Set up the quotas for an inode.
102  *
103  * This routine completely defines the semantics of quotas.
104  * If other criterion want to be used to establish quotas, the
105  * MAXQUOTAS value in quota.h should be increased, and the
106  * additional dquots set up here.
107  */
108 int
109 getinoquota(struct inode *ip)
110 {
111         struct ufsmount *ump;
112         struct vnode *vp;
113         int error;
114
115         vp = ITOV(ip);
116
117         /*
118          * Disk quotas must be turned off for system files.  Currently
119          * snapshot and quota files.
120          */
121         if ((vp->v_vflag & VV_SYSTEM) != 0)
122                 return (0);
123         /*
124          * XXX: Turn off quotas for files with a negative UID or GID.
125          * This prevents the creation of 100GB+ quota files.
126          */
127         if ((int)ip->i_uid < 0 || (int)ip->i_gid < 0)
128                 return (0);
129         ump = VFSTOUFS(vp->v_mount);
130         /*
131          * Set up the user quota based on file uid.
132          * EINVAL means that quotas are not enabled.
133          */
134         if ((error =
135                 dqget(vp, ip->i_uid, ump, USRQUOTA, &ip->i_dquot[USRQUOTA])) &&
136             error != EINVAL)
137                 return (error);
138         /*
139          * Set up the group quota based on file gid.
140          * EINVAL means that quotas are not enabled.
141          */
142         if ((error =
143                 dqget(vp, ip->i_gid, ump, GRPQUOTA, &ip->i_dquot[GRPQUOTA])) &&
144             error != EINVAL)
145                 return (error);
146         return (0);
147 }
148
149 /*
150  * Update disk usage, and take corrective action.
151  */
152 int
153 chkdq(struct inode *ip, ufs2_daddr_t change, struct ucred *cred, int flags)
154 {
155         struct dquot *dq;
156         ufs2_daddr_t ncurblocks;
157         struct vnode *vp = ITOV(ip);
158         int i, error, warn, do_check;
159
160         MPASS(cred != NOCRED || (flags & FORCE) != 0);
161         /*
162          * Disk quotas must be turned off for system files.  Currently
163          * snapshot and quota files.
164          */
165         if ((vp->v_vflag & VV_SYSTEM) != 0)
166                 return (0);
167         /*
168          * XXX: Turn off quotas for files with a negative UID or GID.
169          * This prevents the creation of 100GB+ quota files.
170          */
171         if ((int)ip->i_uid < 0 || (int)ip->i_gid < 0)
172                 return (0);
173 #ifdef DIAGNOSTIC
174         if ((flags & CHOWN) == 0)
175                 chkdquot(ip);
176 #endif
177         if (change == 0)
178                 return (0);
179         if (change < 0) {
180                 for (i = 0; i < MAXQUOTAS; i++) {
181                         if ((dq = ip->i_dquot[i]) == NODQUOT)
182                                 continue;
183                         DQI_LOCK(dq);
184                         DQI_WAIT(dq, PINOD+1, "chkdq1");
185                         ncurblocks = dq->dq_curblocks + change;
186                         if (ncurblocks >= 0)
187                                 dq->dq_curblocks = ncurblocks;
188                         else
189                                 dq->dq_curblocks = 0;
190                         dq->dq_flags &= ~DQ_BLKS;
191                         dq->dq_flags |= DQ_MOD;
192                         DQI_UNLOCK(dq);
193                 }
194                 return (0);
195         }
196         if ((flags & FORCE) == 0 &&
197             priv_check_cred(cred, PRIV_VFS_EXCEEDQUOTA))
198                 do_check = 1;
199         else
200                 do_check = 0;
201         for (i = 0; i < MAXQUOTAS; i++) {
202                 if ((dq = ip->i_dquot[i]) == NODQUOT)
203                         continue;
204                 warn = 0;
205                 DQI_LOCK(dq);
206                 DQI_WAIT(dq, PINOD+1, "chkdq2");
207                 if (do_check) {
208                         error = chkdqchg(ip, change, cred, i, &warn);
209                         if (error) {
210                                 /*
211                                  * Roll back user quota changes when
212                                  * group quota failed.
213                                  */
214                                 while (i > 0) {
215                                         --i;
216                                         dq = ip->i_dquot[i];
217                                         if (dq == NODQUOT)
218                                                 continue;
219                                         DQI_LOCK(dq);
220                                         DQI_WAIT(dq, PINOD+1, "chkdq3");
221                                         ncurblocks = dq->dq_curblocks - change;
222                                         if (ncurblocks >= 0)
223                                                 dq->dq_curblocks = ncurblocks;
224                                         else
225                                                 dq->dq_curblocks = 0;
226                                         dq->dq_flags &= ~DQ_BLKS;
227                                         dq->dq_flags |= DQ_MOD;
228                                         DQI_UNLOCK(dq);
229                                 }
230                                 return (error);
231                         }
232                 }
233                 /* Reset timer when crossing soft limit */
234                 if (dq->dq_curblocks + change >= dq->dq_bsoftlimit &&
235                     dq->dq_curblocks < dq->dq_bsoftlimit)
236                         dq->dq_btime = time_second + ITOUMP(ip)->um_btime[i];
237                 dq->dq_curblocks += change;
238                 dq->dq_flags |= DQ_MOD;
239                 DQI_UNLOCK(dq);
240                 if (warn)
241                         uprintf("\n%s: warning, %s disk quota exceeded\n",
242                             ITOVFS(ip)->mnt_stat.f_mntonname,
243                             quotatypes[i]);
244         }
245         return (0);
246 }
247
248 /*
249  * Check for a valid change to a users allocation.
250  * Issue an error message if appropriate.
251  */
252 static int
253 chkdqchg(struct inode *ip, ufs2_daddr_t change, struct ucred *cred,
254     int type, int *warn)
255 {
256         struct dquot *dq = ip->i_dquot[type];
257         ufs2_daddr_t ncurblocks = dq->dq_curblocks + change;
258
259         /*
260          * If user would exceed their hard limit, disallow space allocation.
261          */
262         if (ncurblocks >= dq->dq_bhardlimit && dq->dq_bhardlimit) {
263                 if ((dq->dq_flags & DQ_BLKS) == 0 &&
264                     ip->i_uid == cred->cr_uid) {
265                         dq->dq_flags |= DQ_BLKS;
266                         DQI_UNLOCK(dq);
267                         uprintf("\n%s: write failed, %s disk limit reached\n",
268                             ITOVFS(ip)->mnt_stat.f_mntonname,
269                             quotatypes[type]);
270                         return (EDQUOT);
271                 }
272                 DQI_UNLOCK(dq);
273                 return (EDQUOT);
274         }
275         /*
276          * If user is over their soft limit for too long, disallow space
277          * allocation. Reset time limit as they cross their soft limit.
278          */
279         if (ncurblocks >= dq->dq_bsoftlimit && dq->dq_bsoftlimit) {
280                 if (dq->dq_curblocks < dq->dq_bsoftlimit) {
281                         dq->dq_btime = time_second + ITOUMP(ip)->um_btime[type];
282                         if (ip->i_uid == cred->cr_uid)
283                                 *warn = 1;
284                         return (0);
285                 }
286                 if (time_second > dq->dq_btime) {
287                         if ((dq->dq_flags & DQ_BLKS) == 0 &&
288                             ip->i_uid == cred->cr_uid) {
289                                 dq->dq_flags |= DQ_BLKS;
290                                 DQI_UNLOCK(dq);
291                                 uprintf("\n%s: write failed, %s "
292                                     "disk quota exceeded for too long\n",
293                                     ITOVFS(ip)->mnt_stat.f_mntonname,
294                                     quotatypes[type]);
295                                 return (EDQUOT);
296                         }
297                         DQI_UNLOCK(dq);
298                         return (EDQUOT);
299                 }
300         }
301         return (0);
302 }
303
304 /*
305  * Check the inode limit, applying corrective action.
306  */
307 int
308 chkiq(struct inode *ip, int change, struct ucred *cred, int flags)
309 {
310         struct dquot *dq;
311         int i, error, warn, do_check;
312
313         MPASS(cred != NOCRED || (flags & FORCE) != 0);
314 #ifdef DIAGNOSTIC
315         if ((flags & CHOWN) == 0)
316                 chkdquot(ip);
317 #endif
318         if (change == 0)
319                 return (0);
320         if (change < 0) {
321                 for (i = 0; i < MAXQUOTAS; i++) {
322                         if ((dq = ip->i_dquot[i]) == NODQUOT)
323                                 continue;
324                         DQI_LOCK(dq);
325                         DQI_WAIT(dq, PINOD+1, "chkiq1");
326                         if (dq->dq_curinodes >= -change)
327                                 dq->dq_curinodes += change;
328                         else
329                                 dq->dq_curinodes = 0;
330                         dq->dq_flags &= ~DQ_INODS;
331                         dq->dq_flags |= DQ_MOD;
332                         DQI_UNLOCK(dq);
333                 }
334                 return (0);
335         }
336         if ((flags & FORCE) == 0 &&
337             priv_check_cred(cred, PRIV_VFS_EXCEEDQUOTA))
338                 do_check = 1;
339         else
340                 do_check = 0;
341         for (i = 0; i < MAXQUOTAS; i++) {
342                 if ((dq = ip->i_dquot[i]) == NODQUOT)
343                         continue;
344                 warn = 0;
345                 DQI_LOCK(dq);
346                 DQI_WAIT(dq, PINOD+1, "chkiq2");
347                 if (do_check) {
348                         error = chkiqchg(ip, change, cred, i, &warn);
349                         if (error) {
350                                 /*
351                                  * Roll back user quota changes when
352                                  * group quota failed.
353                                  */
354                                 while (i > 0) {
355                                         --i;
356                                         dq = ip->i_dquot[i];
357                                         if (dq == NODQUOT)
358                                                 continue;
359                                         DQI_LOCK(dq);
360                                         DQI_WAIT(dq, PINOD+1, "chkiq3");
361                                         if (dq->dq_curinodes >= change)
362                                                 dq->dq_curinodes -= change;
363                                         else
364                                                 dq->dq_curinodes = 0;
365                                         dq->dq_flags &= ~DQ_INODS;
366                                         dq->dq_flags |= DQ_MOD;
367                                         DQI_UNLOCK(dq);
368                                 }
369                                 return (error);
370                         }
371                 }
372                 /* Reset timer when crossing soft limit */
373                 if (dq->dq_curinodes + change >= dq->dq_isoftlimit &&
374                     dq->dq_curinodes < dq->dq_isoftlimit)
375                         dq->dq_itime = time_second + ITOUMP(ip)->um_itime[i];
376                 dq->dq_curinodes += change;
377                 dq->dq_flags |= DQ_MOD;
378                 DQI_UNLOCK(dq);
379                 if (warn)
380                         uprintf("\n%s: warning, %s inode quota exceeded\n",
381                             ITOVFS(ip)->mnt_stat.f_mntonname,
382                             quotatypes[i]);
383         }
384         return (0);
385 }
386
387 /*
388  * Check for a valid change to a users allocation.
389  * Issue an error message if appropriate.
390  */
391 static int
392 chkiqchg(struct inode *ip, int change, struct ucred *cred, int type, int *warn)
393 {
394         struct dquot *dq = ip->i_dquot[type];
395         ino_t ncurinodes = dq->dq_curinodes + change;
396
397         /*
398          * If user would exceed their hard limit, disallow inode allocation.
399          */
400         if (ncurinodes >= dq->dq_ihardlimit && dq->dq_ihardlimit) {
401                 if ((dq->dq_flags & DQ_INODS) == 0 &&
402                     ip->i_uid == cred->cr_uid) {
403                         dq->dq_flags |= DQ_INODS;
404                         DQI_UNLOCK(dq);
405                         uprintf("\n%s: write failed, %s inode limit reached\n",
406                             ITOVFS(ip)->mnt_stat.f_mntonname,
407                             quotatypes[type]);
408                         return (EDQUOT);
409                 }
410                 DQI_UNLOCK(dq);
411                 return (EDQUOT);
412         }
413         /*
414          * If user is over their soft limit for too long, disallow inode
415          * allocation. Reset time limit as they cross their soft limit.
416          */
417         if (ncurinodes >= dq->dq_isoftlimit && dq->dq_isoftlimit) {
418                 if (dq->dq_curinodes < dq->dq_isoftlimit) {
419                         dq->dq_itime = time_second + ITOUMP(ip)->um_itime[type];
420                         if (ip->i_uid == cred->cr_uid)
421                                 *warn = 1;
422                         return (0);
423                 }
424                 if (time_second > dq->dq_itime) {
425                         if ((dq->dq_flags & DQ_INODS) == 0 &&
426                             ip->i_uid == cred->cr_uid) {
427                                 dq->dq_flags |= DQ_INODS;
428                                 DQI_UNLOCK(dq);
429                                 uprintf("\n%s: write failed, %s "
430                                     "inode quota exceeded for too long\n",
431                                     ITOVFS(ip)->mnt_stat.f_mntonname,
432                                     quotatypes[type]);
433                                 return (EDQUOT);
434                         }
435                         DQI_UNLOCK(dq);
436                         return (EDQUOT);
437                 }
438         }
439         return (0);
440 }
441
442 #ifdef DIAGNOSTIC
443 /*
444  * On filesystems with quotas enabled, it is an error for a file to change
445  * size and not to have a dquot structure associated with it.
446  */
447 static void
448 chkdquot(struct inode *ip)
449 {
450         struct ufsmount *ump;
451         struct vnode *vp;
452         int i;
453
454         ump = ITOUMP(ip);
455         vp = ITOV(ip);
456
457         /*
458          * Disk quotas must be turned off for system files.  Currently
459          * these are snapshots and quota files.
460          */
461         if ((vp->v_vflag & VV_SYSTEM) != 0)
462                 return;
463         /*
464          * XXX: Turn off quotas for files with a negative UID or GID.
465          * This prevents the creation of 100GB+ quota files.
466          */
467         if ((int)ip->i_uid < 0 || (int)ip->i_gid < 0)
468                 return;
469
470         UFS_LOCK(ump);
471         for (i = 0; i < MAXQUOTAS; i++) {
472                 if (ump->um_quotas[i] == NULLVP ||
473                     (ump->um_qflags[i] & (QTF_OPENING|QTF_CLOSING)))
474                         continue;
475                 if (ip->i_dquot[i] == NODQUOT) {
476                         UFS_UNLOCK(ump);
477                         vn_printf(ITOV(ip), "chkdquot: missing dquot ");
478                         panic("chkdquot: missing dquot");
479                 }
480         }
481         UFS_UNLOCK(ump);
482 }
483 #endif
484
485 /*
486  * Code to process quotactl commands.
487  */
488
489 /*
490  * Q_QUOTAON - set up a quota file for a particular filesystem.
491  */
492 int
493 quotaon(struct thread *td, struct mount *mp, int type, void *fname,
494     bool *mp_busy)
495 {
496         struct ufsmount *ump;
497         struct vnode *vp, **vpp;
498         struct vnode *mvp;
499         struct dquot *dq;
500         int error, flags;
501         struct nameidata nd;
502
503         error = priv_check(td, PRIV_UFS_QUOTAON);
504         if (error != 0)
505                 return (error);
506
507         if ((mp->mnt_flag & MNT_RDONLY) != 0)
508                 return (EROFS);
509
510         ump = VFSTOUFS(mp);
511         dq = NODQUOT;
512
513         NDINIT(&nd, LOOKUP, FOLLOW, UIO_USERSPACE, fname);
514         flags = FREAD | FWRITE;
515         vfs_ref(mp);
516         KASSERT(*mp_busy, ("%s called without busied mount", __func__));
517         vfs_unbusy(mp);
518         *mp_busy = false;
519         error = vn_open(&nd, &flags, 0, NULL);
520         if (error != 0) {
521                 vfs_rel(mp);
522                 return (error);
523         }
524         NDFREE_PNBUF(&nd);
525         vp = nd.ni_vp;
526         error = vfs_busy(mp, MBF_NOWAIT);
527         vfs_rel(mp);
528         if (error == 0) {
529                 *mp_busy = true;
530                 if (vp->v_type != VREG)
531                         error = EACCES;
532         }
533         if (error != 0) {
534                 VOP_UNLOCK(vp);
535                 (void) vn_close(vp, FREAD|FWRITE, td->td_ucred, td);
536                 return (error);
537         }
538
539         UFS_LOCK(ump);
540         if ((ump->um_qflags[type] & (QTF_OPENING|QTF_CLOSING)) != 0) {
541                 UFS_UNLOCK(ump);
542                 VOP_UNLOCK(vp);
543                 (void) vn_close(vp, FREAD|FWRITE, td->td_ucred, td);
544                 return (EALREADY);
545         }
546         ump->um_qflags[type] |= QTF_OPENING|QTF_CLOSING;
547         UFS_UNLOCK(ump);
548         if ((error = dqopen(vp, ump, type)) != 0) {
549                 VOP_UNLOCK(vp);
550                 UFS_LOCK(ump);
551                 ump->um_qflags[type] &= ~(QTF_OPENING|QTF_CLOSING);
552                 UFS_UNLOCK(ump);
553                 (void) vn_close(vp, FREAD|FWRITE, td->td_ucred, td);
554                 return (error);
555         }
556         VOP_UNLOCK(vp);
557         MNT_ILOCK(mp);
558         mp->mnt_flag |= MNT_QUOTA;
559         mp->mnt_stat.f_flags |= MNT_QUOTA;
560         MNT_IUNLOCK(mp);
561
562         vpp = &ump->um_quotas[type];
563         if (*vpp != vp)
564                 quotaoff1(td, mp, type);
565
566         /*
567          * When the directory vnode containing the quota file is
568          * inactivated, due to the shared lookup of the quota file
569          * vput()ing the dvp, the qsyncvp() call for the containing
570          * directory would try to acquire the quota lock exclusive.
571          * At the same time, lookup already locked the quota vnode
572          * shared.  Mark the quota vnode lock as allowing recursion
573          * and automatically converting shared locks to exclusive.
574          *
575          * Also mark quota vnode as system.
576          */
577         vn_lock(vp, LK_EXCLUSIVE | LK_RETRY);
578         vp->v_vflag |= VV_SYSTEM;
579         VN_LOCK_AREC(vp);
580         VN_LOCK_DSHARE(vp);
581         VOP_UNLOCK(vp);
582         *vpp = vp;
583         /*
584          * Save the credential of the process that turned on quotas.
585          * Set up the time limits for this quota.
586          */
587         ump->um_cred[type] = crhold(td->td_ucred);
588         ump->um_btime[type] = MAX_DQ_TIME;
589         ump->um_itime[type] = MAX_IQ_TIME;
590         if (dqget(NULLVP, 0, ump, type, &dq) == 0) {
591                 if (dq->dq_btime > 0)
592                         ump->um_btime[type] = dq->dq_btime;
593                 if (dq->dq_itime > 0)
594                         ump->um_itime[type] = dq->dq_itime;
595                 dqrele(NULLVP, dq);
596         }
597         /*
598          * Allow the getdq from getinoquota below to read the quota
599          * from file.
600          */
601         UFS_LOCK(ump);
602         ump->um_qflags[type] &= ~QTF_CLOSING;
603         UFS_UNLOCK(ump);
604         /*
605          * Search vnodes associated with this mount point,
606          * adding references to quota file being opened.
607          * NB: only need to add dquot's for inodes being modified.
608          */
609 again:
610         MNT_VNODE_FOREACH_ALL(vp, mp, mvp) {
611                 if (vget(vp, LK_EXCLUSIVE | LK_INTERLOCK)) {
612                         MNT_VNODE_FOREACH_ALL_ABORT(mp, mvp);
613                         goto again;
614                 }
615                 if (vp->v_type == VNON || vp->v_writecount <= 0) {
616                         vput(vp);
617                         continue;
618                 }
619                 error = getinoquota(VTOI(vp));
620                 vput(vp);
621                 if (error) {
622                         MNT_VNODE_FOREACH_ALL_ABORT(mp, mvp);
623                         break;
624                 }
625         }
626
627         if (error)
628                 quotaoff_inchange(td, mp, type);
629         UFS_LOCK(ump);
630         ump->um_qflags[type] &= ~QTF_OPENING;
631         KASSERT((ump->um_qflags[type] & QTF_CLOSING) == 0,
632                 ("quotaon: leaking flags"));
633         UFS_UNLOCK(ump);
634
635         return (error);
636 }
637
638 /*
639  * Main code to turn off disk quotas for a filesystem. Does not change
640  * flags.
641  */
642 static int
643 quotaoff1(struct thread *td, struct mount *mp, int type)
644 {
645         struct vnode *vp;
646         struct vnode *qvp, *mvp;
647         struct ufsmount *ump;
648         struct dquot *dq;
649         struct inode *ip;
650         struct ucred *cr;
651         int error;
652
653         ump = VFSTOUFS(mp);
654
655         UFS_LOCK(ump);
656         KASSERT((ump->um_qflags[type] & QTF_CLOSING) != 0,
657                 ("quotaoff1: flags are invalid"));
658         if ((qvp = ump->um_quotas[type]) == NULLVP) {
659                 UFS_UNLOCK(ump);
660                 return (0);
661         }
662         cr = ump->um_cred[type];
663         UFS_UNLOCK(ump);
664
665         /*
666          * Search vnodes associated with this mount point,
667          * deleting any references to quota file being closed.
668          */
669 again:
670         MNT_VNODE_FOREACH_ALL(vp, mp, mvp) {
671                 if (vp->v_type == VNON) {
672                         VI_UNLOCK(vp);
673                         continue;
674                 }
675                 if (vget(vp, LK_EXCLUSIVE | LK_INTERLOCK)) {
676                         MNT_VNODE_FOREACH_ALL_ABORT(mp, mvp);
677                         goto again;
678                 }
679                 ip = VTOI(vp);
680                 dq = ip->i_dquot[type];
681                 ip->i_dquot[type] = NODQUOT;
682                 dqrele(vp, dq);
683                 vput(vp);
684         }
685
686         error = dqflush(qvp);
687         if (error != 0)
688                 return (error);
689
690         /*
691          * Clear um_quotas before closing the quota vnode to prevent
692          * access to the closed vnode from dqget/dqsync
693          */
694         UFS_LOCK(ump);
695         ump->um_quotas[type] = NULLVP;
696         ump->um_cred[type] = NOCRED;
697         UFS_UNLOCK(ump);
698
699         vn_lock(qvp, LK_EXCLUSIVE | LK_RETRY);
700         qvp->v_vflag &= ~VV_SYSTEM;
701         VOP_UNLOCK(qvp);
702         error = vn_close(qvp, FREAD|FWRITE, td->td_ucred, td);
703         crfree(cr);
704
705         return (error);
706 }
707
708 static int
709 quotaoff_inchange1(struct thread *td, struct mount *mp, int type)
710 {
711         int error;
712         bool need_resume;
713
714         /*
715          * mp is already suspended on unmount.  If not, suspend it, to
716          * avoid the situation where quotaoff operation eventually
717          * failing due to SU structures still keeping references on
718          * dquots, but vnode's references are already clean.  This
719          * would cause quota accounting leak and asserts otherwise.
720          * Note that the thread has already called vn_start_write().
721          */
722         if (mp->mnt_susp_owner == td) {
723                 need_resume = false;
724         } else {
725                 error = vfs_write_suspend_umnt(mp);
726                 if (error != 0)
727                         return (error);
728                 need_resume = true;
729         }
730         error = quotaoff1(td, mp, type);
731         if (need_resume)
732                 vfs_write_resume(mp, VR_START_WRITE);
733         return (error);
734 }
735
736 /*
737  * Turns off quotas, assumes that ump->um_qflags are already checked
738  * and QTF_CLOSING is set to indicate operation in progress. Fixes
739  * ump->um_qflags and mp->mnt_flag after.
740  */
741 int
742 quotaoff_inchange(struct thread *td, struct mount *mp, int type)
743 {
744         struct ufsmount *ump;
745         int error, i;
746
747         error = quotaoff_inchange1(td, mp, type);
748
749         ump = VFSTOUFS(mp);
750         UFS_LOCK(ump);
751         ump->um_qflags[type] &= ~QTF_CLOSING;
752         for (i = 0; i < MAXQUOTAS; i++)
753                 if (ump->um_quotas[i] != NULLVP)
754                         break;
755         if (i == MAXQUOTAS) {
756                 MNT_ILOCK(mp);
757                 mp->mnt_flag &= ~MNT_QUOTA;
758                 mp->mnt_stat.f_flags &= ~MNT_QUOTA;
759                 MNT_IUNLOCK(mp);
760         }
761         UFS_UNLOCK(ump);
762         return (error);
763 }
764
765 /*
766  * Q_QUOTAOFF - turn off disk quotas for a filesystem.
767  */
768 int
769 quotaoff(struct thread *td, struct mount *mp, int type)
770 {
771         struct ufsmount *ump;
772         int error;
773
774         error = priv_check(td, PRIV_UFS_QUOTAOFF);
775         if (error)
776                 return (error);
777
778         ump = VFSTOUFS(mp);
779         UFS_LOCK(ump);
780         if ((ump->um_qflags[type] & (QTF_OPENING|QTF_CLOSING)) != 0) {
781                 UFS_UNLOCK(ump);
782                 return (EALREADY);
783         }
784         ump->um_qflags[type] |= QTF_CLOSING;
785         UFS_UNLOCK(ump);
786
787         return (quotaoff_inchange(td, mp, type));
788 }
789
790 /*
791  * Q_GETQUOTA - return current values in a dqblk structure.
792  */
793 static int
794 _getquota(struct thread *td, struct mount *mp, uint64_t id, int type,
795     struct dqblk64 *dqb)
796 {
797         struct dquot *dq;
798         int error;
799
800         switch (type) {
801         case USRQUOTA:
802                 if ((td->td_ucred->cr_uid != id) && !unprivileged_get_quota) {
803                         error = priv_check(td, PRIV_VFS_GETQUOTA);
804                         if (error)
805                                 return (error);
806                 }
807                 break;
808
809         case GRPQUOTA:
810                 if (!groupmember(id, td->td_ucred) &&
811                     !unprivileged_get_quota) {
812                         error = priv_check(td, PRIV_VFS_GETQUOTA);
813                         if (error)
814                                 return (error);
815                 }
816                 break;
817
818         default:
819                 return (EINVAL);
820         }
821
822         dq = NODQUOT;
823         error = dqget(NULLVP, id, VFSTOUFS(mp), type, &dq);
824         if (error)
825                 return (error);
826         *dqb = dq->dq_dqb;
827         dqrele(NULLVP, dq);
828         return (error);
829 }
830
831 /*
832  * Q_SETQUOTA - assign an entire dqblk structure.
833  */
834 static int
835 _setquota(struct thread *td, struct mount *mp, uint64_t id, int type,
836     struct dqblk64 *dqb)
837 {
838         struct dquot *dq;
839         struct dquot *ndq;
840         struct ufsmount *ump;
841         struct dqblk64 newlim;
842         int error;
843
844         error = priv_check(td, PRIV_VFS_SETQUOTA);
845         if (error)
846                 return (error);
847
848         newlim = *dqb;
849
850         ndq = NODQUOT;
851         ump = VFSTOUFS(mp);
852
853         error = dqget(NULLVP, id, ump, type, &ndq);
854         if (error)
855                 return (error);
856         dq = ndq;
857         DQI_LOCK(dq);
858         DQI_WAIT(dq, PINOD+1, "setqta");
859         /*
860          * Copy all but the current values.
861          * Reset time limit if previously had no soft limit or were
862          * under it, but now have a soft limit and are over it.
863          */
864         newlim.dqb_curblocks = dq->dq_curblocks;
865         newlim.dqb_curinodes = dq->dq_curinodes;
866         if (dq->dq_id != 0) {
867                 newlim.dqb_btime = dq->dq_btime;
868                 newlim.dqb_itime = dq->dq_itime;
869         }
870         if (newlim.dqb_bsoftlimit &&
871             dq->dq_curblocks >= newlim.dqb_bsoftlimit &&
872             (dq->dq_bsoftlimit == 0 || dq->dq_curblocks < dq->dq_bsoftlimit))
873                 newlim.dqb_btime = time_second + ump->um_btime[type];
874         if (newlim.dqb_isoftlimit &&
875             dq->dq_curinodes >= newlim.dqb_isoftlimit &&
876             (dq->dq_isoftlimit == 0 || dq->dq_curinodes < dq->dq_isoftlimit))
877                 newlim.dqb_itime = time_second + ump->um_itime[type];
878         dq->dq_dqb = newlim;
879         if (dq->dq_curblocks < dq->dq_bsoftlimit)
880                 dq->dq_flags &= ~DQ_BLKS;
881         if (dq->dq_curinodes < dq->dq_isoftlimit)
882                 dq->dq_flags &= ~DQ_INODS;
883         if (dq->dq_isoftlimit == 0 && dq->dq_bsoftlimit == 0 &&
884             dq->dq_ihardlimit == 0 && dq->dq_bhardlimit == 0)
885                 dq->dq_flags |= DQ_FAKE;
886         else
887                 dq->dq_flags &= ~DQ_FAKE;
888         dq->dq_flags |= DQ_MOD;
889         DQI_UNLOCK(dq);
890         dqrele(NULLVP, dq);
891         return (0);
892 }
893
894 /*
895  * Q_SETUSE - set current inode and block usage.
896  */
897 static int
898 _setuse(struct thread *td, struct mount *mp, uint64_t id, int type,
899     struct dqblk64 *dqb)
900 {
901         struct dquot *dq;
902         struct ufsmount *ump;
903         struct dquot *ndq;
904         struct dqblk64 usage;
905         int error;
906
907         error = priv_check(td, PRIV_UFS_SETUSE);
908         if (error)
909                 return (error);
910
911         usage = *dqb;
912
913         ump = VFSTOUFS(mp);
914         ndq = NODQUOT;
915
916         error = dqget(NULLVP, id, ump, type, &ndq);
917         if (error)
918                 return (error);
919         dq = ndq;
920         DQI_LOCK(dq);
921         DQI_WAIT(dq, PINOD+1, "setuse");
922         /*
923          * Reset time limit if have a soft limit and were
924          * previously under it, but are now over it.
925          */
926         if (dq->dq_bsoftlimit && dq->dq_curblocks < dq->dq_bsoftlimit &&
927             usage.dqb_curblocks >= dq->dq_bsoftlimit)
928                 dq->dq_btime = time_second + ump->um_btime[type];
929         if (dq->dq_isoftlimit && dq->dq_curinodes < dq->dq_isoftlimit &&
930             usage.dqb_curinodes >= dq->dq_isoftlimit)
931                 dq->dq_itime = time_second + ump->um_itime[type];
932         dq->dq_curblocks = usage.dqb_curblocks;
933         dq->dq_curinodes = usage.dqb_curinodes;
934         if (dq->dq_curblocks < dq->dq_bsoftlimit)
935                 dq->dq_flags &= ~DQ_BLKS;
936         if (dq->dq_curinodes < dq->dq_isoftlimit)
937                 dq->dq_flags &= ~DQ_INODS;
938         dq->dq_flags |= DQ_MOD;
939         DQI_UNLOCK(dq);
940         dqrele(NULLVP, dq);
941         return (0);
942 }
943
944 int
945 getquota32(struct thread *td, struct mount *mp, uint64_t id, int type,
946     void *addr)
947 {
948         struct dqblk32 dqb32;
949         struct dqblk64 dqb64;
950         int error;
951
952         error = _getquota(td, mp, id, type, &dqb64);
953         if (error)
954                 return (error);
955         dqb64_dqb32(&dqb64, &dqb32);
956         error = copyout(&dqb32, addr, sizeof(dqb32));
957         return (error);
958 }
959
960 int
961 setquota32(struct thread *td, struct mount *mp, uint64_t id, int type,
962     void *addr)
963 {
964         struct dqblk32 dqb32;
965         struct dqblk64 dqb64;
966         int error;
967
968         error = copyin(addr, &dqb32, sizeof(dqb32));
969         if (error)
970                 return (error);
971         dqb32_dqb64(&dqb32, &dqb64);
972         error = _setquota(td, mp, id, type, &dqb64);
973         return (error);
974 }
975
976 int
977 setuse32(struct thread *td, struct mount *mp, uint64_t id, int type, void *addr)
978 {
979         struct dqblk32 dqb32;
980         struct dqblk64 dqb64;
981         int error;
982
983         error = copyin(addr, &dqb32, sizeof(dqb32));
984         if (error)
985                 return (error);
986         dqb32_dqb64(&dqb32, &dqb64);
987         error = _setuse(td, mp, id, type, &dqb64);
988         return (error);
989 }
990
991 int
992 getquota(struct thread *td, struct mount *mp, uint64_t id, int type, void *addr)
993 {
994         struct dqblk64 dqb64;
995         int error;
996
997         error = _getquota(td, mp, id, type, &dqb64);
998         if (error)
999                 return (error);
1000         error = copyout(&dqb64, addr, sizeof(dqb64));
1001         return (error);
1002 }
1003
1004 int
1005 setquota(struct thread *td, struct mount *mp, uint64_t id, int type, void *addr)
1006 {
1007         struct dqblk64 dqb64;
1008         int error;
1009
1010         error = copyin(addr, &dqb64, sizeof(dqb64));
1011         if (error)
1012                 return (error);
1013         error = _setquota(td, mp, id, type, &dqb64);
1014         return (error);
1015 }
1016
1017 int
1018 setuse(struct thread *td, struct mount *mp, uint64_t id, int type, void *addr)
1019 {
1020         struct dqblk64 dqb64;
1021         int error;
1022
1023         error = copyin(addr, &dqb64, sizeof(dqb64));
1024         if (error)
1025                 return (error);
1026         error = _setuse(td, mp, id, type, &dqb64);
1027         return (error);
1028 }
1029
1030 /*
1031  * Q_GETQUOTASIZE - get bit-size of quota file fields
1032  */
1033 int
1034 getquotasize(struct thread *td, struct mount *mp, uint64_t id, int type,
1035     void *sizep)
1036 {
1037         struct ufsmount *ump = VFSTOUFS(mp);
1038         int bitsize;
1039
1040         UFS_LOCK(ump);
1041         if (ump->um_quotas[type] == NULLVP ||
1042             (ump->um_qflags[type] & QTF_CLOSING)) {
1043                 UFS_UNLOCK(ump);
1044                 return (EINVAL);
1045         }
1046         if ((ump->um_qflags[type] & QTF_64BIT) != 0)
1047                 bitsize = 64;
1048         else
1049                 bitsize = 32;
1050         UFS_UNLOCK(ump);
1051         return (copyout(&bitsize, sizep, sizeof(int)));
1052 }
1053
1054 /*
1055  * Q_SYNC - sync quota files to disk.
1056  */
1057 int
1058 qsync(struct mount *mp)
1059 {
1060         struct ufsmount *ump = VFSTOUFS(mp);
1061         struct vnode *vp, *mvp;
1062         struct dquot *dq;
1063         int i, error;
1064
1065         /*
1066          * Check if the mount point has any quotas.
1067          * If not, simply return.
1068          */
1069         for (i = 0; i < MAXQUOTAS; i++)
1070                 if (ump->um_quotas[i] != NULLVP)
1071                         break;
1072         if (i == MAXQUOTAS)
1073                 return (0);
1074         /*
1075          * Search vnodes associated with this mount point,
1076          * synchronizing any modified dquot structures.
1077          */
1078 again:
1079         MNT_VNODE_FOREACH_ALL(vp, mp, mvp) {
1080                 if (vp->v_type == VNON) {
1081                         VI_UNLOCK(vp);
1082                         continue;
1083                 }
1084                 error = vget(vp, LK_EXCLUSIVE | LK_INTERLOCK);
1085                 if (error) {
1086                         if (error == ENOENT) {
1087                                 MNT_VNODE_FOREACH_ALL_ABORT(mp, mvp);
1088                                 goto again;
1089                         }
1090                         continue;
1091                 }
1092                 for (i = 0; i < MAXQUOTAS; i++) {
1093                         dq = VTOI(vp)->i_dquot[i];
1094                         if (dq != NODQUOT)
1095                                 dqsync(vp, dq);
1096                 }
1097                 vput(vp);
1098         }
1099         return (0);
1100 }
1101
1102 /*
1103  * Sync quota file for given vnode to disk.
1104  */
1105 int
1106 qsyncvp(struct vnode *vp)
1107 {
1108         struct ufsmount *ump = VFSTOUFS(vp->v_mount);
1109         struct dquot *dq;
1110         int i;
1111
1112         /*
1113          * Check if the mount point has any quotas.
1114          * If not, simply return.
1115          */
1116         for (i = 0; i < MAXQUOTAS; i++)
1117                 if (ump->um_quotas[i] != NULLVP)
1118                         break;
1119         if (i == MAXQUOTAS)
1120                 return (0);
1121         /*
1122          * Search quotas associated with this vnode
1123          * synchronizing any modified dquot structures.
1124          */
1125         for (i = 0; i < MAXQUOTAS; i++) {
1126                 dq = VTOI(vp)->i_dquot[i];
1127                 if (dq != NODQUOT)
1128                         dqsync(vp, dq);
1129         }
1130         return (0);
1131 }
1132
1133 /*
1134  * Code pertaining to management of the in-core dquot data structures.
1135  */
1136 #define DQHASH(dqvp, id) \
1137         (&dqhashtbl[((((intptr_t)(dqvp)) >> 8) + id) & dqhash])
1138 static LIST_HEAD(dqhash, dquot) *dqhashtbl;
1139 static u_long dqhash;
1140
1141 /*
1142  * Dquot free list.
1143  */
1144 #define DQUOTINC        5       /* minimum free dquots desired */
1145 static TAILQ_HEAD(dqfreelist, dquot) dqfreelist;
1146 static long numdquot, desireddquot = DQUOTINC;
1147
1148 /*
1149  * Lock to protect quota hash, dq free list and dq_cnt ref counters of
1150  * _all_ dqs.
1151  */
1152 struct mtx dqhlock;
1153
1154 #define DQH_LOCK()      mtx_lock(&dqhlock)
1155 #define DQH_UNLOCK()    mtx_unlock(&dqhlock)
1156
1157 static struct dquot *dqhashfind(struct dqhash *dqh, uint64_t id,
1158         struct vnode *dqvp);
1159
1160 /*
1161  * Initialize the quota system.
1162  */
1163 void
1164 dqinit(void)
1165 {
1166
1167         mtx_init(&dqhlock, "dqhlock", NULL, MTX_DEF);
1168         dqhashtbl = hashinit(desiredvnodes, M_DQUOT, &dqhash);
1169         TAILQ_INIT(&dqfreelist);
1170 }
1171
1172 /*
1173  * Shut down the quota system.
1174  */
1175 void
1176 dquninit(void)
1177 {
1178         struct dquot *dq;
1179
1180         hashdestroy(dqhashtbl, M_DQUOT, dqhash);
1181         while ((dq = TAILQ_FIRST(&dqfreelist)) != NULL) {
1182                 TAILQ_REMOVE(&dqfreelist, dq, dq_freelist);
1183                 mtx_destroy(&dq->dq_lock);
1184                 free(dq, M_DQUOT);
1185         }
1186         mtx_destroy(&dqhlock);
1187 }
1188
1189 static struct dquot *
1190 dqhashfind(struct dqhash *dqh, uint64_t id, struct vnode *dqvp)
1191 {
1192         struct dquot *dq;
1193
1194         mtx_assert(&dqhlock, MA_OWNED);
1195         LIST_FOREACH(dq, dqh, dq_hash) {
1196                 if (dq->dq_id != id ||
1197                     dq->dq_ump->um_quotas[dq->dq_type] != dqvp)
1198                         continue;
1199                 /*
1200                  * Cache hit with no references.  Take
1201                  * the structure off the free list.
1202                  */
1203                 if (dq->dq_cnt == 0)
1204                         TAILQ_REMOVE(&dqfreelist, dq, dq_freelist);
1205                 DQREF(dq);
1206                 return (dq);
1207         }
1208         return (NODQUOT);
1209 }
1210
1211 /*
1212  * Determine the quota file type.
1213  *
1214  * A 32-bit quota file is simply an array of struct dqblk32.
1215  *
1216  * A 64-bit quota file is a struct dqhdr64 followed by an array of struct
1217  * dqblk64.  The header contains various magic bits which allow us to be
1218  * reasonably confident that it is indeeda 64-bit quota file and not just
1219  * a 32-bit quota file that just happens to "look right".
1220  *
1221  */
1222 static int
1223 dqopen(struct vnode *vp, struct ufsmount *ump, int type)
1224 {
1225         struct dqhdr64 dqh;
1226         struct iovec aiov;
1227         struct uio auio;
1228         int error;
1229
1230         ASSERT_VOP_LOCKED(vp, "dqopen");
1231         auio.uio_iov = &aiov;
1232         auio.uio_iovcnt = 1;
1233         aiov.iov_base = &dqh;
1234         aiov.iov_len = sizeof(dqh);
1235         auio.uio_resid = sizeof(dqh);
1236         auio.uio_offset = 0;
1237         auio.uio_segflg = UIO_SYSSPACE;
1238         auio.uio_rw = UIO_READ;
1239         auio.uio_td = (struct thread *)0;
1240         error = VOP_READ(vp, &auio, 0, ump->um_cred[type]);
1241
1242         if (error != 0)
1243                 return (error);
1244         if (auio.uio_resid > 0) {
1245                 /* assume 32 bits */
1246                 return (0);
1247         }
1248
1249         UFS_LOCK(ump);
1250         if (strcmp(dqh.dqh_magic, Q_DQHDR64_MAGIC) == 0 &&
1251             be32toh(dqh.dqh_version) == Q_DQHDR64_VERSION &&
1252             be32toh(dqh.dqh_hdrlen) == (uint32_t)sizeof(struct dqhdr64) &&
1253             be32toh(dqh.dqh_reclen) == (uint32_t)sizeof(struct dqblk64)) {
1254                 /* XXX: what if the magic matches, but the sizes are wrong? */
1255                 ump->um_qflags[type] |= QTF_64BIT;
1256         } else {
1257                 ump->um_qflags[type] &= ~QTF_64BIT;
1258         }
1259         UFS_UNLOCK(ump);
1260
1261         return (0);
1262 }
1263
1264 /*
1265  * Obtain a dquot structure for the specified identifier and quota file
1266  * reading the information from the file if necessary.
1267  */
1268 static int
1269 dqget(struct vnode *vp, uint64_t id, struct ufsmount *ump, int type,
1270     struct dquot **dqp)
1271 {
1272         uint8_t buf[sizeof(struct dqblk64)];
1273         off_t base, recsize;
1274         struct dquot *dq, *dq1;
1275         struct dqhash *dqh;
1276         struct vnode *dqvp;
1277         struct iovec aiov;
1278         struct uio auio;
1279         int dqvplocked, error;
1280
1281 #ifdef DEBUG_VFS_LOCKS
1282         if (vp != NULLVP)
1283                 ASSERT_VOP_ELOCKED(vp, "dqget");
1284 #endif
1285
1286         if (vp != NULLVP && *dqp != NODQUOT) {
1287                 return (0);
1288         }
1289
1290         /* XXX: Disallow negative id values to prevent the
1291         * creation of 100GB+ quota data files.
1292         */
1293         if ((int)id < 0)
1294                 return (EINVAL);
1295
1296         UFS_LOCK(ump);
1297         dqvp = ump->um_quotas[type];
1298         if (dqvp == NULLVP || (ump->um_qflags[type] & QTF_CLOSING)) {
1299                 *dqp = NODQUOT;
1300                 UFS_UNLOCK(ump);
1301                 return (EINVAL);
1302         }
1303         vref(dqvp);
1304         UFS_UNLOCK(ump);
1305         error = 0;
1306         dqvplocked = 0;
1307
1308         /*
1309          * Check the cache first.
1310          */
1311         dqh = DQHASH(dqvp, id);
1312         DQH_LOCK();
1313         dq = dqhashfind(dqh, id, dqvp);
1314         if (dq != NULL) {
1315                 DQH_UNLOCK();
1316 hfound:         DQI_LOCK(dq);
1317                 DQI_WAIT(dq, PINOD+1, "dqget");
1318                 DQI_UNLOCK(dq);
1319                 if (dq->dq_ump == NULL) {
1320                         dqrele(vp, dq);
1321                         dq = NODQUOT;
1322                         error = EIO;
1323                 }
1324                 *dqp = dq;
1325                 if (dqvplocked)
1326                         vput(dqvp);
1327                 else
1328                         vrele(dqvp);
1329                 return (error);
1330         }
1331
1332         /*
1333          * Quota vnode lock is before DQ_LOCK. Acquire dqvp lock there
1334          * since new dq will appear on the hash chain DQ_LOCKed.
1335          */
1336         if (vp != dqvp) {
1337                 DQH_UNLOCK();
1338                 vn_lock(dqvp, LK_SHARED | LK_RETRY);
1339                 dqvplocked = 1;
1340                 DQH_LOCK();
1341                 /*
1342                  * Recheck the cache after sleep for quota vnode lock.
1343                  */
1344                 dq = dqhashfind(dqh, id, dqvp);
1345                 if (dq != NULL) {
1346                         DQH_UNLOCK();
1347                         goto hfound;
1348                 }
1349         }
1350
1351         /*
1352          * Not in cache, allocate a new one or take it from the
1353          * free list.
1354          */
1355         if (TAILQ_FIRST(&dqfreelist) == NODQUOT &&
1356             numdquot < MAXQUOTAS * desiredvnodes)
1357                 desireddquot += DQUOTINC;
1358         if (numdquot < desireddquot) {
1359                 numdquot++;
1360                 DQH_UNLOCK();
1361                 dq1 = malloc(sizeof *dq1, M_DQUOT, M_WAITOK | M_ZERO);
1362                 mtx_init(&dq1->dq_lock, "dqlock", NULL, MTX_DEF);
1363                 DQH_LOCK();
1364                 /*
1365                  * Recheck the cache after sleep for memory.
1366                  */
1367                 dq = dqhashfind(dqh, id, dqvp);
1368                 if (dq != NULL) {
1369                         numdquot--;
1370                         DQH_UNLOCK();
1371                         mtx_destroy(&dq1->dq_lock);
1372                         free(dq1, M_DQUOT);
1373                         goto hfound;
1374                 }
1375                 dq = dq1;
1376         } else {
1377                 if ((dq = TAILQ_FIRST(&dqfreelist)) == NULL) {
1378                         DQH_UNLOCK();
1379                         tablefull("dquot");
1380                         *dqp = NODQUOT;
1381                         if (dqvplocked)
1382                                 vput(dqvp);
1383                         else
1384                                 vrele(dqvp);
1385                         return (EUSERS);
1386                 }
1387                 if (dq->dq_cnt || (dq->dq_flags & DQ_MOD))
1388                         panic("dqget: free dquot isn't %p", dq);
1389                 TAILQ_REMOVE(&dqfreelist, dq, dq_freelist);
1390                 if (dq->dq_ump != NULL)
1391                         LIST_REMOVE(dq, dq_hash);
1392         }
1393
1394         /*
1395          * Dq is put into hash already locked to prevent parallel
1396          * usage while it is being read from file.
1397          */
1398         dq->dq_flags = DQ_LOCK;
1399         dq->dq_id = id;
1400         dq->dq_type = type;
1401         dq->dq_ump = ump;
1402         LIST_INSERT_HEAD(dqh, dq, dq_hash);
1403         DQREF(dq);
1404         DQH_UNLOCK();
1405
1406         /*
1407          * Read the requested quota record from the quota file, performing
1408          * any necessary conversions.
1409          */
1410         if (ump->um_qflags[type] & QTF_64BIT) {
1411                 recsize = sizeof(struct dqblk64);
1412                 base = sizeof(struct dqhdr64);
1413         } else {
1414                 recsize = sizeof(struct dqblk32);
1415                 base = 0;
1416         }
1417         auio.uio_iov = &aiov;
1418         auio.uio_iovcnt = 1;
1419         aiov.iov_base = buf;
1420         aiov.iov_len = recsize;
1421         auio.uio_resid = recsize;
1422         auio.uio_offset = base + id * recsize;
1423         auio.uio_segflg = UIO_SYSSPACE;
1424         auio.uio_rw = UIO_READ;
1425         auio.uio_td = (struct thread *)0;
1426
1427         error = VOP_READ(dqvp, &auio, 0, ump->um_cred[type]);
1428         if (auio.uio_resid == recsize && error == 0) {
1429                 bzero(&dq->dq_dqb, sizeof(dq->dq_dqb));
1430         } else {
1431                 if (ump->um_qflags[type] & QTF_64BIT)
1432                         dqb64_dq((struct dqblk64 *)buf, dq);
1433                 else
1434                         dqb32_dq((struct dqblk32 *)buf, dq);
1435         }
1436         if (dqvplocked)
1437                 vput(dqvp);
1438         else
1439                 vrele(dqvp);
1440         /*
1441          * I/O error in reading quota file, release
1442          * quota structure and reflect problem to caller.
1443          */
1444         if (error) {
1445                 DQH_LOCK();
1446                 dq->dq_ump = NULL;
1447                 LIST_REMOVE(dq, dq_hash);
1448                 DQH_UNLOCK();
1449                 DQI_LOCK(dq);
1450                 if (dq->dq_flags & DQ_WANT)
1451                         wakeup(dq);
1452                 dq->dq_flags = 0;
1453                 DQI_UNLOCK(dq);
1454                 dqrele(vp, dq);
1455                 *dqp = NODQUOT;
1456                 return (error);
1457         }
1458         DQI_LOCK(dq);
1459         /*
1460          * Check for no limit to enforce.
1461          * Initialize time values if necessary.
1462          */
1463         if (dq->dq_isoftlimit == 0 && dq->dq_bsoftlimit == 0 &&
1464             dq->dq_ihardlimit == 0 && dq->dq_bhardlimit == 0)
1465                 dq->dq_flags |= DQ_FAKE;
1466         if (dq->dq_id != 0) {
1467                 if (dq->dq_btime == 0) {
1468                         dq->dq_btime = time_second + ump->um_btime[type];
1469                         if (dq->dq_bsoftlimit &&
1470                             dq->dq_curblocks >= dq->dq_bsoftlimit)
1471                                 dq->dq_flags |= DQ_MOD;
1472                 }
1473                 if (dq->dq_itime == 0) {
1474                         dq->dq_itime = time_second + ump->um_itime[type];
1475                         if (dq->dq_isoftlimit &&
1476                             dq->dq_curinodes >= dq->dq_isoftlimit)
1477                                 dq->dq_flags |= DQ_MOD;
1478                 }
1479         }
1480         DQI_WAKEUP(dq);
1481         DQI_UNLOCK(dq);
1482         *dqp = dq;
1483         return (0);
1484 }
1485
1486 #ifdef DIAGNOSTIC
1487 /*
1488  * Obtain a reference to a dquot.
1489  */
1490 static void
1491 dqref(struct dquot *dq)
1492 {
1493
1494         dq->dq_cnt++;
1495 }
1496 #endif
1497
1498 /*
1499  * Release a reference to a dquot.
1500  */
1501 void
1502 dqrele(struct vnode *vp, struct dquot *dq)
1503 {
1504
1505         if (dq == NODQUOT)
1506                 return;
1507         DQH_LOCK();
1508         KASSERT(dq->dq_cnt > 0, ("Lost dq %p reference 1", dq));
1509         if (dq->dq_cnt > 1) {
1510                 dq->dq_cnt--;
1511                 DQH_UNLOCK();
1512                 return;
1513         }
1514         DQH_UNLOCK();
1515 sync:
1516         (void) dqsync(vp, dq);
1517
1518         DQH_LOCK();
1519         KASSERT(dq->dq_cnt > 0, ("Lost dq %p reference 2", dq));
1520         if (--dq->dq_cnt > 0)
1521         {
1522                 DQH_UNLOCK();
1523                 return;
1524         }
1525
1526         /*
1527          * The dq may become dirty after it is synced but before it is
1528          * put to the free list. Checking the DQ_MOD there without
1529          * locking dq should be safe since no other references to the
1530          * dq exist.
1531          */
1532         if ((dq->dq_flags & DQ_MOD) != 0) {
1533                 dq->dq_cnt++;
1534                 DQH_UNLOCK();
1535                 goto sync;
1536         }
1537         TAILQ_INSERT_TAIL(&dqfreelist, dq, dq_freelist);
1538         DQH_UNLOCK();
1539 }
1540
1541 /*
1542  * Update the disk quota in the quota file.
1543  */
1544 static int
1545 dqsync(struct vnode *vp, struct dquot *dq)
1546 {
1547         uint8_t buf[sizeof(struct dqblk64)];
1548         off_t base, recsize;
1549         struct vnode *dqvp;
1550         struct iovec aiov;
1551         struct uio auio;
1552         int error;
1553         struct mount *mp;
1554         struct ufsmount *ump;
1555
1556 #ifdef DEBUG_VFS_LOCKS
1557         if (vp != NULL)
1558                 ASSERT_VOP_ELOCKED(vp, "dqsync");
1559 #endif
1560
1561         mp = NULL;
1562         error = 0;
1563         if (dq == NODQUOT)
1564                 panic("dqsync: dquot");
1565         if ((ump = dq->dq_ump) == NULL)
1566                 return (0);
1567         UFS_LOCK(ump);
1568         if ((dqvp = ump->um_quotas[dq->dq_type]) == NULLVP) {
1569                 if (vp == NULL) {
1570                         UFS_UNLOCK(ump);
1571                         return (0);
1572                 } else
1573                         panic("dqsync: file");
1574         }
1575         vref(dqvp);
1576         UFS_UNLOCK(ump);
1577
1578         DQI_LOCK(dq);
1579         if ((dq->dq_flags & DQ_MOD) == 0) {
1580                 DQI_UNLOCK(dq);
1581                 vrele(dqvp);
1582                 return (0);
1583         }
1584         DQI_UNLOCK(dq);
1585
1586         (void) vn_start_secondary_write(dqvp, &mp, V_WAIT);
1587         if (vp != dqvp)
1588                 vn_lock(dqvp, LK_EXCLUSIVE | LK_RETRY);
1589
1590         DQI_LOCK(dq);
1591         DQI_WAIT(dq, PINOD+2, "dqsync");
1592         if ((dq->dq_flags & DQ_MOD) == 0)
1593                 goto out;
1594         dq->dq_flags |= DQ_LOCK;
1595         DQI_UNLOCK(dq);
1596
1597         /*
1598          * Write the quota record to the quota file, performing any
1599          * necessary conversions.  See dqget() for additional details.
1600          */
1601         if (ump->um_qflags[dq->dq_type] & QTF_64BIT) {
1602                 dq_dqb64(dq, (struct dqblk64 *)buf);
1603                 recsize = sizeof(struct dqblk64);
1604                 base = sizeof(struct dqhdr64);
1605         } else {
1606                 dq_dqb32(dq, (struct dqblk32 *)buf);
1607                 recsize = sizeof(struct dqblk32);
1608                 base = 0;
1609         }
1610
1611         auio.uio_iov = &aiov;
1612         auio.uio_iovcnt = 1;
1613         aiov.iov_base = buf;
1614         aiov.iov_len = recsize;
1615         auio.uio_resid = recsize;
1616         auio.uio_offset = base + dq->dq_id * recsize;
1617         auio.uio_segflg = UIO_SYSSPACE;
1618         auio.uio_rw = UIO_WRITE;
1619         auio.uio_td = (struct thread *)0;
1620         error = VOP_WRITE(dqvp, &auio, 0, dq->dq_ump->um_cred[dq->dq_type]);
1621         if (auio.uio_resid && error == 0)
1622                 error = EIO;
1623
1624         DQI_LOCK(dq);
1625         DQI_WAKEUP(dq);
1626         dq->dq_flags &= ~DQ_MOD;
1627 out:
1628         DQI_UNLOCK(dq);
1629         if (vp != dqvp)
1630                 vput(dqvp);
1631         else
1632                 vrele(dqvp);
1633         vn_finished_secondary_write(mp);
1634         return (error);
1635 }
1636
1637 /*
1638  * Flush all entries from the cache for a particular vnode.
1639  */
1640 static int
1641 dqflush(struct vnode *vp)
1642 {
1643         struct dquot *dq, *nextdq;
1644         struct dqhash *dqh;
1645         int error;
1646
1647         /*
1648          * Move all dquot's that used to refer to this quota
1649          * file off their hash chains (they will eventually
1650          * fall off the head of the free list and be re-used).
1651          */
1652         error = 0;
1653         DQH_LOCK();
1654         for (dqh = &dqhashtbl[dqhash]; dqh >= dqhashtbl; dqh--) {
1655                 for (dq = LIST_FIRST(dqh); dq; dq = nextdq) {
1656                         nextdq = LIST_NEXT(dq, dq_hash);
1657                         if (dq->dq_ump->um_quotas[dq->dq_type] != vp)
1658                                 continue;
1659                         if (dq->dq_cnt)
1660                                 error = EBUSY;
1661                         else {
1662                                 LIST_REMOVE(dq, dq_hash);
1663                                 dq->dq_ump = NULL;
1664                         }
1665                 }
1666         }
1667         DQH_UNLOCK();
1668         return (error);
1669 }
1670
1671 /*
1672  * The following three functions are provided for the adjustment of
1673  * quotas by the soft updates code.
1674  */
1675 #ifdef SOFTUPDATES
1676 /*
1677  * Acquire a reference to the quota structures associated with a vnode.
1678  * Return count of number of quota structures found.
1679  */
1680 int
1681 quotaref(struct vnode *vp, struct dquot **qrp)
1682 {
1683         struct inode *ip;
1684         struct dquot *dq;
1685         int i, found;
1686
1687         for (i = 0; i < MAXQUOTAS; i++)
1688                 qrp[i] = NODQUOT;
1689         /*
1690          * Disk quotas must be turned off for system files.  Currently
1691          * snapshot and quota files.
1692          */
1693         if ((vp->v_vflag & VV_SYSTEM) != 0)
1694                 return (0);
1695         /*
1696          * Iterate through and copy active quotas.
1697          */
1698         found = 0;
1699         ip = VTOI(vp);
1700         mtx_lock(&dqhlock);
1701         for (i = 0; i < MAXQUOTAS; i++) {
1702                 if ((dq = ip->i_dquot[i]) == NODQUOT)
1703                         continue;
1704                 DQREF(dq);
1705                 qrp[i] = dq;
1706                 found++;
1707         }
1708         mtx_unlock(&dqhlock);
1709         return (found);
1710 }
1711
1712 /*
1713  * Release a set of quota structures obtained from a vnode.
1714  */
1715 void
1716 quotarele(struct dquot **qrp)
1717 {
1718         struct dquot *dq;
1719         int i;
1720
1721         for (i = 0; i < MAXQUOTAS; i++) {
1722                 if ((dq = qrp[i]) == NODQUOT)
1723                         continue;
1724                 dqrele(NULL, dq);
1725         }
1726 }
1727
1728 /*
1729  * Adjust the number of blocks associated with a quota.
1730  * Positive numbers when adding blocks; negative numbers when freeing blocks.
1731  */
1732 void
1733 quotaadj(struct dquot **qrp, struct ufsmount *ump, int64_t blkcount)
1734 {
1735         struct dquot *dq;
1736         ufs2_daddr_t ncurblocks;
1737         int i;
1738
1739         if (blkcount == 0)
1740                 return;
1741         for (i = 0; i < MAXQUOTAS; i++) {
1742                 if ((dq = qrp[i]) == NODQUOT)
1743                         continue;
1744                 DQI_LOCK(dq);
1745                 DQI_WAIT(dq, PINOD+1, "adjqta");
1746                 ncurblocks = dq->dq_curblocks + blkcount;
1747                 if (ncurblocks >= 0)
1748                         dq->dq_curblocks = ncurblocks;
1749                 else
1750                         dq->dq_curblocks = 0;
1751                 if (blkcount < 0)
1752                         dq->dq_flags &= ~DQ_BLKS;
1753                 else if (dq->dq_curblocks + blkcount >= dq->dq_bsoftlimit &&
1754                          dq->dq_curblocks < dq->dq_bsoftlimit)
1755                         dq->dq_btime = time_second + ump->um_btime[i];
1756                 dq->dq_flags |= DQ_MOD;
1757                 DQI_UNLOCK(dq);
1758         }
1759 }
1760 #endif /* SOFTUPDATES */
1761
1762 /*
1763  * 32-bit / 64-bit conversion functions.
1764  *
1765  * 32-bit quota records are stored in native byte order.  Attention must
1766  * be paid to overflow issues.
1767  *
1768  * 64-bit quota records are stored in network byte order.
1769  */
1770
1771 #define CLIP32(u64) (u64 > UINT32_MAX ? UINT32_MAX : (uint32_t)u64)
1772
1773 /*
1774  * Convert 32-bit host-order structure to dquot.
1775  */
1776 static void
1777 dqb32_dq(const struct dqblk32 *dqb32, struct dquot *dq)
1778 {
1779
1780         dq->dq_bhardlimit = dqb32->dqb_bhardlimit;
1781         dq->dq_bsoftlimit = dqb32->dqb_bsoftlimit;
1782         dq->dq_curblocks = dqb32->dqb_curblocks;
1783         dq->dq_ihardlimit = dqb32->dqb_ihardlimit;
1784         dq->dq_isoftlimit = dqb32->dqb_isoftlimit;
1785         dq->dq_curinodes = dqb32->dqb_curinodes;
1786         dq->dq_btime = dqb32->dqb_btime;
1787         dq->dq_itime = dqb32->dqb_itime;
1788 }
1789
1790 /*
1791  * Convert 64-bit network-order structure to dquot.
1792  */
1793 static void
1794 dqb64_dq(const struct dqblk64 *dqb64, struct dquot *dq)
1795 {
1796
1797         dq->dq_bhardlimit = be64toh(dqb64->dqb_bhardlimit);
1798         dq->dq_bsoftlimit = be64toh(dqb64->dqb_bsoftlimit);
1799         dq->dq_curblocks = be64toh(dqb64->dqb_curblocks);
1800         dq->dq_ihardlimit = be64toh(dqb64->dqb_ihardlimit);
1801         dq->dq_isoftlimit = be64toh(dqb64->dqb_isoftlimit);
1802         dq->dq_curinodes = be64toh(dqb64->dqb_curinodes);
1803         dq->dq_btime = be64toh(dqb64->dqb_btime);
1804         dq->dq_itime = be64toh(dqb64->dqb_itime);
1805 }
1806
1807 /*
1808  * Convert dquot to 32-bit host-order structure.
1809  */
1810 static void
1811 dq_dqb32(const struct dquot *dq, struct dqblk32 *dqb32)
1812 {
1813
1814         dqb32->dqb_bhardlimit = CLIP32(dq->dq_bhardlimit);
1815         dqb32->dqb_bsoftlimit = CLIP32(dq->dq_bsoftlimit);
1816         dqb32->dqb_curblocks = CLIP32(dq->dq_curblocks);
1817         dqb32->dqb_ihardlimit = CLIP32(dq->dq_ihardlimit);
1818         dqb32->dqb_isoftlimit = CLIP32(dq->dq_isoftlimit);
1819         dqb32->dqb_curinodes = CLIP32(dq->dq_curinodes);
1820         dqb32->dqb_btime = CLIP32(dq->dq_btime);
1821         dqb32->dqb_itime = CLIP32(dq->dq_itime);
1822 }
1823
1824 /*
1825  * Convert dquot to 64-bit network-order structure.
1826  */
1827 static void
1828 dq_dqb64(const struct dquot *dq, struct dqblk64 *dqb64)
1829 {
1830
1831         dqb64->dqb_bhardlimit = htobe64(dq->dq_bhardlimit);
1832         dqb64->dqb_bsoftlimit = htobe64(dq->dq_bsoftlimit);
1833         dqb64->dqb_curblocks = htobe64(dq->dq_curblocks);
1834         dqb64->dqb_ihardlimit = htobe64(dq->dq_ihardlimit);
1835         dqb64->dqb_isoftlimit = htobe64(dq->dq_isoftlimit);
1836         dqb64->dqb_curinodes = htobe64(dq->dq_curinodes);
1837         dqb64->dqb_btime = htobe64(dq->dq_btime);
1838         dqb64->dqb_itime = htobe64(dq->dq_itime);
1839 }
1840
1841 /*
1842  * Convert 64-bit host-order structure to 32-bit host-order structure.
1843  */
1844 static void
1845 dqb64_dqb32(const struct dqblk64 *dqb64, struct dqblk32 *dqb32)
1846 {
1847
1848         dqb32->dqb_bhardlimit = CLIP32(dqb64->dqb_bhardlimit);
1849         dqb32->dqb_bsoftlimit = CLIP32(dqb64->dqb_bsoftlimit);
1850         dqb32->dqb_curblocks = CLIP32(dqb64->dqb_curblocks);
1851         dqb32->dqb_ihardlimit = CLIP32(dqb64->dqb_ihardlimit);
1852         dqb32->dqb_isoftlimit = CLIP32(dqb64->dqb_isoftlimit);
1853         dqb32->dqb_curinodes = CLIP32(dqb64->dqb_curinodes);
1854         dqb32->dqb_btime = CLIP32(dqb64->dqb_btime);
1855         dqb32->dqb_itime = CLIP32(dqb64->dqb_itime);
1856 }
1857
1858 /*
1859  * Convert 32-bit host-order structure to 64-bit host-order structure.
1860  */
1861 static void
1862 dqb32_dqb64(const struct dqblk32 *dqb32, struct dqblk64 *dqb64)
1863 {
1864
1865         dqb64->dqb_bhardlimit = dqb32->dqb_bhardlimit;
1866         dqb64->dqb_bsoftlimit = dqb32->dqb_bsoftlimit;
1867         dqb64->dqb_curblocks = dqb32->dqb_curblocks;
1868         dqb64->dqb_ihardlimit = dqb32->dqb_ihardlimit;
1869         dqb64->dqb_isoftlimit = dqb32->dqb_isoftlimit;
1870         dqb64->dqb_curinodes = dqb32->dqb_curinodes;
1871         dqb64->dqb_btime = dqb32->dqb_btime;
1872         dqb64->dqb_itime = dqb32->dqb_itime;
1873 }