]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - sys/kern/sysv_msg.c
Update ELF Tool Chain to upstream rev 3400
[FreeBSD/FreeBSD.git] / sys / kern / sysv_msg.c
1 /*-
2  * Implementation of SVID messages
3  *
4  * Author:  Daniel Boulet
5  *
6  * Copyright 1993 Daniel Boulet and RTMX Inc.
7  *
8  * This system call was implemented by Daniel Boulet under contract from RTMX.
9  *
10  * Redistribution and use in source forms, with and without modification,
11  * are permitted provided that this entire comment appears intact.
12  *
13  * Redistribution in binary form may occur without any restrictions.
14  * Obviously, it would be nice if you gave credit where credit is due
15  * but requiring it would be too onerous.
16  *
17  * This software is provided ``AS IS'' without any warranties of any kind.
18  */
19 /*-
20  * Copyright (c) 2003-2005 McAfee, Inc.
21  * All rights reserved.
22  *
23  * This software was developed for the FreeBSD Project in part by McAfee
24  * Research, the Security Research Division of McAfee, Inc under DARPA/SPAWAR
25  * contract N66001-01-C-8035 ("CBOSS"), as part of the DARPA CHATS research
26  * program.
27  *
28  * Redistribution and use in source and binary forms, with or without
29  * modification, are permitted provided that the following conditions
30  * are met:
31  * 1. Redistributions of source code must retain the above copyright
32  *    notice, this list of conditions and the following disclaimer.
33  * 2. Redistributions in binary form must reproduce the above copyright
34  *    notice, this list of conditions and the following disclaimer in the
35  *    documentation and/or other materials provided with the distribution.
36  *
37  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
38  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
39  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
40  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
41  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
42  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
43  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
44  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
45  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
46  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
47  * SUCH DAMAGE.
48  */
49
50 #include <sys/cdefs.h>
51 __FBSDID("$FreeBSD$");
52
53 #include "opt_compat.h"
54 #include "opt_sysvipc.h"
55
56 #include <sys/param.h>
57 #include <sys/systm.h>
58 #include <sys/sysproto.h>
59 #include <sys/kernel.h>
60 #include <sys/priv.h>
61 #include <sys/proc.h>
62 #include <sys/lock.h>
63 #include <sys/mutex.h>
64 #include <sys/module.h>
65 #include <sys/msg.h>
66 #include <sys/racct.h>
67 #include <sys/syscall.h>
68 #include <sys/syscallsubr.h>
69 #include <sys/sysent.h>
70 #include <sys/sysctl.h>
71 #include <sys/malloc.h>
72 #include <sys/jail.h>
73
74 #include <security/mac/mac_framework.h>
75
76 FEATURE(sysv_msg, "System V message queues support");
77
78 static MALLOC_DEFINE(M_MSG, "msg", "SVID compatible message queues");
79
80 static int msginit(void);
81 static int msgunload(void);
82 static int sysvmsg_modload(struct module *, int, void *);
83
84
85 #ifdef MSG_DEBUG
86 #define DPRINTF(a)      printf a
87 #else
88 #define DPRINTF(a)      (void)0
89 #endif
90
91 static void msg_freehdr(struct msg *msghdr);
92
93 #ifndef MSGSSZ
94 #define MSGSSZ  8               /* Each segment must be 2^N long */
95 #endif
96 #ifndef MSGSEG
97 #define MSGSEG  2048            /* must be less than 32767 */
98 #endif
99 #define MSGMAX  (MSGSSZ*MSGSEG)
100 #ifndef MSGMNB
101 #define MSGMNB  2048            /* max # of bytes in a queue */
102 #endif
103 #ifndef MSGMNI
104 #define MSGMNI  40
105 #endif
106 #ifndef MSGTQL
107 #define MSGTQL  40
108 #endif
109
110 /*
111  * Based on the configuration parameters described in an SVR2 (yes, two)
112  * config(1m) man page.
113  *
114  * Each message is broken up and stored in segments that are msgssz bytes
115  * long.  For efficiency reasons, this should be a power of two.  Also,
116  * it doesn't make sense if it is less than 8 or greater than about 256.
117  * Consequently, msginit in kern/sysv_msg.c checks that msgssz is a power of
118  * two between 8 and 1024 inclusive (and panic's if it isn't).
119  */
120 struct msginfo msginfo = {
121                 MSGMAX,         /* max chars in a message */
122                 MSGMNI,         /* # of message queue identifiers */
123                 MSGMNB,         /* max chars in a queue */
124                 MSGTQL,         /* max messages in system */
125                 MSGSSZ,         /* size of a message segment */
126                                 /* (must be small power of 2 greater than 4) */
127                 MSGSEG          /* number of message segments */
128 };
129
130 /*
131  * macros to convert between msqid_ds's and msqid's.
132  * (specific to this implementation)
133  */
134 #define MSQID(ix,ds)    ((ix) & 0xffff | (((ds).msg_perm.seq << 16) & 0xffff0000))
135 #define MSQID_IX(id)    ((id) & 0xffff)
136 #define MSQID_SEQ(id)   (((id) >> 16) & 0xffff)
137
138 /*
139  * The rest of this file is specific to this particular implementation.
140  */
141
142 struct msgmap {
143         short   next;           /* next segment in buffer */
144                                 /* -1 -> available */
145                                 /* 0..(MSGSEG-1) -> index of next segment */
146 };
147
148 #define MSG_LOCKED      01000   /* Is this msqid_ds locked? */
149
150 static int nfree_msgmaps;       /* # of free map entries */
151 static short free_msgmaps;      /* head of linked list of free map entries */
152 static struct msg *free_msghdrs;/* list of free msg headers */
153 static char *msgpool;           /* MSGMAX byte long msg buffer pool */
154 static struct msgmap *msgmaps;  /* MSGSEG msgmap structures */
155 static struct msg *msghdrs;     /* MSGTQL msg headers */
156 static struct msqid_kernel *msqids;     /* MSGMNI msqid_kernel struct's */
157 static struct mtx msq_mtx;      /* global mutex for message queues. */
158
159 static struct syscall_helper_data msg_syscalls[] = {
160         SYSCALL_INIT_HELPER(msgctl),
161         SYSCALL_INIT_HELPER(msgget),
162         SYSCALL_INIT_HELPER(msgsnd),
163         SYSCALL_INIT_HELPER(msgrcv),
164 #if defined(COMPAT_FREEBSD4) || defined(COMPAT_FREEBSD5) || \
165     defined(COMPAT_FREEBSD6) || defined(COMPAT_FREEBSD7)
166         SYSCALL_INIT_HELPER(msgsys),
167         SYSCALL_INIT_HELPER_COMPAT(freebsd7_msgctl),
168 #endif
169         SYSCALL_INIT_LAST
170 };
171
172 #ifdef COMPAT_FREEBSD32
173 #include <compat/freebsd32/freebsd32.h>
174 #include <compat/freebsd32/freebsd32_ipc.h>
175 #include <compat/freebsd32/freebsd32_proto.h>
176 #include <compat/freebsd32/freebsd32_signal.h>
177 #include <compat/freebsd32/freebsd32_syscall.h>
178 #include <compat/freebsd32/freebsd32_util.h>
179
180 static struct syscall_helper_data msg32_syscalls[] = {
181         SYSCALL32_INIT_HELPER(freebsd32_msgctl),
182         SYSCALL32_INIT_HELPER(freebsd32_msgsnd),
183         SYSCALL32_INIT_HELPER(freebsd32_msgrcv),
184         SYSCALL32_INIT_HELPER_COMPAT(msgget),
185         SYSCALL32_INIT_HELPER(freebsd32_msgsys),
186 #if defined(COMPAT_FREEBSD4) || defined(COMPAT_FREEBSD5) || \
187     defined(COMPAT_FREEBSD6) || defined(COMPAT_FREEBSD7)
188         SYSCALL32_INIT_HELPER(freebsd7_freebsd32_msgctl),
189 #endif
190         SYSCALL_INIT_LAST
191 };
192 #endif
193
194 static int
195 msginit()
196 {
197         int i, error;
198
199         msginfo.msgmax = msginfo.msgseg * msginfo.msgssz;
200         msgpool = malloc(msginfo.msgmax, M_MSG, M_WAITOK);
201         msgmaps = malloc(sizeof(struct msgmap) * msginfo.msgseg, M_MSG, M_WAITOK);
202         msghdrs = malloc(sizeof(struct msg) * msginfo.msgtql, M_MSG, M_WAITOK);
203         msqids = malloc(sizeof(struct msqid_kernel) * msginfo.msgmni, M_MSG,
204             M_WAITOK);
205
206         /*
207          * msginfo.msgssz should be a power of two for efficiency reasons.
208          * It is also pretty silly if msginfo.msgssz is less than 8
209          * or greater than about 256 so ...
210          */
211
212         i = 8;
213         while (i < 1024 && i != msginfo.msgssz)
214                 i <<= 1;
215         if (i != msginfo.msgssz) {
216                 DPRINTF(("msginfo.msgssz=%d (0x%x)\n", msginfo.msgssz,
217                     msginfo.msgssz));
218                 panic("msginfo.msgssz not a small power of 2");
219         }
220
221         if (msginfo.msgseg > 32767) {
222                 DPRINTF(("msginfo.msgseg=%d\n", msginfo.msgseg));
223                 panic("msginfo.msgseg > 32767");
224         }
225
226         for (i = 0; i < msginfo.msgseg; i++) {
227                 if (i > 0)
228                         msgmaps[i-1].next = i;
229                 msgmaps[i].next = -1;   /* implies entry is available */
230         }
231         free_msgmaps = 0;
232         nfree_msgmaps = msginfo.msgseg;
233
234         for (i = 0; i < msginfo.msgtql; i++) {
235                 msghdrs[i].msg_type = 0;
236                 if (i > 0)
237                         msghdrs[i-1].msg_next = &msghdrs[i];
238                 msghdrs[i].msg_next = NULL;
239 #ifdef MAC
240                 mac_sysvmsg_init(&msghdrs[i]);
241 #endif
242         }
243         free_msghdrs = &msghdrs[0];
244
245         for (i = 0; i < msginfo.msgmni; i++) {
246                 msqids[i].u.msg_qbytes = 0;     /* implies entry is available */
247                 msqids[i].u.msg_perm.seq = 0;   /* reset to a known value */
248                 msqids[i].u.msg_perm.mode = 0;
249 #ifdef MAC
250                 mac_sysvmsq_init(&msqids[i]);
251 #endif
252         }
253         mtx_init(&msq_mtx, "msq", NULL, MTX_DEF);
254
255         error = syscall_helper_register(msg_syscalls, SY_THR_STATIC_KLD);
256         if (error != 0)
257                 return (error);
258 #ifdef COMPAT_FREEBSD32
259         error = syscall32_helper_register(msg32_syscalls, SY_THR_STATIC_KLD);
260         if (error != 0)
261                 return (error);
262 #endif
263         return (0);
264 }
265
266 static int
267 msgunload()
268 {
269         struct msqid_kernel *msqkptr;
270         int msqid;
271 #ifdef MAC
272         int i;
273 #endif
274
275         syscall_helper_unregister(msg_syscalls);
276 #ifdef COMPAT_FREEBSD32
277         syscall32_helper_unregister(msg32_syscalls);
278 #endif
279
280         for (msqid = 0; msqid < msginfo.msgmni; msqid++) {
281                 /*
282                  * Look for an unallocated and unlocked msqid_ds.
283                  * msqid_ds's can be locked by msgsnd or msgrcv while
284                  * they are copying the message in/out.  We can't
285                  * re-use the entry until they release it.
286                  */
287                 msqkptr = &msqids[msqid];
288                 if (msqkptr->u.msg_qbytes != 0 ||
289                     (msqkptr->u.msg_perm.mode & MSG_LOCKED) != 0)
290                         break;
291         }
292         if (msqid != msginfo.msgmni)
293                 return (EBUSY);
294
295 #ifdef MAC
296         for (i = 0; i < msginfo.msgtql; i++)
297                 mac_sysvmsg_destroy(&msghdrs[i]);
298         for (msqid = 0; msqid < msginfo.msgmni; msqid++)
299                 mac_sysvmsq_destroy(&msqids[msqid]);
300 #endif
301         free(msgpool, M_MSG);
302         free(msgmaps, M_MSG);
303         free(msghdrs, M_MSG);
304         free(msqids, M_MSG);
305         mtx_destroy(&msq_mtx);
306         return (0);
307 }
308
309
310 static int
311 sysvmsg_modload(struct module *module, int cmd, void *arg)
312 {
313         int error = 0;
314
315         switch (cmd) {
316         case MOD_LOAD:
317                 error = msginit();
318                 if (error != 0)
319                         msgunload();
320                 break;
321         case MOD_UNLOAD:
322                 error = msgunload();
323                 break;
324         case MOD_SHUTDOWN:
325                 break;
326         default:
327                 error = EINVAL;
328                 break;
329         }
330         return (error);
331 }
332
333 static moduledata_t sysvmsg_mod = {
334         "sysvmsg",
335         &sysvmsg_modload,
336         NULL
337 };
338
339 DECLARE_MODULE(sysvmsg, sysvmsg_mod, SI_SUB_SYSV_MSG, SI_ORDER_FIRST);
340 MODULE_VERSION(sysvmsg, 1);
341
342 static void
343 msg_freehdr(msghdr)
344         struct msg *msghdr;
345 {
346         while (msghdr->msg_ts > 0) {
347                 short next;
348                 if (msghdr->msg_spot < 0 || msghdr->msg_spot >= msginfo.msgseg)
349                         panic("msghdr->msg_spot out of range");
350                 next = msgmaps[msghdr->msg_spot].next;
351                 msgmaps[msghdr->msg_spot].next = free_msgmaps;
352                 free_msgmaps = msghdr->msg_spot;
353                 nfree_msgmaps++;
354                 msghdr->msg_spot = next;
355                 if (msghdr->msg_ts >= msginfo.msgssz)
356                         msghdr->msg_ts -= msginfo.msgssz;
357                 else
358                         msghdr->msg_ts = 0;
359         }
360         if (msghdr->msg_spot != -1)
361                 panic("msghdr->msg_spot != -1");
362         msghdr->msg_next = free_msghdrs;
363         free_msghdrs = msghdr;
364 #ifdef MAC
365         mac_sysvmsg_cleanup(msghdr);
366 #endif
367 }
368
369 #ifndef _SYS_SYSPROTO_H_
370 struct msgctl_args {
371         int     msqid;
372         int     cmd;
373         struct  msqid_ds *buf;
374 };
375 #endif
376 int
377 sys_msgctl(td, uap)
378         struct thread *td;
379         register struct msgctl_args *uap;
380 {
381         int msqid = uap->msqid;
382         int cmd = uap->cmd;
383         struct msqid_ds msqbuf;
384         int error;
385
386         DPRINTF(("call to msgctl(%d, %d, %p)\n", msqid, cmd, uap->buf));
387         if (cmd == IPC_SET &&
388             (error = copyin(uap->buf, &msqbuf, sizeof(msqbuf))) != 0)
389                 return (error);
390         error = kern_msgctl(td, msqid, cmd, &msqbuf);
391         if (cmd == IPC_STAT && error == 0)
392                 error = copyout(&msqbuf, uap->buf, sizeof(struct msqid_ds));
393         return (error);
394 }
395
396 int
397 kern_msgctl(td, msqid, cmd, msqbuf)
398         struct thread *td;
399         int msqid;
400         int cmd;
401         struct msqid_ds *msqbuf;
402 {
403         int rval, error, msqix;
404         register struct msqid_kernel *msqkptr;
405
406         if (!prison_allow(td->td_ucred, PR_ALLOW_SYSVIPC))
407                 return (ENOSYS);
408
409         msqix = IPCID_TO_IX(msqid);
410
411         if (msqix < 0 || msqix >= msginfo.msgmni) {
412                 DPRINTF(("msqid (%d) out of range (0<=msqid<%d)\n", msqix,
413                     msginfo.msgmni));
414                 return (EINVAL);
415         }
416
417         msqkptr = &msqids[msqix];
418
419         mtx_lock(&msq_mtx);
420         if (msqkptr->u.msg_qbytes == 0) {
421                 DPRINTF(("no such msqid\n"));
422                 error = EINVAL;
423                 goto done2;
424         }
425         if (msqkptr->u.msg_perm.seq != IPCID_TO_SEQ(msqid)) {
426                 DPRINTF(("wrong sequence number\n"));
427                 error = EINVAL;
428                 goto done2;
429         }
430 #ifdef MAC
431         error = mac_sysvmsq_check_msqctl(td->td_ucred, msqkptr, cmd);
432         if (error != 0)
433                 goto done2;
434 #endif
435
436         error = 0;
437         rval = 0;
438
439         switch (cmd) {
440
441         case IPC_RMID:
442         {
443                 struct msg *msghdr;
444                 if ((error = ipcperm(td, &msqkptr->u.msg_perm, IPC_M)))
445                         goto done2;
446
447 #ifdef MAC
448                 /*
449                  * Check that the thread has MAC access permissions to
450                  * individual msghdrs.  Note: We need to do this in a
451                  * separate loop because the actual loop alters the
452                  * msq/msghdr info as it progresses, and there is no going
453                  * back if half the way through we discover that the
454                  * thread cannot free a certain msghdr.  The msq will get
455                  * into an inconsistent state.
456                  */
457                 for (msghdr = msqkptr->u.msg_first; msghdr != NULL;
458                     msghdr = msghdr->msg_next) {
459                         error = mac_sysvmsq_check_msgrmid(td->td_ucred, msghdr);
460                         if (error != 0)
461                                 goto done2;
462                 }
463 #endif
464
465                 racct_sub_cred(msqkptr->cred, RACCT_NMSGQ, 1);
466                 racct_sub_cred(msqkptr->cred, RACCT_MSGQQUEUED, msqkptr->u.msg_qnum);
467                 racct_sub_cred(msqkptr->cred, RACCT_MSGQSIZE, msqkptr->u.msg_cbytes);
468                 crfree(msqkptr->cred);
469                 msqkptr->cred = NULL;
470
471                 /* Free the message headers */
472                 msghdr = msqkptr->u.msg_first;
473                 while (msghdr != NULL) {
474                         struct msg *msghdr_tmp;
475
476                         /* Free the segments of each message */
477                         msqkptr->u.msg_cbytes -= msghdr->msg_ts;
478                         msqkptr->u.msg_qnum--;
479                         msghdr_tmp = msghdr;
480                         msghdr = msghdr->msg_next;
481                         msg_freehdr(msghdr_tmp);
482                 }
483
484                 if (msqkptr->u.msg_cbytes != 0)
485                         panic("msg_cbytes is screwed up");
486                 if (msqkptr->u.msg_qnum != 0)
487                         panic("msg_qnum is screwed up");
488
489                 msqkptr->u.msg_qbytes = 0;      /* Mark it as free */
490
491 #ifdef MAC
492                 mac_sysvmsq_cleanup(msqkptr);
493 #endif
494
495                 wakeup(msqkptr);
496         }
497
498                 break;
499
500         case IPC_SET:
501                 if ((error = ipcperm(td, &msqkptr->u.msg_perm, IPC_M)))
502                         goto done2;
503                 if (msqbuf->msg_qbytes > msqkptr->u.msg_qbytes) {
504                         error = priv_check(td, PRIV_IPC_MSGSIZE);
505                         if (error)
506                                 goto done2;
507                 }
508                 if (msqbuf->msg_qbytes > msginfo.msgmnb) {
509                         DPRINTF(("can't increase msg_qbytes beyond %d"
510                             "(truncating)\n", msginfo.msgmnb));
511                         msqbuf->msg_qbytes = msginfo.msgmnb;    /* silently restrict qbytes to system limit */
512                 }
513                 if (msqbuf->msg_qbytes == 0) {
514                         DPRINTF(("can't reduce msg_qbytes to 0\n"));
515                         error = EINVAL;         /* non-standard errno! */
516                         goto done2;
517                 }
518                 msqkptr->u.msg_perm.uid = msqbuf->msg_perm.uid; /* change the owner */
519                 msqkptr->u.msg_perm.gid = msqbuf->msg_perm.gid; /* change the owner */
520                 msqkptr->u.msg_perm.mode = (msqkptr->u.msg_perm.mode & ~0777) |
521                     (msqbuf->msg_perm.mode & 0777);
522                 msqkptr->u.msg_qbytes = msqbuf->msg_qbytes;
523                 msqkptr->u.msg_ctime = time_second;
524                 break;
525
526         case IPC_STAT:
527                 if ((error = ipcperm(td, &msqkptr->u.msg_perm, IPC_R))) {
528                         DPRINTF(("requester doesn't have read access\n"));
529                         goto done2;
530                 }
531                 *msqbuf = msqkptr->u;
532                 break;
533
534         default:
535                 DPRINTF(("invalid command %d\n", cmd));
536                 error = EINVAL;
537                 goto done2;
538         }
539
540         if (error == 0)
541                 td->td_retval[0] = rval;
542 done2:
543         mtx_unlock(&msq_mtx);
544         return (error);
545 }
546
547 #ifndef _SYS_SYSPROTO_H_
548 struct msgget_args {
549         key_t   key;
550         int     msgflg;
551 };
552 #endif
553
554 int
555 sys_msgget(td, uap)
556         struct thread *td;
557         register struct msgget_args *uap;
558 {
559         int msqid, error = 0;
560         int key = uap->key;
561         int msgflg = uap->msgflg;
562         struct ucred *cred = td->td_ucred;
563         register struct msqid_kernel *msqkptr = NULL;
564
565         DPRINTF(("msgget(0x%x, 0%o)\n", key, msgflg));
566
567         if (!prison_allow(td->td_ucred, PR_ALLOW_SYSVIPC))
568                 return (ENOSYS);
569
570         mtx_lock(&msq_mtx);
571         if (key != IPC_PRIVATE) {
572                 for (msqid = 0; msqid < msginfo.msgmni; msqid++) {
573                         msqkptr = &msqids[msqid];
574                         if (msqkptr->u.msg_qbytes != 0 &&
575                             msqkptr->u.msg_perm.key == key)
576                                 break;
577                 }
578                 if (msqid < msginfo.msgmni) {
579                         DPRINTF(("found public key\n"));
580                         if ((msgflg & IPC_CREAT) && (msgflg & IPC_EXCL)) {
581                                 DPRINTF(("not exclusive\n"));
582                                 error = EEXIST;
583                                 goto done2;
584                         }
585                         if ((error = ipcperm(td, &msqkptr->u.msg_perm,
586                             msgflg & 0700))) {
587                                 DPRINTF(("requester doesn't have 0%o access\n",
588                                     msgflg & 0700));
589                                 goto done2;
590                         }
591 #ifdef MAC
592                         error = mac_sysvmsq_check_msqget(cred, msqkptr);
593                         if (error != 0)
594                                 goto done2;
595 #endif
596                         goto found;
597                 }
598         }
599
600         DPRINTF(("need to allocate the msqid_ds\n"));
601         if (key == IPC_PRIVATE || (msgflg & IPC_CREAT)) {
602                 for (msqid = 0; msqid < msginfo.msgmni; msqid++) {
603                         /*
604                          * Look for an unallocated and unlocked msqid_ds.
605                          * msqid_ds's can be locked by msgsnd or msgrcv while
606                          * they are copying the message in/out.  We can't
607                          * re-use the entry until they release it.
608                          */
609                         msqkptr = &msqids[msqid];
610                         if (msqkptr->u.msg_qbytes == 0 &&
611                             (msqkptr->u.msg_perm.mode & MSG_LOCKED) == 0)
612                                 break;
613                 }
614                 if (msqid == msginfo.msgmni) {
615                         DPRINTF(("no more msqid_ds's available\n"));
616                         error = ENOSPC;
617                         goto done2;
618                 }
619 #ifdef RACCT
620                 if (racct_enable) {
621                         PROC_LOCK(td->td_proc);
622                         error = racct_add(td->td_proc, RACCT_NMSGQ, 1);
623                         PROC_UNLOCK(td->td_proc);
624                         if (error != 0) {
625                                 error = ENOSPC;
626                                 goto done2;
627                         }
628                 }
629 #endif
630                 DPRINTF(("msqid %d is available\n", msqid));
631                 msqkptr->u.msg_perm.key = key;
632                 msqkptr->u.msg_perm.cuid = cred->cr_uid;
633                 msqkptr->u.msg_perm.uid = cred->cr_uid;
634                 msqkptr->u.msg_perm.cgid = cred->cr_gid;
635                 msqkptr->u.msg_perm.gid = cred->cr_gid;
636                 msqkptr->u.msg_perm.mode = (msgflg & 0777);
637                 msqkptr->cred = crhold(cred);
638                 /* Make sure that the returned msqid is unique */
639                 msqkptr->u.msg_perm.seq = (msqkptr->u.msg_perm.seq + 1) & 0x7fff;
640                 msqkptr->u.msg_first = NULL;
641                 msqkptr->u.msg_last = NULL;
642                 msqkptr->u.msg_cbytes = 0;
643                 msqkptr->u.msg_qnum = 0;
644                 msqkptr->u.msg_qbytes = msginfo.msgmnb;
645                 msqkptr->u.msg_lspid = 0;
646                 msqkptr->u.msg_lrpid = 0;
647                 msqkptr->u.msg_stime = 0;
648                 msqkptr->u.msg_rtime = 0;
649                 msqkptr->u.msg_ctime = time_second;
650 #ifdef MAC
651                 mac_sysvmsq_create(cred, msqkptr);
652 #endif
653         } else {
654                 DPRINTF(("didn't find it and wasn't asked to create it\n"));
655                 error = ENOENT;
656                 goto done2;
657         }
658
659 found:
660         /* Construct the unique msqid */
661         td->td_retval[0] = IXSEQ_TO_IPCID(msqid, msqkptr->u.msg_perm);
662 done2:
663         mtx_unlock(&msq_mtx);
664         return (error);
665 }
666
667 #ifndef _SYS_SYSPROTO_H_
668 struct msgsnd_args {
669         int     msqid;
670         const void      *msgp;
671         size_t  msgsz;
672         int     msgflg;
673 };
674 #endif
675 int
676 kern_msgsnd(td, msqid, msgp, msgsz, msgflg, mtype)
677         struct thread *td;
678         int msqid;
679         const void *msgp;       /* XXX msgp is actually mtext. */
680         size_t msgsz;
681         int msgflg;
682         long mtype;
683 {
684         int msqix, segs_needed, error = 0;
685         register struct msqid_kernel *msqkptr;
686         register struct msg *msghdr;
687         short next;
688 #ifdef RACCT
689         size_t saved_msgsz;
690 #endif
691
692         if (!prison_allow(td->td_ucred, PR_ALLOW_SYSVIPC))
693                 return (ENOSYS);
694
695         mtx_lock(&msq_mtx);
696         msqix = IPCID_TO_IX(msqid);
697
698         if (msqix < 0 || msqix >= msginfo.msgmni) {
699                 DPRINTF(("msqid (%d) out of range (0<=msqid<%d)\n", msqix,
700                     msginfo.msgmni));
701                 error = EINVAL;
702                 goto done2;
703         }
704
705         msqkptr = &msqids[msqix];
706         if (msqkptr->u.msg_qbytes == 0) {
707                 DPRINTF(("no such message queue id\n"));
708                 error = EINVAL;
709                 goto done2;
710         }
711         if (msqkptr->u.msg_perm.seq != IPCID_TO_SEQ(msqid)) {
712                 DPRINTF(("wrong sequence number\n"));
713                 error = EINVAL;
714                 goto done2;
715         }
716
717         if ((error = ipcperm(td, &msqkptr->u.msg_perm, IPC_W))) {
718                 DPRINTF(("requester doesn't have write access\n"));
719                 goto done2;
720         }
721
722 #ifdef MAC
723         error = mac_sysvmsq_check_msqsnd(td->td_ucred, msqkptr);
724         if (error != 0)
725                 goto done2;
726 #endif
727
728 #ifdef RACCT
729         if (racct_enable) {
730                 PROC_LOCK(td->td_proc);
731                 if (racct_add(td->td_proc, RACCT_MSGQQUEUED, 1)) {
732                         PROC_UNLOCK(td->td_proc);
733                         error = EAGAIN;
734                         goto done2;
735                 }
736                 saved_msgsz = msgsz;
737                 if (racct_add(td->td_proc, RACCT_MSGQSIZE, msgsz)) {
738                         racct_sub(td->td_proc, RACCT_MSGQQUEUED, 1);
739                         PROC_UNLOCK(td->td_proc);
740                         error = EAGAIN;
741                         goto done2;
742                 }
743                 PROC_UNLOCK(td->td_proc);
744         }
745 #endif
746
747         segs_needed = (msgsz + msginfo.msgssz - 1) / msginfo.msgssz;
748         DPRINTF(("msgsz=%zu, msgssz=%d, segs_needed=%d\n", msgsz,
749             msginfo.msgssz, segs_needed));
750         for (;;) {
751                 int need_more_resources = 0;
752
753                 /*
754                  * check msgsz
755                  * (inside this loop in case msg_qbytes changes while we sleep)
756                  */
757
758                 if (msgsz > msqkptr->u.msg_qbytes) {
759                         DPRINTF(("msgsz > msqkptr->u.msg_qbytes\n"));
760                         error = EINVAL;
761                         goto done3;
762                 }
763
764                 if (msqkptr->u.msg_perm.mode & MSG_LOCKED) {
765                         DPRINTF(("msqid is locked\n"));
766                         need_more_resources = 1;
767                 }
768                 if (msgsz + msqkptr->u.msg_cbytes > msqkptr->u.msg_qbytes) {
769                         DPRINTF(("msgsz + msg_cbytes > msg_qbytes\n"));
770                         need_more_resources = 1;
771                 }
772                 if (segs_needed > nfree_msgmaps) {
773                         DPRINTF(("segs_needed > nfree_msgmaps\n"));
774                         need_more_resources = 1;
775                 }
776                 if (free_msghdrs == NULL) {
777                         DPRINTF(("no more msghdrs\n"));
778                         need_more_resources = 1;
779                 }
780
781                 if (need_more_resources) {
782                         int we_own_it;
783
784                         if ((msgflg & IPC_NOWAIT) != 0) {
785                                 DPRINTF(("need more resources but caller "
786                                     "doesn't want to wait\n"));
787                                 error = EAGAIN;
788                                 goto done3;
789                         }
790
791                         if ((msqkptr->u.msg_perm.mode & MSG_LOCKED) != 0) {
792                                 DPRINTF(("we don't own the msqid_ds\n"));
793                                 we_own_it = 0;
794                         } else {
795                                 /* Force later arrivals to wait for our
796                                    request */
797                                 DPRINTF(("we own the msqid_ds\n"));
798                                 msqkptr->u.msg_perm.mode |= MSG_LOCKED;
799                                 we_own_it = 1;
800                         }
801                         DPRINTF(("msgsnd:  goodnight\n"));
802                         error = msleep(msqkptr, &msq_mtx, (PZERO - 4) | PCATCH,
803                             "msgsnd", hz);
804                         DPRINTF(("msgsnd:  good morning, error=%d\n", error));
805                         if (we_own_it)
806                                 msqkptr->u.msg_perm.mode &= ~MSG_LOCKED;
807                         if (error == EWOULDBLOCK) {
808                                 DPRINTF(("msgsnd:  timed out\n"));
809                                 continue;
810                         }
811                         if (error != 0) {
812                                 DPRINTF(("msgsnd:  interrupted system call\n"));
813                                 error = EINTR;
814                                 goto done3;
815                         }
816
817                         /*
818                          * Make sure that the msq queue still exists
819                          */
820
821                         if (msqkptr->u.msg_qbytes == 0) {
822                                 DPRINTF(("msqid deleted\n"));
823                                 error = EIDRM;
824                                 goto done3;
825                         }
826
827                 } else {
828                         DPRINTF(("got all the resources that we need\n"));
829                         break;
830                 }
831         }
832
833         /*
834          * We have the resources that we need.
835          * Make sure!
836          */
837
838         if (msqkptr->u.msg_perm.mode & MSG_LOCKED)
839                 panic("msg_perm.mode & MSG_LOCKED");
840         if (segs_needed > nfree_msgmaps)
841                 panic("segs_needed > nfree_msgmaps");
842         if (msgsz + msqkptr->u.msg_cbytes > msqkptr->u.msg_qbytes)
843                 panic("msgsz + msg_cbytes > msg_qbytes");
844         if (free_msghdrs == NULL)
845                 panic("no more msghdrs");
846
847         /*
848          * Re-lock the msqid_ds in case we page-fault when copying in the
849          * message
850          */
851
852         if ((msqkptr->u.msg_perm.mode & MSG_LOCKED) != 0)
853                 panic("msqid_ds is already locked");
854         msqkptr->u.msg_perm.mode |= MSG_LOCKED;
855
856         /*
857          * Allocate a message header
858          */
859
860         msghdr = free_msghdrs;
861         free_msghdrs = msghdr->msg_next;
862         msghdr->msg_spot = -1;
863         msghdr->msg_ts = msgsz;
864         msghdr->msg_type = mtype;
865 #ifdef MAC
866         /*
867          * XXXMAC: Should the mac_sysvmsq_check_msgmsq check follow here
868          * immediately?  Or, should it be checked just before the msg is
869          * enqueued in the msgq (as it is done now)?
870          */
871         mac_sysvmsg_create(td->td_ucred, msqkptr, msghdr);
872 #endif
873
874         /*
875          * Allocate space for the message
876          */
877
878         while (segs_needed > 0) {
879                 if (nfree_msgmaps <= 0)
880                         panic("not enough msgmaps");
881                 if (free_msgmaps == -1)
882                         panic("nil free_msgmaps");
883                 next = free_msgmaps;
884                 if (next <= -1)
885                         panic("next too low #1");
886                 if (next >= msginfo.msgseg)
887                         panic("next out of range #1");
888                 DPRINTF(("allocating segment %d to message\n", next));
889                 free_msgmaps = msgmaps[next].next;
890                 nfree_msgmaps--;
891                 msgmaps[next].next = msghdr->msg_spot;
892                 msghdr->msg_spot = next;
893                 segs_needed--;
894         }
895
896         /*
897          * Validate the message type
898          */
899
900         if (msghdr->msg_type < 1) {
901                 msg_freehdr(msghdr);
902                 msqkptr->u.msg_perm.mode &= ~MSG_LOCKED;
903                 wakeup(msqkptr);
904                 DPRINTF(("mtype (%ld) < 1\n", msghdr->msg_type));
905                 error = EINVAL;
906                 goto done3;
907         }
908
909         /*
910          * Copy in the message body
911          */
912
913         next = msghdr->msg_spot;
914         while (msgsz > 0) {
915                 size_t tlen;
916                 if (msgsz > msginfo.msgssz)
917                         tlen = msginfo.msgssz;
918                 else
919                         tlen = msgsz;
920                 if (next <= -1)
921                         panic("next too low #2");
922                 if (next >= msginfo.msgseg)
923                         panic("next out of range #2");
924                 mtx_unlock(&msq_mtx);
925                 if ((error = copyin(msgp, &msgpool[next * msginfo.msgssz],
926                     tlen)) != 0) {
927                         mtx_lock(&msq_mtx);
928                         DPRINTF(("error %d copying in message segment\n",
929                             error));
930                         msg_freehdr(msghdr);
931                         msqkptr->u.msg_perm.mode &= ~MSG_LOCKED;
932                         wakeup(msqkptr);
933                         goto done3;
934                 }
935                 mtx_lock(&msq_mtx);
936                 msgsz -= tlen;
937                 msgp = (const char *)msgp + tlen;
938                 next = msgmaps[next].next;
939         }
940         if (next != -1)
941                 panic("didn't use all the msg segments");
942
943         /*
944          * We've got the message.  Unlock the msqid_ds.
945          */
946
947         msqkptr->u.msg_perm.mode &= ~MSG_LOCKED;
948
949         /*
950          * Make sure that the msqid_ds is still allocated.
951          */
952
953         if (msqkptr->u.msg_qbytes == 0) {
954                 msg_freehdr(msghdr);
955                 wakeup(msqkptr);
956                 error = EIDRM;
957                 goto done3;
958         }
959
960 #ifdef MAC
961         /*
962          * Note: Since the task/thread allocates the msghdr and usually
963          * primes it with its own MAC label, for a majority of policies, it
964          * won't be necessary to check whether the msghdr has access
965          * permissions to the msgq.  The mac_sysvmsq_check_msqsnd check would
966          * suffice in that case.  However, this hook may be required where
967          * individual policies derive a non-identical label for the msghdr
968          * from the current thread label and may want to check the msghdr
969          * enqueue permissions, along with read/write permissions to the
970          * msgq.
971          */
972         error = mac_sysvmsq_check_msgmsq(td->td_ucred, msghdr, msqkptr);
973         if (error != 0) {
974                 msg_freehdr(msghdr);
975                 wakeup(msqkptr);
976                 goto done3;
977         }
978 #endif
979
980         /*
981          * Put the message into the queue
982          */
983         if (msqkptr->u.msg_first == NULL) {
984                 msqkptr->u.msg_first = msghdr;
985                 msqkptr->u.msg_last = msghdr;
986         } else {
987                 msqkptr->u.msg_last->msg_next = msghdr;
988                 msqkptr->u.msg_last = msghdr;
989         }
990         msqkptr->u.msg_last->msg_next = NULL;
991
992         msqkptr->u.msg_cbytes += msghdr->msg_ts;
993         msqkptr->u.msg_qnum++;
994         msqkptr->u.msg_lspid = td->td_proc->p_pid;
995         msqkptr->u.msg_stime = time_second;
996
997         wakeup(msqkptr);
998         td->td_retval[0] = 0;
999 done3:
1000 #ifdef RACCT
1001         if (racct_enable && error != 0) {
1002                 PROC_LOCK(td->td_proc);
1003                 racct_sub(td->td_proc, RACCT_MSGQQUEUED, 1);
1004                 racct_sub(td->td_proc, RACCT_MSGQSIZE, saved_msgsz);
1005                 PROC_UNLOCK(td->td_proc);
1006         }
1007 #endif
1008 done2:
1009         mtx_unlock(&msq_mtx);
1010         return (error);
1011 }
1012
1013 int
1014 sys_msgsnd(td, uap)
1015         struct thread *td;
1016         register struct msgsnd_args *uap;
1017 {
1018         int error;
1019         long mtype;
1020
1021         DPRINTF(("call to msgsnd(%d, %p, %zu, %d)\n", uap->msqid, uap->msgp,
1022             uap->msgsz, uap->msgflg));
1023
1024         if ((error = copyin(uap->msgp, &mtype, sizeof(mtype))) != 0) {
1025                 DPRINTF(("error %d copying the message type\n", error));
1026                 return (error);
1027         }
1028         return (kern_msgsnd(td, uap->msqid,
1029             (const char *)uap->msgp + sizeof(mtype),
1030             uap->msgsz, uap->msgflg, mtype));
1031 }
1032
1033 #ifndef _SYS_SYSPROTO_H_
1034 struct msgrcv_args {
1035         int     msqid;
1036         void    *msgp;
1037         size_t  msgsz;
1038         long    msgtyp;
1039         int     msgflg;
1040 };
1041 #endif
1042 int
1043 kern_msgrcv(td, msqid, msgp, msgsz, msgtyp, msgflg, mtype)
1044         struct thread *td;
1045         int msqid;
1046         void *msgp;     /* XXX msgp is actually mtext. */
1047         size_t msgsz;
1048         long msgtyp;
1049         int msgflg;
1050         long *mtype;
1051 {
1052         size_t len;
1053         register struct msqid_kernel *msqkptr;
1054         register struct msg *msghdr;
1055         int msqix, error = 0;
1056         short next;
1057
1058         if (!prison_allow(td->td_ucred, PR_ALLOW_SYSVIPC))
1059                 return (ENOSYS);
1060
1061         msqix = IPCID_TO_IX(msqid);
1062
1063         if (msqix < 0 || msqix >= msginfo.msgmni) {
1064                 DPRINTF(("msqid (%d) out of range (0<=msqid<%d)\n", msqix,
1065                     msginfo.msgmni));
1066                 return (EINVAL);
1067         }
1068
1069         msqkptr = &msqids[msqix];
1070         mtx_lock(&msq_mtx);
1071         if (msqkptr->u.msg_qbytes == 0) {
1072                 DPRINTF(("no such message queue id\n"));
1073                 error = EINVAL;
1074                 goto done2;
1075         }
1076         if (msqkptr->u.msg_perm.seq != IPCID_TO_SEQ(msqid)) {
1077                 DPRINTF(("wrong sequence number\n"));
1078                 error = EINVAL;
1079                 goto done2;
1080         }
1081
1082         if ((error = ipcperm(td, &msqkptr->u.msg_perm, IPC_R))) {
1083                 DPRINTF(("requester doesn't have read access\n"));
1084                 goto done2;
1085         }
1086
1087 #ifdef MAC
1088         error = mac_sysvmsq_check_msqrcv(td->td_ucred, msqkptr);
1089         if (error != 0)
1090                 goto done2;
1091 #endif
1092
1093         msghdr = NULL;
1094         while (msghdr == NULL) {
1095                 if (msgtyp == 0) {
1096                         msghdr = msqkptr->u.msg_first;
1097                         if (msghdr != NULL) {
1098                                 if (msgsz < msghdr->msg_ts &&
1099                                     (msgflg & MSG_NOERROR) == 0) {
1100                                         DPRINTF(("first message on the queue "
1101                                             "is too big (want %zu, got %d)\n",
1102                                             msgsz, msghdr->msg_ts));
1103                                         error = E2BIG;
1104                                         goto done2;
1105                                 }
1106 #ifdef MAC
1107                                 error = mac_sysvmsq_check_msgrcv(td->td_ucred,
1108                                     msghdr);
1109                                 if (error != 0)
1110                                         goto done2;
1111 #endif
1112                                 if (msqkptr->u.msg_first == msqkptr->u.msg_last) {
1113                                         msqkptr->u.msg_first = NULL;
1114                                         msqkptr->u.msg_last = NULL;
1115                                 } else {
1116                                         msqkptr->u.msg_first = msghdr->msg_next;
1117                                         if (msqkptr->u.msg_first == NULL)
1118                                                 panic("msg_first/last screwed up #1");
1119                                 }
1120                         }
1121                 } else {
1122                         struct msg *previous;
1123                         struct msg **prev;
1124
1125                         previous = NULL;
1126                         prev = &(msqkptr->u.msg_first);
1127                         while ((msghdr = *prev) != NULL) {
1128                                 /*
1129                                  * Is this message's type an exact match or is
1130                                  * this message's type less than or equal to
1131                                  * the absolute value of a negative msgtyp?
1132                                  * Note that the second half of this test can
1133                                  * NEVER be true if msgtyp is positive since
1134                                  * msg_type is always positive!
1135                                  */
1136
1137                                 if (msgtyp == msghdr->msg_type ||
1138                                     msghdr->msg_type <= -msgtyp) {
1139                                         DPRINTF(("found message type %ld, "
1140                                             "requested %ld\n",
1141                                             msghdr->msg_type, msgtyp));
1142                                         if (msgsz < msghdr->msg_ts &&
1143                                             (msgflg & MSG_NOERROR) == 0) {
1144                                                 DPRINTF(("requested message "
1145                                                     "on the queue is too big "
1146                                                     "(want %zu, got %hu)\n",
1147                                                     msgsz, msghdr->msg_ts));
1148                                                 error = E2BIG;
1149                                                 goto done2;
1150                                         }
1151 #ifdef MAC
1152                                         error = mac_sysvmsq_check_msgrcv(
1153                                             td->td_ucred, msghdr);
1154                                         if (error != 0)
1155                                                 goto done2;
1156 #endif
1157                                         *prev = msghdr->msg_next;
1158                                         if (msghdr == msqkptr->u.msg_last) {
1159                                                 if (previous == NULL) {
1160                                                         if (prev !=
1161                                                             &msqkptr->u.msg_first)
1162                                                                 panic("msg_first/last screwed up #2");
1163                                                         msqkptr->u.msg_first =
1164                                                             NULL;
1165                                                         msqkptr->u.msg_last =
1166                                                             NULL;
1167                                                 } else {
1168                                                         if (prev ==
1169                                                             &msqkptr->u.msg_first)
1170                                                                 panic("msg_first/last screwed up #3");
1171                                                         msqkptr->u.msg_last =
1172                                                             previous;
1173                                                 }
1174                                         }
1175                                         break;
1176                                 }
1177                                 previous = msghdr;
1178                                 prev = &(msghdr->msg_next);
1179                         }
1180                 }
1181
1182                 /*
1183                  * We've either extracted the msghdr for the appropriate
1184                  * message or there isn't one.
1185                  * If there is one then bail out of this loop.
1186                  */
1187
1188                 if (msghdr != NULL)
1189                         break;
1190
1191                 /*
1192                  * Hmph!  No message found.  Does the user want to wait?
1193                  */
1194
1195                 if ((msgflg & IPC_NOWAIT) != 0) {
1196                         DPRINTF(("no appropriate message found (msgtyp=%ld)\n",
1197                             msgtyp));
1198                         /* The SVID says to return ENOMSG. */
1199                         error = ENOMSG;
1200                         goto done2;
1201                 }
1202
1203                 /*
1204                  * Wait for something to happen
1205                  */
1206
1207                 DPRINTF(("msgrcv:  goodnight\n"));
1208                 error = msleep(msqkptr, &msq_mtx, (PZERO - 4) | PCATCH,
1209                     "msgrcv", 0);
1210                 DPRINTF(("msgrcv:  good morning (error=%d)\n", error));
1211
1212                 if (error != 0) {
1213                         DPRINTF(("msgrcv:  interrupted system call\n"));
1214                         error = EINTR;
1215                         goto done2;
1216                 }
1217
1218                 /*
1219                  * Make sure that the msq queue still exists
1220                  */
1221
1222                 if (msqkptr->u.msg_qbytes == 0 ||
1223                     msqkptr->u.msg_perm.seq != IPCID_TO_SEQ(msqid)) {
1224                         DPRINTF(("msqid deleted\n"));
1225                         error = EIDRM;
1226                         goto done2;
1227                 }
1228         }
1229
1230         /*
1231          * Return the message to the user.
1232          *
1233          * First, do the bookkeeping (before we risk being interrupted).
1234          */
1235
1236         msqkptr->u.msg_cbytes -= msghdr->msg_ts;
1237         msqkptr->u.msg_qnum--;
1238         msqkptr->u.msg_lrpid = td->td_proc->p_pid;
1239         msqkptr->u.msg_rtime = time_second;
1240
1241         racct_sub_cred(msqkptr->cred, RACCT_MSGQQUEUED, 1);
1242         racct_sub_cred(msqkptr->cred, RACCT_MSGQSIZE, msghdr->msg_ts);
1243
1244         /*
1245          * Make msgsz the actual amount that we'll be returning.
1246          * Note that this effectively truncates the message if it is too long
1247          * (since msgsz is never increased).
1248          */
1249
1250         DPRINTF(("found a message, msgsz=%zu, msg_ts=%hu\n", msgsz,
1251             msghdr->msg_ts));
1252         if (msgsz > msghdr->msg_ts)
1253                 msgsz = msghdr->msg_ts;
1254         *mtype = msghdr->msg_type;
1255
1256         /*
1257          * Return the segments to the user
1258          */
1259
1260         next = msghdr->msg_spot;
1261         for (len = 0; len < msgsz; len += msginfo.msgssz) {
1262                 size_t tlen;
1263
1264                 if (msgsz - len > msginfo.msgssz)
1265                         tlen = msginfo.msgssz;
1266                 else
1267                         tlen = msgsz - len;
1268                 if (next <= -1)
1269                         panic("next too low #3");
1270                 if (next >= msginfo.msgseg)
1271                         panic("next out of range #3");
1272                 mtx_unlock(&msq_mtx);
1273                 error = copyout(&msgpool[next * msginfo.msgssz], msgp, tlen);
1274                 mtx_lock(&msq_mtx);
1275                 if (error != 0) {
1276                         DPRINTF(("error (%d) copying out message segment\n",
1277                             error));
1278                         msg_freehdr(msghdr);
1279                         wakeup(msqkptr);
1280                         goto done2;
1281                 }
1282                 msgp = (char *)msgp + tlen;
1283                 next = msgmaps[next].next;
1284         }
1285
1286         /*
1287          * Done, return the actual number of bytes copied out.
1288          */
1289
1290         msg_freehdr(msghdr);
1291         wakeup(msqkptr);
1292         td->td_retval[0] = msgsz;
1293 done2:
1294         mtx_unlock(&msq_mtx);
1295         return (error);
1296 }
1297
1298 int
1299 sys_msgrcv(td, uap)
1300         struct thread *td;
1301         register struct msgrcv_args *uap;
1302 {
1303         int error;
1304         long mtype;
1305
1306         DPRINTF(("call to msgrcv(%d, %p, %zu, %ld, %d)\n", uap->msqid,
1307             uap->msgp, uap->msgsz, uap->msgtyp, uap->msgflg));
1308
1309         if ((error = kern_msgrcv(td, uap->msqid,
1310             (char *)uap->msgp + sizeof(mtype), uap->msgsz,
1311             uap->msgtyp, uap->msgflg, &mtype)) != 0)
1312                 return (error);
1313         if ((error = copyout(&mtype, uap->msgp, sizeof(mtype))) != 0)
1314                 DPRINTF(("error %d copying the message type\n", error));
1315         return (error);
1316 }
1317
1318 static int
1319 sysctl_msqids(SYSCTL_HANDLER_ARGS)
1320 {
1321
1322         return (SYSCTL_OUT(req, msqids,
1323             sizeof(struct msqid_kernel) * msginfo.msgmni));
1324 }
1325
1326 SYSCTL_INT(_kern_ipc, OID_AUTO, msgmax, CTLFLAG_RD, &msginfo.msgmax, 0,
1327     "Maximum message size");
1328 SYSCTL_INT(_kern_ipc, OID_AUTO, msgmni, CTLFLAG_RDTUN, &msginfo.msgmni, 0,
1329     "Number of message queue identifiers");
1330 SYSCTL_INT(_kern_ipc, OID_AUTO, msgmnb, CTLFLAG_RDTUN, &msginfo.msgmnb, 0,
1331     "Maximum number of bytes in a queue");
1332 SYSCTL_INT(_kern_ipc, OID_AUTO, msgtql, CTLFLAG_RDTUN, &msginfo.msgtql, 0,
1333     "Maximum number of messages in the system");
1334 SYSCTL_INT(_kern_ipc, OID_AUTO, msgssz, CTLFLAG_RDTUN, &msginfo.msgssz, 0,
1335     "Size of a message segment");
1336 SYSCTL_INT(_kern_ipc, OID_AUTO, msgseg, CTLFLAG_RDTUN, &msginfo.msgseg, 0,
1337     "Number of message segments");
1338 SYSCTL_PROC(_kern_ipc, OID_AUTO, msqids, CTLTYPE_OPAQUE | CTLFLAG_RD,
1339     NULL, 0, sysctl_msqids, "", "Message queue IDs");
1340
1341 #ifdef COMPAT_FREEBSD32
1342 int
1343 freebsd32_msgsys(struct thread *td, struct freebsd32_msgsys_args *uap)
1344 {
1345
1346 #if defined(COMPAT_FREEBSD4) || defined(COMPAT_FREEBSD5) || \
1347     defined(COMPAT_FREEBSD6) || defined(COMPAT_FREEBSD7)
1348         switch (uap->which) {
1349         case 0:
1350                 return (freebsd7_freebsd32_msgctl(td,
1351                     (struct freebsd7_freebsd32_msgctl_args *)&uap->a2));
1352         case 2:
1353                 return (freebsd32_msgsnd(td,
1354                     (struct freebsd32_msgsnd_args *)&uap->a2));
1355         case 3:
1356                 return (freebsd32_msgrcv(td,
1357                     (struct freebsd32_msgrcv_args *)&uap->a2));
1358         default:
1359                 return (sys_msgsys(td, (struct msgsys_args *)uap));
1360         }
1361 #else
1362         return (nosys(td, NULL));
1363 #endif
1364 }
1365
1366 #if defined(COMPAT_FREEBSD4) || defined(COMPAT_FREEBSD5) || \
1367     defined(COMPAT_FREEBSD6) || defined(COMPAT_FREEBSD7)
1368 int
1369 freebsd7_freebsd32_msgctl(struct thread *td,
1370     struct freebsd7_freebsd32_msgctl_args *uap)
1371 {
1372         struct msqid_ds msqbuf;
1373         struct msqid_ds32_old msqbuf32;
1374         int error;
1375
1376         if (uap->cmd == IPC_SET) {
1377                 error = copyin(uap->buf, &msqbuf32, sizeof(msqbuf32));
1378                 if (error)
1379                         return (error);
1380                 freebsd32_ipcperm_old_in(&msqbuf32.msg_perm, &msqbuf.msg_perm);
1381                 PTRIN_CP(msqbuf32, msqbuf, msg_first);
1382                 PTRIN_CP(msqbuf32, msqbuf, msg_last);
1383                 CP(msqbuf32, msqbuf, msg_cbytes);
1384                 CP(msqbuf32, msqbuf, msg_qnum);
1385                 CP(msqbuf32, msqbuf, msg_qbytes);
1386                 CP(msqbuf32, msqbuf, msg_lspid);
1387                 CP(msqbuf32, msqbuf, msg_lrpid);
1388                 CP(msqbuf32, msqbuf, msg_stime);
1389                 CP(msqbuf32, msqbuf, msg_rtime);
1390                 CP(msqbuf32, msqbuf, msg_ctime);
1391         }
1392         error = kern_msgctl(td, uap->msqid, uap->cmd, &msqbuf);
1393         if (error)
1394                 return (error);
1395         if (uap->cmd == IPC_STAT) {
1396                 bzero(&msqbuf32, sizeof(msqbuf32));
1397                 freebsd32_ipcperm_old_out(&msqbuf.msg_perm, &msqbuf32.msg_perm);
1398                 PTROUT_CP(msqbuf, msqbuf32, msg_first);
1399                 PTROUT_CP(msqbuf, msqbuf32, msg_last);
1400                 CP(msqbuf, msqbuf32, msg_cbytes);
1401                 CP(msqbuf, msqbuf32, msg_qnum);
1402                 CP(msqbuf, msqbuf32, msg_qbytes);
1403                 CP(msqbuf, msqbuf32, msg_lspid);
1404                 CP(msqbuf, msqbuf32, msg_lrpid);
1405                 CP(msqbuf, msqbuf32, msg_stime);
1406                 CP(msqbuf, msqbuf32, msg_rtime);
1407                 CP(msqbuf, msqbuf32, msg_ctime);
1408                 error = copyout(&msqbuf32, uap->buf, sizeof(struct msqid_ds32));
1409         }
1410         return (error);
1411 }
1412 #endif
1413
1414 int
1415 freebsd32_msgctl(struct thread *td, struct freebsd32_msgctl_args *uap)
1416 {
1417         struct msqid_ds msqbuf;
1418         struct msqid_ds32 msqbuf32;
1419         int error;
1420
1421         if (uap->cmd == IPC_SET) {
1422                 error = copyin(uap->buf, &msqbuf32, sizeof(msqbuf32));
1423                 if (error)
1424                         return (error);
1425                 freebsd32_ipcperm_in(&msqbuf32.msg_perm, &msqbuf.msg_perm);
1426                 PTRIN_CP(msqbuf32, msqbuf, msg_first);
1427                 PTRIN_CP(msqbuf32, msqbuf, msg_last);
1428                 CP(msqbuf32, msqbuf, msg_cbytes);
1429                 CP(msqbuf32, msqbuf, msg_qnum);
1430                 CP(msqbuf32, msqbuf, msg_qbytes);
1431                 CP(msqbuf32, msqbuf, msg_lspid);
1432                 CP(msqbuf32, msqbuf, msg_lrpid);
1433                 CP(msqbuf32, msqbuf, msg_stime);
1434                 CP(msqbuf32, msqbuf, msg_rtime);
1435                 CP(msqbuf32, msqbuf, msg_ctime);
1436         }
1437         error = kern_msgctl(td, uap->msqid, uap->cmd, &msqbuf);
1438         if (error)
1439                 return (error);
1440         if (uap->cmd == IPC_STAT) {
1441                 freebsd32_ipcperm_out(&msqbuf.msg_perm, &msqbuf32.msg_perm);
1442                 PTROUT_CP(msqbuf, msqbuf32, msg_first);
1443                 PTROUT_CP(msqbuf, msqbuf32, msg_last);
1444                 CP(msqbuf, msqbuf32, msg_cbytes);
1445                 CP(msqbuf, msqbuf32, msg_qnum);
1446                 CP(msqbuf, msqbuf32, msg_qbytes);
1447                 CP(msqbuf, msqbuf32, msg_lspid);
1448                 CP(msqbuf, msqbuf32, msg_lrpid);
1449                 CP(msqbuf, msqbuf32, msg_stime);
1450                 CP(msqbuf, msqbuf32, msg_rtime);
1451                 CP(msqbuf, msqbuf32, msg_ctime);
1452                 error = copyout(&msqbuf32, uap->buf, sizeof(struct msqid_ds32));
1453         }
1454         return (error);
1455 }
1456
1457 int
1458 freebsd32_msgsnd(struct thread *td, struct freebsd32_msgsnd_args *uap)
1459 {
1460         const void *msgp;
1461         long mtype;
1462         int32_t mtype32;
1463         int error;
1464
1465         msgp = PTRIN(uap->msgp);
1466         if ((error = copyin(msgp, &mtype32, sizeof(mtype32))) != 0)
1467                 return (error);
1468         mtype = mtype32;
1469         return (kern_msgsnd(td, uap->msqid,
1470             (const char *)msgp + sizeof(mtype32),
1471             uap->msgsz, uap->msgflg, mtype));
1472 }
1473
1474 int
1475 freebsd32_msgrcv(struct thread *td, struct freebsd32_msgrcv_args *uap)
1476 {
1477         void *msgp;
1478         long mtype;
1479         int32_t mtype32;
1480         int error;
1481
1482         msgp = PTRIN(uap->msgp);
1483         if ((error = kern_msgrcv(td, uap->msqid,
1484             (char *)msgp + sizeof(mtype32), uap->msgsz,
1485             uap->msgtyp, uap->msgflg, &mtype)) != 0)
1486                 return (error);
1487         mtype32 = (int32_t)mtype;
1488         return (copyout(&mtype32, msgp, sizeof(mtype32)));
1489 }
1490 #endif
1491
1492 #if defined(COMPAT_FREEBSD4) || defined(COMPAT_FREEBSD5) || \
1493     defined(COMPAT_FREEBSD6) || defined(COMPAT_FREEBSD7)
1494
1495 /* XXX casting to (sy_call_t *) is bogus, as usual. */
1496 static sy_call_t *msgcalls[] = {
1497         (sy_call_t *)freebsd7_msgctl, (sy_call_t *)sys_msgget,
1498         (sy_call_t *)sys_msgsnd, (sy_call_t *)sys_msgrcv
1499 };
1500
1501 /*
1502  * Entry point for all MSG calls.
1503  */
1504 int
1505 sys_msgsys(td, uap)
1506         struct thread *td;
1507         /* XXX actually varargs. */
1508         struct msgsys_args /* {
1509                 int     which;
1510                 int     a2;
1511                 int     a3;
1512                 int     a4;
1513                 int     a5;
1514                 int     a6;
1515         } */ *uap;
1516 {
1517         int error;
1518
1519         if (!prison_allow(td->td_ucred, PR_ALLOW_SYSVIPC))
1520                 return (ENOSYS);
1521         if (uap->which < 0 ||
1522             uap->which >= sizeof(msgcalls)/sizeof(msgcalls[0]))
1523                 return (EINVAL);
1524         error = (*msgcalls[uap->which])(td, &uap->a2);
1525         return (error);
1526 }
1527
1528 #ifndef CP
1529 #define CP(src, dst, fld)       do { (dst).fld = (src).fld; } while (0)
1530 #endif
1531
1532 #ifndef _SYS_SYSPROTO_H_
1533 struct freebsd7_msgctl_args {
1534         int     msqid;
1535         int     cmd;
1536         struct  msqid_ds_old *buf;
1537 };
1538 #endif
1539 int
1540 freebsd7_msgctl(td, uap)
1541         struct thread *td;
1542         struct freebsd7_msgctl_args *uap;
1543 {
1544         struct msqid_ds_old msqold;
1545         struct msqid_ds msqbuf;
1546         int error;
1547
1548         DPRINTF(("call to freebsd7_msgctl(%d, %d, %p)\n", uap->msqid, uap->cmd,
1549             uap->buf));
1550         if (uap->cmd == IPC_SET) {
1551                 error = copyin(uap->buf, &msqold, sizeof(msqold));
1552                 if (error)
1553                         return (error);
1554                 ipcperm_old2new(&msqold.msg_perm, &msqbuf.msg_perm);
1555                 CP(msqold, msqbuf, msg_first);
1556                 CP(msqold, msqbuf, msg_last);
1557                 CP(msqold, msqbuf, msg_cbytes);
1558                 CP(msqold, msqbuf, msg_qnum);
1559                 CP(msqold, msqbuf, msg_qbytes);
1560                 CP(msqold, msqbuf, msg_lspid);
1561                 CP(msqold, msqbuf, msg_lrpid);
1562                 CP(msqold, msqbuf, msg_stime);
1563                 CP(msqold, msqbuf, msg_rtime);
1564                 CP(msqold, msqbuf, msg_ctime);
1565         }
1566         error = kern_msgctl(td, uap->msqid, uap->cmd, &msqbuf);
1567         if (error)
1568                 return (error);
1569         if (uap->cmd == IPC_STAT) {
1570                 bzero(&msqold, sizeof(msqold));
1571                 ipcperm_new2old(&msqbuf.msg_perm, &msqold.msg_perm);
1572                 CP(msqbuf, msqold, msg_first);
1573                 CP(msqbuf, msqold, msg_last);
1574                 CP(msqbuf, msqold, msg_cbytes);
1575                 CP(msqbuf, msqold, msg_qnum);
1576                 CP(msqbuf, msqold, msg_qbytes);
1577                 CP(msqbuf, msqold, msg_lspid);
1578                 CP(msqbuf, msqold, msg_lrpid);
1579                 CP(msqbuf, msqold, msg_stime);
1580                 CP(msqbuf, msqold, msg_rtime);
1581                 CP(msqbuf, msqold, msg_ctime);
1582                 error = copyout(&msqold, uap->buf, sizeof(struct msqid_ds_old));
1583         }
1584         return (error);
1585 }
1586
1587 #undef CP
1588
1589 #endif  /* COMPAT_FREEBSD4 || COMPAT_FREEBSD5 || COMPAT_FREEBSD6 ||
1590            COMPAT_FREEBSD7 */