]> CyberLeo.Net >> Repos - FreeBSD/releng/7.2.git/blob - sys/compat/linux/linux_socket.c
Create releng/7.2 from stable/7 in preparation for 7.2-RELEASE.
[FreeBSD/releng/7.2.git] / sys / compat / linux / linux_socket.c
1 /*-
2  * Copyright (c) 1995 Søren Schmidt
3  * All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  * 1. Redistributions of source code must retain the above copyright
9  *    notice, this list of conditions and the following disclaimer
10  *    in this position and unchanged.
11  * 2. Redistributions in binary form must reproduce the above copyright
12  *    notice, this list of conditions and the following disclaimer in the
13  *    documentation and/or other materials provided with the distribution.
14  * 3. The name of the author may not be used to endorse or promote products
15  *    derived from this software without specific prior written permission
16  *
17  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR ``AS IS'' AND ANY EXPRESS OR
18  * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
19  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
20  * IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT, INDIRECT,
21  * INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT
22  * NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
23  * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
24  * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
25  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
26  * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
27  */
28
29 #include <sys/cdefs.h>
30 __FBSDID("$FreeBSD$");
31
32 /* XXX we use functions that might not exist. */
33 #include "opt_compat.h"
34 #include "opt_inet6.h"
35
36 #include <sys/param.h>
37 #include <sys/proc.h>
38 #include <sys/systm.h>
39 #include <sys/sysproto.h>
40 #include <sys/fcntl.h>
41 #include <sys/file.h>
42 #include <sys/limits.h>
43 #include <sys/lock.h>
44 #include <sys/malloc.h>
45 #include <sys/mutex.h>
46 #include <sys/mbuf.h>
47 #include <sys/socket.h>
48 #include <sys/socketvar.h>
49 #include <sys/syscallsubr.h>
50 #include <sys/uio.h>
51 #include <sys/syslog.h>
52 #include <sys/un.h>
53
54 #include <netinet/in.h>
55 #include <netinet/in_systm.h>
56 #include <netinet/ip.h>
57 #ifdef INET6
58 #include <netinet/ip6.h>
59 #include <netinet6/ip6_var.h>
60 #endif
61
62 #ifdef COMPAT_LINUX32
63 #include <machine/../linux32/linux.h>
64 #include <machine/../linux32/linux32_proto.h>
65 #else
66 #include <machine/../linux/linux.h>
67 #include <machine/../linux/linux_proto.h>
68 #endif
69 #include <compat/linux/linux_socket.h>
70 #include <compat/linux/linux_util.h>
71
72 static int do_sa_get(struct sockaddr **, const struct osockaddr *, int *,
73     struct malloc_type *);
74 static int linux_to_bsd_domain(int);
75
76 /*
77  * Reads a linux sockaddr and does any necessary translation.
78  * Linux sockaddrs don't have a length field, only a family.
79  */
80 static int
81 linux_getsockaddr(struct sockaddr **sap, const struct osockaddr *osa, int len)
82 {
83         int osalen = len;
84
85         return (do_sa_get(sap, osa, &osalen, M_SONAME));
86 }
87
88 /*
89  * Copy the osockaddr structure pointed to by osa to kernel, adjust
90  * family and convert to sockaddr.
91  */
92 static int
93 do_sa_get(struct sockaddr **sap, const struct osockaddr *osa, int *osalen,
94     struct malloc_type *mtype)
95 {
96         int error=0, bdom;
97         struct sockaddr *sa;
98         struct osockaddr *kosa;
99         int alloclen;
100 #ifdef INET6
101         int oldv6size;
102         struct sockaddr_in6 *sin6;
103 #endif
104
105         if (*osalen < 2 || *osalen > UCHAR_MAX || !osa)
106                 return (EINVAL);
107
108         alloclen = *osalen;
109 #ifdef INET6
110         oldv6size = 0;
111         /*
112          * Check for old (pre-RFC2553) sockaddr_in6. We may accept it
113          * if it's a v4-mapped address, so reserve the proper space
114          * for it.
115          */
116         if (alloclen == sizeof (struct sockaddr_in6) - sizeof (u_int32_t)) {
117                 alloclen = sizeof (struct sockaddr_in6);
118                 oldv6size = 1;
119         }
120 #endif
121
122         MALLOC(kosa, struct osockaddr *, alloclen, mtype, M_WAITOK);
123
124         if ((error = copyin(osa, kosa, *osalen)))
125                 goto out;
126
127         bdom = linux_to_bsd_domain(kosa->sa_family);
128         if (bdom == -1) {
129                 error = EINVAL;
130                 goto out;
131         }
132
133 #ifdef INET6
134         /*
135          * Older Linux IPv6 code uses obsolete RFC2133 struct sockaddr_in6,
136          * which lacks the scope id compared with RFC2553 one. If we detect
137          * the situation, reject the address and write a message to system log.
138          *
139          * Still accept addresses for which the scope id is not used.
140          */
141         if (oldv6size && bdom == AF_INET6) {
142                 sin6 = (struct sockaddr_in6 *)kosa;
143                 if (IN6_IS_ADDR_V4MAPPED(&sin6->sin6_addr) ||
144                     (!IN6_IS_ADDR_LINKLOCAL(&sin6->sin6_addr) &&
145                      !IN6_IS_ADDR_SITELOCAL(&sin6->sin6_addr) &&
146                      !IN6_IS_ADDR_V4COMPAT(&sin6->sin6_addr) &&
147                      !IN6_IS_ADDR_UNSPECIFIED(&sin6->sin6_addr) &&
148                      !IN6_IS_ADDR_MULTICAST(&sin6->sin6_addr))) {
149                         sin6->sin6_scope_id = 0;
150                 } else {
151                         log(LOG_DEBUG,
152                             "obsolete pre-RFC2553 sockaddr_in6 rejected\n");
153                         error = EINVAL;
154                         goto out;
155                 }
156         } else
157 #endif
158         if (bdom == AF_INET)
159                 alloclen = sizeof(struct sockaddr_in);
160
161         sa = (struct sockaddr *) kosa;
162         sa->sa_family = bdom;
163         sa->sa_len = alloclen;
164
165         *sap = sa;
166         *osalen = alloclen;
167         return (0);
168
169 out:
170         FREE(kosa, mtype);
171         return (error);
172 }
173
174 static int
175 linux_to_bsd_domain(int domain)
176 {
177
178         switch (domain) {
179         case LINUX_AF_UNSPEC:
180                 return (AF_UNSPEC);
181         case LINUX_AF_UNIX:
182                 return (AF_LOCAL);
183         case LINUX_AF_INET:
184                 return (AF_INET);
185         case LINUX_AF_INET6:
186                 return (AF_INET6);
187         case LINUX_AF_AX25:
188                 return (AF_CCITT);
189         case LINUX_AF_IPX:
190                 return (AF_IPX);
191         case LINUX_AF_APPLETALK:
192                 return (AF_APPLETALK);
193         }
194         return (-1);
195 }
196
197 static int
198 bsd_to_linux_domain(int domain)
199 {
200
201         switch (domain) {
202         case AF_UNSPEC:
203                 return (LINUX_AF_UNSPEC);
204         case AF_LOCAL:
205                 return (LINUX_AF_UNIX);
206         case AF_INET:
207                 return (LINUX_AF_INET);
208         case AF_INET6:
209                 return (LINUX_AF_INET6);
210         case AF_CCITT:
211                 return (LINUX_AF_AX25);
212         case AF_IPX:
213                 return (LINUX_AF_IPX);
214         case AF_APPLETALK:
215                 return (LINUX_AF_APPLETALK);
216         }
217         return (-1);
218 }
219
220 static int
221 linux_to_bsd_sockopt_level(int level)
222 {
223
224         switch (level) {
225         case LINUX_SOL_SOCKET:
226                 return (SOL_SOCKET);
227         }
228         return (level);
229 }
230
231 static int
232 bsd_to_linux_sockopt_level(int level)
233 {
234
235         switch (level) {
236         case SOL_SOCKET:
237                 return (LINUX_SOL_SOCKET);
238         }
239         return (level);
240 }
241
242 static int
243 linux_to_bsd_ip_sockopt(int opt)
244 {
245
246         switch (opt) {
247         case LINUX_IP_TOS:
248                 return (IP_TOS);
249         case LINUX_IP_TTL:
250                 return (IP_TTL);
251         case LINUX_IP_OPTIONS:
252                 return (IP_OPTIONS);
253         case LINUX_IP_MULTICAST_IF:
254                 return (IP_MULTICAST_IF);
255         case LINUX_IP_MULTICAST_TTL:
256                 return (IP_MULTICAST_TTL);
257         case LINUX_IP_MULTICAST_LOOP:
258                 return (IP_MULTICAST_LOOP);
259         case LINUX_IP_ADD_MEMBERSHIP:
260                 return (IP_ADD_MEMBERSHIP);
261         case LINUX_IP_DROP_MEMBERSHIP:
262                 return (IP_DROP_MEMBERSHIP);
263         case LINUX_IP_HDRINCL:
264                 return (IP_HDRINCL);
265         }
266         return (-1);
267 }
268
269 static int
270 linux_to_bsd_so_sockopt(int opt)
271 {
272
273         switch (opt) {
274         case LINUX_SO_DEBUG:
275                 return (SO_DEBUG);
276         case LINUX_SO_REUSEADDR:
277                 return (SO_REUSEADDR);
278         case LINUX_SO_TYPE:
279                 return (SO_TYPE);
280         case LINUX_SO_ERROR:
281                 return (SO_ERROR);
282         case LINUX_SO_DONTROUTE:
283                 return (SO_DONTROUTE);
284         case LINUX_SO_BROADCAST:
285                 return (SO_BROADCAST);
286         case LINUX_SO_SNDBUF:
287                 return (SO_SNDBUF);
288         case LINUX_SO_RCVBUF:
289                 return (SO_RCVBUF);
290         case LINUX_SO_KEEPALIVE:
291                 return (SO_KEEPALIVE);
292         case LINUX_SO_OOBINLINE:
293                 return (SO_OOBINLINE);
294         case LINUX_SO_LINGER:
295                 return (SO_LINGER);
296         case LINUX_SO_PEERCRED:
297                 return (LOCAL_PEERCRED);
298         case LINUX_SO_RCVLOWAT:
299                 return (SO_RCVLOWAT);
300         case LINUX_SO_SNDLOWAT:
301                 return (SO_SNDLOWAT);
302         case LINUX_SO_RCVTIMEO:
303                 return (SO_RCVTIMEO);
304         case LINUX_SO_SNDTIMEO:
305                 return (SO_SNDTIMEO);
306         case LINUX_SO_TIMESTAMP:
307                 return (SO_TIMESTAMP);
308         case LINUX_SO_ACCEPTCONN:
309                 return (SO_ACCEPTCONN);
310         }
311         return (-1);
312 }
313
314 static int
315 linux_to_bsd_msg_flags(int flags)
316 {
317         int ret_flags = 0;
318
319         if (flags & LINUX_MSG_OOB)
320                 ret_flags |= MSG_OOB;
321         if (flags & LINUX_MSG_PEEK)
322                 ret_flags |= MSG_PEEK;
323         if (flags & LINUX_MSG_DONTROUTE)
324                 ret_flags |= MSG_DONTROUTE;
325         if (flags & LINUX_MSG_CTRUNC)
326                 ret_flags |= MSG_CTRUNC;
327         if (flags & LINUX_MSG_TRUNC)
328                 ret_flags |= MSG_TRUNC;
329         if (flags & LINUX_MSG_DONTWAIT)
330                 ret_flags |= MSG_DONTWAIT;
331         if (flags & LINUX_MSG_EOR)
332                 ret_flags |= MSG_EOR;
333         if (flags & LINUX_MSG_WAITALL)
334                 ret_flags |= MSG_WAITALL;
335         if (flags & LINUX_MSG_NOSIGNAL)
336                 ret_flags |= MSG_NOSIGNAL;
337 #if 0 /* not handled */
338         if (flags & LINUX_MSG_PROXY)
339                 ;
340         if (flags & LINUX_MSG_FIN)
341                 ;
342         if (flags & LINUX_MSG_SYN)
343                 ;
344         if (flags & LINUX_MSG_CONFIRM)
345                 ;
346         if (flags & LINUX_MSG_RST)
347                 ;
348         if (flags & LINUX_MSG_ERRQUEUE)
349                 ;
350 #endif
351         return ret_flags;
352 }
353
354 /*
355 * If bsd_to_linux_sockaddr() or linux_to_bsd_sockaddr() faults, then the
356 * native syscall will fault.  Thus, we don't really need to check the
357 * return values for these functions.
358 */
359
360 static int
361 bsd_to_linux_sockaddr(struct sockaddr *arg)
362 {
363         struct sockaddr sa;
364         size_t sa_len = sizeof(struct sockaddr);
365         int error;
366         
367         if ((error = copyin(arg, &sa, sa_len)))
368                 return (error);
369         
370         *(u_short *)&sa = sa.sa_family;
371         
372         error = copyout(&sa, arg, sa_len);
373         
374         return (error);
375 }
376
377 static int
378 linux_to_bsd_sockaddr(struct sockaddr *arg, int len)
379 {
380         struct sockaddr sa;
381         size_t sa_len = sizeof(struct sockaddr);
382         int error;
383
384         if ((error = copyin(arg, &sa, sa_len)))
385                 return (error);
386
387         sa.sa_family = *(sa_family_t *)&sa;
388         sa.sa_len = len;
389
390         error = copyout(&sa, arg, sa_len);
391
392         return (error);
393 }
394
395
396 static int
397 linux_sa_put(struct osockaddr *osa)
398 {
399         struct osockaddr sa;
400         int error, bdom;
401
402         /*
403          * Only read/write the osockaddr family part, the rest is
404          * not changed.
405          */
406         error = copyin(osa, &sa, sizeof(sa.sa_family));
407         if (error)
408                 return (error);
409
410         bdom = bsd_to_linux_domain(sa.sa_family);
411         if (bdom == -1)
412                 return (EINVAL);
413
414         sa.sa_family = bdom;
415         error = copyout(&sa, osa, sizeof(sa.sa_family));
416         if (error)
417                 return (error);
418
419         return (0);
420 }
421
422 static int
423 linux_sendit(struct thread *td, int s, struct msghdr *mp, int flags,
424     enum uio_seg segflg)
425 {
426         struct mbuf *control;
427         struct sockaddr *to;
428         int error;
429
430         if (mp->msg_name != NULL) {
431                 error = linux_getsockaddr(&to, mp->msg_name, mp->msg_namelen);
432                 if (error)
433                         return (error);
434                 mp->msg_name = to;
435         } else
436                 to = NULL;
437
438         if (mp->msg_control != NULL) {
439                 struct cmsghdr *cmsg;
440
441                 if (mp->msg_controllen < sizeof(struct cmsghdr)) {
442                         error = EINVAL;
443                         goto bad;
444                 }
445                 error = sockargs(&control, mp->msg_control,
446                     mp->msg_controllen, MT_CONTROL);
447                 if (error)
448                         goto bad;
449
450                 cmsg = mtod(control, struct cmsghdr *);
451                 cmsg->cmsg_level = linux_to_bsd_sockopt_level(cmsg->cmsg_level);
452         } else
453                 control = NULL;
454
455         error = kern_sendit(td, s, mp, linux_to_bsd_msg_flags(flags), control,
456             segflg);
457
458 bad:
459         if (to)
460                 FREE(to, M_SONAME);
461         return (error);
462 }
463
464 /* Return 0 if IP_HDRINCL is set for the given socket. */
465 static int
466 linux_check_hdrincl(struct thread *td, int s)
467 {
468         int error, optval, size_val;
469
470         size_val = sizeof(optval);
471         error = kern_getsockopt(td, s, IPPROTO_IP, IP_HDRINCL,
472             &optval, UIO_SYSSPACE, &size_val);
473         if (error)
474                 return (error);
475
476         return (optval == 0);
477 }
478
479 struct linux_sendto_args {
480         int s;
481         l_uintptr_t msg;
482         int len;
483         int flags;
484         l_uintptr_t to;
485         int tolen;
486 };
487
488 /*
489  * Updated sendto() when IP_HDRINCL is set:
490  * tweak endian-dependent fields in the IP packet.
491  */
492 static int
493 linux_sendto_hdrincl(struct thread *td, struct linux_sendto_args *linux_args)
494 {
495 /*
496  * linux_ip_copysize defines how many bytes we should copy
497  * from the beginning of the IP packet before we customize it for BSD.
498  * It should include all the fields we modify (ip_len and ip_off).
499  */
500 #define linux_ip_copysize       8
501
502         struct ip *packet;
503         struct msghdr msg;
504         struct iovec aiov[1];
505         int error;
506
507         /* Check that the packet isn't too big or too small. */
508         if (linux_args->len < linux_ip_copysize ||
509             linux_args->len > IP_MAXPACKET)
510                 return (EINVAL);
511
512         packet = (struct ip *)malloc(linux_args->len, M_TEMP, M_WAITOK);
513
514         /* Make kernel copy of the packet to be sent */
515         if ((error = copyin(PTRIN(linux_args->msg), packet,
516             linux_args->len)))
517                 goto goout;
518
519         /* Convert fields from Linux to BSD raw IP socket format */
520         packet->ip_len = linux_args->len;
521         packet->ip_off = ntohs(packet->ip_off);
522
523         /* Prepare the msghdr and iovec structures describing the new packet */
524         msg.msg_name = PTRIN(linux_args->to);
525         msg.msg_namelen = linux_args->tolen;
526         msg.msg_iov = aiov;
527         msg.msg_iovlen = 1;
528         msg.msg_control = NULL;
529         msg.msg_flags = 0;
530         aiov[0].iov_base = (char *)packet;
531         aiov[0].iov_len = linux_args->len;
532         error = linux_sendit(td, linux_args->s, &msg, linux_args->flags,
533             UIO_SYSSPACE);
534 goout:
535         free(packet, M_TEMP);
536         return (error);
537 }
538
539 struct linux_socket_args {
540         int domain;
541         int type;
542         int protocol;
543 };
544
545 static int
546 linux_socket(struct thread *td, struct linux_socket_args *args)
547 {
548         struct socket_args /* {
549                 int domain;
550                 int type;
551                 int protocol;
552         } */ bsd_args;
553         int retval_socket;
554
555         bsd_args.protocol = args->protocol;
556         bsd_args.type = args->type;
557         bsd_args.domain = linux_to_bsd_domain(args->domain);
558         if (bsd_args.domain == -1)
559                 return (EINVAL);
560
561         retval_socket = socket(td, &bsd_args);
562         if (bsd_args.type == SOCK_RAW
563             && (bsd_args.protocol == IPPROTO_RAW || bsd_args.protocol == 0)
564             && bsd_args.domain == AF_INET
565             && retval_socket >= 0) {
566                 /* It's a raw IP socket: set the IP_HDRINCL option. */
567                 int hdrincl;
568
569                 hdrincl = 1;
570                 /* We ignore any error returned by kern_setsockopt() */
571                 kern_setsockopt(td, td->td_retval[0], IPPROTO_IP, IP_HDRINCL,
572                     &hdrincl, UIO_SYSSPACE, sizeof(hdrincl));
573         }
574 #ifdef INET6
575         /*
576          * Linux AF_INET6 socket has IPV6_V6ONLY setsockopt set to 0 by
577          * default and some apps depend on this. So, set V6ONLY to 0
578          * for Linux apps if the sysctl value is set to 1.
579          */
580         if (bsd_args.domain == PF_INET6 && retval_socket >= 0
581 #ifndef KLD_MODULE
582             /*
583              * XXX: Avoid undefined symbol error with an IPv4 only
584              * kernel.
585              */
586             && ip6_v6only
587 #endif
588             ) {
589                 int v6only;
590
591                 v6only = 0;
592                 /* We ignore any error returned by setsockopt() */
593                 kern_setsockopt(td, td->td_retval[0], IPPROTO_IPV6, IPV6_V6ONLY,
594                     &v6only, UIO_SYSSPACE, sizeof(v6only));
595         }
596 #endif
597
598         return (retval_socket);
599 }
600
601 struct linux_bind_args {
602         int s;
603         l_uintptr_t name;
604         int namelen;
605 };
606
607 static int
608 linux_bind(struct thread *td, struct linux_bind_args *args)
609 {
610         struct sockaddr *sa;
611         int error;
612
613         error = linux_getsockaddr(&sa, PTRIN(args->name),
614             args->namelen);
615         if (error)
616                 return (error);
617
618         error = kern_bind(td, args->s, sa);
619         free(sa, M_SONAME);
620         if (error == EADDRNOTAVAIL && args->namelen != sizeof(struct sockaddr_in))
621                 return (EINVAL);
622         return (error);
623 }
624
625 struct linux_connect_args {
626         int s;
627         l_uintptr_t name;
628         int namelen;
629 };
630 int linux_connect(struct thread *, struct linux_connect_args *);
631
632 int
633 linux_connect(struct thread *td, struct linux_connect_args *args)
634 {
635         struct socket *so;
636         struct sockaddr *sa;
637         u_int fflag;
638         int error;
639
640         error = linux_getsockaddr(&sa, (struct osockaddr *)PTRIN(args->name),
641             args->namelen);
642         if (error)
643                 return (error);
644
645         error = kern_connect(td, args->s, sa);
646         free(sa, M_SONAME);
647         if (error != EISCONN)
648                 return (error);
649
650         /*
651          * Linux doesn't return EISCONN the first time it occurs,
652          * when on a non-blocking socket. Instead it returns the
653          * error getsockopt(SOL_SOCKET, SO_ERROR) would return on BSD.
654          *
655          * XXXRW: Instead of using fgetsock(), check that it is a
656          * socket and use the file descriptor reference instead of
657          * creating a new one.
658          */
659         error = fgetsock(td, args->s, &so, &fflag);
660         if (error == 0) {
661                 error = EISCONN;
662                 if (fflag & FNONBLOCK) {
663                         SOCK_LOCK(so);
664                         if (so->so_emuldata == 0)
665                                 error = so->so_error;
666                         so->so_emuldata = (void *)1;
667                         SOCK_UNLOCK(so);
668                 }
669                 fputsock(so);
670         }
671         return (error);
672 }
673
674 struct linux_listen_args {
675         int s;
676         int backlog;
677 };
678
679 static int
680 linux_listen(struct thread *td, struct linux_listen_args *args)
681 {
682         struct listen_args /* {
683                 int s;
684                 int backlog;
685         } */ bsd_args;
686
687         bsd_args.s = args->s;
688         bsd_args.backlog = args->backlog;
689         return (listen(td, &bsd_args));
690 }
691
692 struct linux_accept_args {
693         int s;
694         l_uintptr_t addr;
695         l_uintptr_t namelen;
696 };
697
698 static int
699 linux_accept(struct thread *td, struct linux_accept_args *args)
700 {
701         struct accept_args /* {
702                 int     s;
703                 struct sockaddr * __restrict name;
704                 socklen_t * __restrict anamelen;
705         } */ bsd_args;
706         int error, fd;
707
708         bsd_args.s = args->s;
709         /* XXX: */
710         bsd_args.name = (struct sockaddr * __restrict)PTRIN(args->addr);
711         bsd_args.anamelen = PTRIN(args->namelen);/* XXX */
712         error = accept(td, &bsd_args);
713         bsd_to_linux_sockaddr((struct sockaddr *)bsd_args.name);
714         if (error) {
715                 if (error == EFAULT && args->namelen != sizeof(struct sockaddr_in))
716                         return (EINVAL);
717                 return (error);
718         }
719         if (args->addr) {
720                 error = linux_sa_put(PTRIN(args->addr));
721                 if (error) {
722                         (void)kern_close(td, td->td_retval[0]);
723                         return (error);
724                 }
725         }
726
727         /*
728          * linux appears not to copy flags from the parent socket to the
729          * accepted one, so we must clear the flags in the new descriptor.
730          * Ignore any errors, because we already have an open fd.
731          */
732         fd = td->td_retval[0];
733         (void)kern_fcntl(td, fd, F_SETFL, 0);
734         td->td_retval[0] = fd;
735         return (0);
736 }
737
738 struct linux_getsockname_args {
739         int s;
740         l_uintptr_t addr;
741         l_uintptr_t namelen;
742 };
743
744 static int
745 linux_getsockname(struct thread *td, struct linux_getsockname_args *args)
746 {
747         struct getsockname_args /* {
748                 int     fdes;
749                 struct sockaddr * __restrict asa;
750                 socklen_t * __restrict alen;
751         } */ bsd_args;
752         int error;
753
754         bsd_args.fdes = args->s;
755         /* XXX: */
756         bsd_args.asa = (struct sockaddr * __restrict)PTRIN(args->addr);
757         bsd_args.alen = PTRIN(args->namelen);   /* XXX */
758         error = getsockname(td, &bsd_args);
759         bsd_to_linux_sockaddr((struct sockaddr *)bsd_args.asa);
760         if (error)
761                 return (error);
762         error = linux_sa_put(PTRIN(args->addr));
763         if (error)
764                 return (error);
765         return (0);
766 }
767
768 struct linux_getpeername_args {
769         int s;
770         l_uintptr_t addr;
771         l_uintptr_t namelen;
772 };
773
774 static int
775 linux_getpeername(struct thread *td, struct linux_getpeername_args *args)
776 {
777         struct getpeername_args /* {
778                 int fdes;
779                 caddr_t asa;
780                 int *alen;
781         } */ bsd_args;
782         int error;
783
784         bsd_args.fdes = args->s;
785         bsd_args.asa = (struct sockaddr *)PTRIN(args->addr);
786         bsd_args.alen = (int *)PTRIN(args->namelen);
787         error = getpeername(td, &bsd_args);
788         bsd_to_linux_sockaddr((struct sockaddr *)bsd_args.asa);
789         if (error)
790                 return (error);
791         error = linux_sa_put(PTRIN(args->addr));
792         if (error)
793                 return (error);
794         return (0);
795 }
796
797 struct linux_socketpair_args {
798         int domain;
799         int type;
800         int protocol;
801         l_uintptr_t rsv;
802 };
803
804 static int
805 linux_socketpair(struct thread *td, struct linux_socketpair_args *args)
806 {
807         struct socketpair_args /* {
808                 int domain;
809                 int type;
810                 int protocol;
811                 int *rsv;
812         } */ bsd_args;
813
814         bsd_args.domain = linux_to_bsd_domain(args->domain);
815         if (bsd_args.domain == -1)
816                 return (EINVAL);
817
818         bsd_args.type = args->type;
819         bsd_args.protocol = args->protocol;
820         bsd_args.rsv = (int *)PTRIN(args->rsv);
821         return (socketpair(td, &bsd_args));
822 }
823
824 struct linux_send_args {
825         int s;
826         l_uintptr_t msg;
827         int len;
828         int flags;
829 };
830
831 static int
832 linux_send(struct thread *td, struct linux_send_args *args)
833 {
834         struct sendto_args /* {
835                 int s;
836                 caddr_t buf;
837                 int len;
838                 int flags;
839                 caddr_t to;
840                 int tolen;
841         } */ bsd_args;
842
843         bsd_args.s = args->s;
844         bsd_args.buf = (caddr_t)PTRIN(args->msg);
845         bsd_args.len = args->len;
846         bsd_args.flags = args->flags;
847         bsd_args.to = NULL;
848         bsd_args.tolen = 0;
849         return sendto(td, &bsd_args);
850 }
851
852 struct linux_recv_args {
853         int s;
854         l_uintptr_t msg;
855         int len;
856         int flags;
857 };
858
859 static int
860 linux_recv(struct thread *td, struct linux_recv_args *args)
861 {
862         struct recvfrom_args /* {
863                 int s;
864                 caddr_t buf;
865                 int len;
866                 int flags;
867                 struct sockaddr *from;
868                 socklen_t fromlenaddr;
869         } */ bsd_args;
870
871         bsd_args.s = args->s;
872         bsd_args.buf = (caddr_t)PTRIN(args->msg);
873         bsd_args.len = args->len;
874         bsd_args.flags = args->flags;
875         bsd_args.from = NULL;
876         bsd_args.fromlenaddr = 0;
877         return (recvfrom(td, &bsd_args));
878 }
879
880 static int
881 linux_sendto(struct thread *td, struct linux_sendto_args *args)
882 {
883         struct msghdr msg;
884         struct iovec aiov;
885         int error;
886
887         if (linux_check_hdrincl(td, args->s) == 0)
888                 /* IP_HDRINCL set, tweak the packet before sending */
889                 return (linux_sendto_hdrincl(td, args));
890
891         msg.msg_name = PTRIN(args->to);
892         msg.msg_namelen = args->tolen;
893         msg.msg_iov = &aiov;
894         msg.msg_iovlen = 1;
895         msg.msg_control = NULL;
896         msg.msg_flags = 0;
897         aiov.iov_base = PTRIN(args->msg);
898         aiov.iov_len = args->len;
899         error = linux_sendit(td, args->s, &msg, args->flags, UIO_USERSPACE);
900         return (error);
901 }
902
903 struct linux_recvfrom_args {
904         int s;
905         l_uintptr_t buf;
906         int len;
907         int flags;
908         l_uintptr_t from;
909         l_uintptr_t fromlen;
910 };
911
912 static int
913 linux_recvfrom(struct thread *td, struct linux_recvfrom_args *args)
914 {
915         struct recvfrom_args /* {
916                 int     s;
917                 caddr_t buf;
918                 size_t  len;
919                 int     flags;
920                 struct sockaddr * __restrict from;
921                 socklen_t * __restrict fromlenaddr;
922         } */ bsd_args;
923         size_t len;
924         int error;
925
926         if ((error = copyin(PTRIN(args->fromlen), &len, sizeof(size_t))))
927                 return (error);
928
929         bsd_args.s = args->s;
930         bsd_args.buf = PTRIN(args->buf);
931         bsd_args.len = args->len;
932         bsd_args.flags = linux_to_bsd_msg_flags(args->flags);
933         /* XXX: */
934         bsd_args.from = (struct sockaddr * __restrict)PTRIN(args->from);
935         bsd_args.fromlenaddr = PTRIN(args->fromlen);/* XXX */
936         
937         linux_to_bsd_sockaddr((struct sockaddr *)bsd_args.from, len);
938         error = recvfrom(td, &bsd_args);
939         bsd_to_linux_sockaddr((struct sockaddr *)bsd_args.from);
940         
941         if (error)
942                 return (error);
943         if (args->from) {
944                 error = linux_sa_put((struct osockaddr *)
945                     PTRIN(args->from));
946                 if (error)
947                         return (error);
948         }
949         return (0);
950 }
951
952 struct linux_sendmsg_args {
953         int s;
954         l_uintptr_t msg;
955         int flags;
956 };
957
958 static int
959 linux_sendmsg(struct thread *td, struct linux_sendmsg_args *args)
960 {
961         struct msghdr msg;
962         struct iovec *iov;
963         int error;
964
965         /* XXXTJR sendmsg is broken on amd64 */
966
967         error = copyin(PTRIN(args->msg), &msg, sizeof(msg));
968         if (error)
969                 return (error);
970
971         /*
972          * Some Linux applications (ping) define a non-NULL control data
973          * pointer, but a msg_controllen of 0, which is not allowed in the
974          * FreeBSD system call interface.  NULL the msg_control pointer in
975          * order to handle this case.  This should be checked, but allows the
976          * Linux ping to work.
977          */
978         if (msg.msg_control != NULL && msg.msg_controllen == 0)
979                 msg.msg_control = NULL;
980         error = copyiniov(msg.msg_iov, msg.msg_iovlen, &iov, EMSGSIZE);
981         if (error)
982                 return (error);
983         msg.msg_iov = iov;
984         msg.msg_flags = 0;
985         error = linux_sendit(td, args->s, &msg, args->flags, UIO_USERSPACE);
986         free(iov, M_IOV);
987         return (error);
988 }
989
990 struct linux_recvmsg_args {
991         int s;
992         l_uintptr_t msg;
993         int flags;
994 };
995
996 static int
997 linux_recvmsg(struct thread *td, struct linux_recvmsg_args *args)
998 {
999         struct recvmsg_args /* {
1000                 int     s;
1001                 struct  msghdr *msg;
1002                 int     flags;
1003         } */ bsd_args;
1004         struct msghdr msg;
1005         struct cmsghdr *cmsg;
1006         int error;
1007
1008         /* XXXTJR recvmsg is broken on amd64 */
1009
1010         if ((error = copyin(PTRIN(args->msg), &msg, sizeof (msg))))
1011                 return (error);
1012
1013         bsd_args.s = args->s;
1014         bsd_args.msg = PTRIN(args->msg);
1015         bsd_args.flags = linux_to_bsd_msg_flags(args->flags);
1016         if (msg.msg_name) {
1017                 linux_to_bsd_sockaddr((struct sockaddr *)msg.msg_name,
1018                       msg.msg_namelen);
1019                 error = recvmsg(td, &bsd_args);
1020                 bsd_to_linux_sockaddr((struct sockaddr *)msg.msg_name);
1021         } else
1022                 error = recvmsg(td, &bsd_args);
1023         if (error)
1024                 return (error);
1025
1026         if (bsd_args.msg->msg_control != NULL &&
1027             bsd_args.msg->msg_controllen > 0) {
1028                 cmsg = (struct cmsghdr*)bsd_args.msg->msg_control;
1029                 cmsg->cmsg_level = bsd_to_linux_sockopt_level(cmsg->cmsg_level);
1030         }
1031
1032         error = copyin(PTRIN(args->msg), &msg, sizeof(msg));
1033         if (error)
1034                 return (error);
1035         if (msg.msg_name && msg.msg_namelen > 2)
1036                 error = linux_sa_put(msg.msg_name);
1037         return (error);
1038 }
1039
1040 struct linux_shutdown_args {
1041         int s;
1042         int how;
1043 };
1044
1045 static int
1046 linux_shutdown(struct thread *td, struct linux_shutdown_args *args)
1047 {
1048         struct shutdown_args /* {
1049                 int s;
1050                 int how;
1051         } */ bsd_args;
1052
1053         bsd_args.s = args->s;
1054         bsd_args.how = args->how;
1055         return (shutdown(td, &bsd_args));
1056 }
1057
1058 struct linux_setsockopt_args {
1059         int s;
1060         int level;
1061         int optname;
1062         l_uintptr_t optval;
1063         int optlen;
1064 };
1065
1066 static int
1067 linux_setsockopt(struct thread *td, struct linux_setsockopt_args *args)
1068 {
1069         struct setsockopt_args /* {
1070                 int s;
1071                 int level;
1072                 int name;
1073                 caddr_t val;
1074                 int valsize;
1075         } */ bsd_args;
1076         int error, name;
1077
1078         bsd_args.s = args->s;
1079         bsd_args.level = linux_to_bsd_sockopt_level(args->level);
1080         switch (bsd_args.level) {
1081         case SOL_SOCKET:
1082                 name = linux_to_bsd_so_sockopt(args->optname);
1083                 break;
1084         case IPPROTO_IP:
1085                 name = linux_to_bsd_ip_sockopt(args->optname);
1086                 break;
1087         case IPPROTO_TCP:
1088                 /* Linux TCP option values match BSD's */
1089                 name = args->optname;
1090                 break;
1091         default:
1092                 name = -1;
1093                 break;
1094         }
1095         if (name == -1)
1096                 return (ENOPROTOOPT);
1097
1098         bsd_args.name = name;
1099         bsd_args.val = PTRIN(args->optval);
1100         bsd_args.valsize = args->optlen;
1101
1102         if (name == IPV6_NEXTHOP) {
1103                 linux_to_bsd_sockaddr((struct sockaddr *)bsd_args.val,
1104                         bsd_args.valsize);
1105                 error = setsockopt(td, &bsd_args);
1106                 bsd_to_linux_sockaddr((struct sockaddr *)bsd_args.val);
1107         } else
1108                 error = setsockopt(td, &bsd_args);
1109
1110         return (error);
1111 }
1112
1113 struct linux_getsockopt_args {
1114         int s;
1115         int level;
1116         int optname;
1117         l_uintptr_t optval;
1118         l_uintptr_t optlen;
1119 };
1120
1121 static int
1122 linux_getsockopt(struct thread *td, struct linux_getsockopt_args *args)
1123 {
1124         struct getsockopt_args /* {
1125                 int s;
1126                 int level;
1127                 int name;
1128                 caddr_t val;
1129                 int *avalsize;
1130         } */ bsd_args;
1131         int error, name;
1132
1133         bsd_args.s = args->s;
1134         bsd_args.level = linux_to_bsd_sockopt_level(args->level);
1135         switch (bsd_args.level) {
1136         case SOL_SOCKET:
1137                 name = linux_to_bsd_so_sockopt(args->optname);
1138                 break;
1139         case IPPROTO_IP:
1140                 name = linux_to_bsd_ip_sockopt(args->optname);
1141                 break;
1142         case IPPROTO_TCP:
1143                 /* Linux TCP option values match BSD's */
1144                 name = args->optname;
1145                 break;
1146         default:
1147                 name = -1;
1148                 break;
1149         }
1150         if (name == -1)
1151                 return (EINVAL);
1152
1153         bsd_args.name = name;
1154         bsd_args.val = PTRIN(args->optval);
1155         bsd_args.avalsize = PTRIN(args->optlen);
1156
1157         if (name == IPV6_NEXTHOP) {
1158                 error = getsockopt(td, &bsd_args);
1159                 bsd_to_linux_sockaddr((struct sockaddr *)bsd_args.val);
1160         } else
1161                 error = getsockopt(td, &bsd_args);
1162
1163         return (error);
1164 }
1165
1166 int
1167 linux_socketcall(struct thread *td, struct linux_socketcall_args *args)
1168 {
1169         void *arg = (void *)(intptr_t)args->args;
1170
1171         switch (args->what) {
1172         case LINUX_SOCKET:
1173                 return (linux_socket(td, arg));
1174         case LINUX_BIND:
1175                 return (linux_bind(td, arg));
1176         case LINUX_CONNECT:
1177                 return (linux_connect(td, arg));
1178         case LINUX_LISTEN:
1179                 return (linux_listen(td, arg));
1180         case LINUX_ACCEPT:
1181                 return (linux_accept(td, arg));
1182         case LINUX_GETSOCKNAME:
1183                 return (linux_getsockname(td, arg));
1184         case LINUX_GETPEERNAME:
1185                 return (linux_getpeername(td, arg));
1186         case LINUX_SOCKETPAIR:
1187                 return (linux_socketpair(td, arg));
1188         case LINUX_SEND:
1189                 return (linux_send(td, arg));
1190         case LINUX_RECV:
1191                 return (linux_recv(td, arg));
1192         case LINUX_SENDTO:
1193                 return (linux_sendto(td, arg));
1194         case LINUX_RECVFROM:
1195                 return (linux_recvfrom(td, arg));
1196         case LINUX_SHUTDOWN:
1197                 return (linux_shutdown(td, arg));
1198         case LINUX_SETSOCKOPT:
1199                 return (linux_setsockopt(td, arg));
1200         case LINUX_GETSOCKOPT:
1201                 return (linux_getsockopt(td, arg));
1202         case LINUX_SENDMSG:
1203                 return (linux_sendmsg(td, arg));
1204         case LINUX_RECVMSG:
1205                 return (linux_recvmsg(td, arg));
1206         }
1207
1208         uprintf("LINUX: 'socket' typ=%d not implemented\n", args->what);
1209         return (ENOSYS);
1210 }