]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - sys/sys/socketvar.h
- We don't need to cache_purge() in nfs_reclaim(), vclean() does it for us.
[FreeBSD/FreeBSD.git] / sys / sys / socketvar.h
1 /*-
2  * Copyright (c) 1982, 1986, 1990, 1993
3  *      The Regents of the University of California.  All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  * 1. Redistributions of source code must retain the above copyright
9  *    notice, this list of conditions and the following disclaimer.
10  * 2. Redistributions in binary form must reproduce the above copyright
11  *    notice, this list of conditions and the following disclaimer in the
12  *    documentation and/or other materials provided with the distribution.
13  * 3. All advertising materials mentioning features or use of this software
14  *    must display the following acknowledgement:
15  *      This product includes software developed by the University of
16  *      California, Berkeley and its contributors.
17  * 4. Neither the name of the University nor the names of its contributors
18  *    may be used to endorse or promote products derived from this software
19  *    without specific prior written permission.
20  *
21  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
22  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
23  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
24  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
25  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
26  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
27  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
28  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
29  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
30  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
31  * SUCH DAMAGE.
32  *
33  *      @(#)socketvar.h 8.3 (Berkeley) 2/19/95
34  * $FreeBSD$
35  */
36
37 #ifndef _SYS_SOCKETVAR_H_
38 #define _SYS_SOCKETVAR_H_
39
40 #include <sys/_label.h>                 /* for struct label */
41 #include <sys/queue.h>                  /* for TAILQ macros */
42 #include <sys/selinfo.h>                /* for struct selinfo */
43
44 /*
45  * Kernel structure per socket.
46  * Contains send and receive buffer queues,
47  * handle on protocol and pointer to protocol
48  * private data and error information.
49  */
50 typedef u_quad_t so_gen_t;
51
52 /*
53  * List of locks:
54  * (c)  const, inited in either socreate() or sonewconn()
55  * (m)  sb_mtx mutex
56  * (mr) so_rcv.sb_mtx mutex
57  * (sg) sigio_lock sx
58  * (sh) sohead_lock sx
59  *
60  * Lock of so_rcv.sb_mtx can duplicate, provided that sohead_lock
61  * is exclusively locked.
62  *
63  * Brackets mean that this data is not protected yet.
64  */
65 struct socket {
66         int     so_count;               /* reference count */
67         short   so_type;                /* generic type, see socket.h */
68         short   so_options;             /* from socket call, see socket.h */
69         short   so_linger;              /* time to linger while closing */
70         short   so_state;               /* internal state flags SS_*, below */
71         void    *so_pcb;                /* protocol control block */
72         struct  protosw *so_proto;      /* protocol handle */
73 /*
74  * Variables for connection queuing.
75  * Socket where accepts occur is so_head in all subsidiary sockets.
76  * If so_head is 0, socket is not related to an accept.
77  * For head socket so_incomp queues partially completed connections,
78  * while so_comp is a queue of connections ready to be accepted.
79  * If a connection is aborted and it has so_head set, then
80  * it has to be pulled out of either so_incomp or so_comp.
81  * We allow connections to queue up based on current queue lengths
82  * and limit on number of queued connections for this socket.
83  */
84         struct  socket *so_head;        /* back pointer to accept socket */
85         TAILQ_HEAD(, socket) so_incomp; /* queue of partial unaccepted connections */
86         TAILQ_HEAD(, socket) so_comp;   /* queue of complete unaccepted connections */
87         TAILQ_ENTRY(socket) so_list;    /* list of unaccepted connections */
88         short   so_qlen;                /* number of unaccepted connections */
89         short   so_incqlen;             /* number of unaccepted incomplete
90                                            connections */
91         short   so_qlimit;              /* max number queued connections */
92         short   so_timeo;               /* connection timeout */
93         u_short so_error;               /* error affecting connection */
94         struct  sigio *so_sigio;        /* [sg] information for async I/O or
95                                            out of band data (SIGURG) */
96         u_long  so_oobmark;             /* chars to oob mark */
97         TAILQ_HEAD(, aiocblist) so_aiojobq; /* AIO ops waiting on socket */
98 /*
99  * Variables for socket buffering.
100  */
101         struct sockbuf {
102                 struct  selinfo sb_sel; /* process selecting read/write */
103 #define sb_startzero    sb_mb
104                 struct  mbuf *sb_mb;    /* the mbuf chain */
105                 u_int   sb_cc;          /* actual chars in buffer */
106                 u_int   sb_hiwat;       /* max actual char count */
107                 u_int   sb_mbcnt;       /* chars of mbufs used */
108                 u_int   sb_mbmax;       /* max chars of mbufs to use */
109                 u_int   sb_ctl;         /* non-data chars in buffer */
110                 int     sb_lowat;       /* low water mark */
111                 int     sb_timeo;       /* timeout for read/write */
112                 short   sb_flags;       /* flags, see below */
113         } so_rcv, so_snd;
114 #define SB_MAX          (256*1024)      /* default for max chars in sockbuf */
115 #define SB_LOCK         0x01            /* lock on data queue */
116 #define SB_WANT         0x02            /* someone is waiting to lock */
117 #define SB_WAIT         0x04            /* someone is waiting for data/space */
118 #define SB_SEL          0x08            /* someone is selecting */
119 #define SB_ASYNC        0x10            /* ASYNC I/O, need signals */
120 #define SB_UPCALL       0x20            /* someone wants an upcall */
121 #define SB_NOINTR       0x40            /* operations not interruptible */
122 #define SB_AIO          0x80            /* AIO operations queued */
123 #define SB_KNOTE        0x100           /* kernel note attached */
124
125         void    (*so_upcall)(struct socket *, void *, int);
126         void    *so_upcallarg;
127         struct  ucred *so_cred;         /* user credentials */
128         struct  label so_label;         /* MAC label for socket */
129         struct  label so_peerlabel;     /* cached MAC label for socket peer */
130         /* NB: generation count must not be first; easiest to make it last. */
131         so_gen_t so_gencnt;             /* generation count */
132         void    *so_emuldata;           /* private data for emulators */
133         struct so_accf {
134                 struct  accept_filter *so_accept_filter;
135                 void    *so_accept_filter_arg;  /* saved filter args */
136                 char    *so_accept_filter_str;  /* saved user args */
137         } *so_accf;
138 };
139
140 /*
141  * Socket state bits.
142  */
143 #define SS_NOFDREF              0x0001  /* no file table ref any more */
144 #define SS_ISCONNECTED          0x0002  /* socket connected to a peer */
145 #define SS_ISCONNECTING         0x0004  /* in process of connecting to peer */
146 #define SS_ISDISCONNECTING      0x0008  /* in process of disconnecting */
147 #define SS_CANTSENDMORE         0x0010  /* can't send more data to peer */
148 #define SS_CANTRCVMORE          0x0020  /* can't receive more data from peer */
149 #define SS_RCVATMARK            0x0040  /* at mark on input */
150
151 #define SS_NBIO                 0x0100  /* non-blocking ops */
152 #define SS_ASYNC                0x0200  /* async i/o notify */
153 #define SS_ISCONFIRMING         0x0400  /* deciding to accept connection req */
154
155 #define SS_INCOMP               0x0800  /* unaccepted, incomplete connection */
156 #define SS_COMP                 0x1000  /* unaccepted, complete connection */
157 #define SS_ISDISCONNECTED       0x2000  /* socket disconnected from peer */
158
159 /*
160  * Externalized form of struct socket used by the sysctl(3) interface.
161  */
162 struct xsocket {
163         size_t  xso_len;        /* length of this structure */
164         struct  socket *xso_so; /* makes a convenient handle sometimes */
165         short   so_type;
166         short   so_options;
167         short   so_linger;
168         short   so_state;
169         caddr_t so_pcb;         /* another convenient handle */
170         int     xso_protocol;
171         int     xso_family;
172         short   so_qlen;
173         short   so_incqlen;
174         short   so_qlimit;
175         short   so_timeo;
176         u_short so_error;
177         pid_t   so_pgid;
178         u_long  so_oobmark;
179         struct xsockbuf {
180                 u_int   sb_cc;
181                 u_int   sb_hiwat;
182                 u_int   sb_mbcnt;
183                 u_int   sb_mbmax;
184                 int     sb_lowat;
185                 int     sb_timeo;
186                 short   sb_flags;
187         } so_rcv, so_snd;
188         uid_t   so_uid;         /* XXX */
189 };
190
191 /*
192  * Macros for sockets and socket buffering.
193  */
194
195 /*
196  * Do we need to notify the other side when I/O is possible?
197  */
198 #define sb_notify(sb)   (((sb)->sb_flags & (SB_WAIT | SB_SEL | SB_ASYNC | \
199     SB_UPCALL | SB_AIO | SB_KNOTE)) != 0)
200
201 /*
202  * How much space is there in a socket buffer (so->so_snd or so->so_rcv)?
203  * This is problematical if the fields are unsigned, as the space might
204  * still be negative (cc > hiwat or mbcnt > mbmax).  Should detect
205  * overflow and return 0.  Should use "lmin" but it doesn't exist now.
206  */
207 #define sbspace(sb) \
208     ((long) imin((int)((sb)->sb_hiwat - (sb)->sb_cc), \
209          (int)((sb)->sb_mbmax - (sb)->sb_mbcnt)))
210
211 /* do we have to send all at once on a socket? */
212 #define sosendallatonce(so) \
213     ((so)->so_proto->pr_flags & PR_ATOMIC)
214
215 /* can we read something from so? */
216 #define soreadable(so) \
217     ((so)->so_rcv.sb_cc >= (so)->so_rcv.sb_lowat || \
218         ((so)->so_state & SS_CANTRCVMORE) || \
219         !TAILQ_EMPTY(&(so)->so_comp) || (so)->so_error)
220
221 /* can we write something to so? */
222 #define sowriteable(so) \
223     ((sbspace(&(so)->so_snd) >= (so)->so_snd.sb_lowat && \
224         (((so)->so_state&SS_ISCONNECTED) || \
225           ((so)->so_proto->pr_flags&PR_CONNREQUIRED)==0)) || \
226      ((so)->so_state & SS_CANTSENDMORE) || \
227      (so)->so_error)
228
229 /* adjust counters in sb reflecting allocation of m */
230 #define sballoc(sb, m) { \
231         (sb)->sb_cc += (m)->m_len; \
232         if ((m)->m_type != MT_DATA && (m)->m_type != MT_HEADER && \
233             (m)->m_type != MT_OOBDATA) \
234                 (sb)->sb_ctl += (m)->m_len; \
235         (sb)->sb_mbcnt += MSIZE; \
236         if ((m)->m_flags & M_EXT) \
237                 (sb)->sb_mbcnt += (m)->m_ext.ext_size; \
238 }
239
240 /* adjust counters in sb reflecting freeing of m */
241 #define sbfree(sb, m) { \
242         (sb)->sb_cc -= (m)->m_len; \
243         if ((m)->m_type != MT_DATA && (m)->m_type != MT_HEADER && \
244             (m)->m_type != MT_OOBDATA) \
245                 (sb)->sb_ctl -= (m)->m_len; \
246         (sb)->sb_mbcnt -= MSIZE; \
247         if ((m)->m_flags & M_EXT) \
248                 (sb)->sb_mbcnt -= (m)->m_ext.ext_size; \
249 }
250
251 /*
252  * Set lock on sockbuf sb; sleep if lock is already held.
253  * Unless SB_NOINTR is set on sockbuf, sleep is interruptible.
254  * Returns error without lock if sleep is interrupted.
255  */
256 #define sblock(sb, wf) ((sb)->sb_flags & SB_LOCK ? \
257                 (((wf) == M_WAITOK) ? sb_lock(sb) : EWOULDBLOCK) : \
258                 ((sb)->sb_flags |= SB_LOCK), 0)
259
260 /* release lock on sockbuf sb */
261 #define sbunlock(sb) { \
262         (sb)->sb_flags &= ~SB_LOCK; \
263         if ((sb)->sb_flags & SB_WANT) { \
264                 (sb)->sb_flags &= ~SB_WANT; \
265                 wakeup(&(sb)->sb_flags); \
266         } \
267 }
268
269 /*
270  * soref()/sorele() ref-count the socket structure.  Note that you must
271  * still explicitly close the socket, but the last ref count will free
272  * the structure.
273  */
274 #define soref(so)       do {                    \
275                                 ++(so)->so_count; \
276                         } while (0)
277
278 #define sorele(so)      do {                            \
279                                 if ((so)->so_count <= 0)        \
280                                         panic("sorele");\
281                                 if (--(so)->so_count == 0)\
282                                         sofree(so);     \
283                         } while (0)
284
285 #define sotryfree(so)   do {                            \
286                                 if ((so)->so_count == 0)        \
287                                         sofree(so);     \
288                         } while(0)
289
290 #define sorwakeup(so)   do {                                    \
291                                 if (sb_notify(&(so)->so_rcv))   \
292                                         sowakeup((so), &(so)->so_rcv); \
293                         } while (0)
294
295 #define sowwakeup(so)   do {                                    \
296                                 if (sb_notify(&(so)->so_snd))   \
297                                         sowakeup((so), &(so)->so_snd); \
298                         } while (0)
299
300 #ifdef _KERNEL
301
302 /*
303  * Argument structure for sosetopt et seq.  This is in the KERNEL
304  * section because it will never be visible to user code.
305  */
306 enum sopt_dir { SOPT_GET, SOPT_SET };
307 struct sockopt {
308         enum    sopt_dir sopt_dir; /* is this a get or a set? */
309         int     sopt_level;     /* second arg of [gs]etsockopt */
310         int     sopt_name;      /* third arg of [gs]etsockopt */
311         void   *sopt_val;       /* fourth arg of [gs]etsockopt */
312         size_t  sopt_valsize;   /* (almost) fifth arg of [gs]etsockopt */
313         struct  thread *sopt_td; /* calling thread or null if kernel */
314 };
315
316 struct sf_buf {
317         SLIST_ENTRY(sf_buf) free_list;  /* list of free buffer slots */
318         struct          vm_page *m;     /* currently mapped page */
319         vm_offset_t     kva;            /* va of mapping */
320 };
321
322 struct accept_filter {
323         char    accf_name[16];
324         void    (*accf_callback)
325                 (struct socket *so, void *arg, int waitflag);
326         void *  (*accf_create)
327                 (struct socket *so, char *arg);
328         void    (*accf_destroy)
329                 (struct socket *so);
330         SLIST_ENTRY(accept_filter) accf_next;
331 };
332
333 #ifdef MALLOC_DECLARE
334 MALLOC_DECLARE(M_ACCF);
335 MALLOC_DECLARE(M_PCB);
336 MALLOC_DECLARE(M_SONAME);
337 #endif
338
339 extern int      maxsockets;
340 extern u_long   sb_max;
341 extern struct uma_zone *socket_zone;
342 extern so_gen_t so_gencnt;
343
344 struct mbuf;
345 struct sockaddr;
346 struct ucred;
347 struct uio;
348
349 /*
350  * From uipc_socket and friends
351  */
352 struct  sockaddr *dup_sockaddr(struct sockaddr *sa, int canwait);
353 int     sockargs(struct mbuf **mp, caddr_t buf, int buflen, int type);
354 int     getsockaddr(struct sockaddr **namp, caddr_t uaddr, size_t len);
355 void    sbappend(struct sockbuf *sb, struct mbuf *m);
356 int     sbappendaddr(struct sockbuf *sb, struct sockaddr *asa,
357             struct mbuf *m0, struct mbuf *control);
358 int     sbappendcontrol(struct sockbuf *sb, struct mbuf *m0,
359             struct mbuf *control);
360 void    sbappendrecord(struct sockbuf *sb, struct mbuf *m0);
361 void    sbcheck(struct sockbuf *sb);
362 void    sbcompress(struct sockbuf *sb, struct mbuf *m, struct mbuf *n);
363 struct mbuf *
364         sbcreatecontrol(caddr_t p, int size, int type, int level);
365 void    sbdrop(struct sockbuf *sb, int len);
366 void    sbdroprecord(struct sockbuf *sb);
367 void    sbflush(struct sockbuf *sb);
368 void    sbinsertoob(struct sockbuf *sb, struct mbuf *m0);
369 void    sbrelease(struct sockbuf *sb, struct socket *so);
370 int     sbreserve(struct sockbuf *sb, u_long cc, struct socket *so,
371             struct thread *td);
372 void    sbtoxsockbuf(struct sockbuf *sb, struct xsockbuf *xsb);
373 int     sbwait(struct sockbuf *sb);
374 struct sf_buf *
375         sf_buf_alloc(struct vm_page *m);
376 void    sf_buf_free(void *addr, void *args);
377 int     sb_lock(struct sockbuf *sb);
378 int     soabort(struct socket *so);
379 int     soaccept(struct socket *so, struct sockaddr **nam);
380 int     socheckuid(struct socket *so, uid_t uid);
381 struct  socket *soalloc(int waitok);
382 int     sobind(struct socket *so, struct sockaddr *nam, struct thread *td);
383 void    socantrcvmore(struct socket *so);
384 void    socantsendmore(struct socket *so);
385 int     soclose(struct socket *so);
386 int     soconnect(struct socket *so, struct sockaddr *nam, struct thread *td);
387 int     soconnect2(struct socket *so1, struct socket *so2);
388 int     socow_setup(struct mbuf *m0, struct uio *uio);
389 int     socreate(int dom, struct socket **aso, int type, int proto,
390             struct ucred *cred, struct thread *td);
391 void    sodealloc(struct socket *so);
392 int     sodisconnect(struct socket *so);
393 void    sofree(struct socket *so);
394 int     sogetopt(struct socket *so, struct sockopt *sopt);
395 void    sohasoutofband(struct socket *so);
396 void    soisconnected(struct socket *so);
397 void    soisconnecting(struct socket *so);
398 void    soisdisconnected(struct socket *so);
399 void    soisdisconnecting(struct socket *so);
400 int     solisten(struct socket *so, int backlog, struct thread *td);
401 struct socket *
402         sonewconn(struct socket *head, int connstatus);
403 int     sooptcopyin(struct sockopt *sopt, void *buf, size_t len, size_t minlen);
404 int     sooptcopyout(struct sockopt *sopt, const void *buf, size_t len);
405
406 /* XXX; prepare mbuf for (__FreeBSD__ < 3) routines. */
407 int     soopt_getm(struct sockopt *sopt, struct mbuf **mp);
408 int     soopt_mcopyin(struct sockopt *sopt, struct mbuf *m);
409 int     soopt_mcopyout(struct sockopt *sopt, struct mbuf *m);
410
411 int     sopoll(struct socket *so, int events, struct ucred *active_cred,
412             struct thread *td);
413 int     soreceive(struct socket *so, struct sockaddr **paddr, struct uio *uio,
414             struct mbuf **mp0, struct mbuf **controlp, int *flagsp);
415 int     soreserve(struct socket *so, u_long sndcc, u_long rcvcc);
416 void    sorflush(struct socket *so);
417 int     sosend(struct socket *so, struct sockaddr *addr, struct uio *uio,
418             struct mbuf *top, struct mbuf *control, int flags,
419             struct thread *td);
420 int     sosetopt(struct socket *so, struct sockopt *sopt);
421 int     soshutdown(struct socket *so, int how);
422 void    sotoxsocket(struct socket *so, struct xsocket *xso);
423 void    sowakeup(struct socket *so, struct sockbuf *sb);
424
425 /*
426  * Accept filter functions (duh).
427  */
428 int     accept_filt_add(struct accept_filter *filt);
429 int     accept_filt_del(char *name);
430 struct  accept_filter *accept_filt_get(char *name);
431 #ifdef ACCEPT_FILTER_MOD
432 #ifdef SYSCTL_DECL
433 SYSCTL_DECL(_net_inet_accf);
434 #endif
435 int     accept_filt_generic_mod_event(module_t mod, int event, void *data);
436 #endif
437
438 #endif /* _KERNEL */
439
440 #endif /* !_SYS_SOCKETVAR_H_ */