]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - share/man/man4/pci.4
Upgrade Unbound to 1.7.0. More to follow.
[FreeBSD/FreeBSD.git] / share / man / man4 / pci.4
1 .\"
2 .\" Copyright (c) 1999 Kenneth D. Merry.
3 .\" All rights reserved.
4 .\"
5 .\" Redistribution and use in source and binary forms, with or without
6 .\" modification, are permitted provided that the following conditions
7 .\" are met:
8 .\" 1. Redistributions of source code must retain the above copyright
9 .\"    notice, this list of conditions and the following disclaimer.
10 .\" 2. The name of the author may not be used to endorse or promote products
11 .\"    derived from this software without specific prior written permission.
12 .\"
13 .\" THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
14 .\" ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
15 .\" IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
16 .\" ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
17 .\" FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
18 .\" DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
19 .\" OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
20 .\" HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
21 .\" LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
22 .\" OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
23 .\" SUCH DAMAGE.
24 .\"
25 .\" $FreeBSD$
26 .\"
27 .Dd December 20, 2017
28 .Dt PCI 4
29 .Os
30 .Sh NAME
31 .Nm pci
32 .Nd generic PCI bus driver
33 .Sh SYNOPSIS
34 To compile the PCI bus driver into the kernel,
35 place the following line in your
36 kernel configuration file:
37 .Bd -ragged -offset indent
38 .Cd device pci
39 .Ed
40 .Pp
41 To compile in support for Single Root I/O Virtualization
42 .Pq SR-IOV :
43 .Bd -ragged -offset indent
44 .Cd options PCI_IOV
45 .Ed
46 .Pp
47 To compile in support for native PCI-express HotPlug:
48 .Bd -ragged -offset indent
49 .Cd options PCI_HP
50 .Ed
51 .Sh DESCRIPTION
52 The
53 .Nm
54 driver provides support for
55 .Tn PCI
56 devices in the kernel and limited access to
57 .Tn PCI
58 devices for userland.
59 .Pp
60 The
61 .Nm
62 driver provides a
63 .Pa /dev/pci
64 character device that can be used by userland programs to read and write
65 .Tn PCI
66 configuration registers.
67 Programs can also use this device to get a list of all
68 .Tn PCI
69 devices, or all
70 .Tn PCI
71 devices that match various patterns.
72 .Pp
73 Since the
74 .Nm
75 driver provides a write interface for
76 .Tn PCI
77 configuration registers, system administrators should exercise caution when
78 granting access to the
79 .Nm
80 device.
81 If used improperly, this driver can allow userland applications to
82 crash a machine or cause data loss.
83 .Pp
84 The
85 .Nm
86 driver implements the
87 .Tn PCI
88 bus in the kernel.
89 It enumerates any devices on the
90 .Tn PCI
91 bus and gives
92 .Tn PCI
93 client drivers the chance to attach to them.
94 It assigns resources to children, when the BIOS does not.
95 It takes care of routing interrupts when necessary.
96 It reprobes the unattached
97 .Tn PCI
98 children when
99 .Tn PCI
100 client drivers are dynamically
101 loaded at runtime.
102 The
103 .Nm
104 driver also includes support for PCI-PCI bridges,
105 various platform-specific Host-PCI bridges,
106 and basic support for
107 .Tn PCI
108 VGA adapters.
109 .Sh IOCTLS
110 The following
111 .Xr ioctl 2
112 calls are supported by the
113 .Nm
114 driver.
115 They are defined in the header file
116 .In sys/pciio.h .
117 .Bl -tag -width 012345678901234
118 .It PCIOCGETCONF
119 This
120 .Xr ioctl 2
121 takes a
122 .Va pci_conf_io
123 structure.
124 It allows the user to retrieve information on all
125 .Tn PCI
126 devices in the system, or on
127 .Tn PCI
128 devices matching patterns supplied by the user.
129 The call may set
130 .Va errno
131 to any value specified in either
132 .Xr copyin 9
133 or
134 .Xr copyout 9 .
135 The
136 .Va pci_conf_io
137 structure consists of a number of fields:
138 .Bl -tag -width match_buf_len
139 .It pat_buf_len
140 The length, in bytes, of the buffer filled with user-supplied patterns.
141 .It num_patterns
142 The number of user-supplied patterns.
143 .It patterns
144 Pointer to a buffer filled with user-supplied patterns.
145 .Va patterns
146 is a pointer to
147 .Va num_patterns
148 .Va pci_match_conf
149 structures.
150 The
151 .Va pci_match_conf
152 structure consists of the following elements:
153 .Bl -tag -width pd_vendor
154 .It pc_sel
155 .Tn PCI
156 domain, bus, slot and function.
157 .It pd_name
158 .Tn PCI
159 device driver name.
160 .It pd_unit
161 .Tn PCI
162 device driver unit number.
163 .It pc_vendor
164 .Tn PCI
165 vendor ID.
166 .It pc_device
167 .Tn PCI
168 device ID.
169 .It pc_class
170 .Tn PCI
171 device class.
172 .It flags
173 The flags describe which of the fields the kernel should match against.
174 A device must match all specified fields in order to be returned.
175 The match flags are enumerated in the
176 .Va pci_getconf_flags
177 structure.
178 Hopefully the flag values are obvious enough that they do not need to
179 described in detail.
180 .El
181 .It match_buf_len
182 Length of the
183 .Va matches
184 buffer allocated by the user to hold the results of the
185 .Dv PCIOCGETCONF
186 query.
187 .It num_matches
188 Number of matches returned by the kernel.
189 .It matches
190 Buffer containing matching devices returned by the kernel.
191 The items in this buffer are of type
192 .Va pci_conf ,
193 which consists of the following items:
194 .Bl -tag -width pc_subvendor
195 .It pc_sel
196 .Tn PCI
197 domain, bus, slot and function.
198 .It pc_hdr
199 .Tn PCI
200 header type.
201 .It pc_subvendor
202 .Tn PCI
203 subvendor ID.
204 .It pc_subdevice
205 .Tn PCI
206 subdevice ID.
207 .It pc_vendor
208 .Tn PCI
209 vendor ID.
210 .It pc_device
211 .Tn PCI
212 device ID.
213 .It pc_class
214 .Tn PCI
215 device class.
216 .It pc_subclass
217 .Tn PCI
218 device subclass.
219 .It pc_progif
220 .Tn PCI
221 device programming interface.
222 .It pc_revid
223 .Tn PCI
224 revision ID.
225 .It pd_name
226 Driver name.
227 .It pd_unit
228 Driver unit number.
229 .El
230 .It offset
231 The offset is passed in by the user to tell the kernel where it should
232 start traversing the device list.
233 The value passed out by the kernel
234 points to the record immediately after the last one returned.
235 The user may
236 pass the value returned by the kernel in subsequent calls to the
237 .Dv PCIOCGETCONF
238 ioctl.
239 If the user does not intend to use the offset, it must be set to zero.
240 .It generation
241 .Tn PCI
242 configuration generation.
243 This value only needs to be set if the offset is set.
244 The kernel will compare the current generation number of its internal
245 device list to the generation passed in by the user to determine whether
246 its device list has changed since the user last called the
247 .Dv PCIOCGETCONF
248 ioctl.
249 If the device list has changed, a status of
250 .Va PCI_GETCONF_LIST_CHANGED
251 will be passed back.
252 .It status
253 The status tells the user the disposition of his request for a device list.
254 The possible status values are:
255 .Bl -ohang
256 .It PCI_GETCONF_LAST_DEVICE
257 This means that there are no more devices in the PCI device list matching
258 the specified criteria after the
259 ones returned in the
260 .Va matches
261 buffer.
262 .It PCI_GETCONF_LIST_CHANGED
263 This status tells the user that the
264 .Tn PCI
265 device list has changed since his last call to the
266 .Dv PCIOCGETCONF
267 ioctl and he must reset the
268 .Va offset
269 and
270 .Va generation
271 to zero to start over at the beginning of the list.
272 .It PCI_GETCONF_MORE_DEVS
273 This tells the user that his buffer was not large enough to hold all of the
274 remaining devices in the device list that match his criteria.
275 .It PCI_GETCONF_ERROR
276 This indicates a general error while servicing the user's request.
277 If the
278 .Va pat_buf_len
279 is not equal to
280 .Va num_patterns
281 times
282 .Fn sizeof "struct pci_match_conf" ,
283 .Va errno
284 will be set to
285 .Er EINVAL .
286 .El
287 .El
288 .It PCIOCREAD
289 This
290 .Xr ioctl 2
291 reads the
292 .Tn PCI
293 configuration registers specified by the passed-in
294 .Va pci_io
295 structure.
296 The
297 .Va pci_io
298 structure consists of the following fields:
299 .Bl -tag -width pi_width
300 .It pi_sel
301 A
302 .Va pcisel
303 structure which specifies the domain, bus, slot and function the user would
304 like to query.
305 If the specific bus is not found, errno will be set to ENODEV and -1 returned
306 from the ioctl.
307 .It pi_reg
308 The
309 .Tn PCI
310 configuration register the user would like to access.
311 .It pi_width
312 The width, in bytes, of the data the user would like to read.
313 This value
314 may be either 1, 2, or 4.
315 3-byte reads and reads larger than 4 bytes are
316 not supported.
317 If an invalid width is passed, errno will be set to EINVAL.
318 .It pi_data
319 The data returned by the kernel.
320 .El
321 .It PCIOCWRITE
322 This
323 .Xr ioctl 2
324 allows users to write to the
325 .Tn PCI
326 specified in the passed-in
327 .Va pci_io
328 structure.
329 The
330 .Va pci_io
331 structure is described above.
332 The limitations on data width described for
333 reading registers, above, also apply to writing
334 .Tn PCI
335 configuration registers.
336 .El
337 .Sh LOADER TUNABLES
338 Tunables can be set at the
339 .Xr loader 8
340 prompt before booting the kernel, or stored in
341 .Xr loader.conf 5 .
342 The current value of these tunables can be examined at runtime via
343 .Xr sysctl 8
344 nodes of the same name.
345 Unless otherwise specified,
346 each of these tunables is a boolean that can be enabled by setting the
347 tunable to a non-zero value.
348 .Bl -tag -width indent
349 .It Va hw.pci.clear_bars Pq Defaults to 0
350 Ignore any firmware-assigned memory and I/O port resources.
351 This forces the
352 .Tn PCI
353 bus driver to allocate resource ranges for memory and I/O port resources
354 from scratch.
355 .It Va hw.pci.clear_buses Pq Defaults to 0
356 Ignore any firmware-assigned bus number registers in PCI-PCI bridges.
357 This forces the
358 .Tn PCI
359 bus driver and PCI-PCI bridge driver to allocate bus numbers for secondary
360 buses behind PCI-PCI bridges.
361 .It Va hw.pci.clear_pcib Pq Defaults to 0
362 Ignore any firmware-assigned memory and I/O port resource windows in PCI-PCI
363 bridges.
364 This forces the PCI-PCI bridge driver to allocate memory and I/O port resources
365 for resource windows from scratch.
366 .Pp
367 By default the PCI-PCI bridge driver will allocate windows that
368 contain the firmware-assigned resources devices behind the bridge.
369 In addition, the PCI-PCI bridge driver will suballocate from existing window
370 regions when possible to satisfy a resource request.
371 As a result,
372 both
373 .Va hw.pci.clear_bars
374 and
375 .Va hw.pci.clear_pcib
376 must be enabled to fully ignore firmware-supplied resource assignments.
377 .It Va hw.pci.default_vgapci_unit Pq Defaults to -1
378 By default,
379 the first
380 .Tn PCI
381 VGA adapter encountered by the system is assumed to be the boot display device.
382 This tunable can be set to choose a specific VGA adapter by specifying the
383 unit number of the associated
384 .Va vgapci Ns Ar X
385 device.
386 .It Va hw.pci.do_power_nodriver Pq Defaults to 0
387 Place devices into a low power state
388 .Pq D3
389 when a suitable device driver is not found.
390 Can be set to one of the following values:
391 .Bl -tag -width indent
392 .It 3
393 Powers down all
394 .Tn PCI
395 devices without a device driver.
396 .It 2
397 Powers down most devices without a device driver.
398 PCI devices with the display, memory, and base peripheral device classes
399 are not powered down.
400 .It 1
401 Similar to a setting of 2 except that storage controllers are also not
402 powered down.
403 .It 0
404 All devices are left fully powered.
405 .El
406 .Pp
407 A
408 .Tn PCI
409 device must support power management to be powered down.
410 Placing a device into a low power state may not reduce power consumption.
411 .It Va hw.pci.do_power_resume Pq Defaults to 1
412 Place
413 .Tn PCI
414 devices into the fully powered state when resuming either the system or an
415 individual device.
416 Setting this to zero is discouraged as the system will not attempt to power
417 up non-powered PCI devices after a suspend.
418 .It Va hw.pci.do_power_suspend Pq Defaults to 1
419 Place
420 .Tn PCI
421 devices into a low power state when suspending either the system or individual
422 devices.
423 Normally the D3 state is used as the low power state,
424 but firmware may override the desired power state during a system suspend.
425 .It Va hw.pci.enable_ari Pq Defaults to 1
426 Enable support for PCI-express Alternative RID Interpretation.
427 This is often used in conjunction with SR-IOV.
428 .It Va hw.pci.enable_io_modes Pq Defaults to 1
429 Enable memory or I/O port decoding in a PCI device's command register if it has
430 firmware-assigned memory or I/O port resources.
431 The firmware
432 .Pq BIOS
433 in some systems does not enable memory or I/O port decoding for some devices
434 even when it has assigned resources to the device.
435 This enables decoding for such resources during bus probe.
436 .It Va hw.pci.enable_msi Pq Defaults to 1
437 Enable support for Message Signalled Interrupts
438 .Pq MSI .
439 MSI interrupts can be disabled by setting this tunable to 0.
440 .It Va hw.pci.enable_msix Pq Defaults to 1
441 Enable support for extended Message Signalled Interrupts
442 .Pq MSI-X .
443 MSI-X interrupts can be disabled by setting this tunable to 0.
444 .It Va hw.pci.enable_pcie_hp Pq Defaults to 1
445 Enable support for native PCI-express HotPlug.
446 .It Va hw.pci.honor_msi_blacklist Pq Defaults to 1
447 MSI and MSI-X interrupts are disabled for certain chipsets known to have
448 broken MSI and MSI-X implementations when this tunable is set.
449 It can be set to zero to permit use of MSI and MSI-X interrupts if the
450 chipset match is a false positive.
451 .It Va hw.pci.iov_max_config Pq Defaults to 1MB
452 The maximum amount of memory permitted for the configuration parameters
453 used when creating Virtual Functions via SR-IOV.
454 This tunable can also be changed at runtime via
455 .Xr sysctl 8 .
456 .It Va hw.pci.realloc_bars Pq Defaults to 0
457 Attempt to allocate a new resource range during the initial device scan
458 for any memory or I/O port resources with firmware-assigned ranges that
459 conflict with another active resource.
460 .It Va hw.pci.usb_early_takeover Pq Defaults to 1 on Tn amd64 and Tn i386
461 Disable legacy device emulation of USB devices during the initial device
462 scan.
463 Set this tunable to zero to use USB devices via legacy emulation when
464 using a custom kernel without USB controller drivers.
465 .It Va hw.pci<D>.<B>.<S>.INT<P>.irq
466 These tunables can be used to override the interrupt routing for legacy
467 PCI INTx interrupts.
468 Unlike other tunables in this list,
469 these do not have corresponding sysctl nodes.
470 The tunable name includes the address of the PCI device as well as the
471 pin of the desired INTx IRQ to override:
472 .Bl -tag -width indent
473 .It <D>
474 The domain
475 .Pq or segment
476 of the PCI device in decimal.
477 .It <B>
478 The bus address of the PCI device in decimal.
479 .It <S>
480 The slot of the PCI device in decimal.
481 .It <P>
482 The interrupt pin of the PCI slot to override.
483 One of
484 .Ql A ,
485 .Ql B ,
486 .Ql C ,
487 or
488 .Ql D .
489 .El
490 .Pp
491 The value of the tunable is the raw IRQ value to use for the INTx interrupt
492 pin identified by the tunable name.
493 Mapping of IRQ values to platform interrupt sources is machine dependent.
494 .El
495 .Sh DEVICE WIRING
496 You can wire the device unit at a given location with device.hints.
497 Entries of the form
498 .Va hints.<name>.<unit>.at="pci<B>:<S>:<F>"
499 or
500 .Va hints.<name>.<unit>.at="pci<D>:<B>:<S>:<F>"
501 will force the driver
502 .Va name
503 to probe and attach at unit
504 .Va unit
505 for any PCI device found to match the specification, where:
506 .Bl -tag -width -indent
507 .It <D>
508 The domain
509 .Pq or segment
510 of the PCI device in decimal.
511 Defaults to 0 if unspecified
512 .It <B>
513 The bus address of the PCI device in decimal.
514 .It <S>
515 The slot of the PCI device in decimal.
516 .It <F>
517 The function of the PCI device in decimal.
518 .El
519 .Pp
520 The code to do the matching requires an exact string match.
521 Do not specify the angle brackets
522 .Pq < >
523 in the hints file.
524 Wiring multiple devices to the same
525 .Va name
526 and
527 .Va unit
528 produces undefined results.
529 .Ss Examples
530 Given the following lines in
531 .Pa /boot/device.hints :
532 .Cd hint.nvme.3.at="pci6:0:0"
533 .Cd hint.igb.8.at="pci14:0:0"
534 If there is a device that supports
535 .Xr igb 4
536 at PCI bus 14 slot 0 function 0,
537 then it will be assigned igb8 for probe and attach.
538 Likewise, if there is an
539 .Xr nvme 4
540 card at PCI bus 6 slot 0 function 0,
541 then it will be assigned nvme3 for probe and attach.
542 If another type of card is in either of these locations, the name and
543 unit of that card will be the default names and will be unaffected by
544 these hints.
545 If other igb or nvme cards are located elsewhere, they will be
546 assigned their unit numbers sequentially, skipping the unit numbers
547 that have 'at' hints.
548 .Sh FILES
549 .Bl -tag -width /dev/pci -compact
550 .It Pa /dev/pci
551 Character device for the
552 .Nm
553 driver.
554 .El
555 .Sh SEE ALSO
556 .Xr pciconf 8
557 .Sh HISTORY
558 The
559 .Nm
560 driver (not the kernel's
561 .Tn PCI
562 support code) first appeared in
563 .Fx 2.2 ,
564 and was written by Stefan Esser and Garrett Wollman.
565 Support for device listing and matching was re-implemented by
566 Kenneth Merry, and first appeared in
567 .Fx 3.0 .
568 .Sh AUTHORS
569 .An Kenneth Merry Aq Mt ken@FreeBSD.org
570 .Sh BUGS
571 It is not possible for users to specify an accurate offset into the device
572 list without calling the
573 .Dv PCIOCGETCONF
574 at least once, since they have no way of knowing the current generation
575 number otherwise.
576 This probably is not a serious problem, though, since
577 users can easily narrow their search by specifying a pattern or patterns
578 for the kernel to match against.