]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - stand/i386/libi386/biosdisk.c
MFC r334656, r334665, r334695
[FreeBSD/FreeBSD.git] / stand / i386 / libi386 / biosdisk.c
1 /*-
2  * Copyright (c) 1998 Michael Smith <msmith@freebsd.org>
3  * Copyright (c) 2012 Andrey V. Elsukov <ae@FreeBSD.org>
4  * All rights reserved.
5  *
6  * Redistribution and use in source and binary forms, with or without
7  * modification, are permitted provided that the following conditions
8  * are met:
9  * 1. Redistributions of source code must retain the above copyright
10  *    notice, this list of conditions and the following disclaimer.
11  * 2. Redistributions in binary form must reproduce the above copyright
12  *    notice, this list of conditions and the following disclaimer in the
13  *    documentation and/or other materials provided with the distribution.
14  *
15  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
16  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
17  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
18  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
19  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
20  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
21  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
22  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
23  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
24  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
25  * SUCH DAMAGE.
26  */
27
28 #include <sys/cdefs.h>
29 __FBSDID("$FreeBSD$");
30
31 /*
32  * BIOS disk device handling.
33  * 
34  * Ideas and algorithms from:
35  *
36  * - NetBSD libi386/biosdisk.c
37  * - FreeBSD biosboot/disk.c
38  *
39  */
40
41 #include <sys/disk.h>
42 #include <sys/limits.h>
43 #include <stand.h>
44 #include <machine/bootinfo.h>
45 #include <stdarg.h>
46
47 #include <bootstrap.h>
48 #include <btxv86.h>
49 #include <edd.h>
50 #include "disk.h"
51 #include "libi386.h"
52
53 #ifdef LOADER_GELI_SUPPORT
54 #include "cons.h"
55 #include "drv.h"
56 #include "gpt.h"
57 #include "part.h"
58 #include <uuid.h>
59 struct pentry {
60         struct ptable_entry     part;
61         uint64_t                flags;
62         union {
63                 uint8_t bsd;
64                 uint8_t mbr;
65                 uuid_t  gpt;
66                 uint16_t vtoc8;
67         } type;
68         STAILQ_ENTRY(pentry)    entry;
69 };
70 struct ptable {
71         enum ptable_type        type;
72         uint16_t                sectorsize;
73         uint64_t                sectors;
74
75         STAILQ_HEAD(, pentry)   entries;
76 };
77
78 #include "geliboot.c"
79 #endif /* LOADER_GELI_SUPPORT */
80
81 #define BIOS_NUMDRIVES          0x475
82 #define BIOSDISK_SECSIZE        512
83 #define BUFSIZE                 (1 * BIOSDISK_SECSIZE)
84
85 #define DT_ATAPI                0x10            /* disk type for ATAPI floppies */
86 #define WDMAJOR                 0               /* major numbers for devices we frontend for */
87 #define WFDMAJOR                1
88 #define FDMAJOR                 2
89 #define DAMAJOR                 4
90
91 #ifdef DISK_DEBUG
92 # define DEBUG(fmt, args...)    printf("%s: " fmt "\n" , __func__ , ## args)
93 #else
94 # define DEBUG(fmt, args...)
95 #endif
96
97 /*
98  * List of BIOS devices, translation from disk unit number to
99  * BIOS unit number.
100  */
101 static struct bdinfo
102 {
103         int             bd_unit;        /* BIOS unit number */
104         int             bd_cyl;         /* BIOS geometry */
105         int             bd_hds;
106         int             bd_sec;
107         int             bd_flags;
108 #define BD_MODEINT13    0x0000
109 #define BD_MODEEDD1     0x0001
110 #define BD_MODEEDD3     0x0002
111 #define BD_MODEMASK     0x0003
112 #define BD_FLOPPY       0x0004
113         int             bd_type;        /* BIOS 'drive type' (floppy only) */
114         uint16_t        bd_sectorsize;  /* Sector size */
115         uint64_t        bd_sectors;     /* Disk size */
116         int             bd_open;        /* reference counter */
117         void            *bd_bcache;     /* buffer cache data */
118 } bdinfo [MAXBDDEV];
119 static int nbdinfo = 0;
120
121 #define BD(dev)         (bdinfo[(dev)->dd.d_unit])
122
123 static void bd_io_workaround(struct disk_devdesc *dev);
124
125 static int bd_read(struct disk_devdesc *dev, daddr_t dblk, int blks,
126     caddr_t dest);
127 static int bd_write(struct disk_devdesc *dev, daddr_t dblk, int blks,
128     caddr_t dest);
129 static int bd_int13probe(struct bdinfo *bd);
130
131 static int bd_init(void);
132 static int bd_strategy(void *devdata, int flag, daddr_t dblk, size_t size,
133     char *buf, size_t *rsize);
134 static int bd_realstrategy(void *devdata, int flag, daddr_t dblk, size_t size,
135     char *buf, size_t *rsize);
136 static int bd_open(struct open_file *f, ...);
137 static int bd_close(struct open_file *f);
138 static int bd_ioctl(struct open_file *f, u_long cmd, void *data);
139 static int bd_print(int verbose);
140
141 #ifdef LOADER_GELI_SUPPORT
142 enum isgeli {
143         ISGELI_UNKNOWN,
144         ISGELI_NO,
145         ISGELI_YES
146 };
147 static enum isgeli geli_status[MAXBDDEV][MAXTBLENTS];
148
149 int bios_read(void *, void *, off_t off, void *buf, size_t bytes);
150 #endif /* LOADER_GELI_SUPPORT */
151
152 struct devsw biosdisk = {
153         "disk",
154         DEVT_DISK,
155         bd_init,
156         bd_strategy,
157         bd_open,
158         bd_close,
159         bd_ioctl,
160         bd_print,
161         NULL
162 };
163
164 /*
165  * Translate between BIOS device numbers and our private unit numbers.
166  */
167 int
168 bd_bios2unit(int biosdev)
169 {
170         int i;
171
172         DEBUG("looking for bios device 0x%x", biosdev);
173         for (i = 0; i < nbdinfo; i++) {
174                 DEBUG("bd unit %d is BIOS device 0x%x", i, bdinfo[i].bd_unit);
175                 if (bdinfo[i].bd_unit == biosdev)
176                         return (i);
177         }
178         return (-1);
179 }
180
181 int
182 bd_unit2bios(int unit)
183 {
184
185         if ((unit >= 0) && (unit < nbdinfo))
186                 return (bdinfo[unit].bd_unit);
187         return (-1);
188 }
189
190 /*
191  * Quiz the BIOS for disk devices, save a little info about them.
192  */
193 static int
194 bd_init(void)
195 {
196         int base, unit, nfd = 0;
197
198 #ifdef LOADER_GELI_SUPPORT
199         geli_init();
200 #endif
201         /* sequence 0, 0x80 */
202         for (base = 0; base <= 0x80; base += 0x80) {
203                 for (unit = base; (nbdinfo < MAXBDDEV); unit++) {
204 #ifndef VIRTUALBOX
205                         /*
206                          * Check the BIOS equipment list for number
207                          * of fixed disks.
208                          */
209                         if(base == 0x80 &&
210                             (nfd >= *(unsigned char *)PTOV(BIOS_NUMDRIVES)))
211                                 break;
212 #endif
213                         bdinfo[nbdinfo].bd_open = 0;
214                         bdinfo[nbdinfo].bd_bcache = NULL;
215                         bdinfo[nbdinfo].bd_unit = unit;
216                         bdinfo[nbdinfo].bd_flags = unit < 0x80 ? BD_FLOPPY: 0;
217                         if (!bd_int13probe(&bdinfo[nbdinfo]))
218                                 break;
219
220                         /* XXX we need "disk aliases" to make this simpler */
221                         printf("BIOS drive %c: is disk%d\n", (unit < 0x80) ?
222                             ('A' + unit): ('C' + unit - 0x80), nbdinfo);
223                         nbdinfo++;
224                         if (base == 0x80)
225                                 nfd++;
226                 }
227         }
228         bcache_add_dev(nbdinfo);
229         return(0);
230 }
231
232 /*
233  * Try to detect a device supported by the legacy int13 BIOS
234  */
235 static int
236 bd_int13probe(struct bdinfo *bd)
237 {
238         struct edd_params params;
239         int ret = 1;    /* assume success */
240
241         v86.ctl = V86_FLAGS;
242         v86.addr = 0x13;
243         v86.eax = 0x800;
244         v86.edx = bd->bd_unit;
245         v86int();
246
247         /* Don't error out if we get bad sector number, try EDD as well */
248         if (V86_CY(v86.efl) ||  /* carry set */
249             (v86.edx & 0xff) <= (unsigned)(bd->bd_unit & 0x7f)) /* unit # bad */
250                 return (0);     /* skip device */
251
252         if ((v86.ecx & 0x3f) == 0) /* absurd sector number */
253                 ret = 0;        /* set error */
254
255         /* Convert max cyl # -> # of cylinders */
256         bd->bd_cyl = ((v86.ecx & 0xc0) << 2) + ((v86.ecx & 0xff00) >> 8) + 1;
257         /* Convert max head # -> # of heads */
258         bd->bd_hds = ((v86.edx & 0xff00) >> 8) + 1;
259         bd->bd_sec = v86.ecx & 0x3f;
260         bd->bd_type = v86.ebx & 0xff;
261         bd->bd_flags |= BD_MODEINT13;
262
263         /* Calculate sectors count from the geometry */
264         bd->bd_sectors = bd->bd_cyl * bd->bd_hds * bd->bd_sec;
265         bd->bd_sectorsize = BIOSDISK_SECSIZE;
266         DEBUG("unit 0x%x geometry %d/%d/%d", bd->bd_unit, bd->bd_cyl,
267             bd->bd_hds, bd->bd_sec);
268
269         /* Determine if we can use EDD with this device. */
270         v86.ctl = V86_FLAGS;
271         v86.addr = 0x13;
272         v86.eax = 0x4100;
273         v86.edx = bd->bd_unit;
274         v86.ebx = 0x55aa;
275         v86int();
276         if (V86_CY(v86.efl) ||  /* carry set */
277             (v86.ebx & 0xffff) != 0xaa55 || /* signature */
278             (v86.ecx & EDD_INTERFACE_FIXED_DISK) == 0)
279                 return (ret);   /* return code from int13 AH=08 */
280
281         /* EDD supported */
282         bd->bd_flags |= BD_MODEEDD1;
283         if ((v86.eax & 0xff00) >= 0x3000)
284                 bd->bd_flags |= BD_MODEEDD3;
285         /* Get disk params */
286         params.len = sizeof(struct edd_params);
287         v86.ctl = V86_FLAGS;
288         v86.addr = 0x13;
289         v86.eax = 0x4800;
290         v86.edx = bd->bd_unit;
291         v86.ds = VTOPSEG(&params);
292         v86.esi = VTOPOFF(&params);
293         v86int();
294         if (!V86_CY(v86.efl)) {
295                 uint64_t total;
296
297                 /*
298                  * Sector size must be a multiple of 512 bytes.
299                  * An alternate test would be to check power of 2,
300                  * powerof2(params.sector_size).
301                  */
302                 if (params.sector_size % BIOSDISK_SECSIZE)
303                         bd->bd_sectorsize = BIOSDISK_SECSIZE;
304                 else
305                         bd->bd_sectorsize = params.sector_size;
306
307                 total = bd->bd_sectorsize * params.sectors;
308                 if (params.sectors != 0) {
309                         /* Only update if we did not overflow. */
310                         if (total > params.sectors)
311                                 bd->bd_sectors = params.sectors;
312                 }
313
314                 total = (uint64_t)params.cylinders *
315                     params.heads * params.sectors_per_track;
316                 if (bd->bd_sectors < total)
317                         bd->bd_sectors = total;
318
319                 ret = 1;
320         }
321         DEBUG("unit 0x%x flags %x, sectors %llu, sectorsize %u",
322             bd->bd_unit, bd->bd_flags, bd->bd_sectors, bd->bd_sectorsize);
323         return (ret);
324 }
325
326 /*
327  * Print information about disks
328  */
329 static int
330 bd_print(int verbose)
331 {
332         static char line[80];
333         struct disk_devdesc dev;
334         int i, ret = 0;
335
336         if (nbdinfo == 0)
337                 return (0);
338
339         printf("%s devices:", biosdisk.dv_name);
340         if ((ret = pager_output("\n")) != 0)
341                 return (ret);
342
343         for (i = 0; i < nbdinfo; i++) {
344                 snprintf(line, sizeof(line),
345                     "    disk%d:   BIOS drive %c (%ju X %u):\n", i,
346                     (bdinfo[i].bd_unit < 0x80) ? ('A' + bdinfo[i].bd_unit):
347                     ('C' + bdinfo[i].bd_unit - 0x80),
348                     (uintmax_t)bdinfo[i].bd_sectors,
349                     bdinfo[i].bd_sectorsize);
350                 if ((ret = pager_output(line)) != 0)
351                         break;
352                 dev.dd.d_dev = &biosdisk;
353                 dev.dd.d_unit = i;
354                 dev.d_slice = -1;
355                 dev.d_partition = -1;
356                 if (disk_open(&dev,
357                     bdinfo[i].bd_sectorsize * bdinfo[i].bd_sectors,
358                     bdinfo[i].bd_sectorsize) == 0) {
359                         snprintf(line, sizeof(line), "    disk%d", i);
360                         ret = disk_print(&dev, line, verbose);
361                         disk_close(&dev);
362                         if (ret != 0)
363                             return (ret);
364                 }
365         }
366         return (ret);
367 }
368
369 /*
370  * Attempt to open the disk described by (dev) for use by (f).
371  *
372  * Note that the philosophy here is "give them exactly what
373  * they ask for".  This is necessary because being too "smart"
374  * about what the user might want leads to complications.
375  * (eg. given no slice or partition value, with a disk that is
376  *  sliced - are they after the first BSD slice, or the DOS
377  *  slice before it?)
378  */
379 static int
380 bd_open(struct open_file *f, ...)
381 {
382         struct disk_devdesc *dev, rdev;
383         struct disk_devdesc disk;
384         int err, g_err;
385         va_list ap;
386         uint64_t size;
387
388         va_start(ap, f);
389         dev = va_arg(ap, struct disk_devdesc *);
390         va_end(ap);
391
392         if (dev->dd.d_unit < 0 || dev->dd.d_unit >= nbdinfo)
393                 return (EIO);
394         BD(dev).bd_open++;
395         if (BD(dev).bd_bcache == NULL)
396             BD(dev).bd_bcache = bcache_allocate();
397
398         /*
399          * Read disk size from partition.
400          * This is needed to work around buggy BIOS systems returning
401          * wrong (truncated) disk media size.
402          * During bd_probe() we tested if the mulitplication of bd_sectors
403          * would overflow so it should be safe to perform here.
404          */
405         disk.dd.d_dev = dev->dd.d_dev;
406         disk.dd.d_unit = dev->dd.d_unit;
407         disk.d_slice = -1;
408         disk.d_partition = -1;
409         disk.d_offset = 0;
410         if (disk_open(&disk, BD(dev).bd_sectors * BD(dev).bd_sectorsize,
411             BD(dev).bd_sectorsize) == 0) {
412
413                 if (disk_ioctl(&disk, DIOCGMEDIASIZE, &size) == 0) {
414                         size /= BD(dev).bd_sectorsize;
415                         if (size > BD(dev).bd_sectors)
416                                 BD(dev).bd_sectors = size;
417                 }
418                 disk_close(&disk);
419         }
420
421         err = disk_open(dev, BD(dev).bd_sectors * BD(dev).bd_sectorsize,
422             BD(dev).bd_sectorsize);
423
424 #ifdef LOADER_GELI_SUPPORT
425         static char gelipw[GELI_PW_MAXLEN];
426         char *passphrase;
427
428         if (err)
429                 return (err);
430
431         /* if we already know there is no GELI, skip the rest */
432         if (geli_status[dev->dd.d_unit][dev->d_slice] != ISGELI_UNKNOWN)
433                 return (err);
434
435         struct dsk dskp;
436         struct ptable *table = NULL;
437         struct ptable_entry part;
438         struct pentry *entry;
439         int geli_part = 0;
440
441         dskp.drive = bd_unit2bios(dev->dd.d_unit);
442         dskp.type = dev->dd.d_dev->dv_type;
443         dskp.unit = dev->dd.d_unit;
444         dskp.slice = dev->d_slice;
445         dskp.part = dev->d_partition;
446         dskp.start = dev->d_offset;
447
448         memcpy(&rdev, dev, sizeof(rdev));
449         /* to read the GPT table, we need to read the first sector */
450         rdev.d_offset = 0;
451         /* We need the LBA of the end of the partition */
452         table = ptable_open(&rdev, BD(dev).bd_sectors,
453             BD(dev).bd_sectorsize, ptblread);
454         if (table == NULL) {
455                 DEBUG("Can't read partition table");
456                 /* soft failure, return the exit status of disk_open */
457                 return (err);
458         }
459
460         if (table->type == PTABLE_GPT)
461                 dskp.part = 255;
462
463         STAILQ_FOREACH(entry, &table->entries, entry) {
464                 dskp.slice = entry->part.index;
465                 dskp.start = entry->part.start;
466                 if (is_geli(&dskp) == 0) {
467                         geli_status[dev->dd.d_unit][dskp.slice] = ISGELI_YES;
468                         return (0);
469                 }
470                 if (geli_taste(bios_read, &dskp,
471                     entry->part.end - entry->part.start) == 0) {
472                         if (geli_havekey(&dskp) == 0) {
473                                 geli_status[dev->dd.d_unit][dskp.slice] = ISGELI_YES;
474                                 geli_part++;
475                                 continue;
476                         }
477                         if ((passphrase = getenv("kern.geom.eli.passphrase"))
478                             != NULL) {
479                                 /* Use the cached passphrase */
480                                 bcopy(passphrase, &gelipw, GELI_PW_MAXLEN);
481                         }
482                         if (geli_passphrase(gelipw, dskp.unit, 'p',
483                                     (dskp.slice > 0 ? dskp.slice : dskp.part),
484                                     &dskp) == 0) {
485                                 setenv("kern.geom.eli.passphrase", gelipw, 1);
486                                 bzero(gelipw, sizeof(gelipw));
487                                 geli_status[dev->dd.d_unit][dskp.slice] = ISGELI_YES;
488                                 geli_part++;
489                                 continue;
490                         }
491                 } else
492                         geli_status[dev->dd.d_unit][dskp.slice] = ISGELI_NO;
493         }
494
495         /* none of the partitions on this disk have GELI */
496         if (geli_part == 0) {
497                 /* found no GELI */
498                 geli_status[dev->dd.d_unit][dev->d_slice] = ISGELI_NO;
499         }
500 #endif /* LOADER_GELI_SUPPORT */
501
502         return (err);
503 }
504
505 static int
506 bd_close(struct open_file *f)
507 {
508         struct disk_devdesc *dev;
509
510         dev = (struct disk_devdesc *)f->f_devdata;
511         BD(dev).bd_open--;
512         if (BD(dev).bd_open == 0) {
513             bcache_free(BD(dev).bd_bcache);
514             BD(dev).bd_bcache = NULL;
515         }
516         return (disk_close(dev));
517 }
518
519 static int
520 bd_ioctl(struct open_file *f, u_long cmd, void *data)
521 {
522         struct disk_devdesc *dev;
523         int rc;
524
525         dev = (struct disk_devdesc *)f->f_devdata;
526
527         rc = disk_ioctl(dev, cmd, data);
528         if (rc != ENOTTY)
529                 return (rc);
530
531         switch (cmd) {
532         case DIOCGSECTORSIZE:
533                 *(u_int *)data = BD(dev).bd_sectorsize;
534                 break;
535         case DIOCGMEDIASIZE:
536                 *(uint64_t *)data = BD(dev).bd_sectors * BD(dev).bd_sectorsize;
537                 break;
538         default:
539                 return (ENOTTY);
540         }
541         return (0);
542 }
543
544 static int
545 bd_strategy(void *devdata, int rw, daddr_t dblk, size_t size,
546     char *buf, size_t *rsize)
547 {
548         struct bcache_devdata bcd;
549         struct disk_devdesc *dev;
550
551         dev = (struct disk_devdesc *)devdata;
552         bcd.dv_strategy = bd_realstrategy;
553         bcd.dv_devdata = devdata;
554         bcd.dv_cache = BD(dev).bd_bcache;
555         return (bcache_strategy(&bcd, rw, dblk + dev->d_offset,
556             size, buf, rsize));
557 }
558
559 static int
560 bd_realstrategy(void *devdata, int rw, daddr_t dblk, size_t size,
561     char *buf, size_t *rsize)
562 {
563     struct disk_devdesc *dev = (struct disk_devdesc *)devdata;
564     uint64_t            disk_blocks;
565     int                 blks, rc;
566 #ifdef BD_SUPPORT_FRAGS /* XXX: sector size */
567     char                fragbuf[BIOSDISK_SECSIZE];
568     size_t              fragsize;
569
570     fragsize = size % BIOSDISK_SECSIZE;
571 #else
572     if (size % BD(dev).bd_sectorsize)
573         panic("bd_strategy: %d bytes I/O not multiple of block size", size);
574 #endif
575
576     DEBUG("open_disk %p", dev);
577
578     /*
579      * Check the value of the size argument. We do have quite small
580      * heap (64MB), but we do not know good upper limit, so we check against
581      * INT_MAX here. This will also protect us against possible overflows
582      * while translating block count to bytes.
583      */
584     if (size > INT_MAX) {
585         DEBUG("too large read: %zu bytes", size);
586         return (EIO);
587     }
588
589     blks = size / BD(dev).bd_sectorsize;
590     if (dblk > dblk + blks)
591         return (EIO);
592
593     if (rsize)
594         *rsize = 0;
595
596     /* Get disk blocks, this value is either for whole disk or for partition */
597     if (disk_ioctl(dev, DIOCGMEDIASIZE, &disk_blocks)) {
598         /* DIOCGMEDIASIZE does return bytes. */
599         disk_blocks /= BD(dev).bd_sectorsize;
600     } else {
601         /* We should not get here. Just try to survive. */
602         disk_blocks = BD(dev).bd_sectors - dev->d_offset;
603     }
604
605     /* Validate source block address. */
606     if (dblk < dev->d_offset || dblk >= dev->d_offset + disk_blocks)
607         return (EIO);
608
609     /*
610      * Truncate if we are crossing disk or partition end.
611      */
612     if (dblk + blks >= dev->d_offset + disk_blocks) {
613         blks = dev->d_offset + disk_blocks - dblk;
614         size = blks * BD(dev).bd_sectorsize;
615         DEBUG("short read %d", blks);
616     }
617
618     switch (rw & F_MASK) {
619     case F_READ:
620         DEBUG("read %d from %lld to %p", blks, dblk, buf);
621
622         if (blks && (rc = bd_read(dev, dblk, blks, buf))) {
623             /* Filter out floppy controller errors */
624             if (BD(dev).bd_flags != BD_FLOPPY || rc != 0x20) {
625                 printf("read %d from %lld to %p, error: 0x%x", blks, dblk,
626                     buf, rc);
627             }
628             return (EIO);
629         }
630 #ifdef BD_SUPPORT_FRAGS /* XXX: sector size */
631         DEBUG("bd_strategy: frag read %d from %d+%d to %p",
632             fragsize, dblk, blks, buf + (blks * BIOSDISK_SECSIZE));
633         if (fragsize && bd_read(od, dblk + blks, 1, fragsize)) {
634             DEBUG("frag read error");
635             return(EIO);
636         }
637         bcopy(fragbuf, buf + (blks * BIOSDISK_SECSIZE), fragsize);
638 #endif
639         break;
640     case F_WRITE :
641         DEBUG("write %d from %d to %p", blks, dblk, buf);
642
643         if (blks && bd_write(dev, dblk, blks, buf)) {
644             DEBUG("write error");
645             return (EIO);
646         }
647 #ifdef BD_SUPPORT_FRAGS
648         if(fragsize) {
649             DEBUG("Attempted to write a frag");
650             return (EIO);
651         }
652 #endif
653         break;
654     default:
655         /* DO NOTHING */
656         return (EROFS);
657     }
658
659     if (rsize)
660         *rsize = size;
661     return (0);
662 }
663
664 static int
665 bd_edd_io(struct disk_devdesc *dev, daddr_t dblk, int blks, caddr_t dest,
666     int write)
667 {
668     static struct edd_packet packet;
669
670     packet.len = sizeof(struct edd_packet);
671     packet.count = blks;
672     packet.off = VTOPOFF(dest);
673     packet.seg = VTOPSEG(dest);
674     packet.lba = dblk;
675     v86.ctl = V86_FLAGS;
676     v86.addr = 0x13;
677     if (write)
678         /* Should we Write with verify ?? 0x4302 ? */
679         v86.eax = 0x4300;
680     else
681         v86.eax = 0x4200;
682     v86.edx = BD(dev).bd_unit;
683     v86.ds = VTOPSEG(&packet);
684     v86.esi = VTOPOFF(&packet);
685     v86int();
686     if (V86_CY(v86.efl))
687         return (v86.eax >> 8);
688     return (0);
689 }
690
691 static int
692 bd_chs_io(struct disk_devdesc *dev, daddr_t dblk, int blks, caddr_t dest,
693     int write)
694 {
695     u_int       x, bpc, cyl, hd, sec;
696
697     bpc = BD(dev).bd_sec * BD(dev).bd_hds;      /* blocks per cylinder */
698     x = dblk;
699     cyl = x / bpc;                      /* block # / blocks per cylinder */
700     x %= bpc;                           /* block offset into cylinder */
701     hd = x / BD(dev).bd_sec;            /* offset / blocks per track */
702     sec = x % BD(dev).bd_sec;           /* offset into track */
703
704     /* correct sector number for 1-based BIOS numbering */
705     sec++;
706
707     if (cyl > 1023)
708         /* CHS doesn't support cylinders > 1023. */
709         return (1);
710
711     v86.ctl = V86_FLAGS;
712     v86.addr = 0x13;
713     if (write)
714         v86.eax = 0x300 | blks;
715     else
716         v86.eax = 0x200 | blks;
717     v86.ecx = ((cyl & 0xff) << 8) | ((cyl & 0x300) >> 2) | sec;
718     v86.edx = (hd << 8) | BD(dev).bd_unit;
719     v86.es = VTOPSEG(dest);
720     v86.ebx = VTOPOFF(dest);
721     v86int();
722     if (V86_CY(v86.efl))
723         return (v86.eax >> 8);
724     return (0);
725 }
726
727 static void
728 bd_io_workaround(struct disk_devdesc *dev)
729 {
730         uint8_t buf[8 * 1024];
731
732         bd_edd_io(dev, 0xffffffff, 1, (caddr_t)buf, 0);
733 }
734
735
736 static int
737 bd_io(struct disk_devdesc *dev, daddr_t dblk, int blks, caddr_t dest, int write)
738 {
739     u_int       x, sec, result, resid, retry, maxfer;
740     caddr_t     p, xp, bbuf;
741     
742     /* Just in case some idiot actually tries to read/write -1 blocks... */
743     if (blks < 0)
744         return (-1);
745
746     resid = blks;
747     p = dest;
748
749     /*
750      * Workaround for a problem with some HP ProLiant BIOS failing to work out
751      * the boot disk after installation. hrs and kuriyama discovered this
752      * problem with an HP ProLiant DL320e Gen 8 with a 3TB HDD, and discovered
753      * that an int13h call seems to cause a buffer overrun in the bios. The
754      * problem is alleviated by doing an extra read before the buggy read. It
755      * is not immediately known whether other models are similarly affected.
756      */
757     if (dblk >= 0x100000000)
758         bd_io_workaround(dev);
759
760     /* Decide whether we have to bounce */
761     if (VTOP(dest) >> 20 != 0 || (BD(dev).bd_unit < 0x80 &&
762         (VTOP(dest) >> 16) != (VTOP(dest +
763         blks * BD(dev).bd_sectorsize) >> 16))) {
764
765         /* 
766          * There is a 64k physical boundary somewhere in the
767          * destination buffer, or the destination buffer is above
768          * first 1MB of physical memory so we have to arrange a
769          * suitable bounce buffer.  Allocate a buffer twice as large
770          * as we need to.  Use the bottom half unless there is a break
771          * there, in which case we use the top half.
772          */
773         x = V86_IO_BUFFER_SIZE / BD(dev).bd_sectorsize;
774         x = min(x, (unsigned)blks);
775         bbuf = PTOV(V86_IO_BUFFER);
776         maxfer = x;             /* limit transfers to bounce region size */
777     } else {
778         bbuf = NULL;
779         maxfer = 0;
780     }
781     
782     while (resid > 0) {
783         /*
784          * Play it safe and don't cross track boundaries.
785          * (XXX this is probably unnecessary)
786          */
787         sec = dblk % BD(dev).bd_sec;    /* offset into track */
788         x = min(BD(dev).bd_sec - sec, resid);
789         if (maxfer > 0)
790             x = min(x, maxfer);         /* fit bounce buffer */
791
792         /* where do we transfer to? */
793         xp = bbuf == NULL ? p : bbuf;
794
795         /*
796          * Put your Data In, Put your Data out,
797          * Put your Data In, and shake it all about 
798          */
799         if (write && bbuf != NULL)
800             bcopy(p, bbuf, x * BD(dev).bd_sectorsize);
801
802         /*
803          * Loop retrying the operation a couple of times.  The BIOS
804          * may also retry.
805          */
806         for (retry = 0; retry < 3; retry++) {
807             /* if retrying, reset the drive */
808             if (retry > 0) {
809                 v86.ctl = V86_FLAGS;
810                 v86.addr = 0x13;
811                 v86.eax = 0;
812                 v86.edx = BD(dev).bd_unit;
813                 v86int();
814             }
815
816             if (BD(dev).bd_flags & BD_MODEEDD1)
817                 result = bd_edd_io(dev, dblk, x, xp, write);
818             else
819                 result = bd_chs_io(dev, dblk, x, xp, write);
820             if (result == 0)
821                 break;
822         }
823
824         if (write)
825             DEBUG("Write %d sector(s) from %p (0x%x) to %lld %s", x,
826                 p, VTOP(p), dblk, result ? "failed" : "ok");
827         else
828             DEBUG("Read %d sector(s) from %lld to %p (0x%x) %s", x,
829                 dblk, p, VTOP(p), result ? "failed" : "ok");
830         if (result) {
831             return (result);
832         }
833         if (!write && bbuf != NULL)
834             bcopy(bbuf, p, x * BD(dev).bd_sectorsize);
835         p += (x * BD(dev).bd_sectorsize);
836         dblk += x;
837         resid -= x;
838     }
839
840 /*    hexdump(dest, (blks * BD(dev).bd_sectorsize)); */
841     return(0);
842 }
843
844 static int
845 bd_read(struct disk_devdesc *dev, daddr_t dblk, int blks, caddr_t dest)
846 {
847 #ifdef LOADER_GELI_SUPPORT
848         struct dsk dskp;
849         off_t p_off, diff;
850         daddr_t alignlba;
851         int err, n, alignblks;
852         char *tmpbuf;
853
854         /* if we already know there is no GELI, skip the rest */
855         if (geli_status[dev->dd.d_unit][dev->d_slice] != ISGELI_YES)
856                 return (bd_io(dev, dblk, blks, dest, 0));
857
858         if (geli_status[dev->dd.d_unit][dev->d_slice] == ISGELI_YES) {
859                 /*
860                  * Align reads to DEV_GELIBOOT_BSIZE bytes because partial
861                  * sectors cannot be decrypted. Round the requested LBA down to
862                  * nearest multiple of DEV_GELIBOOT_BSIZE bytes.
863                  */
864                 alignlba = rounddown2(dblk * BD(dev).bd_sectorsize,
865                     DEV_GELIBOOT_BSIZE) / BD(dev).bd_sectorsize;
866                 /*
867                  * Round number of blocks to read up to nearest multiple of
868                  * DEV_GELIBOOT_BSIZE
869                  */
870                 diff = (dblk - alignlba) * BD(dev).bd_sectorsize;
871                 alignblks = roundup2(blks * BD(dev).bd_sectorsize + diff,
872                     DEV_GELIBOOT_BSIZE) / BD(dev).bd_sectorsize;
873
874                 /*
875                  * If the read is rounded up to a larger size, use a temporary
876                  * buffer here because the buffer provided by the caller may be
877                  * too small.
878                  */
879                 if (diff == 0) {
880                         tmpbuf = dest;
881                 } else {
882                         tmpbuf = malloc(alignblks * BD(dev).bd_sectorsize);
883                         if (tmpbuf == NULL) {
884                                 return (-1);
885                         }
886                 }
887
888                 err = bd_io(dev, alignlba, alignblks, tmpbuf, 0);
889                 if (err)
890                         return (err);
891
892                 dskp.drive = bd_unit2bios(dev->dd.d_unit);
893                 dskp.type = dev->dd.d_dev->dv_type;
894                 dskp.unit = dev->dd.d_unit;
895                 dskp.slice = dev->d_slice;
896                 dskp.part = dev->d_partition;
897                 dskp.start = dev->d_offset;
898
899                 /* GELI needs the offset relative to the partition start */
900                 p_off = alignlba - dskp.start;
901
902                 err = geli_read(&dskp, p_off * BD(dev).bd_sectorsize, (u_char *)tmpbuf,
903                     alignblks * BD(dev).bd_sectorsize);
904                 if (err)
905                         return (err);
906
907                 if (tmpbuf != dest) {
908                         bcopy(tmpbuf + diff, dest, blks * BD(dev).bd_sectorsize);
909                         free(tmpbuf);
910                 }
911                 return (0);
912         }
913 #endif /* LOADER_GELI_SUPPORT */
914
915         return (bd_io(dev, dblk, blks, dest, 0));
916 }
917
918 static int
919 bd_write(struct disk_devdesc *dev, daddr_t dblk, int blks, caddr_t dest)
920 {
921
922         return (bd_io(dev, dblk, blks, dest, 1));
923 }
924
925 /*
926  * Return the BIOS geometry of a given "fixed drive" in a format
927  * suitable for the legacy bootinfo structure.  Since the kernel is
928  * expecting raw int 0x13/0x8 values for N_BIOS_GEOM drives, we
929  * prefer to get the information directly, rather than rely on being
930  * able to put it together from information already maintained for
931  * different purposes and for a probably different number of drives.
932  *
933  * For valid drives, the geometry is expected in the format (31..0)
934  * "000000cc cccccccc hhhhhhhh 00ssssss"; and invalid drives are
935  * indicated by returning the geometry of a "1.2M" PC-format floppy
936  * disk.  And, incidentally, what is returned is not the geometry as
937  * such but the highest valid cylinder, head, and sector numbers.
938  */
939 uint32_t
940 bd_getbigeom(int bunit)
941 {
942
943     v86.ctl = V86_FLAGS;
944     v86.addr = 0x13;
945     v86.eax = 0x800;
946     v86.edx = 0x80 + bunit;
947     v86int();
948     if (V86_CY(v86.efl))
949         return 0x4f010f;
950     return ((v86.ecx & 0xc0) << 18) | ((v86.ecx & 0xff00) << 8) |
951            (v86.edx & 0xff00) | (v86.ecx & 0x3f);
952 }
953
954 /*
955  * Return a suitable dev_t value for (dev).
956  *
957  * In the case where it looks like (dev) is a SCSI disk, we allow the number of
958  * IDE disks to be specified in $num_ide_disks.  There should be a Better Way.
959  */
960 int
961 bd_getdev(struct i386_devdesc *d)
962 {
963     struct disk_devdesc         *dev;
964     int                         biosdev;
965     int                         major;
966     int                         rootdev;
967     char                        *nip, *cp;
968     int                         i, unit;
969
970     dev = (struct disk_devdesc *)d;
971     biosdev = bd_unit2bios(dev->dd.d_unit);
972     DEBUG("unit %d BIOS device %d", dev->dd.d_unit, biosdev);
973     if (biosdev == -1)                          /* not a BIOS device */
974         return(-1);
975     if (disk_open(dev, BD(dev).bd_sectors * BD(dev).bd_sectorsize,
976         BD(dev).bd_sectorsize) != 0)            /* oops, not a viable device */
977             return (-1);
978     else
979         disk_close(dev);
980
981     if (biosdev < 0x80) {
982         /* floppy (or emulated floppy) or ATAPI device */
983         if (bdinfo[dev->dd.d_unit].bd_type == DT_ATAPI) {
984             /* is an ATAPI disk */
985             major = WFDMAJOR;
986         } else {
987             /* is a floppy disk */
988             major = FDMAJOR;
989         }
990     } else {
991             /* assume an IDE disk */
992             major = WDMAJOR;
993     }
994     /* default root disk unit number */
995     unit = biosdev & 0x7f;
996
997     /* XXX a better kludge to set the root disk unit number */
998     if ((nip = getenv("root_disk_unit")) != NULL) {
999         i = strtol(nip, &cp, 0);
1000         /* check for parse error */
1001         if ((cp != nip) && (*cp == 0))
1002             unit = i;
1003     }
1004
1005     rootdev = MAKEBOOTDEV(major, dev->d_slice + 1, unit, dev->d_partition);
1006     DEBUG("dev is 0x%x\n", rootdev);
1007     return(rootdev);
1008 }
1009
1010 #ifdef LOADER_GELI_SUPPORT
1011 int
1012 bios_read(void *vdev __unused, void *xpriv, off_t off, void *buf, size_t bytes)
1013 {
1014         struct disk_devdesc dev;
1015         struct dsk *priv = xpriv;
1016
1017         dev.dd.d_dev = &biosdisk;
1018         dev.dd.d_unit = priv->unit;
1019         dev.d_slice = priv->slice;
1020         dev.d_partition = priv->part;
1021         dev.d_offset = priv->start;
1022
1023         off = off / BD(&dev).bd_sectorsize;
1024         /* GELI gives us the offset relative to the partition start */
1025         off += dev.d_offset;
1026         bytes = bytes / BD(&dev).bd_sectorsize;
1027
1028         return (bd_io(&dev, off, bytes, buf, 0));
1029 }
1030 #endif /* LOADER_GELI_SUPPORT */