]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - sys/geom/raid/md_jmicron.c
Add liblutok a lightweight C++ API for lua.
[FreeBSD/FreeBSD.git] / sys / geom / raid / md_jmicron.c
1 /*-
2  * SPDX-License-Identifier: BSD-2-Clause-FreeBSD
3  *
4  * Copyright (c) 2010 Alexander Motin <mav@FreeBSD.org>
5  * Copyright (c) 2000 - 2008 Søren Schmidt <sos@FreeBSD.org>
6  * All rights reserved.
7  *
8  * Redistribution and use in source and binary forms, with or without
9  * modification, are permitted provided that the following conditions
10  * are met:
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in the
15  *    documentation and/or other materials provided with the distribution.
16  *
17  * THIS SOFTWARE IS PROVIDED BY THE AUTHORS AND CONTRIBUTORS ``AS IS'' AND
18  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
19  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
20  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHORS OR CONTRIBUTORS BE LIABLE
21  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
22  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
23  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
24  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
25  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
26  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
27  * SUCH DAMAGE.
28  */
29
30 #include <sys/cdefs.h>
31 __FBSDID("$FreeBSD$");
32
33 #include <sys/param.h>
34 #include <sys/bio.h>
35 #include <sys/endian.h>
36 #include <sys/kernel.h>
37 #include <sys/kobj.h>
38 #include <sys/limits.h>
39 #include <sys/lock.h>
40 #include <sys/malloc.h>
41 #include <sys/mutex.h>
42 #include <sys/systm.h>
43 #include <sys/taskqueue.h>
44 #include <geom/geom.h>
45 #include <geom/geom_dbg.h>
46 #include "geom/raid/g_raid.h"
47 #include "g_raid_md_if.h"
48
49 static MALLOC_DEFINE(M_MD_JMICRON, "md_jmicron_data", "GEOM_RAID JMicron metadata");
50
51 #define JMICRON_MAX_DISKS       8
52 #define JMICRON_MAX_SPARE       2
53
54 struct jmicron_raid_conf {
55     u_int8_t            signature[2];
56 #define JMICRON_MAGIC           "JM"
57
58     u_int16_t           version;
59 #define JMICRON_VERSION         0x0001
60
61     u_int16_t           checksum;
62     u_int8_t            filler_1[10];
63     u_int32_t           disk_id;
64     u_int32_t           offset;
65     u_int32_t           disk_sectors_high;
66     u_int16_t           disk_sectors_low;
67     u_int8_t            filler_2[2];
68     u_int8_t            name[16];
69     u_int8_t            type;
70 #define JMICRON_T_RAID0         0
71 #define JMICRON_T_RAID1         1
72 #define JMICRON_T_RAID01        2
73 #define JMICRON_T_CONCAT        3
74 #define JMICRON_T_RAID5         5
75
76     u_int8_t            stripe_shift;
77     u_int16_t           flags;
78 #define JMICRON_F_READY         0x0001
79 #define JMICRON_F_BOOTABLE      0x0002
80 #define JMICRON_F_BADSEC        0x0004
81 #define JMICRON_F_ACTIVE        0x0010
82 #define JMICRON_F_UNSYNC        0x0020
83 #define JMICRON_F_NEWEST        0x0040
84
85     u_int8_t            filler_3[4];
86     u_int32_t           spare[JMICRON_MAX_SPARE];
87     u_int32_t           disks[JMICRON_MAX_DISKS];
88 #define JMICRON_DISK_MASK       0xFFFFFFF0
89 #define JMICRON_SEG_MASK        0x0000000F
90     u_int8_t            filler_4[32];
91     u_int8_t            filler_5[384];
92 };
93
94 struct g_raid_md_jmicron_perdisk {
95         struct jmicron_raid_conf        *pd_meta;
96         int                              pd_disk_pos;
97         int                              pd_disk_id;
98         off_t                            pd_disk_size;
99 };
100
101 struct g_raid_md_jmicron_object {
102         struct g_raid_md_object  mdio_base;
103         uint32_t                 mdio_config_id;
104         struct jmicron_raid_conf        *mdio_meta;
105         struct callout           mdio_start_co; /* STARTING state timer. */
106         int                      mdio_total_disks;
107         int                      mdio_disks_present;
108         int                      mdio_started;
109         int                      mdio_incomplete;
110         struct root_hold_token  *mdio_rootmount; /* Root mount delay token. */
111 };
112
113 static g_raid_md_create_t g_raid_md_create_jmicron;
114 static g_raid_md_taste_t g_raid_md_taste_jmicron;
115 static g_raid_md_event_t g_raid_md_event_jmicron;
116 static g_raid_md_ctl_t g_raid_md_ctl_jmicron;
117 static g_raid_md_write_t g_raid_md_write_jmicron;
118 static g_raid_md_fail_disk_t g_raid_md_fail_disk_jmicron;
119 static g_raid_md_free_disk_t g_raid_md_free_disk_jmicron;
120 static g_raid_md_free_t g_raid_md_free_jmicron;
121
122 static kobj_method_t g_raid_md_jmicron_methods[] = {
123         KOBJMETHOD(g_raid_md_create,    g_raid_md_create_jmicron),
124         KOBJMETHOD(g_raid_md_taste,     g_raid_md_taste_jmicron),
125         KOBJMETHOD(g_raid_md_event,     g_raid_md_event_jmicron),
126         KOBJMETHOD(g_raid_md_ctl,       g_raid_md_ctl_jmicron),
127         KOBJMETHOD(g_raid_md_write,     g_raid_md_write_jmicron),
128         KOBJMETHOD(g_raid_md_fail_disk, g_raid_md_fail_disk_jmicron),
129         KOBJMETHOD(g_raid_md_free_disk, g_raid_md_free_disk_jmicron),
130         KOBJMETHOD(g_raid_md_free,      g_raid_md_free_jmicron),
131         { 0, 0 }
132 };
133
134 static struct g_raid_md_class g_raid_md_jmicron_class = {
135         "JMicron",
136         g_raid_md_jmicron_methods,
137         sizeof(struct g_raid_md_jmicron_object),
138         .mdc_enable = 1,
139         .mdc_priority = 100
140 };
141
142 static void
143 g_raid_md_jmicron_print(struct jmicron_raid_conf *meta)
144 {
145         int k;
146
147         if (g_raid_debug < 1)
148                 return;
149
150         printf("********* ATA JMicron RAID Metadata *********\n");
151         printf("signature           <%c%c>\n", meta->signature[0], meta->signature[1]);
152         printf("version             %04x\n", meta->version);
153         printf("checksum            0x%04x\n", meta->checksum);
154         printf("disk_id             0x%08x\n", meta->disk_id);
155         printf("offset              0x%08x\n", meta->offset);
156         printf("disk_sectors_high   0x%08x\n", meta->disk_sectors_high);
157         printf("disk_sectors_low    0x%04x\n", meta->disk_sectors_low);
158         printf("name                <%.16s>\n", meta->name);
159         printf("type                %d\n", meta->type);
160         printf("stripe_shift        %d\n", meta->stripe_shift);
161         printf("flags               %04x\n", meta->flags);
162         printf("spare              ");
163         for (k = 0; k < JMICRON_MAX_SPARE; k++)
164                 printf(" 0x%08x", meta->spare[k]);
165         printf("\n");
166         printf("disks              ");
167         for (k = 0; k < JMICRON_MAX_DISKS; k++)
168                 printf(" 0x%08x", meta->disks[k]);
169         printf("\n");
170         printf("=================================================\n");
171 }
172
173 static struct jmicron_raid_conf *
174 jmicron_meta_copy(struct jmicron_raid_conf *meta)
175 {
176         struct jmicron_raid_conf *nmeta;
177
178         nmeta = malloc(sizeof(*meta), M_MD_JMICRON, M_WAITOK);
179         memcpy(nmeta, meta, sizeof(*meta));
180         return (nmeta);
181 }
182
183 static int
184 jmicron_meta_total_disks(struct jmicron_raid_conf *meta)
185 {
186         int pos;
187
188         for (pos = 0; pos < JMICRON_MAX_DISKS; pos++) {
189                 if (meta->disks[pos] == 0)
190                         break;
191         }
192         return (pos);
193 }
194
195 static int
196 jmicron_meta_total_spare(struct jmicron_raid_conf *meta)
197 {
198         int pos, n;
199
200         n = 0;
201         for (pos = 0; pos < JMICRON_MAX_SPARE; pos++) {
202                 if (meta->spare[pos] != 0)
203                         n++;
204         }
205         return (n);
206 }
207
208 /*
209  * Generate fake Configuration ID based on disk IDs.
210  * Note: it will change after each disk set change.
211  */
212 static uint32_t
213 jmicron_meta_config_id(struct jmicron_raid_conf *meta)
214 {
215         int pos;
216         uint32_t config_id;
217
218         config_id = 0;
219         for (pos = 0; pos < JMICRON_MAX_DISKS; pos++)
220                 config_id += meta->disks[pos] << pos;
221         return (config_id);
222 }
223
224 static void
225 jmicron_meta_get_name(struct jmicron_raid_conf *meta, char *buf)
226 {
227         int i;
228
229         strncpy(buf, meta->name, 16);
230         buf[16] = 0;
231         for (i = 15; i >= 0; i--) {
232                 if (buf[i] > 0x20)
233                         break;
234                 buf[i] = 0;
235         }
236 }
237
238 static void
239 jmicron_meta_put_name(struct jmicron_raid_conf *meta, char *buf)
240 {
241
242         memset(meta->name, 0x20, 16);
243         memcpy(meta->name, buf, MIN(strlen(buf), 16));
244 }
245
246 static int
247 jmicron_meta_find_disk(struct jmicron_raid_conf *meta, uint32_t id)
248 {
249         int pos;
250
251         id &= JMICRON_DISK_MASK;
252         for (pos = 0; pos < JMICRON_MAX_DISKS; pos++) {
253                 if ((meta->disks[pos] & JMICRON_DISK_MASK) == id)
254                         return (pos);
255         }
256         for (pos = 0; pos < JMICRON_MAX_SPARE; pos++) {
257                 if ((meta->spare[pos] & JMICRON_DISK_MASK) == id)
258                         return (-3);
259         }
260         return (-1);
261 }
262
263 static struct jmicron_raid_conf *
264 jmicron_meta_read(struct g_consumer *cp)
265 {
266         struct g_provider *pp;
267         struct jmicron_raid_conf *meta;
268         char *buf;
269         int error, i;
270         uint16_t checksum, *ptr;
271
272         pp = cp->provider;
273
274         /* Read the anchor sector. */
275         buf = g_read_data(cp,
276             pp->mediasize - pp->sectorsize, pp->sectorsize, &error);
277         if (buf == NULL) {
278                 G_RAID_DEBUG(1, "Cannot read metadata from %s (error=%d).",
279                     pp->name, error);
280                 return (NULL);
281         }
282         meta = (struct jmicron_raid_conf *)buf;
283
284         /* Check if this is an JMicron RAID struct */
285         if (strncmp(meta->signature, JMICRON_MAGIC, strlen(JMICRON_MAGIC))) {
286                 G_RAID_DEBUG(1, "JMicron signature check failed on %s", pp->name);
287                 g_free(buf);
288                 return (NULL);
289         }
290         meta = malloc(sizeof(*meta), M_MD_JMICRON, M_WAITOK);
291         memcpy(meta, buf, min(sizeof(*meta), pp->sectorsize));
292         g_free(buf);
293
294         /* Check metadata checksum. */
295         for (checksum = 0, ptr = (uint16_t *)meta, i = 0; i < 64; i++)
296                 checksum += *ptr++;
297         if (checksum != 0) {
298                 G_RAID_DEBUG(1, "JMicron checksum check failed on %s", pp->name);
299                 free(meta, M_MD_JMICRON);
300                 return (NULL);
301         }
302
303         return (meta);
304 }
305
306 static int
307 jmicron_meta_write(struct g_consumer *cp, struct jmicron_raid_conf *meta)
308 {
309         struct g_provider *pp;
310         char *buf;
311         int error, i;
312         uint16_t checksum, *ptr;
313
314         pp = cp->provider;
315
316         /* Recalculate checksum for case if metadata were changed. */
317         meta->checksum = 0;
318         for (checksum = 0, ptr = (uint16_t *)meta, i = 0; i < 64; i++)
319                 checksum += *ptr++;
320         meta->checksum -= checksum;
321
322         /* Create and fill buffer. */
323         buf = malloc(pp->sectorsize, M_MD_JMICRON, M_WAITOK | M_ZERO);
324         memcpy(buf, meta, sizeof(*meta));
325
326         error = g_write_data(cp,
327             pp->mediasize - pp->sectorsize, buf, pp->sectorsize);
328         if (error != 0) {
329                 G_RAID_DEBUG(1, "Cannot write metadata to %s (error=%d).",
330                     pp->name, error);
331         }
332
333         free(buf, M_MD_JMICRON);
334         return (error);
335 }
336
337 static int
338 jmicron_meta_erase(struct g_consumer *cp)
339 {
340         struct g_provider *pp;
341         char *buf;
342         int error;
343
344         pp = cp->provider;
345         buf = malloc(pp->sectorsize, M_MD_JMICRON, M_WAITOK | M_ZERO);
346         error = g_write_data(cp,
347             pp->mediasize - pp->sectorsize, buf, pp->sectorsize);
348         if (error != 0) {
349                 G_RAID_DEBUG(1, "Cannot erase metadata on %s (error=%d).",
350                     pp->name, error);
351         }
352         free(buf, M_MD_JMICRON);
353         return (error);
354 }
355
356 static struct g_raid_disk *
357 g_raid_md_jmicron_get_disk(struct g_raid_softc *sc, int id)
358 {
359         struct g_raid_disk      *disk;
360         struct g_raid_md_jmicron_perdisk *pd;
361
362         TAILQ_FOREACH(disk, &sc->sc_disks, d_next) {
363                 pd = (struct g_raid_md_jmicron_perdisk *)disk->d_md_data;
364                 if (pd->pd_disk_pos == id)
365                         break;
366         }
367         return (disk);
368 }
369
370 static int
371 g_raid_md_jmicron_supported(int level, int qual, int disks, int force)
372 {
373
374         if (disks > 8)
375                 return (0);
376         switch (level) {
377         case G_RAID_VOLUME_RL_RAID0:
378                 if (disks < 1)
379                         return (0);
380                 if (!force && (disks < 2 || disks > 6))
381                         return (0);
382                 break;
383         case G_RAID_VOLUME_RL_RAID1:
384                 if (disks < 1)
385                         return (0);
386                 if (!force && (disks != 2))
387                         return (0);
388                 break;
389         case G_RAID_VOLUME_RL_RAID1E:
390                 if (disks < 2)
391                         return (0);
392                 if (!force && (disks != 4))
393                         return (0);
394                 break;
395         case G_RAID_VOLUME_RL_SINGLE:
396                 if (disks != 1)
397                         return (0);
398                 if (!force)
399                         return (0);
400                 break;
401         case G_RAID_VOLUME_RL_CONCAT:
402                 if (disks < 2)
403                         return (0);
404                 break;
405         case G_RAID_VOLUME_RL_RAID5:
406                 if (disks < 3)
407                         return (0);
408                 if (qual != G_RAID_VOLUME_RLQ_R5LA)
409                         return (0);
410                 if (!force)
411                         return (0);
412                 break;
413         default:
414                 return (0);
415         }
416         if (level != G_RAID_VOLUME_RL_RAID5 && qual != G_RAID_VOLUME_RLQ_NONE)
417                 return (0);
418         return (1);
419 }
420
421 static int
422 g_raid_md_jmicron_start_disk(struct g_raid_disk *disk)
423 {
424         struct g_raid_softc *sc;
425         struct g_raid_subdisk *sd, *tmpsd;
426         struct g_raid_disk *olddisk, *tmpdisk;
427         struct g_raid_md_object *md;
428         struct g_raid_md_jmicron_object *mdi;
429         struct g_raid_md_jmicron_perdisk *pd, *oldpd;
430         struct jmicron_raid_conf *meta;
431         int disk_pos, resurrection = 0;
432
433         sc = disk->d_softc;
434         md = sc->sc_md;
435         mdi = (struct g_raid_md_jmicron_object *)md;
436         meta = mdi->mdio_meta;
437         pd = (struct g_raid_md_jmicron_perdisk *)disk->d_md_data;
438         olddisk = NULL;
439
440         /* Find disk position in metadata by its serial. */
441         if (pd->pd_meta != NULL)
442                 disk_pos = jmicron_meta_find_disk(meta, pd->pd_disk_id);
443         else
444                 disk_pos = -1;
445         if (disk_pos < 0) {
446                 G_RAID_DEBUG1(1, sc, "Unknown, probably new or stale disk");
447                 /* If we are in the start process, that's all for now. */
448                 if (!mdi->mdio_started)
449                         goto nofit;
450                 /*
451                  * If we have already started - try to get use of the disk.
452                  * Try to replace OFFLINE disks first, then FAILED.
453                  */
454                 TAILQ_FOREACH(tmpdisk, &sc->sc_disks, d_next) {
455                         if (tmpdisk->d_state != G_RAID_DISK_S_OFFLINE &&
456                             tmpdisk->d_state != G_RAID_DISK_S_FAILED)
457                                 continue;
458                         /* Make sure this disk is big enough. */
459                         TAILQ_FOREACH(sd, &tmpdisk->d_subdisks, sd_next) {
460                                 if (sd->sd_offset + sd->sd_size + 512 >
461                                     pd->pd_disk_size) {
462                                         G_RAID_DEBUG1(1, sc,
463                                             "Disk too small (%ju < %ju)",
464                                             pd->pd_disk_size,
465                                             sd->sd_offset + sd->sd_size + 512);
466                                         break;
467                                 }
468                         }
469                         if (sd != NULL)
470                                 continue;
471                         if (tmpdisk->d_state == G_RAID_DISK_S_OFFLINE) {
472                                 olddisk = tmpdisk;
473                                 break;
474                         } else if (olddisk == NULL)
475                                 olddisk = tmpdisk;
476                 }
477                 if (olddisk == NULL) {
478 nofit:
479                         if (disk_pos == -3 || pd->pd_disk_pos == -3) {
480                                 g_raid_change_disk_state(disk,
481                                     G_RAID_DISK_S_SPARE);
482                                 return (1);
483                         } else {
484                                 g_raid_change_disk_state(disk,
485                                     G_RAID_DISK_S_STALE);
486                                 return (0);
487                         }
488                 }
489                 oldpd = (struct g_raid_md_jmicron_perdisk *)olddisk->d_md_data;
490                 disk_pos = oldpd->pd_disk_pos;
491                 resurrection = 1;
492         }
493
494         if (olddisk == NULL) {
495                 /* Find placeholder by position. */
496                 olddisk = g_raid_md_jmicron_get_disk(sc, disk_pos);
497                 if (olddisk == NULL)
498                         panic("No disk at position %d!", disk_pos);
499                 if (olddisk->d_state != G_RAID_DISK_S_OFFLINE) {
500                         G_RAID_DEBUG1(1, sc, "More than one disk for pos %d",
501                             disk_pos);
502                         g_raid_change_disk_state(disk, G_RAID_DISK_S_STALE);
503                         return (0);
504                 }
505                 oldpd = (struct g_raid_md_jmicron_perdisk *)olddisk->d_md_data;
506         }
507
508         /* Replace failed disk or placeholder with new disk. */
509         TAILQ_FOREACH_SAFE(sd, &olddisk->d_subdisks, sd_next, tmpsd) {
510                 TAILQ_REMOVE(&olddisk->d_subdisks, sd, sd_next);
511                 TAILQ_INSERT_TAIL(&disk->d_subdisks, sd, sd_next);
512                 sd->sd_disk = disk;
513         }
514         oldpd->pd_disk_pos = -2;
515         pd->pd_disk_pos = disk_pos;
516         /* Update global metadata just in case. */
517         meta->disks[disk_pos] = pd->pd_disk_id;
518
519         /* If it was placeholder -- destroy it. */
520         if (olddisk->d_state == G_RAID_DISK_S_OFFLINE) {
521                 g_raid_destroy_disk(olddisk);
522         } else {
523                 /* Otherwise, make it STALE_FAILED. */
524                 g_raid_change_disk_state(olddisk, G_RAID_DISK_S_STALE_FAILED);
525         }
526
527         /* Welcome the new disk. */
528         g_raid_change_disk_state(disk, G_RAID_DISK_S_ACTIVE);
529         TAILQ_FOREACH(sd, &disk->d_subdisks, sd_next) {
530
531                 /*
532                  * Different disks may have different sizes/offsets,
533                  * especially in concat mode. Update.
534                  */
535                 if (!resurrection) {
536                         sd->sd_offset =
537                             (off_t)pd->pd_meta->offset * 16 * 512; //ZZZ
538                         sd->sd_size =
539                             (((off_t)pd->pd_meta->disk_sectors_high << 16) +
540                               pd->pd_meta->disk_sectors_low) * 512;
541                 }
542
543                 if (resurrection) {
544                         /* Stale disk, almost same as new. */
545                         g_raid_change_subdisk_state(sd,
546                             G_RAID_SUBDISK_S_NEW);
547                 } else if ((meta->flags & JMICRON_F_BADSEC) != 0 &&
548                     (pd->pd_meta->flags & JMICRON_F_BADSEC) == 0) {
549                         /* Cold-inserted or rebuilding disk. */
550                         g_raid_change_subdisk_state(sd,
551                             G_RAID_SUBDISK_S_NEW);
552                 } else if (pd->pd_meta->flags & JMICRON_F_UNSYNC) {
553                         /* Dirty or resyncing disk.. */
554                         g_raid_change_subdisk_state(sd,
555                             G_RAID_SUBDISK_S_STALE);
556                 } else {
557                         /* Up to date disk. */
558                         g_raid_change_subdisk_state(sd,
559                             G_RAID_SUBDISK_S_ACTIVE);
560                 }
561                 g_raid_event_send(sd, G_RAID_SUBDISK_E_NEW,
562                     G_RAID_EVENT_SUBDISK);
563         }
564
565         /* Update status of our need for spare. */
566         if (mdi->mdio_started) {
567                 mdi->mdio_incomplete =
568                     (g_raid_ndisks(sc, G_RAID_DISK_S_ACTIVE) <
569                      mdi->mdio_total_disks);
570         }
571
572         return (resurrection);
573 }
574
575 static void
576 g_disk_md_jmicron_retaste(void *arg, int pending)
577 {
578
579         G_RAID_DEBUG(1, "Array is not complete, trying to retaste.");
580         g_retaste(&g_raid_class);
581         free(arg, M_MD_JMICRON);
582 }
583
584 static void
585 g_raid_md_jmicron_refill(struct g_raid_softc *sc)
586 {
587         struct g_raid_md_object *md;
588         struct g_raid_md_jmicron_object *mdi;
589         struct g_raid_disk *disk;
590         struct task *task;
591         int update, na;
592
593         md = sc->sc_md;
594         mdi = (struct g_raid_md_jmicron_object *)md;
595         update = 0;
596         do {
597                 /* Make sure we miss anything. */
598                 na = g_raid_ndisks(sc, G_RAID_DISK_S_ACTIVE);
599                 if (na == mdi->mdio_total_disks)
600                         break;
601
602                 G_RAID_DEBUG1(1, md->mdo_softc,
603                     "Array is not complete (%d of %d), "
604                     "trying to refill.", na, mdi->mdio_total_disks);
605
606                 /* Try to get use some of STALE disks. */
607                 TAILQ_FOREACH(disk, &sc->sc_disks, d_next) {
608                         if (disk->d_state == G_RAID_DISK_S_STALE) {
609                                 update += g_raid_md_jmicron_start_disk(disk);
610                                 if (disk->d_state == G_RAID_DISK_S_ACTIVE)
611                                         break;
612                         }
613                 }
614                 if (disk != NULL)
615                         continue;
616
617                 /* Try to get use some of SPARE disks. */
618                 TAILQ_FOREACH(disk, &sc->sc_disks, d_next) {
619                         if (disk->d_state == G_RAID_DISK_S_SPARE) {
620                                 update += g_raid_md_jmicron_start_disk(disk);
621                                 if (disk->d_state == G_RAID_DISK_S_ACTIVE)
622                                         break;
623                         }
624                 }
625         } while (disk != NULL);
626
627         /* Write new metadata if we changed something. */
628         if (update)
629                 g_raid_md_write_jmicron(md, NULL, NULL, NULL);
630
631         /* Update status of our need for spare. */
632         mdi->mdio_incomplete = (g_raid_ndisks(sc, G_RAID_DISK_S_ACTIVE) <
633             mdi->mdio_total_disks);
634
635         /* Request retaste hoping to find spare. */
636         if (mdi->mdio_incomplete) {
637                 task = malloc(sizeof(struct task),
638                     M_MD_JMICRON, M_WAITOK | M_ZERO);
639                 TASK_INIT(task, 0, g_disk_md_jmicron_retaste, task);
640                 taskqueue_enqueue(taskqueue_swi, task);
641         }
642 }
643
644 static void
645 g_raid_md_jmicron_start(struct g_raid_softc *sc)
646 {
647         struct g_raid_md_object *md;
648         struct g_raid_md_jmicron_object *mdi;
649         struct g_raid_md_jmicron_perdisk *pd;
650         struct jmicron_raid_conf *meta;
651         struct g_raid_volume *vol;
652         struct g_raid_subdisk *sd;
653         struct g_raid_disk *disk;
654         off_t size;
655         int j, disk_pos;
656         char buf[17];
657
658         md = sc->sc_md;
659         mdi = (struct g_raid_md_jmicron_object *)md;
660         meta = mdi->mdio_meta;
661
662         /* Create volumes and subdisks. */
663         jmicron_meta_get_name(meta, buf);
664         vol = g_raid_create_volume(sc, buf, -1);
665         size = ((off_t)meta->disk_sectors_high << 16) + meta->disk_sectors_low;
666         size *= 512; //ZZZ
667         vol->v_raid_level_qualifier = G_RAID_VOLUME_RLQ_NONE;
668         if (meta->type == JMICRON_T_RAID0) {
669                 vol->v_raid_level = G_RAID_VOLUME_RL_RAID0;
670                 vol->v_mediasize = size * mdi->mdio_total_disks;
671         } else if (meta->type == JMICRON_T_RAID1) {
672                 vol->v_raid_level = G_RAID_VOLUME_RL_RAID1;
673                 vol->v_mediasize = size;
674         } else if (meta->type == JMICRON_T_RAID01) {
675                 vol->v_raid_level = G_RAID_VOLUME_RL_RAID1E;
676                 vol->v_mediasize = size * mdi->mdio_total_disks / 2;
677         } else if (meta->type == JMICRON_T_CONCAT) {
678                 if (mdi->mdio_total_disks == 1)
679                         vol->v_raid_level = G_RAID_VOLUME_RL_SINGLE;
680                 else
681                         vol->v_raid_level = G_RAID_VOLUME_RL_CONCAT;
682                 vol->v_mediasize = 0;
683         } else if (meta->type == JMICRON_T_RAID5) {
684                 vol->v_raid_level = G_RAID_VOLUME_RL_RAID5;
685                 vol->v_raid_level_qualifier = G_RAID_VOLUME_RLQ_R5LA;
686                 vol->v_mediasize = size * (mdi->mdio_total_disks - 1);
687         } else {
688                 vol->v_raid_level = G_RAID_VOLUME_RL_UNKNOWN;
689                 vol->v_mediasize = 0;
690         }
691         vol->v_strip_size = 1024 << meta->stripe_shift; //ZZZ
692         vol->v_disks_count = mdi->mdio_total_disks;
693         vol->v_sectorsize = 512; //ZZZ
694         for (j = 0; j < vol->v_disks_count; j++) {
695                 sd = &vol->v_subdisks[j];
696                 sd->sd_offset = (off_t)meta->offset * 16 * 512; //ZZZ
697                 sd->sd_size = size;
698         }
699         g_raid_start_volume(vol);
700
701         /* Create disk placeholders to store data for later writing. */
702         for (disk_pos = 0; disk_pos < mdi->mdio_total_disks; disk_pos++) {
703                 pd = malloc(sizeof(*pd), M_MD_JMICRON, M_WAITOK | M_ZERO);
704                 pd->pd_disk_pos = disk_pos;
705                 pd->pd_disk_id = meta->disks[disk_pos];
706                 disk = g_raid_create_disk(sc);
707                 disk->d_md_data = (void *)pd;
708                 disk->d_state = G_RAID_DISK_S_OFFLINE;
709                 sd = &vol->v_subdisks[disk_pos];
710                 sd->sd_disk = disk;
711                 TAILQ_INSERT_TAIL(&disk->d_subdisks, sd, sd_next);
712         }
713
714         /* Make all disks found till the moment take their places. */
715         do {
716                 TAILQ_FOREACH(disk, &sc->sc_disks, d_next) {
717                         if (disk->d_state == G_RAID_DISK_S_NONE) {
718                                 g_raid_md_jmicron_start_disk(disk);
719                                 break;
720                         }
721                 }
722         } while (disk != NULL);
723
724         mdi->mdio_started = 1;
725         G_RAID_DEBUG1(0, sc, "Array started.");
726         g_raid_md_write_jmicron(md, NULL, NULL, NULL);
727
728         /* Pickup any STALE/SPARE disks to refill array if needed. */
729         g_raid_md_jmicron_refill(sc);
730
731         g_raid_event_send(vol, G_RAID_VOLUME_E_START, G_RAID_EVENT_VOLUME);
732
733         callout_stop(&mdi->mdio_start_co);
734         G_RAID_DEBUG1(1, sc, "root_mount_rel %p", mdi->mdio_rootmount);
735         root_mount_rel(mdi->mdio_rootmount);
736         mdi->mdio_rootmount = NULL;
737 }
738
739 static void
740 g_raid_md_jmicron_new_disk(struct g_raid_disk *disk)
741 {
742         struct g_raid_softc *sc;
743         struct g_raid_md_object *md;
744         struct g_raid_md_jmicron_object *mdi;
745         struct jmicron_raid_conf *pdmeta;
746         struct g_raid_md_jmicron_perdisk *pd;
747
748         sc = disk->d_softc;
749         md = sc->sc_md;
750         mdi = (struct g_raid_md_jmicron_object *)md;
751         pd = (struct g_raid_md_jmicron_perdisk *)disk->d_md_data;
752         pdmeta = pd->pd_meta;
753
754         if (mdi->mdio_started) {
755                 if (g_raid_md_jmicron_start_disk(disk))
756                         g_raid_md_write_jmicron(md, NULL, NULL, NULL);
757         } else {
758                 /*
759                  * If we haven't started yet - update common metadata
760                  * to get subdisks details, avoiding data from spare disks.
761                  */
762                 if (mdi->mdio_meta == NULL ||
763                     jmicron_meta_find_disk(mdi->mdio_meta,
764                      mdi->mdio_meta->disk_id) == -3) {
765                         if (mdi->mdio_meta != NULL)
766                                 free(mdi->mdio_meta, M_MD_JMICRON);
767                         mdi->mdio_meta = jmicron_meta_copy(pdmeta);
768                         mdi->mdio_total_disks = jmicron_meta_total_disks(pdmeta);
769                 }
770                 mdi->mdio_meta->flags |= pdmeta->flags & JMICRON_F_BADSEC;
771
772                 mdi->mdio_disks_present++;
773                 G_RAID_DEBUG1(1, sc, "Matching disk (%d of %d+%d up)",
774                     mdi->mdio_disks_present,
775                     mdi->mdio_total_disks,
776                     jmicron_meta_total_spare(mdi->mdio_meta));
777
778                 /* If we collected all needed disks - start array. */
779                 if (mdi->mdio_disks_present == mdi->mdio_total_disks +
780                     jmicron_meta_total_spare(mdi->mdio_meta))
781                         g_raid_md_jmicron_start(sc);
782         }
783 }
784
785 static void
786 g_raid_jmicron_go(void *arg)
787 {
788         struct g_raid_softc *sc;
789         struct g_raid_md_object *md;
790         struct g_raid_md_jmicron_object *mdi;
791
792         sc = arg;
793         md = sc->sc_md;
794         mdi = (struct g_raid_md_jmicron_object *)md;
795         if (!mdi->mdio_started) {
796                 G_RAID_DEBUG1(0, sc, "Force array start due to timeout.");
797                 g_raid_event_send(sc, G_RAID_NODE_E_START, 0);
798         }
799 }
800
801 static int
802 g_raid_md_create_jmicron(struct g_raid_md_object *md, struct g_class *mp,
803     struct g_geom **gp)
804 {
805         struct g_raid_softc *sc;
806         struct g_raid_md_jmicron_object *mdi;
807         char name[16];
808
809         mdi = (struct g_raid_md_jmicron_object *)md;
810         mdi->mdio_config_id = arc4random();
811         snprintf(name, sizeof(name), "JMicron-%08x", mdi->mdio_config_id);
812         sc = g_raid_create_node(mp, name, md);
813         if (sc == NULL)
814                 return (G_RAID_MD_TASTE_FAIL);
815         md->mdo_softc = sc;
816         *gp = sc->sc_geom;
817         return (G_RAID_MD_TASTE_NEW);
818 }
819
820 static int
821 g_raid_md_taste_jmicron(struct g_raid_md_object *md, struct g_class *mp,
822                               struct g_consumer *cp, struct g_geom **gp)
823 {
824         struct g_consumer *rcp;
825         struct g_provider *pp;
826         struct g_raid_md_jmicron_object *mdi, *mdi1;
827         struct g_raid_softc *sc;
828         struct g_raid_disk *disk;
829         struct jmicron_raid_conf *meta;
830         struct g_raid_md_jmicron_perdisk *pd;
831         struct g_geom *geom;
832         int disk_pos, result, spare, len;
833         char name[16];
834         uint16_t vendor;
835
836         G_RAID_DEBUG(1, "Tasting JMicron on %s", cp->provider->name);
837         mdi = (struct g_raid_md_jmicron_object *)md;
838         pp = cp->provider;
839
840         /* Read metadata from device. */
841         meta = NULL;
842         g_topology_unlock();
843         vendor = 0xffff;
844         len = sizeof(vendor);
845         if (pp->geom->rank == 1)
846                 g_io_getattr("GEOM::hba_vendor", cp, &len, &vendor);
847         meta = jmicron_meta_read(cp);
848         g_topology_lock();
849         if (meta == NULL) {
850                 if (g_raid_aggressive_spare) {
851                         if (vendor == 0x197b) {
852                                 G_RAID_DEBUG(1,
853                                     "No JMicron metadata, forcing spare.");
854                                 spare = 2;
855                                 goto search;
856                         } else {
857                                 G_RAID_DEBUG(1,
858                                     "JMicron vendor mismatch 0x%04x != 0x197b",
859                                     vendor);
860                         }
861                 }
862                 return (G_RAID_MD_TASTE_FAIL);
863         }
864
865         /* Check this disk position in obtained metadata. */
866         disk_pos = jmicron_meta_find_disk(meta, meta->disk_id);
867         if (disk_pos == -1) {
868                 G_RAID_DEBUG(1, "JMicron disk_id %08x not found",
869                     meta->disk_id);
870                 goto fail1;
871         }
872
873         /* Metadata valid. Print it. */
874         g_raid_md_jmicron_print(meta);
875         G_RAID_DEBUG(1, "JMicron disk position %d", disk_pos);
876         spare = (disk_pos == -2) ? 1 : 0;
877
878 search:
879         /* Search for matching node. */
880         sc = NULL;
881         mdi1 = NULL;
882         LIST_FOREACH(geom, &mp->geom, geom) {
883                 sc = geom->softc;
884                 if (sc == NULL)
885                         continue;
886                 if (sc->sc_stopping != 0)
887                         continue;
888                 if (sc->sc_md->mdo_class != md->mdo_class)
889                         continue;
890                 mdi1 = (struct g_raid_md_jmicron_object *)sc->sc_md;
891                 if (spare == 2) {
892                         if (mdi1->mdio_incomplete)
893                                 break;
894                 } else {
895                         if (mdi1->mdio_config_id ==
896                             jmicron_meta_config_id(meta))
897                                 break;
898                 }
899         }
900
901         /* Found matching node. */
902         if (geom != NULL) {
903                 G_RAID_DEBUG(1, "Found matching array %s", sc->sc_name);
904                 result = G_RAID_MD_TASTE_EXISTING;
905
906         } else if (spare) { /* Not found needy node -- left for later. */
907                 G_RAID_DEBUG(1, "Spare is not needed at this time");
908                 goto fail1;
909
910         } else { /* Not found matching node -- create one. */
911                 result = G_RAID_MD_TASTE_NEW;
912                 mdi->mdio_config_id = jmicron_meta_config_id(meta);
913                 snprintf(name, sizeof(name), "JMicron-%08x",
914                     mdi->mdio_config_id);
915                 sc = g_raid_create_node(mp, name, md);
916                 md->mdo_softc = sc;
917                 geom = sc->sc_geom;
918                 callout_init(&mdi->mdio_start_co, 1);
919                 callout_reset(&mdi->mdio_start_co, g_raid_start_timeout * hz,
920                     g_raid_jmicron_go, sc);
921                 mdi->mdio_rootmount = root_mount_hold("GRAID-JMicron");
922                 G_RAID_DEBUG1(1, sc, "root_mount_hold %p", mdi->mdio_rootmount);
923         }
924
925         /* There is no return after this point, so we close passed consumer. */
926         g_access(cp, -1, 0, 0);
927
928         rcp = g_new_consumer(geom);
929         rcp->flags |= G_CF_DIRECT_RECEIVE;
930         g_attach(rcp, pp);
931         if (g_access(rcp, 1, 1, 1) != 0)
932                 ; //goto fail1;
933
934         g_topology_unlock();
935         sx_xlock(&sc->sc_lock);
936
937         pd = malloc(sizeof(*pd), M_MD_JMICRON, M_WAITOK | M_ZERO);
938         pd->pd_meta = meta;
939         if (spare == 2) {
940                 pd->pd_disk_pos = -3;
941                 pd->pd_disk_id = arc4random() & JMICRON_DISK_MASK;
942         } else {
943                 pd->pd_disk_pos = -1;
944                 pd->pd_disk_id = meta->disk_id;
945         }
946         pd->pd_disk_size = pp->mediasize;
947         disk = g_raid_create_disk(sc);
948         disk->d_md_data = (void *)pd;
949         disk->d_consumer = rcp;
950         rcp->private = disk;
951
952         g_raid_get_disk_info(disk);
953
954         g_raid_md_jmicron_new_disk(disk);
955
956         sx_xunlock(&sc->sc_lock);
957         g_topology_lock();
958         *gp = geom;
959         return (result);
960 fail1:
961         free(meta, M_MD_JMICRON);
962         return (G_RAID_MD_TASTE_FAIL);
963 }
964
965 static int
966 g_raid_md_event_jmicron(struct g_raid_md_object *md,
967     struct g_raid_disk *disk, u_int event)
968 {
969         struct g_raid_softc *sc;
970         struct g_raid_subdisk *sd;
971         struct g_raid_md_jmicron_object *mdi;
972         struct g_raid_md_jmicron_perdisk *pd;
973
974         sc = md->mdo_softc;
975         mdi = (struct g_raid_md_jmicron_object *)md;
976         if (disk == NULL) {
977                 switch (event) {
978                 case G_RAID_NODE_E_START:
979                         if (!mdi->mdio_started)
980                                 g_raid_md_jmicron_start(sc);
981                         return (0);
982                 }
983                 return (-1);
984         }
985         pd = (struct g_raid_md_jmicron_perdisk *)disk->d_md_data;
986         switch (event) {
987         case G_RAID_DISK_E_DISCONNECTED:
988                 /* If disk was assigned, just update statuses. */
989                 if (pd->pd_disk_pos >= 0) {
990                         g_raid_change_disk_state(disk, G_RAID_DISK_S_OFFLINE);
991                         if (disk->d_consumer) {
992                                 g_raid_kill_consumer(sc, disk->d_consumer);
993                                 disk->d_consumer = NULL;
994                         }
995                         TAILQ_FOREACH(sd, &disk->d_subdisks, sd_next) {
996                                 g_raid_change_subdisk_state(sd,
997                                     G_RAID_SUBDISK_S_NONE);
998                                 g_raid_event_send(sd, G_RAID_SUBDISK_E_DISCONNECTED,
999                                     G_RAID_EVENT_SUBDISK);
1000                         }
1001                 } else {
1002                         /* Otherwise -- delete. */
1003                         g_raid_change_disk_state(disk, G_RAID_DISK_S_NONE);
1004                         g_raid_destroy_disk(disk);
1005                 }
1006
1007                 /* Write updated metadata to all disks. */
1008                 g_raid_md_write_jmicron(md, NULL, NULL, NULL);
1009
1010                 /* Check if anything left except placeholders. */
1011                 if (g_raid_ndisks(sc, -1) ==
1012                     g_raid_ndisks(sc, G_RAID_DISK_S_OFFLINE))
1013                         g_raid_destroy_node(sc, 0);
1014                 else
1015                         g_raid_md_jmicron_refill(sc);
1016                 return (0);
1017         }
1018         return (-2);
1019 }
1020
1021 static int
1022 g_raid_md_ctl_jmicron(struct g_raid_md_object *md,
1023     struct gctl_req *req)
1024 {
1025         struct g_raid_softc *sc;
1026         struct g_raid_volume *vol;
1027         struct g_raid_subdisk *sd;
1028         struct g_raid_disk *disk;
1029         struct g_raid_md_jmicron_object *mdi;
1030         struct g_raid_md_jmicron_perdisk *pd;
1031         struct g_consumer *cp;
1032         struct g_provider *pp;
1033         char arg[16];
1034         const char *verb, *volname, *levelname, *diskname;
1035         int *nargs, *force;
1036         off_t size, sectorsize, strip;
1037         intmax_t *sizearg, *striparg;
1038         int numdisks, i, len, level, qual, update;
1039         int error;
1040
1041         sc = md->mdo_softc;
1042         mdi = (struct g_raid_md_jmicron_object *)md;
1043         verb = gctl_get_param(req, "verb", NULL);
1044         nargs = gctl_get_paraml(req, "nargs", sizeof(*nargs));
1045         error = 0;
1046         if (strcmp(verb, "label") == 0) {
1047
1048                 if (*nargs < 4) {
1049                         gctl_error(req, "Invalid number of arguments.");
1050                         return (-1);
1051                 }
1052                 volname = gctl_get_asciiparam(req, "arg1");
1053                 if (volname == NULL) {
1054                         gctl_error(req, "No volume name.");
1055                         return (-2);
1056                 }
1057                 levelname = gctl_get_asciiparam(req, "arg2");
1058                 if (levelname == NULL) {
1059                         gctl_error(req, "No RAID level.");
1060                         return (-3);
1061                 }
1062                 if (strcasecmp(levelname, "RAID5") == 0)
1063                         levelname = "RAID5-LA";
1064                 if (g_raid_volume_str2level(levelname, &level, &qual)) {
1065                         gctl_error(req, "Unknown RAID level '%s'.", levelname);
1066                         return (-4);
1067                 }
1068                 numdisks = *nargs - 3;
1069                 force = gctl_get_paraml(req, "force", sizeof(*force));
1070                 if (!g_raid_md_jmicron_supported(level, qual, numdisks,
1071                     force ? *force : 0)) {
1072                         gctl_error(req, "Unsupported RAID level "
1073                             "(0x%02x/0x%02x), or number of disks (%d).",
1074                             level, qual, numdisks);
1075                         return (-5);
1076                 }
1077
1078                 /* Search for disks, connect them and probe. */
1079                 size = 0x7fffffffffffffffllu;
1080                 sectorsize = 0;
1081                 for (i = 0; i < numdisks; i++) {
1082                         snprintf(arg, sizeof(arg), "arg%d", i + 3);
1083                         diskname = gctl_get_asciiparam(req, arg);
1084                         if (diskname == NULL) {
1085                                 gctl_error(req, "No disk name (%s).", arg);
1086                                 error = -6;
1087                                 break;
1088                         }
1089                         if (strcmp(diskname, "NONE") == 0) {
1090                                 cp = NULL;
1091                                 pp = NULL;
1092                         } else {
1093                                 g_topology_lock();
1094                                 cp = g_raid_open_consumer(sc, diskname);
1095                                 if (cp == NULL) {
1096                                         gctl_error(req, "Can't open '%s'.",
1097                                             diskname);
1098                                         g_topology_unlock();
1099                                         error = -7;
1100                                         break;
1101                                 }
1102                                 pp = cp->provider;
1103                         }
1104                         pd = malloc(sizeof(*pd), M_MD_JMICRON, M_WAITOK | M_ZERO);
1105                         pd->pd_disk_pos = i;
1106                         pd->pd_disk_id = arc4random() & JMICRON_DISK_MASK;
1107                         disk = g_raid_create_disk(sc);
1108                         disk->d_md_data = (void *)pd;
1109                         disk->d_consumer = cp;
1110                         if (cp == NULL)
1111                                 continue;
1112                         cp->private = disk;
1113                         g_topology_unlock();
1114
1115                         g_raid_get_disk_info(disk);
1116
1117                         pd->pd_disk_size = pp->mediasize;
1118                         if (size > pp->mediasize)
1119                                 size = pp->mediasize;
1120                         if (sectorsize < pp->sectorsize)
1121                                 sectorsize = pp->sectorsize;
1122                 }
1123                 if (error != 0)
1124                         return (error);
1125
1126                 if (sectorsize <= 0) {
1127                         gctl_error(req, "Can't get sector size.");
1128                         return (-8);
1129                 }
1130
1131                 /* Reserve space for metadata. */
1132                 size -= sectorsize;
1133
1134                 /* Handle size argument. */
1135                 len = sizeof(*sizearg);
1136                 sizearg = gctl_get_param(req, "size", &len);
1137                 if (sizearg != NULL && len == sizeof(*sizearg) &&
1138                     *sizearg > 0) {
1139                         if (*sizearg > size) {
1140                                 gctl_error(req, "Size too big %lld > %lld.",
1141                                     (long long)*sizearg, (long long)size);
1142                                 return (-9);
1143                         }
1144                         size = *sizearg;
1145                 }
1146
1147                 /* Handle strip argument. */
1148                 strip = 131072;
1149                 len = sizeof(*striparg);
1150                 striparg = gctl_get_param(req, "strip", &len);
1151                 if (striparg != NULL && len == sizeof(*striparg) &&
1152                     *striparg > 0) {
1153                         if (*striparg < sectorsize) {
1154                                 gctl_error(req, "Strip size too small.");
1155                                 return (-10);
1156                         }
1157                         if (*striparg % sectorsize != 0) {
1158                                 gctl_error(req, "Incorrect strip size.");
1159                                 return (-11);
1160                         }
1161                         if (strip > 65535 * sectorsize) {
1162                                 gctl_error(req, "Strip size too big.");
1163                                 return (-12);
1164                         }
1165                         strip = *striparg;
1166                 }
1167
1168                 /* Round size down to strip or sector. */
1169                 if (level == G_RAID_VOLUME_RL_RAID1)
1170                         size -= (size % sectorsize);
1171                 else if (level == G_RAID_VOLUME_RL_RAID1E &&
1172                     (numdisks & 1) != 0)
1173                         size -= (size % (2 * strip));
1174                 else
1175                         size -= (size % strip);
1176                 if (size <= 0) {
1177                         gctl_error(req, "Size too small.");
1178                         return (-13);
1179                 }
1180                 if (size > 0xffffffffffffllu * sectorsize) {
1181                         gctl_error(req, "Size too big.");
1182                         return (-14);
1183                 }
1184
1185                 /* We have all we need, create things: volume, ... */
1186                 mdi->mdio_total_disks = numdisks;
1187                 mdi->mdio_started = 1;
1188                 vol = g_raid_create_volume(sc, volname, -1);
1189                 vol->v_md_data = (void *)(intptr_t)0;
1190                 vol->v_raid_level = level;
1191                 vol->v_raid_level_qualifier = qual;
1192                 vol->v_strip_size = strip;
1193                 vol->v_disks_count = numdisks;
1194                 if (level == G_RAID_VOLUME_RL_RAID0 ||
1195                     level == G_RAID_VOLUME_RL_CONCAT ||
1196                     level == G_RAID_VOLUME_RL_SINGLE)
1197                         vol->v_mediasize = size * numdisks;
1198                 else if (level == G_RAID_VOLUME_RL_RAID1)
1199                         vol->v_mediasize = size;
1200                 else if (level == G_RAID_VOLUME_RL_RAID5)
1201                         vol->v_mediasize = size * (numdisks - 1);
1202                 else { /* RAID1E */
1203                         vol->v_mediasize = ((size * numdisks) / strip / 2) *
1204                             strip;
1205                 }
1206                 vol->v_sectorsize = sectorsize;
1207                 g_raid_start_volume(vol);
1208
1209                 /* , and subdisks. */
1210                 TAILQ_FOREACH(disk, &sc->sc_disks, d_next) {
1211                         pd = (struct g_raid_md_jmicron_perdisk *)disk->d_md_data;
1212                         sd = &vol->v_subdisks[pd->pd_disk_pos];
1213                         sd->sd_disk = disk;
1214                         sd->sd_offset = 0;
1215                         sd->sd_size = size;
1216                         TAILQ_INSERT_TAIL(&disk->d_subdisks, sd, sd_next);
1217                         if (sd->sd_disk->d_consumer != NULL) {
1218                                 g_raid_change_disk_state(disk,
1219                                     G_RAID_DISK_S_ACTIVE);
1220                                 g_raid_change_subdisk_state(sd,
1221                                     G_RAID_SUBDISK_S_ACTIVE);
1222                                 g_raid_event_send(sd, G_RAID_SUBDISK_E_NEW,
1223                                     G_RAID_EVENT_SUBDISK);
1224                         } else {
1225                                 g_raid_change_disk_state(disk, G_RAID_DISK_S_OFFLINE);
1226                         }
1227                 }
1228
1229                 /* Write metadata based on created entities. */
1230                 G_RAID_DEBUG1(0, sc, "Array started.");
1231                 g_raid_md_write_jmicron(md, NULL, NULL, NULL);
1232
1233                 /* Pickup any STALE/SPARE disks to refill array if needed. */
1234                 g_raid_md_jmicron_refill(sc);
1235
1236                 g_raid_event_send(vol, G_RAID_VOLUME_E_START,
1237                     G_RAID_EVENT_VOLUME);
1238                 return (0);
1239         }
1240         if (strcmp(verb, "delete") == 0) {
1241
1242                 /* Check if some volume is still open. */
1243                 force = gctl_get_paraml(req, "force", sizeof(*force));
1244                 if (force != NULL && *force == 0 &&
1245                     g_raid_nopens(sc) != 0) {
1246                         gctl_error(req, "Some volume is still open.");
1247                         return (-4);
1248                 }
1249
1250                 TAILQ_FOREACH(disk, &sc->sc_disks, d_next) {
1251                         if (disk->d_consumer)
1252                                 jmicron_meta_erase(disk->d_consumer);
1253                 }
1254                 g_raid_destroy_node(sc, 0);
1255                 return (0);
1256         }
1257         if (strcmp(verb, "remove") == 0 ||
1258             strcmp(verb, "fail") == 0) {
1259                 if (*nargs < 2) {
1260                         gctl_error(req, "Invalid number of arguments.");
1261                         return (-1);
1262                 }
1263                 for (i = 1; i < *nargs; i++) {
1264                         snprintf(arg, sizeof(arg), "arg%d", i);
1265                         diskname = gctl_get_asciiparam(req, arg);
1266                         if (diskname == NULL) {
1267                                 gctl_error(req, "No disk name (%s).", arg);
1268                                 error = -2;
1269                                 break;
1270                         }
1271                         if (strncmp(diskname, "/dev/", 5) == 0)
1272                                 diskname += 5;
1273
1274                         TAILQ_FOREACH(disk, &sc->sc_disks, d_next) {
1275                                 if (disk->d_consumer != NULL && 
1276                                     disk->d_consumer->provider != NULL &&
1277                                     strcmp(disk->d_consumer->provider->name,
1278                                      diskname) == 0)
1279                                         break;
1280                         }
1281                         if (disk == NULL) {
1282                                 gctl_error(req, "Disk '%s' not found.",
1283                                     diskname);
1284                                 error = -3;
1285                                 break;
1286                         }
1287
1288                         if (strcmp(verb, "fail") == 0) {
1289                                 g_raid_md_fail_disk_jmicron(md, NULL, disk);
1290                                 continue;
1291                         }
1292
1293                         pd = (struct g_raid_md_jmicron_perdisk *)disk->d_md_data;
1294
1295                         /* Erase metadata on deleting disk. */
1296                         jmicron_meta_erase(disk->d_consumer);
1297
1298                         /* If disk was assigned, just update statuses. */
1299                         if (pd->pd_disk_pos >= 0) {
1300                                 g_raid_change_disk_state(disk, G_RAID_DISK_S_OFFLINE);
1301                                 g_raid_kill_consumer(sc, disk->d_consumer);
1302                                 disk->d_consumer = NULL;
1303                                 TAILQ_FOREACH(sd, &disk->d_subdisks, sd_next) {
1304                                         g_raid_change_subdisk_state(sd,
1305                                             G_RAID_SUBDISK_S_NONE);
1306                                         g_raid_event_send(sd, G_RAID_SUBDISK_E_DISCONNECTED,
1307                                             G_RAID_EVENT_SUBDISK);
1308                                 }
1309                         } else {
1310                                 /* Otherwise -- delete. */
1311                                 g_raid_change_disk_state(disk, G_RAID_DISK_S_NONE);
1312                                 g_raid_destroy_disk(disk);
1313                         }
1314                 }
1315
1316                 /* Write updated metadata to remaining disks. */
1317                 g_raid_md_write_jmicron(md, NULL, NULL, NULL);
1318
1319                 /* Check if anything left except placeholders. */
1320                 if (g_raid_ndisks(sc, -1) ==
1321                     g_raid_ndisks(sc, G_RAID_DISK_S_OFFLINE))
1322                         g_raid_destroy_node(sc, 0);
1323                 else
1324                         g_raid_md_jmicron_refill(sc);
1325                 return (error);
1326         }
1327         if (strcmp(verb, "insert") == 0) {
1328                 if (*nargs < 2) {
1329                         gctl_error(req, "Invalid number of arguments.");
1330                         return (-1);
1331                 }
1332                 update = 0;
1333                 for (i = 1; i < *nargs; i++) {
1334                         /* Get disk name. */
1335                         snprintf(arg, sizeof(arg), "arg%d", i);
1336                         diskname = gctl_get_asciiparam(req, arg);
1337                         if (diskname == NULL) {
1338                                 gctl_error(req, "No disk name (%s).", arg);
1339                                 error = -3;
1340                                 break;
1341                         }
1342
1343                         /* Try to find provider with specified name. */
1344                         g_topology_lock();
1345                         cp = g_raid_open_consumer(sc, diskname);
1346                         if (cp == NULL) {
1347                                 gctl_error(req, "Can't open disk '%s'.",
1348                                     diskname);
1349                                 g_topology_unlock();
1350                                 error = -4;
1351                                 break;
1352                         }
1353                         pp = cp->provider;
1354
1355                         pd = malloc(sizeof(*pd), M_MD_JMICRON, M_WAITOK | M_ZERO);
1356                         pd->pd_disk_pos = -3;
1357                         pd->pd_disk_id = arc4random() & JMICRON_DISK_MASK;
1358                         pd->pd_disk_size = pp->mediasize;
1359
1360                         disk = g_raid_create_disk(sc);
1361                         disk->d_consumer = cp;
1362                         disk->d_md_data = (void *)pd;
1363                         cp->private = disk;
1364                         g_topology_unlock();
1365
1366                         g_raid_get_disk_info(disk);
1367
1368                         /* Welcome the "new" disk. */
1369                         update += g_raid_md_jmicron_start_disk(disk);
1370                         if (disk->d_state != G_RAID_DISK_S_ACTIVE &&
1371                             disk->d_state != G_RAID_DISK_S_SPARE) {
1372                                 gctl_error(req, "Disk '%s' doesn't fit.",
1373                                     diskname);
1374                                 g_raid_destroy_disk(disk);
1375                                 error = -8;
1376                                 break;
1377                         }
1378                 }
1379
1380                 /* Write new metadata if we changed something. */
1381                 if (update)
1382                         g_raid_md_write_jmicron(md, NULL, NULL, NULL);
1383                 return (error);
1384         }
1385         gctl_error(req, "Command '%s' is not supported.", verb);
1386         return (-100);
1387 }
1388
1389 static int
1390 g_raid_md_write_jmicron(struct g_raid_md_object *md, struct g_raid_volume *tvol,
1391     struct g_raid_subdisk *tsd, struct g_raid_disk *tdisk)
1392 {
1393         struct g_raid_softc *sc;
1394         struct g_raid_volume *vol;
1395         struct g_raid_subdisk *sd;
1396         struct g_raid_disk *disk;
1397         struct g_raid_md_jmicron_object *mdi;
1398         struct g_raid_md_jmicron_perdisk *pd;
1399         struct jmicron_raid_conf *meta;
1400         int i, spares;
1401
1402         sc = md->mdo_softc;
1403         mdi = (struct g_raid_md_jmicron_object *)md;
1404
1405         if (sc->sc_stopping == G_RAID_DESTROY_HARD)
1406                 return (0);
1407
1408         /* There is only one volume. */
1409         vol = TAILQ_FIRST(&sc->sc_volumes);
1410
1411         /* Fill global fields. */
1412         meta = malloc(sizeof(*meta), M_MD_JMICRON, M_WAITOK | M_ZERO);
1413         strncpy(meta->signature, JMICRON_MAGIC, 2);
1414         meta->version = JMICRON_VERSION;
1415         jmicron_meta_put_name(meta, vol->v_name);
1416         if (vol->v_raid_level == G_RAID_VOLUME_RL_RAID0)
1417                 meta->type = JMICRON_T_RAID0;
1418         else if (vol->v_raid_level == G_RAID_VOLUME_RL_RAID1)
1419                 meta->type = JMICRON_T_RAID1;
1420         else if (vol->v_raid_level == G_RAID_VOLUME_RL_RAID1E)
1421                 meta->type = JMICRON_T_RAID01;
1422         else if (vol->v_raid_level == G_RAID_VOLUME_RL_CONCAT ||
1423             vol->v_raid_level == G_RAID_VOLUME_RL_SINGLE)
1424                 meta->type = JMICRON_T_CONCAT;
1425         else
1426                 meta->type = JMICRON_T_RAID5;
1427         meta->stripe_shift = fls(vol->v_strip_size / 2048);
1428         meta->flags = JMICRON_F_READY | JMICRON_F_BOOTABLE;
1429         for (i = 0; i < vol->v_disks_count; i++) {
1430                 sd = &vol->v_subdisks[i];
1431                 if (sd->sd_disk == NULL || sd->sd_disk->d_md_data == NULL)
1432                         meta->disks[i] = 0xffffffff;
1433                 else {
1434                         pd = (struct g_raid_md_jmicron_perdisk *)
1435                             sd->sd_disk->d_md_data;
1436                         meta->disks[i] = pd->pd_disk_id;
1437                 }
1438                 if (sd->sd_state < G_RAID_SUBDISK_S_STALE)
1439                         meta->flags |= JMICRON_F_BADSEC;
1440                 if (vol->v_dirty)
1441                         meta->flags |= JMICRON_F_UNSYNC;
1442         }
1443
1444         /* Put spares to their slots. */
1445         spares = 0;
1446         TAILQ_FOREACH(disk, &sc->sc_disks, d_next) {
1447                 pd = (struct g_raid_md_jmicron_perdisk *)disk->d_md_data;
1448                 if (disk->d_state != G_RAID_DISK_S_SPARE)
1449                         continue;
1450                 meta->spare[spares] = pd->pd_disk_id;
1451                 if (++spares >= 2)
1452                         break;
1453         }
1454
1455         /* We are done. Print meta data and store them to disks. */
1456         if (mdi->mdio_meta != NULL)
1457                 free(mdi->mdio_meta, M_MD_JMICRON);
1458         mdi->mdio_meta = meta;
1459         TAILQ_FOREACH(disk, &sc->sc_disks, d_next) {
1460                 pd = (struct g_raid_md_jmicron_perdisk *)disk->d_md_data;
1461                 if (disk->d_state != G_RAID_DISK_S_ACTIVE &&
1462                     disk->d_state != G_RAID_DISK_S_SPARE)
1463                         continue;
1464                 if (pd->pd_meta != NULL) {
1465                         free(pd->pd_meta, M_MD_JMICRON);
1466                         pd->pd_meta = NULL;
1467                 }
1468                 pd->pd_meta = jmicron_meta_copy(meta);
1469                 pd->pd_meta->disk_id = pd->pd_disk_id;
1470                 if ((sd = TAILQ_FIRST(&disk->d_subdisks)) != NULL) {
1471                         pd->pd_meta->offset =
1472                             (sd->sd_offset / 512) / 16;
1473                         pd->pd_meta->disk_sectors_high =
1474                             (sd->sd_size / 512) >> 16;
1475                         pd->pd_meta->disk_sectors_low =
1476                             (sd->sd_size / 512) & 0xffff;
1477                         if (sd->sd_state < G_RAID_SUBDISK_S_STALE)
1478                                 pd->pd_meta->flags &= ~JMICRON_F_BADSEC;
1479                         else if (sd->sd_state < G_RAID_SUBDISK_S_ACTIVE)
1480                                 pd->pd_meta->flags |= JMICRON_F_UNSYNC;
1481                 }
1482                 G_RAID_DEBUG(1, "Writing JMicron metadata to %s",
1483                     g_raid_get_diskname(disk));
1484                 g_raid_md_jmicron_print(pd->pd_meta);
1485                 jmicron_meta_write(disk->d_consumer, pd->pd_meta);
1486         }
1487         return (0);
1488 }
1489
1490 static int
1491 g_raid_md_fail_disk_jmicron(struct g_raid_md_object *md,
1492     struct g_raid_subdisk *tsd, struct g_raid_disk *tdisk)
1493 {
1494         struct g_raid_softc *sc;
1495         struct g_raid_md_jmicron_perdisk *pd;
1496         struct g_raid_subdisk *sd;
1497
1498         sc = md->mdo_softc;
1499         pd = (struct g_raid_md_jmicron_perdisk *)tdisk->d_md_data;
1500
1501         /* We can't fail disk that is not a part of array now. */
1502         if (pd->pd_disk_pos < 0)
1503                 return (-1);
1504
1505         if (tdisk->d_consumer)
1506                 jmicron_meta_erase(tdisk->d_consumer);
1507
1508         /* Change states. */
1509         g_raid_change_disk_state(tdisk, G_RAID_DISK_S_FAILED);
1510         TAILQ_FOREACH(sd, &tdisk->d_subdisks, sd_next) {
1511                 g_raid_change_subdisk_state(sd,
1512                     G_RAID_SUBDISK_S_FAILED);
1513                 g_raid_event_send(sd, G_RAID_SUBDISK_E_FAILED,
1514                     G_RAID_EVENT_SUBDISK);
1515         }
1516
1517         /* Write updated metadata to remaining disks. */
1518         g_raid_md_write_jmicron(md, NULL, NULL, tdisk);
1519
1520         /* Check if anything left except placeholders. */
1521         if (g_raid_ndisks(sc, -1) ==
1522             g_raid_ndisks(sc, G_RAID_DISK_S_OFFLINE))
1523                 g_raid_destroy_node(sc, 0);
1524         else
1525                 g_raid_md_jmicron_refill(sc);
1526         return (0);
1527 }
1528
1529 static int
1530 g_raid_md_free_disk_jmicron(struct g_raid_md_object *md,
1531     struct g_raid_disk *disk)
1532 {
1533         struct g_raid_md_jmicron_perdisk *pd;
1534
1535         pd = (struct g_raid_md_jmicron_perdisk *)disk->d_md_data;
1536         if (pd->pd_meta != NULL) {
1537                 free(pd->pd_meta, M_MD_JMICRON);
1538                 pd->pd_meta = NULL;
1539         }
1540         free(pd, M_MD_JMICRON);
1541         disk->d_md_data = NULL;
1542         return (0);
1543 }
1544
1545 static int
1546 g_raid_md_free_jmicron(struct g_raid_md_object *md)
1547 {
1548         struct g_raid_md_jmicron_object *mdi;
1549
1550         mdi = (struct g_raid_md_jmicron_object *)md;
1551         if (!mdi->mdio_started) {
1552                 mdi->mdio_started = 0;
1553                 callout_stop(&mdi->mdio_start_co);
1554                 G_RAID_DEBUG1(1, md->mdo_softc,
1555                     "root_mount_rel %p", mdi->mdio_rootmount);
1556                 root_mount_rel(mdi->mdio_rootmount);
1557                 mdi->mdio_rootmount = NULL;
1558         }
1559         if (mdi->mdio_meta != NULL) {
1560                 free(mdi->mdio_meta, M_MD_JMICRON);
1561                 mdi->mdio_meta = NULL;
1562         }
1563         return (0);
1564 }
1565
1566 G_RAID_MD_DECLARE(jmicron, "JMicron");