1 /*===---- avx512vlintrin.h - AVX512VL intrinsics ---------------------------===
3 * Permission is hereby granted, free of charge, to any person obtaining a copy
4 * of this software and associated documentation files (the "Software"), to deal
5 * in the Software without restriction, including without limitation the rights
6 * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
7 * copies of the Software, and to permit persons to whom the Software is
8 * furnished to do so, subject to the following conditions:
10 * The above copyright notice and this permission notice shall be included in
11 * all copies or substantial portions of the Software.
13 * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
14 * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
15 * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
16 * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
17 * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
18 * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
21 *===-----------------------------------------------------------------------===
25 #error "Never use <avx512vlintrin.h> directly; include <immintrin.h> instead."
28 #ifndef __AVX512VLINTRIN_H
29 #define __AVX512VLINTRIN_H
31 /* Define the default attributes for the functions in this file. */
32 #define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__))
36 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
37 _mm_cmpeq_epi32_mask(__m128i __a, __m128i __b) {
38 return (__mmask8)__builtin_ia32_pcmpeqd128_mask((__v4si)__a, (__v4si)__b,
42 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
43 _mm_mask_cmpeq_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
44 return (__mmask8)__builtin_ia32_pcmpeqd128_mask((__v4si)__a, (__v4si)__b,
48 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
49 _mm_cmpeq_epu32_mask(__m128i __a, __m128i __b) {
50 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 0,
54 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
55 _mm_mask_cmpeq_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
56 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 0,
60 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
61 _mm256_cmpeq_epi32_mask(__m256i __a, __m256i __b) {
62 return (__mmask8)__builtin_ia32_pcmpeqd256_mask((__v8si)__a, (__v8si)__b,
66 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
67 _mm256_mask_cmpeq_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
68 return (__mmask8)__builtin_ia32_pcmpeqd256_mask((__v8si)__a, (__v8si)__b,
72 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
73 _mm256_cmpeq_epu32_mask(__m256i __a, __m256i __b) {
74 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 0,
78 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
79 _mm256_mask_cmpeq_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
80 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 0,
84 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
85 _mm_cmpeq_epi64_mask(__m128i __a, __m128i __b) {
86 return (__mmask8)__builtin_ia32_pcmpeqq128_mask((__v2di)__a, (__v2di)__b,
90 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
91 _mm_mask_cmpeq_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
92 return (__mmask8)__builtin_ia32_pcmpeqq128_mask((__v2di)__a, (__v2di)__b,
96 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
97 _mm_cmpeq_epu64_mask(__m128i __a, __m128i __b) {
98 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 0,
102 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
103 _mm_mask_cmpeq_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
104 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 0,
108 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
109 _mm256_cmpeq_epi64_mask(__m256i __a, __m256i __b) {
110 return (__mmask8)__builtin_ia32_pcmpeqq256_mask((__v4di)__a, (__v4di)__b,
114 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
115 _mm256_mask_cmpeq_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
116 return (__mmask8)__builtin_ia32_pcmpeqq256_mask((__v4di)__a, (__v4di)__b,
120 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
121 _mm256_cmpeq_epu64_mask(__m256i __a, __m256i __b) {
122 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 0,
126 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
127 _mm256_mask_cmpeq_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
128 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 0,
133 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
134 _mm_cmpge_epi32_mask(__m128i __a, __m128i __b) {
135 return (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 5,
139 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
140 _mm_mask_cmpge_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
141 return (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 5,
145 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
146 _mm_cmpge_epu32_mask(__m128i __a, __m128i __b) {
147 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 5,
151 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
152 _mm_mask_cmpge_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
153 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 5,
157 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
158 _mm256_cmpge_epi32_mask(__m256i __a, __m256i __b) {
159 return (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 5,
163 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
164 _mm256_mask_cmpge_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
165 return (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 5,
169 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
170 _mm256_cmpge_epu32_mask(__m256i __a, __m256i __b) {
171 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 5,
175 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
176 _mm256_mask_cmpge_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
177 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 5,
181 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
182 _mm_cmpge_epi64_mask(__m128i __a, __m128i __b) {
183 return (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 5,
187 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
188 _mm_mask_cmpge_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
189 return (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 5,
193 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
194 _mm_cmpge_epu64_mask(__m128i __a, __m128i __b) {
195 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 5,
199 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
200 _mm_mask_cmpge_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
201 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 5,
205 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
206 _mm256_cmpge_epi64_mask(__m256i __a, __m256i __b) {
207 return (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 5,
211 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
212 _mm256_mask_cmpge_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
213 return (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 5,
217 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
218 _mm256_cmpge_epu64_mask(__m256i __a, __m256i __b) {
219 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 5,
223 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
224 _mm256_mask_cmpge_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
225 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 5,
232 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
233 _mm_cmpgt_epi32_mask(__m128i __a, __m128i __b) {
234 return (__mmask8)__builtin_ia32_pcmpgtd128_mask((__v4si)__a, (__v4si)__b,
238 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
239 _mm_mask_cmpgt_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
240 return (__mmask8)__builtin_ia32_pcmpgtd128_mask((__v4si)__a, (__v4si)__b,
244 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
245 _mm_cmpgt_epu32_mask(__m128i __a, __m128i __b) {
246 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 6,
250 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
251 _mm_mask_cmpgt_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
252 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 6,
256 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
257 _mm256_cmpgt_epi32_mask(__m256i __a, __m256i __b) {
258 return (__mmask8)__builtin_ia32_pcmpgtd256_mask((__v8si)__a, (__v8si)__b,
262 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
263 _mm256_mask_cmpgt_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
264 return (__mmask8)__builtin_ia32_pcmpgtd256_mask((__v8si)__a, (__v8si)__b,
268 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
269 _mm256_cmpgt_epu32_mask(__m256i __a, __m256i __b) {
270 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 6,
274 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
275 _mm256_mask_cmpgt_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
276 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 6,
280 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
281 _mm_cmpgt_epi64_mask(__m128i __a, __m128i __b) {
282 return (__mmask8)__builtin_ia32_pcmpgtq128_mask((__v2di)__a, (__v2di)__b,
286 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
287 _mm_mask_cmpgt_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
288 return (__mmask8)__builtin_ia32_pcmpgtq128_mask((__v2di)__a, (__v2di)__b,
292 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
293 _mm_cmpgt_epu64_mask(__m128i __a, __m128i __b) {
294 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 6,
298 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
299 _mm_mask_cmpgt_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
300 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 6,
304 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
305 _mm256_cmpgt_epi64_mask(__m256i __a, __m256i __b) {
306 return (__mmask8)__builtin_ia32_pcmpgtq256_mask((__v4di)__a, (__v4di)__b,
310 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
311 _mm256_mask_cmpgt_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
312 return (__mmask8)__builtin_ia32_pcmpgtq256_mask((__v4di)__a, (__v4di)__b,
316 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
317 _mm256_cmpgt_epu64_mask(__m256i __a, __m256i __b) {
318 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 6,
322 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
323 _mm256_mask_cmpgt_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
324 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 6,
328 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
329 _mm_cmple_epi32_mask(__m128i __a, __m128i __b) {
330 return (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 2,
334 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
335 _mm_mask_cmple_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
336 return (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 2,
340 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
341 _mm_cmple_epu32_mask(__m128i __a, __m128i __b) {
342 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 2,
346 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
347 _mm_mask_cmple_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
348 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 2,
352 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
353 _mm256_cmple_epi32_mask(__m256i __a, __m256i __b) {
354 return (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 2,
358 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
359 _mm256_mask_cmple_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
360 return (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 2,
364 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
365 _mm256_cmple_epu32_mask(__m256i __a, __m256i __b) {
366 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 2,
370 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
371 _mm256_mask_cmple_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
372 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 2,
376 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
377 _mm_cmple_epi64_mask(__m128i __a, __m128i __b) {
378 return (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 2,
382 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
383 _mm_mask_cmple_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
384 return (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 2,
388 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
389 _mm_cmple_epu64_mask(__m128i __a, __m128i __b) {
390 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 2,
394 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
395 _mm_mask_cmple_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
396 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 2,
400 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
401 _mm256_cmple_epi64_mask(__m256i __a, __m256i __b) {
402 return (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 2,
406 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
407 _mm256_mask_cmple_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
408 return (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 2,
412 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
413 _mm256_cmple_epu64_mask(__m256i __a, __m256i __b) {
414 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 2,
418 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
419 _mm256_mask_cmple_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
420 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 2,
424 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
425 _mm_cmplt_epi32_mask(__m128i __a, __m128i __b) {
426 return (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 1,
430 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
431 _mm_mask_cmplt_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
432 return (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 1,
436 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
437 _mm_cmplt_epu32_mask(__m128i __a, __m128i __b) {
438 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 1,
442 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
443 _mm_mask_cmplt_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
444 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 1,
448 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
449 _mm256_cmplt_epi32_mask(__m256i __a, __m256i __b) {
450 return (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 1,
454 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
455 _mm256_mask_cmplt_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
456 return (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 1,
460 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
461 _mm256_cmplt_epu32_mask(__m256i __a, __m256i __b) {
462 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 1,
466 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
467 _mm256_mask_cmplt_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
468 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 1,
472 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
473 _mm_cmplt_epi64_mask(__m128i __a, __m128i __b) {
474 return (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 1,
478 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
479 _mm_mask_cmplt_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
480 return (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 1,
484 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
485 _mm_cmplt_epu64_mask(__m128i __a, __m128i __b) {
486 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 1,
490 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
491 _mm_mask_cmplt_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
492 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 1,
496 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
497 _mm256_cmplt_epi64_mask(__m256i __a, __m256i __b) {
498 return (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 1,
502 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
503 _mm256_mask_cmplt_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
504 return (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 1,
508 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
509 _mm256_cmplt_epu64_mask(__m256i __a, __m256i __b) {
510 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 1,
514 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
515 _mm256_mask_cmplt_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
516 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 1,
520 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
521 _mm_cmpneq_epi32_mask(__m128i __a, __m128i __b) {
522 return (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 4,
526 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
527 _mm_mask_cmpneq_epi32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
528 return (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 4,
532 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
533 _mm_cmpneq_epu32_mask(__m128i __a, __m128i __b) {
534 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 4,
538 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
539 _mm_mask_cmpneq_epu32_mask(__mmask8 __u, __m128i __a, __m128i __b) {
540 return (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 4,
544 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
545 _mm256_cmpneq_epi32_mask(__m256i __a, __m256i __b) {
546 return (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 4,
550 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
551 _mm256_mask_cmpneq_epi32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
552 return (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 4,
556 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
557 _mm256_cmpneq_epu32_mask(__m256i __a, __m256i __b) {
558 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 4,
562 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
563 _mm256_mask_cmpneq_epu32_mask(__mmask8 __u, __m256i __a, __m256i __b) {
564 return (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 4,
568 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
569 _mm_cmpneq_epi64_mask(__m128i __a, __m128i __b) {
570 return (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 4,
574 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
575 _mm_mask_cmpneq_epi64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
576 return (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 4,
580 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
581 _mm_cmpneq_epu64_mask(__m128i __a, __m128i __b) {
582 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 4,
586 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
587 _mm_mask_cmpneq_epu64_mask(__mmask8 __u, __m128i __a, __m128i __b) {
588 return (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 4,
592 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
593 _mm256_cmpneq_epi64_mask(__m256i __a, __m256i __b) {
594 return (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 4,
598 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
599 _mm256_mask_cmpneq_epi64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
600 return (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 4,
604 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
605 _mm256_cmpneq_epu64_mask(__m256i __a, __m256i __b) {
606 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 4,
610 static __inline__ __mmask8 __DEFAULT_FN_ATTRS
611 _mm256_mask_cmpneq_epu64_mask(__mmask8 __u, __m256i __a, __m256i __b) {
612 return (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 4,
616 static __inline__ __m256i __DEFAULT_FN_ATTRS
617 _mm256_mask_add_epi32 (__m256i __W, __mmask8 __U, __m256i __A,
620 return (__m256i) __builtin_ia32_paddd256_mask ((__v8si) __A,
626 static __inline__ __m256i __DEFAULT_FN_ATTRS
627 _mm256_maskz_add_epi32 (__mmask8 __U, __m256i __A, __m256i __B)
629 return (__m256i) __builtin_ia32_paddd256_mask ((__v8si) __A,
632 _mm256_setzero_si256 (),
636 static __inline__ __m256i __DEFAULT_FN_ATTRS
637 _mm256_mask_add_epi64 (__m256i __W, __mmask8 __U, __m256i __A,
640 return (__m256i) __builtin_ia32_paddq256_mask ((__v4di) __A,
646 static __inline__ __m256i __DEFAULT_FN_ATTRS
647 _mm256_maskz_add_epi64 (__mmask8 __U, __m256i __A, __m256i __B)
649 return (__m256i) __builtin_ia32_paddq256_mask ((__v4di) __A,
652 _mm256_setzero_si256 (),
656 static __inline__ __m256i __DEFAULT_FN_ATTRS
657 _mm256_mask_sub_epi32 (__m256i __W, __mmask8 __U, __m256i __A,
660 return (__m256i) __builtin_ia32_psubd256_mask ((__v8si) __A,
666 static __inline__ __m256i __DEFAULT_FN_ATTRS
667 _mm256_maskz_sub_epi32 (__mmask8 __U, __m256i __A, __m256i __B)
669 return (__m256i) __builtin_ia32_psubd256_mask ((__v8si) __A,
672 _mm256_setzero_si256 (),
676 static __inline__ __m256i __DEFAULT_FN_ATTRS
677 _mm256_mask_sub_epi64 (__m256i __W, __mmask8 __U, __m256i __A,
680 return (__m256i) __builtin_ia32_psubq256_mask ((__v4di) __A,
686 static __inline__ __m256i __DEFAULT_FN_ATTRS
687 _mm256_maskz_sub_epi64 (__mmask8 __U, __m256i __A, __m256i __B)
689 return (__m256i) __builtin_ia32_psubq256_mask ((__v4di) __A,
692 _mm256_setzero_si256 (),
696 static __inline__ __m128i __DEFAULT_FN_ATTRS
697 _mm_mask_add_epi32 (__m128i __W, __mmask8 __U, __m128i __A,
700 return (__m128i) __builtin_ia32_paddd128_mask ((__v4si) __A,
706 static __inline__ __m128i __DEFAULT_FN_ATTRS
707 _mm_maskz_add_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
709 return (__m128i) __builtin_ia32_paddd128_mask ((__v4si) __A,
712 _mm_setzero_si128 (),
716 static __inline__ __m128i __DEFAULT_FN_ATTRS
717 _mm_mask_add_epi64 (__m128i __W, __mmask8 __U, __m128i __A,
720 return (__m128i) __builtin_ia32_paddq128_mask ((__v2di) __A,
726 static __inline__ __m128i __DEFAULT_FN_ATTRS
727 _mm_maskz_add_epi64 (__mmask8 __U, __m128i __A, __m128i __B)
729 return (__m128i) __builtin_ia32_paddq128_mask ((__v2di) __A,
732 _mm_setzero_si128 (),
736 static __inline__ __m128i __DEFAULT_FN_ATTRS
737 _mm_mask_sub_epi32 (__m128i __W, __mmask8 __U, __m128i __A,
740 return (__m128i) __builtin_ia32_psubd128_mask ((__v4si) __A,
746 static __inline__ __m128i __DEFAULT_FN_ATTRS
747 _mm_maskz_sub_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
749 return (__m128i) __builtin_ia32_psubd128_mask ((__v4si) __A,
752 _mm_setzero_si128 (),
756 static __inline__ __m128i __DEFAULT_FN_ATTRS
757 _mm_mask_sub_epi64 (__m128i __W, __mmask8 __U, __m128i __A,
760 return (__m128i) __builtin_ia32_psubq128_mask ((__v2di) __A,
766 static __inline__ __m128i __DEFAULT_FN_ATTRS
767 _mm_maskz_sub_epi64 (__mmask8 __U, __m128i __A, __m128i __B)
769 return (__m128i) __builtin_ia32_psubq128_mask ((__v2di) __A,
772 _mm_setzero_si128 (),
776 static __inline__ __m256i __DEFAULT_FN_ATTRS
777 _mm256_mask_mul_epi32 (__m256i __W, __mmask8 __M, __m256i __X,
780 return (__m256i) __builtin_ia32_pmuldq256_mask ((__v8si) __X,
785 static __inline__ __m256i __DEFAULT_FN_ATTRS
786 _mm256_maskz_mul_epi32 (__mmask8 __M, __m256i __X, __m256i __Y)
788 return (__m256i) __builtin_ia32_pmuldq256_mask ((__v8si) __X,
791 _mm256_setzero_si256 (),
795 static __inline__ __m128i __DEFAULT_FN_ATTRS
796 _mm_mask_mul_epi32 (__m128i __W, __mmask8 __M, __m128i __X,
799 return (__m128i) __builtin_ia32_pmuldq128_mask ((__v4si) __X,
804 static __inline__ __m128i __DEFAULT_FN_ATTRS
805 _mm_maskz_mul_epi32 (__mmask8 __M, __m128i __X, __m128i __Y)
807 return (__m128i) __builtin_ia32_pmuldq128_mask ((__v4si) __X,
810 _mm_setzero_si128 (),
814 static __inline__ __m256i __DEFAULT_FN_ATTRS
815 _mm256_mask_mul_epu32 (__m256i __W, __mmask8 __M, __m256i __X,
818 return (__m256i) __builtin_ia32_pmuludq256_mask ((__v8si) __X,
823 static __inline__ __m256i __DEFAULT_FN_ATTRS
824 _mm256_maskz_mul_epu32 (__mmask8 __M, __m256i __X, __m256i __Y)
826 return (__m256i) __builtin_ia32_pmuludq256_mask ((__v8si) __X,
829 _mm256_setzero_si256 (),
833 static __inline__ __m128i __DEFAULT_FN_ATTRS
834 _mm_mask_mul_epu32 (__m128i __W, __mmask8 __M, __m128i __X,
837 return (__m128i) __builtin_ia32_pmuludq128_mask ((__v4si) __X,
842 static __inline__ __m128i __DEFAULT_FN_ATTRS
843 _mm_maskz_mul_epu32 (__mmask8 __M, __m128i __X, __m128i __Y)
845 return (__m128i) __builtin_ia32_pmuludq128_mask ((__v4si) __X,
848 _mm_setzero_si128 (),
852 static __inline__ __m256i __DEFAULT_FN_ATTRS
853 _mm256_maskz_mullo_epi32 (__mmask8 __M, __m256i __A, __m256i __B)
855 return (__m256i) __builtin_ia32_pmulld256_mask ((__v8si) __A,
858 _mm256_setzero_si256 (),
862 static __inline__ __m256i __DEFAULT_FN_ATTRS
863 _mm256_mask_mullo_epi32 (__m256i __W, __mmask8 __M, __m256i __A,
866 return (__m256i) __builtin_ia32_pmulld256_mask ((__v8si) __A,
871 static __inline__ __m128i __DEFAULT_FN_ATTRS
872 _mm_maskz_mullo_epi32 (__mmask8 __M, __m128i __A, __m128i __B)
874 return (__m128i) __builtin_ia32_pmulld128_mask ((__v4si) __A,
877 _mm_setzero_si128 (),
881 static __inline__ __m128i __DEFAULT_FN_ATTRS
882 _mm_mask_mullo_epi32 (__m128i __W, __mmask16 __M, __m128i __A,
885 return (__m128i) __builtin_ia32_pmulld128_mask ((__v4si) __A,
890 static __inline__ __m256i __DEFAULT_FN_ATTRS
891 _mm256_mask_and_epi32 (__m256i __W, __mmask8 __U, __m256i __A,
894 return (__m256i) __builtin_ia32_pandd256_mask ((__v8si) __A,
900 static __inline__ __m256i __DEFAULT_FN_ATTRS
901 _mm256_maskz_and_epi32 (__mmask8 __U, __m256i __A, __m256i __B)
903 return (__m256i) __builtin_ia32_pandd256_mask ((__v8si) __A,
906 _mm256_setzero_si256 (),
910 static __inline__ __m128i __DEFAULT_FN_ATTRS
911 _mm_mask_and_epi32 (__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
913 return (__m128i) __builtin_ia32_pandd128_mask ((__v4si) __A,
919 static __inline__ __m128i __DEFAULT_FN_ATTRS
920 _mm_maskz_and_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
922 return (__m128i) __builtin_ia32_pandd128_mask ((__v4si) __A,
925 _mm_setzero_si128 (),
929 static __inline__ __m256i __DEFAULT_FN_ATTRS
930 _mm256_mask_andnot_epi32 (__m256i __W, __mmask8 __U, __m256i __A,
933 return (__m256i) __builtin_ia32_pandnd256_mask ((__v8si) __A,
939 static __inline__ __m256i __DEFAULT_FN_ATTRS
940 _mm256_maskz_andnot_epi32 (__mmask8 __U, __m256i __A, __m256i __B)
942 return (__m256i) __builtin_ia32_pandnd256_mask ((__v8si) __A,
945 _mm256_setzero_si256 (),
949 static __inline__ __m128i __DEFAULT_FN_ATTRS
950 _mm_mask_andnot_epi32 (__m128i __W, __mmask8 __U, __m128i __A,
953 return (__m128i) __builtin_ia32_pandnd128_mask ((__v4si) __A,
959 static __inline__ __m128i __DEFAULT_FN_ATTRS
960 _mm_maskz_andnot_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
962 return (__m128i) __builtin_ia32_pandnd128_mask ((__v4si) __A,
965 _mm_setzero_si128 (),
969 static __inline__ __m256i __DEFAULT_FN_ATTRS
970 _mm256_mask_or_epi32 (__m256i __W, __mmask8 __U, __m256i __A,
973 return (__m256i) __builtin_ia32_pord256_mask ((__v8si) __A,
979 static __inline__ __m256i __DEFAULT_FN_ATTRS
980 _mm256_maskz_or_epi32 (__mmask8 __U, __m256i __A, __m256i __B)
982 return (__m256i) __builtin_ia32_pord256_mask ((__v8si) __A,
985 _mm256_setzero_si256 (),
989 static __inline__ __m128i __DEFAULT_FN_ATTRS
990 _mm_mask_or_epi32 (__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
992 return (__m128i) __builtin_ia32_pord128_mask ((__v4si) __A,
998 static __inline__ __m128i __DEFAULT_FN_ATTRS
999 _mm_maskz_or_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
1001 return (__m128i) __builtin_ia32_pord128_mask ((__v4si) __A,
1004 _mm_setzero_si128 (),
1008 static __inline__ __m256i __DEFAULT_FN_ATTRS
1009 _mm256_mask_xor_epi32 (__m256i __W, __mmask8 __U, __m256i __A,
1012 return (__m256i) __builtin_ia32_pxord256_mask ((__v8si) __A,
1018 static __inline__ __m256i __DEFAULT_FN_ATTRS
1019 _mm256_maskz_xor_epi32 (__mmask8 __U, __m256i __A, __m256i __B)
1021 return (__m256i) __builtin_ia32_pxord256_mask ((__v8si) __A,
1024 _mm256_setzero_si256 (),
1028 static __inline__ __m128i __DEFAULT_FN_ATTRS
1029 _mm_mask_xor_epi32 (__m128i __W, __mmask8 __U, __m128i __A,
1032 return (__m128i) __builtin_ia32_pxord128_mask ((__v4si) __A,
1038 static __inline__ __m128i __DEFAULT_FN_ATTRS
1039 _mm_maskz_xor_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
1041 return (__m128i) __builtin_ia32_pxord128_mask ((__v4si) __A,
1044 _mm_setzero_si128 (),
1048 static __inline__ __m256i __DEFAULT_FN_ATTRS
1049 _mm256_mask_and_epi64 (__m256i __W, __mmask8 __U, __m256i __A,
1052 return (__m256i) __builtin_ia32_pandq256_mask ((__v4di) __A,
1057 static __inline__ __m256i __DEFAULT_FN_ATTRS
1058 _mm256_maskz_and_epi64 (__mmask8 __U, __m256i __A, __m256i __B)
1060 return (__m256i) __builtin_ia32_pandq256_mask ((__v4di) __A,
1063 _mm256_setzero_pd (),
1067 static __inline__ __m128i __DEFAULT_FN_ATTRS
1068 _mm_mask_and_epi64 (__m128i __W, __mmask8 __U, __m128i __A,
1071 return (__m128i) __builtin_ia32_pandq128_mask ((__v2di) __A,
1076 static __inline__ __m128i __DEFAULT_FN_ATTRS
1077 _mm_maskz_and_epi64 (__mmask8 __U, __m128i __A, __m128i __B)
1079 return (__m128i) __builtin_ia32_pandq128_mask ((__v2di) __A,
1086 static __inline__ __m256i __DEFAULT_FN_ATTRS
1087 _mm256_mask_andnot_epi64 (__m256i __W, __mmask8 __U, __m256i __A,
1090 return (__m256i) __builtin_ia32_pandnq256_mask ((__v4di) __A,
1095 static __inline__ __m256i __DEFAULT_FN_ATTRS
1096 _mm256_maskz_andnot_epi64 (__mmask8 __U, __m256i __A, __m256i __B)
1098 return (__m256i) __builtin_ia32_pandnq256_mask ((__v4di) __A,
1101 _mm256_setzero_pd (),
1105 static __inline__ __m128i __DEFAULT_FN_ATTRS
1106 _mm_mask_andnot_epi64 (__m128i __W, __mmask8 __U, __m128i __A,
1109 return (__m128i) __builtin_ia32_pandnq128_mask ((__v2di) __A,
1114 static __inline__ __m128i __DEFAULT_FN_ATTRS
1115 _mm_maskz_andnot_epi64 (__mmask8 __U, __m128i __A, __m128i __B)
1117 return (__m128i) __builtin_ia32_pandnq128_mask ((__v2di) __A,
1124 static __inline__ __m256i __DEFAULT_FN_ATTRS
1125 _mm256_mask_or_epi64 (__m256i __W, __mmask8 __U, __m256i __A,
1128 return (__m256i) __builtin_ia32_porq256_mask ((__v4di) __A,
1134 static __inline__ __m256i __DEFAULT_FN_ATTRS
1135 _mm256_maskz_or_epi64 (__mmask8 __U, __m256i __A, __m256i __B)
1137 return (__m256i) __builtin_ia32_porq256_mask ((__v4di) __A,
1140 _mm256_setzero_si256 (),
1144 static __inline__ __m128i __DEFAULT_FN_ATTRS
1145 _mm_mask_or_epi64 (__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
1147 return (__m128i) __builtin_ia32_porq128_mask ((__v2di) __A,
1153 static __inline__ __m128i __DEFAULT_FN_ATTRS
1154 _mm_maskz_or_epi64 (__mmask8 __U, __m128i __A, __m128i __B)
1156 return (__m128i) __builtin_ia32_porq128_mask ((__v2di) __A,
1159 _mm_setzero_si128 (),
1163 static __inline__ __m256i __DEFAULT_FN_ATTRS
1164 _mm256_mask_xor_epi64 (__m256i __W, __mmask8 __U, __m256i __A,
1167 return (__m256i) __builtin_ia32_pxorq256_mask ((__v4di) __A,
1173 static __inline__ __m256i __DEFAULT_FN_ATTRS
1174 _mm256_maskz_xor_epi64 (__mmask8 __U, __m256i __A, __m256i __B)
1176 return (__m256i) __builtin_ia32_pxorq256_mask ((__v4di) __A,
1179 _mm256_setzero_si256 (),
1183 static __inline__ __m128i __DEFAULT_FN_ATTRS
1184 _mm_mask_xor_epi64 (__m128i __W, __mmask8 __U, __m128i __A,
1187 return (__m128i) __builtin_ia32_pxorq128_mask ((__v2di) __A,
1193 static __inline__ __m128i __DEFAULT_FN_ATTRS
1194 _mm_maskz_xor_epi64 (__mmask8 __U, __m128i __A, __m128i __B)
1196 return (__m128i) __builtin_ia32_pxorq128_mask ((__v2di) __A,
1199 _mm_setzero_si128 (),
1203 #define _mm_cmp_epi32_mask(a, b, p) __extension__ ({ \
1204 (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)(__m128i)(a), \
1205 (__v4si)(__m128i)(b), \
1206 (p), (__mmask8)-1); })
1208 #define _mm_mask_cmp_epi32_mask(m, a, b, p) __extension__ ({ \
1209 (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)(__m128i)(a), \
1210 (__v4si)(__m128i)(b), \
1211 (p), (__mmask8)(m)); })
1213 #define _mm_cmp_epu32_mask(a, b, p) __extension__ ({ \
1214 (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)(__m128i)(a), \
1215 (__v4si)(__m128i)(b), \
1216 (p), (__mmask8)-1); })
1218 #define _mm_mask_cmp_epu32_mask(m, a, b, p) __extension__ ({ \
1219 (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)(__m128i)(a), \
1220 (__v4si)(__m128i)(b), \
1221 (p), (__mmask8)(m)); })
1223 #define _mm256_cmp_epi32_mask(a, b, p) __extension__ ({ \
1224 (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)(__m256i)(a), \
1225 (__v8si)(__m256i)(b), \
1226 (p), (__mmask8)-1); })
1228 #define _mm256_mask_cmp_epi32_mask(m, a, b, p) __extension__ ({ \
1229 (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)(__m256i)(a), \
1230 (__v8si)(__m256i)(b), \
1231 (p), (__mmask8)(m)); })
1233 #define _mm256_cmp_epu32_mask(a, b, p) __extension__ ({ \
1234 (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)(__m256i)(a), \
1235 (__v8si)(__m256i)(b), \
1236 (p), (__mmask8)-1); })
1238 #define _mm256_mask_cmp_epu32_mask(m, a, b, p) __extension__ ({ \
1239 (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)(__m256i)(a), \
1240 (__v8si)(__m256i)(b), \
1241 (p), (__mmask8)(m)); })
1243 #define _mm_cmp_epi64_mask(a, b, p) __extension__ ({ \
1244 (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)(__m128i)(a), \
1245 (__v2di)(__m128i)(b), \
1246 (p), (__mmask8)-1); })
1248 #define _mm_mask_cmp_epi64_mask(m, a, b, p) __extension__ ({ \
1249 (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)(__m128i)(a), \
1250 (__v2di)(__m128i)(b), \
1251 (p), (__mmask8)(m)); })
1253 #define _mm_cmp_epu64_mask(a, b, p) __extension__ ({ \
1254 (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)(__m128i)(a), \
1255 (__v2di)(__m128i)(b), \
1256 (p), (__mmask8)-1); })
1258 #define _mm_mask_cmp_epu64_mask(m, a, b, p) __extension__ ({ \
1259 (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)(__m128i)(a), \
1260 (__v2di)(__m128i)(b), \
1261 (p), (__mmask8)(m)); })
1263 #define _mm256_cmp_epi64_mask(a, b, p) __extension__ ({ \
1264 (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)(__m256i)(a), \
1265 (__v4di)(__m256i)(b), \
1266 (p), (__mmask8)-1); })
1268 #define _mm256_mask_cmp_epi64_mask(m, a, b, p) __extension__ ({ \
1269 (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)(__m256i)(a), \
1270 (__v4di)(__m256i)(b), \
1271 (p), (__mmask8)(m)); })
1273 #define _mm256_cmp_epu64_mask(a, b, p) __extension__ ({ \
1274 (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)(__m256i)(a), \
1275 (__v4di)(__m256i)(b), \
1276 (p), (__mmask8)-1); })
1278 #define _mm256_mask_cmp_epu64_mask(m, a, b, p) __extension__ ({ \
1279 (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)(__m256i)(a), \
1280 (__v4di)(__m256i)(b), \
1281 (p), (__mmask8)(m)); })
1283 #define _mm256_cmp_ps_mask(a, b, p) __extension__ ({ \
1284 (__mmask8)__builtin_ia32_cmpps256_mask((__v8sf)(__m256)(a), \
1285 (__v8sf)(__m256)(b), \
1286 (p), (__mmask8)-1); })
1288 #define _mm256_mask_cmp_ps_mask(m, a, b, p) __extension__ ({ \
1289 (__mmask8)__builtin_ia32_cmpps256_mask((__v8sf)(__m256)(a), \
1290 (__v8sf)(__m256)(b), \
1291 (p), (__mmask8)(m)); })
1293 #define _mm256_cmp_pd_mask(a, b, p) __extension__ ({ \
1294 (__mmask8)__builtin_ia32_cmppd256_mask((__v4df)(__m256)(a), \
1295 (__v4df)(__m256)(b), \
1296 (p), (__mmask8)-1); })
1298 #define _mm256_mask_cmp_pd_mask(m, a, b, p) __extension__ ({ \
1299 (__mmask8)__builtin_ia32_cmppd256_mask((__v4df)(__m256)(a), \
1300 (__v4df)(__m256)(b), \
1301 (p), (__mmask8)(m)); })
1303 #define _mm128_cmp_ps_mask(a, b, p) __extension__ ({ \
1304 (__mmask8)__builtin_ia32_cmpps128_mask((__v4sf)(__m128)(a), \
1305 (__v4sf)(__m128)(b), \
1306 (p), (__mmask8)-1); })
1308 #define _mm128_mask_cmp_ps_mask(m, a, b, p) __extension__ ({ \
1309 (__mmask8)__builtin_ia32_cmpps128_mask((__v4sf)(__m128)(a), \
1310 (__v4sf)(__m128)(b), \
1311 (p), (__mmask8)(m)); })
1313 #define _mm128_cmp_pd_mask(a, b, p) __extension__ ({ \
1314 (__mmask8)__builtin_ia32_cmppd128_mask((__v2df)(__m128)(a), \
1315 (__v2df)(__m128)(b), \
1316 (p), (__mmask8)-1); })
1318 #define _mm128_mask_cmp_pd_mask(m, a, b, p) __extension__ ({ \
1319 (__mmask8)__builtin_ia32_cmppd128_mask((__v2df)(__m128)(a), \
1320 (__v2df)(__m128)(b), \
1321 (p), (__mmask8)(m)); })
1323 static __inline__ __m128d __DEFAULT_FN_ATTRS
1324 _mm_mask_fmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
1326 return (__m128d) __builtin_ia32_vfmaddpd128_mask ((__v2df) __A,
1332 static __inline__ __m128d __DEFAULT_FN_ATTRS
1333 _mm_mask3_fmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
1335 return (__m128d) __builtin_ia32_vfmaddpd128_mask3 ((__v2df) __A,
1341 static __inline__ __m128d __DEFAULT_FN_ATTRS
1342 _mm_maskz_fmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1344 return (__m128d) __builtin_ia32_vfmaddpd128_maskz ((__v2df) __A,
1350 static __inline__ __m128d __DEFAULT_FN_ATTRS
1351 _mm_mask_fmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
1353 return (__m128d) __builtin_ia32_vfmaddpd128_mask ((__v2df) __A,
1359 static __inline__ __m128d __DEFAULT_FN_ATTRS
1360 _mm_maskz_fmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1362 return (__m128d) __builtin_ia32_vfmaddpd128_maskz ((__v2df) __A,
1368 static __inline__ __m128d __DEFAULT_FN_ATTRS
1369 _mm_mask3_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
1371 return (__m128d) __builtin_ia32_vfmaddpd128_mask3 (-(__v2df) __A,
1377 static __inline__ __m128d __DEFAULT_FN_ATTRS
1378 _mm_maskz_fnmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1380 return (__m128d) __builtin_ia32_vfmaddpd128_maskz (-(__v2df) __A,
1386 static __inline__ __m128d __DEFAULT_FN_ATTRS
1387 _mm_maskz_fnmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1389 return (__m128d) __builtin_ia32_vfmaddpd128_maskz (-(__v2df) __A,
1395 static __inline__ __m256d __DEFAULT_FN_ATTRS
1396 _mm256_mask_fmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1398 return (__m256d) __builtin_ia32_vfmaddpd256_mask ((__v4df) __A,
1404 static __inline__ __m256d __DEFAULT_FN_ATTRS
1405 _mm256_mask3_fmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1407 return (__m256d) __builtin_ia32_vfmaddpd256_mask3 ((__v4df) __A,
1413 static __inline__ __m256d __DEFAULT_FN_ATTRS
1414 _mm256_maskz_fmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1416 return (__m256d) __builtin_ia32_vfmaddpd256_maskz ((__v4df) __A,
1422 static __inline__ __m256d __DEFAULT_FN_ATTRS
1423 _mm256_mask_fmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1425 return (__m256d) __builtin_ia32_vfmaddpd256_mask ((__v4df) __A,
1431 static __inline__ __m256d __DEFAULT_FN_ATTRS
1432 _mm256_maskz_fmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1434 return (__m256d) __builtin_ia32_vfmaddpd256_maskz ((__v4df) __A,
1440 static __inline__ __m256d __DEFAULT_FN_ATTRS
1441 _mm256_mask3_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1443 return (__m256d) __builtin_ia32_vfmaddpd256_mask3 (-(__v4df) __A,
1449 static __inline__ __m256d __DEFAULT_FN_ATTRS
1450 _mm256_maskz_fnmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1452 return (__m256d) __builtin_ia32_vfmaddpd256_maskz (-(__v4df) __A,
1458 static __inline__ __m256d __DEFAULT_FN_ATTRS
1459 _mm256_maskz_fnmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1461 return (__m256d) __builtin_ia32_vfmaddpd256_maskz (-(__v4df) __A,
1467 static __inline__ __m128 __DEFAULT_FN_ATTRS
1468 _mm_mask_fmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1470 return (__m128) __builtin_ia32_vfmaddps128_mask ((__v4sf) __A,
1476 static __inline__ __m128 __DEFAULT_FN_ATTRS
1477 _mm_mask3_fmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1479 return (__m128) __builtin_ia32_vfmaddps128_mask3 ((__v4sf) __A,
1485 static __inline__ __m128 __DEFAULT_FN_ATTRS
1486 _mm_maskz_fmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1488 return (__m128) __builtin_ia32_vfmaddps128_maskz ((__v4sf) __A,
1494 static __inline__ __m128 __DEFAULT_FN_ATTRS
1495 _mm_mask_fmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1497 return (__m128) __builtin_ia32_vfmaddps128_mask ((__v4sf) __A,
1503 static __inline__ __m128 __DEFAULT_FN_ATTRS
1504 _mm_maskz_fmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1506 return (__m128) __builtin_ia32_vfmaddps128_maskz ((__v4sf) __A,
1512 static __inline__ __m128 __DEFAULT_FN_ATTRS
1513 _mm_mask3_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1515 return (__m128) __builtin_ia32_vfmaddps128_mask3 (-(__v4sf) __A,
1521 static __inline__ __m128 __DEFAULT_FN_ATTRS
1522 _mm_maskz_fnmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1524 return (__m128) __builtin_ia32_vfmaddps128_maskz (-(__v4sf) __A,
1530 static __inline__ __m128 __DEFAULT_FN_ATTRS
1531 _mm_maskz_fnmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1533 return (__m128) __builtin_ia32_vfmaddps128_maskz (-(__v4sf) __A,
1539 static __inline__ __m256 __DEFAULT_FN_ATTRS
1540 _mm256_mask_fmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
1542 return (__m256) __builtin_ia32_vfmaddps256_mask ((__v8sf) __A,
1548 static __inline__ __m256 __DEFAULT_FN_ATTRS
1549 _mm256_mask3_fmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1551 return (__m256) __builtin_ia32_vfmaddps256_mask3 ((__v8sf) __A,
1557 static __inline__ __m256 __DEFAULT_FN_ATTRS
1558 _mm256_maskz_fmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1560 return (__m256) __builtin_ia32_vfmaddps256_maskz ((__v8sf) __A,
1566 static __inline__ __m256 __DEFAULT_FN_ATTRS
1567 _mm256_mask_fmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
1569 return (__m256) __builtin_ia32_vfmaddps256_mask ((__v8sf) __A,
1575 static __inline__ __m256 __DEFAULT_FN_ATTRS
1576 _mm256_maskz_fmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1578 return (__m256) __builtin_ia32_vfmaddps256_maskz ((__v8sf) __A,
1584 static __inline__ __m256 __DEFAULT_FN_ATTRS
1585 _mm256_mask3_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1587 return (__m256) __builtin_ia32_vfmaddps256_mask3 (-(__v8sf) __A,
1593 static __inline__ __m256 __DEFAULT_FN_ATTRS
1594 _mm256_maskz_fnmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1596 return (__m256) __builtin_ia32_vfmaddps256_maskz (-(__v8sf) __A,
1602 static __inline__ __m256 __DEFAULT_FN_ATTRS
1603 _mm256_maskz_fnmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1605 return (__m256) __builtin_ia32_vfmaddps256_maskz (-(__v8sf) __A,
1611 static __inline__ __m128d __DEFAULT_FN_ATTRS
1612 _mm_mask_fmaddsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
1614 return (__m128d) __builtin_ia32_vfmaddsubpd128_mask ((__v2df) __A,
1620 static __inline__ __m128d __DEFAULT_FN_ATTRS
1621 _mm_mask3_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
1623 return (__m128d) __builtin_ia32_vfmaddsubpd128_mask3 ((__v2df) __A,
1630 static __inline__ __m128d __DEFAULT_FN_ATTRS
1631 _mm_maskz_fmaddsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1633 return (__m128d) __builtin_ia32_vfmaddsubpd128_maskz ((__v2df) __A,
1640 static __inline__ __m128d __DEFAULT_FN_ATTRS
1641 _mm_mask_fmsubadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
1643 return (__m128d) __builtin_ia32_vfmaddsubpd128_mask ((__v2df) __A,
1649 static __inline__ __m128d __DEFAULT_FN_ATTRS
1650 _mm_maskz_fmsubadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1652 return (__m128d) __builtin_ia32_vfmaddsubpd128_maskz ((__v2df) __A,
1659 static __inline__ __m256d __DEFAULT_FN_ATTRS
1660 _mm256_mask_fmaddsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1662 return (__m256d) __builtin_ia32_vfmaddsubpd256_mask ((__v4df) __A,
1668 static __inline__ __m256d __DEFAULT_FN_ATTRS
1669 _mm256_mask3_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1671 return (__m256d) __builtin_ia32_vfmaddsubpd256_mask3 ((__v4df) __A,
1678 static __inline__ __m256d __DEFAULT_FN_ATTRS
1679 _mm256_maskz_fmaddsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1681 return (__m256d) __builtin_ia32_vfmaddsubpd256_maskz ((__v4df) __A,
1688 static __inline__ __m256d __DEFAULT_FN_ATTRS
1689 _mm256_mask_fmsubadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1691 return (__m256d) __builtin_ia32_vfmaddsubpd256_mask ((__v4df) __A,
1697 static __inline__ __m256d __DEFAULT_FN_ATTRS
1698 _mm256_maskz_fmsubadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1700 return (__m256d) __builtin_ia32_vfmaddsubpd256_maskz ((__v4df) __A,
1707 static __inline__ __m128 __DEFAULT_FN_ATTRS
1708 _mm_mask_fmaddsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1710 return (__m128) __builtin_ia32_vfmaddsubps128_mask ((__v4sf) __A,
1716 static __inline__ __m128 __DEFAULT_FN_ATTRS
1717 _mm_mask3_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1719 return (__m128) __builtin_ia32_vfmaddsubps128_mask3 ((__v4sf) __A,
1725 static __inline__ __m128 __DEFAULT_FN_ATTRS
1726 _mm_maskz_fmaddsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1728 return (__m128) __builtin_ia32_vfmaddsubps128_maskz ((__v4sf) __A,
1734 static __inline__ __m128 __DEFAULT_FN_ATTRS
1735 _mm_mask_fmsubadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1737 return (__m128) __builtin_ia32_vfmaddsubps128_mask ((__v4sf) __A,
1743 static __inline__ __m128 __DEFAULT_FN_ATTRS
1744 _mm_maskz_fmsubadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1746 return (__m128) __builtin_ia32_vfmaddsubps128_maskz ((__v4sf) __A,
1752 static __inline__ __m256 __DEFAULT_FN_ATTRS
1753 _mm256_mask_fmaddsub_ps(__m256 __A, __mmask8 __U, __m256 __B,
1756 return (__m256) __builtin_ia32_vfmaddsubps256_mask ((__v8sf) __A,
1762 static __inline__ __m256 __DEFAULT_FN_ATTRS
1763 _mm256_mask3_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1765 return (__m256) __builtin_ia32_vfmaddsubps256_mask3 ((__v8sf) __A,
1771 static __inline__ __m256 __DEFAULT_FN_ATTRS
1772 _mm256_maskz_fmaddsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1774 return (__m256) __builtin_ia32_vfmaddsubps256_maskz ((__v8sf) __A,
1780 static __inline__ __m256 __DEFAULT_FN_ATTRS
1781 _mm256_mask_fmsubadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
1783 return (__m256) __builtin_ia32_vfmaddsubps256_mask ((__v8sf) __A,
1789 static __inline__ __m256 __DEFAULT_FN_ATTRS
1790 _mm256_maskz_fmsubadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1792 return (__m256) __builtin_ia32_vfmaddsubps256_maskz ((__v8sf) __A,
1798 static __inline__ __m128d __DEFAULT_FN_ATTRS
1799 _mm_mask3_fmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
1801 return (__m128d) __builtin_ia32_vfmsubpd128_mask3 ((__v2df) __A,
1807 static __inline__ __m256d __DEFAULT_FN_ATTRS
1808 _mm256_mask3_fmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1810 return (__m256d) __builtin_ia32_vfmsubpd256_mask3 ((__v4df) __A,
1816 static __inline__ __m128 __DEFAULT_FN_ATTRS
1817 _mm_mask3_fmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1819 return (__m128) __builtin_ia32_vfmsubps128_mask3 ((__v4sf) __A,
1825 static __inline__ __m256 __DEFAULT_FN_ATTRS
1826 _mm256_mask3_fmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1828 return (__m256) __builtin_ia32_vfmsubps256_mask3 ((__v8sf) __A,
1834 static __inline__ __m128d __DEFAULT_FN_ATTRS
1835 _mm_mask3_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
1837 return (__m128d) __builtin_ia32_vfmsubaddpd128_mask3 ((__v2df) __A,
1844 static __inline__ __m256d __DEFAULT_FN_ATTRS
1845 _mm256_mask3_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1847 return (__m256d) __builtin_ia32_vfmsubaddpd256_mask3 ((__v4df) __A,
1854 static __inline__ __m128 __DEFAULT_FN_ATTRS
1855 _mm_mask3_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1857 return (__m128) __builtin_ia32_vfmsubaddps128_mask3 ((__v4sf) __A,
1863 static __inline__ __m256 __DEFAULT_FN_ATTRS
1864 _mm256_mask3_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1866 return (__m256) __builtin_ia32_vfmsubaddps256_mask3 ((__v8sf) __A,
1872 static __inline__ __m128d __DEFAULT_FN_ATTRS
1873 _mm_mask_fnmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
1875 return (__m128d) __builtin_ia32_vfnmaddpd128_mask ((__v2df) __A,
1881 static __inline__ __m256d __DEFAULT_FN_ATTRS
1882 _mm256_mask_fnmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1884 return (__m256d) __builtin_ia32_vfnmaddpd256_mask ((__v4df) __A,
1890 static __inline__ __m128 __DEFAULT_FN_ATTRS
1891 _mm_mask_fnmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1893 return (__m128) __builtin_ia32_vfnmaddps128_mask ((__v4sf) __A,
1899 static __inline__ __m256 __DEFAULT_FN_ATTRS
1900 _mm256_mask_fnmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
1902 return (__m256) __builtin_ia32_vfnmaddps256_mask ((__v8sf) __A,
1908 static __inline__ __m128d __DEFAULT_FN_ATTRS
1909 _mm_mask_fnmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
1911 return (__m128d) __builtin_ia32_vfnmsubpd128_mask ((__v2df) __A,
1917 static __inline__ __m128d __DEFAULT_FN_ATTRS
1918 _mm_mask3_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
1920 return (__m128d) __builtin_ia32_vfnmsubpd128_mask3 ((__v2df) __A,
1926 static __inline__ __m256d __DEFAULT_FN_ATTRS
1927 _mm256_mask_fnmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1929 return (__m256d) __builtin_ia32_vfnmsubpd256_mask ((__v4df) __A,
1935 static __inline__ __m256d __DEFAULT_FN_ATTRS
1936 _mm256_mask3_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1938 return (__m256d) __builtin_ia32_vfnmsubpd256_mask3 ((__v4df) __A,
1944 static __inline__ __m128 __DEFAULT_FN_ATTRS
1945 _mm_mask_fnmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1947 return (__m128) __builtin_ia32_vfnmsubps128_mask ((__v4sf) __A,
1953 static __inline__ __m128 __DEFAULT_FN_ATTRS
1954 _mm_mask3_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1956 return (__m128) __builtin_ia32_vfnmsubps128_mask3 ((__v4sf) __A,
1962 static __inline__ __m256 __DEFAULT_FN_ATTRS
1963 _mm256_mask_fnmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
1965 return (__m256) __builtin_ia32_vfnmsubps256_mask ((__v8sf) __A,
1971 static __inline__ __m256 __DEFAULT_FN_ATTRS
1972 _mm256_mask3_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1974 return (__m256) __builtin_ia32_vfnmsubps256_mask3 ((__v8sf) __A,
1980 #undef __DEFAULT_FN_ATTRS
1982 #endif /* __AVX512VLINTRIN_H */