]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - contrib/llvm-project/clang/lib/Headers/avx512vlvnniintrin.h
Merge llvm, clang, compiler-rt, libc++, libunwind, lld, lldb and openmp
[FreeBSD/FreeBSD.git] / contrib / llvm-project / clang / lib / Headers / avx512vlvnniintrin.h
1 /*===------------- avx512vlvnniintrin.h - VNNI intrinsics ------------------===
2  *
3  *
4  * Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
5  * See https://llvm.org/LICENSE.txt for license information.
6  * SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
7  *
8  *===-----------------------------------------------------------------------===
9  */
10 #ifndef __IMMINTRIN_H
11 #error "Never use <avx512vlvnniintrin.h> directly; include <immintrin.h> instead."
12 #endif
13
14 #ifndef __AVX512VLVNNIINTRIN_H
15 #define __AVX512VLVNNIINTRIN_H
16
17 /* Define the default attributes for the functions in this file. */
18 #define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512vnni"), __min_vector_width__(128)))
19 #define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512vnni"), __min_vector_width__(256)))
20
21
22 static __inline__ __m256i __DEFAULT_FN_ATTRS256
23 _mm256_dpbusd_epi32(__m256i __S, __m256i __A, __m256i __B)
24 {
25   return (__m256i)__builtin_ia32_vpdpbusd256((__v8si)__S, (__v8si)__A,
26                                              (__v8si)__B);
27 }
28
29 static __inline__ __m256i __DEFAULT_FN_ATTRS256
30 _mm256_mask_dpbusd_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
31 {
32   return (__m256i)__builtin_ia32_selectd_256(__U,
33                                      (__v8si)_mm256_dpbusd_epi32(__S, __A, __B),
34                                      (__v8si)__S);
35 }
36
37 static __inline__ __m256i __DEFAULT_FN_ATTRS256
38 _mm256_maskz_dpbusd_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
39 {
40   return (__m256i)__builtin_ia32_selectd_256(__U,
41                                      (__v8si)_mm256_dpbusd_epi32(__S, __A, __B),
42                                      (__v8si)_mm256_setzero_si256());
43 }
44
45 static __inline__ __m256i __DEFAULT_FN_ATTRS256
46 _mm256_dpbusds_epi32(__m256i __S, __m256i __A, __m256i __B)
47 {
48   return (__m256i)__builtin_ia32_vpdpbusds256((__v8si)__S, (__v8si)__A,
49                                               (__v8si)__B);
50 }
51
52 static __inline__ __m256i __DEFAULT_FN_ATTRS256
53 _mm256_mask_dpbusds_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
54 {
55   return (__m256i)__builtin_ia32_selectd_256(__U,
56                                     (__v8si)_mm256_dpbusds_epi32(__S, __A, __B),
57                                     (__v8si)__S);
58 }
59
60 static __inline__ __m256i __DEFAULT_FN_ATTRS256
61 _mm256_maskz_dpbusds_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
62 {
63   return (__m256i)__builtin_ia32_selectd_256(__U,
64                                      (__v8si)_mm256_dpbusds_epi32(__S, __A, __B),
65                                      (__v8si)_mm256_setzero_si256());
66 }
67
68 static __inline__ __m256i __DEFAULT_FN_ATTRS256
69 _mm256_dpwssd_epi32(__m256i __S, __m256i __A, __m256i __B)
70 {
71   return (__m256i)__builtin_ia32_vpdpwssd256((__v8si)__S, (__v8si)__A,
72                                              (__v8si)__B);
73 }
74
75 static __inline__ __m256i __DEFAULT_FN_ATTRS256
76 _mm256_mask_dpwssd_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
77 {
78   return (__m256i)__builtin_ia32_selectd_256(__U,
79                                      (__v8si)_mm256_dpwssd_epi32(__S, __A, __B),
80                                      (__v8si)__S);
81 }
82
83 static __inline__ __m256i __DEFAULT_FN_ATTRS256
84 _mm256_maskz_dpwssd_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
85 {
86   return (__m256i)__builtin_ia32_selectd_256(__U,
87                                      (__v8si)_mm256_dpwssd_epi32(__S, __A, __B),
88                                      (__v8si)_mm256_setzero_si256());
89 }
90
91 static __inline__ __m256i __DEFAULT_FN_ATTRS256
92 _mm256_dpwssds_epi32(__m256i __S, __m256i __A, __m256i __B)
93 {
94   return (__m256i)__builtin_ia32_vpdpwssds256((__v8si)__S, (__v8si)__A,
95                                               (__v8si)__B);
96 }
97
98 static __inline__ __m256i __DEFAULT_FN_ATTRS256
99 _mm256_mask_dpwssds_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
100 {
101   return (__m256i)__builtin_ia32_selectd_256(__U,
102                                     (__v8si)_mm256_dpwssds_epi32(__S, __A, __B),
103                                     (__v8si)__S);
104 }
105
106 static __inline__ __m256i __DEFAULT_FN_ATTRS256
107 _mm256_maskz_dpwssds_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
108 {
109   return (__m256i)__builtin_ia32_selectd_256(__U,
110                                     (__v8si)_mm256_dpwssds_epi32(__S, __A, __B),
111                                     (__v8si)_mm256_setzero_si256());
112 }
113
114 static __inline__ __m128i __DEFAULT_FN_ATTRS128
115 _mm_dpbusd_epi32(__m128i __S, __m128i __A, __m128i __B)
116 {
117   return (__m128i)__builtin_ia32_vpdpbusd128((__v4si)__S, (__v4si)__A,
118                                              (__v4si)__B);
119 }
120
121 static __inline__ __m128i __DEFAULT_FN_ATTRS128
122 _mm_mask_dpbusd_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
123 {
124   return (__m128i)__builtin_ia32_selectd_128(__U,
125                                         (__v4si)_mm_dpbusd_epi32(__S, __A, __B),
126                                         (__v4si)__S);
127 }
128
129 static __inline__ __m128i __DEFAULT_FN_ATTRS128
130 _mm_maskz_dpbusd_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
131 {
132   return (__m128i)__builtin_ia32_selectd_128(__U,
133                                         (__v4si)_mm_dpbusd_epi32(__S, __A, __B),
134                                         (__v4si)_mm_setzero_si128());
135 }
136
137 static __inline__ __m128i __DEFAULT_FN_ATTRS128
138 _mm_dpbusds_epi32(__m128i __S, __m128i __A, __m128i __B)
139 {
140   return (__m128i)__builtin_ia32_vpdpbusds128((__v4si)__S, (__v4si)__A,
141                                               (__v4si)__B);
142 }
143
144 static __inline__ __m128i __DEFAULT_FN_ATTRS128
145 _mm_mask_dpbusds_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
146 {
147   return (__m128i)__builtin_ia32_selectd_128(__U,
148                                        (__v4si)_mm_dpbusds_epi32(__S, __A, __B),
149                                        (__v4si)__S);
150 }
151
152 static __inline__ __m128i __DEFAULT_FN_ATTRS128
153 _mm_maskz_dpbusds_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
154 {
155   return (__m128i)__builtin_ia32_selectd_128(__U,
156                                        (__v4si)_mm_dpbusds_epi32(__S, __A, __B),
157                                        (__v4si)_mm_setzero_si128());
158 }
159
160 static __inline__ __m128i __DEFAULT_FN_ATTRS128
161 _mm_dpwssd_epi32(__m128i __S, __m128i __A, __m128i __B)
162 {
163   return (__m128i)__builtin_ia32_vpdpwssd128((__v4si)__S, (__v4si)__A,
164                                              (__v4si)__B);
165 }
166
167 static __inline__ __m128i __DEFAULT_FN_ATTRS128
168 _mm_mask_dpwssd_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
169 {
170   return (__m128i)__builtin_ia32_selectd_128(__U,
171                                         (__v4si)_mm_dpwssd_epi32(__S, __A, __B),
172                                         (__v4si)__S);
173 }
174
175 static __inline__ __m128i __DEFAULT_FN_ATTRS128
176 _mm_maskz_dpwssd_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
177 {
178   return (__m128i)__builtin_ia32_selectd_128(__U,
179                                         (__v4si)_mm_dpwssd_epi32(__S, __A, __B),
180                                         (__v4si)_mm_setzero_si128());
181 }
182
183 static __inline__ __m128i __DEFAULT_FN_ATTRS128
184 _mm_dpwssds_epi32(__m128i __S, __m128i __A, __m128i __B)
185 {
186   return (__m128i)__builtin_ia32_vpdpwssds128((__v4si)__S, (__v4si)__A,
187                                               (__v4si)__B);
188 }
189
190 static __inline__ __m128i __DEFAULT_FN_ATTRS128
191 _mm_mask_dpwssds_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
192 {
193   return (__m128i)__builtin_ia32_selectd_128(__U,
194                                        (__v4si)_mm_dpwssds_epi32(__S, __A, __B),
195                                        (__v4si)__S);
196 }
197
198 static __inline__ __m128i __DEFAULT_FN_ATTRS128
199 _mm_maskz_dpwssds_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
200 {
201   return (__m128i)__builtin_ia32_selectd_128(__U,
202                                        (__v4si)_mm_dpwssds_epi32(__S, __A, __B),
203                                        (__v4si)_mm_setzero_si128());
204 }
205
206 #undef __DEFAULT_FN_ATTRS128
207 #undef __DEFAULT_FN_ATTRS256
208
209 #endif