2 # Do not modify. This file is auto-generated from ecp_nistz256-x86_64.pl.
9 .quad 0xffffffffffffffff, 0x00000000ffffffff, 0x0000000000000000, 0xffffffff00000001
13 .quad 0x0000000000000003, 0xfffffffbffffffff, 0xfffffffffffffffe, 0x00000004fffffffd
22 .quad 0x0000000000000001, 0xffffffff00000000, 0xffffffffffffffff, 0x00000000fffffffe
24 .globl ecp_nistz256_mul_by_2
25 .type ecp_nistz256_mul_by_2,@function
27 ecp_nistz256_mul_by_2:
37 leaq .Lpoly(%rip),%rsi
64 .size ecp_nistz256_mul_by_2,.-ecp_nistz256_mul_by_2
68 .globl ecp_nistz256_div_by_2
69 .type ecp_nistz256_div_by_2,@function
71 ecp_nistz256_div_by_2:
80 leaq .Lpoly(%rip),%rsi
124 .size ecp_nistz256_div_by_2,.-ecp_nistz256_div_by_2
128 .globl ecp_nistz256_mul_by_3
129 .type ecp_nistz256_mul_by_3,@function
131 ecp_nistz256_mul_by_3:
150 sbbq .Lpoly+8(%rip),%r9
153 sbbq .Lpoly+24(%rip),%r11
172 sbbq .Lpoly+8(%rip),%r9
175 sbbq .Lpoly+24(%rip),%r11
190 .size ecp_nistz256_mul_by_3,.-ecp_nistz256_mul_by_3
194 .globl ecp_nistz256_add
195 .type ecp_nistz256_add,@function
206 leaq .Lpoly(%rip),%rsi
236 .size ecp_nistz256_add,.-ecp_nistz256_add
240 .globl ecp_nistz256_sub
241 .type ecp_nistz256_sub,@function
252 leaq .Lpoly(%rip),%rsi
282 .size ecp_nistz256_sub,.-ecp_nistz256_sub
286 .globl ecp_nistz256_neg
287 .type ecp_nistz256_neg,@function
304 leaq .Lpoly(%rip),%rsi
328 .size ecp_nistz256_neg,.-ecp_nistz256_neg
333 .globl ecp_nistz256_to_mont
334 .type ecp_nistz256_to_mont,@function
336 ecp_nistz256_to_mont:
338 andl OPENSSL_ia32cap_P+8(%rip),%ecx
341 .size ecp_nistz256_to_mont,.-ecp_nistz256_to_mont
349 .globl ecp_nistz256_mul_mont
350 .type ecp_nistz256_mul_mont,@function
352 ecp_nistz256_mul_mont:
354 andl OPENSSL_ia32cap_P+8(%rip),%ecx
371 call __ecp_nistz256_mul_montq
384 call __ecp_nistz256_mul_montx
393 .size ecp_nistz256_mul_mont,.-ecp_nistz256_mul_mont
395 .type __ecp_nistz256_mul_montq,@function
397 __ecp_nistz256_mul_montq:
402 movq .Lpoly+8(%rip),%r14
408 movq .Lpoly+24(%rip),%r15
609 .size __ecp_nistz256_mul_montq,.-__ecp_nistz256_mul_montq
618 .globl ecp_nistz256_sqr_mont
619 .type ecp_nistz256_sqr_mont,@function
621 ecp_nistz256_sqr_mont:
623 andl OPENSSL_ia32cap_P+8(%rip),%ecx
637 call __ecp_nistz256_sqr_montq
648 call __ecp_nistz256_sqr_montx
657 .size ecp_nistz256_sqr_mont,.-ecp_nistz256_sqr_mont
659 .type __ecp_nistz256_sqr_montq,@function
661 __ecp_nistz256_sqr_montq:
736 movq .Lpoly+8(%rip),%rsi
737 movq .Lpoly+24(%rip),%rbp
819 .size __ecp_nistz256_sqr_montq,.-__ecp_nistz256_sqr_montq
820 .type __ecp_nistz256_mul_montx,@function
822 __ecp_nistz256_mul_montx:
830 movq .Lpoly+24(%rip),%r15
854 mulxq 0+128(%rsi),%rcx,%rbp
858 mulxq 8+128(%rsi),%rcx,%rbp
862 mulxq 16+128(%rsi),%rcx,%rbp
866 mulxq 24+128(%rsi),%rcx,%rbp
891 mulxq 0+128(%rsi),%rcx,%rbp
895 mulxq 8+128(%rsi),%rcx,%rbp
899 mulxq 16+128(%rsi),%rcx,%rbp
903 mulxq 24+128(%rsi),%rcx,%rbp
928 mulxq 0+128(%rsi),%rcx,%rbp
932 mulxq 8+128(%rsi),%rcx,%rbp
936 mulxq 16+128(%rsi),%rcx,%rbp
940 mulxq 24+128(%rsi),%rcx,%rbp
958 movq .Lpoly+8(%rip),%r14
985 .size __ecp_nistz256_mul_montx,.-__ecp_nistz256_mul_montx
987 .type __ecp_nistz256_sqr_montx,@function
989 __ecp_nistz256_sqr_montx:
1001 mulxq %r15,%rcx,%rbp
1013 movq 0+128(%rsi),%rdx
1021 movq 8+128(%rsi),%rdx
1025 mulxq %rdx,%rcx,%rax
1026 movq 16+128(%rsi),%rdx
1031 mulxq %rdx,%rcx,%rbp
1032 movq 24+128(%rsi),%rdx
1039 mulxq %rdx,%rcx,%rax
1045 movq .Lpoly+24(%rip),%rbp
1065 shlxq %rsi,%r10,%rcx
1067 shrxq %rsi,%r10,%rax
1073 mulxq %rbp,%rcx,%r10
1076 shlxq %rsi,%r11,%rcx
1078 shrxq %rsi,%r11,%rax
1084 mulxq %rbp,%rcx,%r11
1090 movq .Lpoly+8(%rip),%rsi
1117 .size __ecp_nistz256_sqr_montx,.-__ecp_nistz256_sqr_montx
1124 .globl ecp_nistz256_from_mont
1125 .type ecp_nistz256_from_mont,@function
1127 ecp_nistz256_from_mont:
1132 movq .Lpoly+24(%rip),%r13
1137 movq .Lpoly+8(%rip),%r12
1213 .size ecp_nistz256_from_mont,.-ecp_nistz256_from_mont
1216 .globl ecp_nistz256_select_w5
1217 .type ecp_nistz256_select_w5,@function
1219 ecp_nistz256_select_w5:
1220 movl OPENSSL_ia32cap_P+8(%rip),%eax
1222 jnz .Lavx2_select_w5
1223 movdqa .LOne(%rip),%xmm0
1234 pshufd $0,%xmm1,%xmm1
1237 .Lselect_loop_sse_w5:
1241 pcmpeqd %xmm1,%xmm15
1243 movdqa 0(%rsi),%xmm9
1244 movdqa 16(%rsi),%xmm10
1245 movdqa 32(%rsi),%xmm11
1246 movdqa 48(%rsi),%xmm12
1247 movdqa 64(%rsi),%xmm13
1248 movdqa 80(%rsi),%xmm14
1265 jnz .Lselect_loop_sse_w5
1267 movdqu %xmm2,0(%rdi)
1268 movdqu %xmm3,16(%rdi)
1269 movdqu %xmm4,32(%rdi)
1270 movdqu %xmm5,48(%rdi)
1271 movdqu %xmm6,64(%rdi)
1272 movdqu %xmm7,80(%rdi)
1274 .size ecp_nistz256_select_w5,.-ecp_nistz256_select_w5
1278 .globl ecp_nistz256_select_w7
1279 .type ecp_nistz256_select_w7,@function
1281 ecp_nistz256_select_w7:
1282 movl OPENSSL_ia32cap_P+8(%rip),%eax
1284 jnz .Lavx2_select_w7
1285 movdqa .LOne(%rip),%xmm8
1294 pshufd $0,%xmm1,%xmm1
1297 .Lselect_loop_sse_w7:
1300 movdqa 0(%rsi),%xmm9
1301 movdqa 16(%rsi),%xmm10
1302 pcmpeqd %xmm1,%xmm15
1303 movdqa 32(%rsi),%xmm11
1304 movdqa 48(%rsi),%xmm12
1314 prefetcht0 255(%rsi)
1318 jnz .Lselect_loop_sse_w7
1320 movdqu %xmm2,0(%rdi)
1321 movdqu %xmm3,16(%rdi)
1322 movdqu %xmm4,32(%rdi)
1323 movdqu %xmm5,48(%rdi)
1325 .size ecp_nistz256_select_w7,.-ecp_nistz256_select_w7
1328 .type ecp_nistz256_avx2_select_w5,@function
1330 ecp_nistz256_avx2_select_w5:
1333 vmovdqa .LTwo(%rip),%ymm0
1335 vpxor %ymm2,%ymm2,%ymm2
1336 vpxor %ymm3,%ymm3,%ymm3
1337 vpxor %ymm4,%ymm4,%ymm4
1339 vmovdqa .LOne(%rip),%ymm5
1340 vmovdqa .LTwo(%rip),%ymm10
1343 vpermd %ymm1,%ymm2,%ymm1
1346 .Lselect_loop_avx2_w5:
1348 vmovdqa 0(%rsi),%ymm6
1349 vmovdqa 32(%rsi),%ymm7
1350 vmovdqa 64(%rsi),%ymm8
1352 vmovdqa 96(%rsi),%ymm11
1353 vmovdqa 128(%rsi),%ymm12
1354 vmovdqa 160(%rsi),%ymm13
1356 vpcmpeqd %ymm1,%ymm5,%ymm9
1357 vpcmpeqd %ymm1,%ymm10,%ymm14
1359 vpaddd %ymm0,%ymm5,%ymm5
1360 vpaddd %ymm0,%ymm10,%ymm10
1363 vpand %ymm9,%ymm6,%ymm6
1364 vpand %ymm9,%ymm7,%ymm7
1365 vpand %ymm9,%ymm8,%ymm8
1366 vpand %ymm14,%ymm11,%ymm11
1367 vpand %ymm14,%ymm12,%ymm12
1368 vpand %ymm14,%ymm13,%ymm13
1370 vpxor %ymm6,%ymm2,%ymm2
1371 vpxor %ymm7,%ymm3,%ymm3
1372 vpxor %ymm8,%ymm4,%ymm4
1373 vpxor %ymm11,%ymm2,%ymm2
1374 vpxor %ymm12,%ymm3,%ymm3
1375 vpxor %ymm13,%ymm4,%ymm4
1378 jnz .Lselect_loop_avx2_w5
1380 vmovdqu %ymm2,0(%rdi)
1381 vmovdqu %ymm3,32(%rdi)
1382 vmovdqu %ymm4,64(%rdi)
1385 .size ecp_nistz256_avx2_select_w5,.-ecp_nistz256_avx2_select_w5
1389 .globl ecp_nistz256_avx2_select_w7
1390 .type ecp_nistz256_avx2_select_w7,@function
1392 ecp_nistz256_avx2_select_w7:
1395 vmovdqa .LThree(%rip),%ymm0
1397 vpxor %ymm2,%ymm2,%ymm2
1398 vpxor %ymm3,%ymm3,%ymm3
1400 vmovdqa .LOne(%rip),%ymm4
1401 vmovdqa .LTwo(%rip),%ymm8
1402 vmovdqa .LThree(%rip),%ymm12
1405 vpermd %ymm1,%ymm2,%ymm1
1409 .Lselect_loop_avx2_w7:
1411 vmovdqa 0(%rsi),%ymm5
1412 vmovdqa 32(%rsi),%ymm6
1414 vmovdqa 64(%rsi),%ymm9
1415 vmovdqa 96(%rsi),%ymm10
1417 vmovdqa 128(%rsi),%ymm13
1418 vmovdqa 160(%rsi),%ymm14
1420 vpcmpeqd %ymm1,%ymm4,%ymm7
1421 vpcmpeqd %ymm1,%ymm8,%ymm11
1422 vpcmpeqd %ymm1,%ymm12,%ymm15
1424 vpaddd %ymm0,%ymm4,%ymm4
1425 vpaddd %ymm0,%ymm8,%ymm8
1426 vpaddd %ymm0,%ymm12,%ymm12
1429 vpand %ymm7,%ymm5,%ymm5
1430 vpand %ymm7,%ymm6,%ymm6
1431 vpand %ymm11,%ymm9,%ymm9
1432 vpand %ymm11,%ymm10,%ymm10
1433 vpand %ymm15,%ymm13,%ymm13
1434 vpand %ymm15,%ymm14,%ymm14
1436 vpxor %ymm5,%ymm2,%ymm2
1437 vpxor %ymm6,%ymm3,%ymm3
1438 vpxor %ymm9,%ymm2,%ymm2
1439 vpxor %ymm10,%ymm3,%ymm3
1440 vpxor %ymm13,%ymm2,%ymm2
1441 vpxor %ymm14,%ymm3,%ymm3
1444 jnz .Lselect_loop_avx2_w7
1447 vmovdqa 0(%rsi),%ymm5
1448 vmovdqa 32(%rsi),%ymm6
1450 vpcmpeqd %ymm1,%ymm4,%ymm7
1452 vpand %ymm7,%ymm5,%ymm5
1453 vpand %ymm7,%ymm6,%ymm6
1455 vpxor %ymm5,%ymm2,%ymm2
1456 vpxor %ymm6,%ymm3,%ymm3
1458 vmovdqu %ymm2,0(%rdi)
1459 vmovdqu %ymm3,32(%rdi)
1462 .size ecp_nistz256_avx2_select_w7,.-ecp_nistz256_avx2_select_w7
1463 .type __ecp_nistz256_add_toq,@function
1465 __ecp_nistz256_add_toq:
1492 .size __ecp_nistz256_add_toq,.-__ecp_nistz256_add_toq
1494 .type __ecp_nistz256_sub_fromq,@function
1496 __ecp_nistz256_sub_fromq:
1523 .size __ecp_nistz256_sub_fromq,.-__ecp_nistz256_sub_fromq
1525 .type __ecp_nistz256_subq,@function
1527 __ecp_nistz256_subq:
1550 .size __ecp_nistz256_subq,.-__ecp_nistz256_subq
1552 .type __ecp_nistz256_mul_by_2q,@function
1554 __ecp_nistz256_mul_by_2q:
1581 .size __ecp_nistz256_mul_by_2q,.-__ecp_nistz256_mul_by_2q
1582 .globl ecp_nistz256_point_double
1583 .type ecp_nistz256_point_double,@function
1585 ecp_nistz256_point_double:
1587 andl OPENSSL_ia32cap_P+8(%rip),%ecx
1598 .Lpoint_double_shortcutq:
1599 movdqu 0(%rsi),%xmm0
1601 movdqu 16(%rsi),%xmm1
1602 movq 32+0(%rsi),%r12
1603 movq 32+8(%rsi),%r13
1604 movq 32+16(%rsi),%r8
1605 movq 32+24(%rsi),%r9
1606 movq .Lpoly+8(%rip),%r14
1607 movq .Lpoly+24(%rip),%r15
1608 movdqa %xmm0,96(%rsp)
1609 movdqa %xmm1,96+16(%rsp)
1612 .byte 102,72,15,110,199
1613 .byte 102,73,15,110,202
1614 .byte 102,73,15,110,211
1617 call __ecp_nistz256_mul_by_2q
1619 movq 64+0(%rsi),%rax
1620 movq 64+8(%rsi),%r14
1621 movq 64+16(%rsi),%r15
1622 movq 64+24(%rsi),%r8
1623 leaq 64-0(%rsi),%rsi
1625 call __ecp_nistz256_sqr_montq
1630 movq 16+0(%rsp),%r15
1633 call __ecp_nistz256_sqr_montq
1637 movq 64+8(%rbx),%r10
1638 movq 64+16(%rbx),%r11
1639 movq 64+24(%rbx),%r12
1640 leaq 64-0(%rbx),%rsi
1642 .byte 102,72,15,126,215
1643 call __ecp_nistz256_mul_montq
1644 call __ecp_nistz256_mul_by_2q
1646 movq 96+0(%rsp),%r12
1647 movq 96+8(%rsp),%r13
1649 movq 96+16(%rsp),%r8
1650 movq 96+24(%rsp),%r9
1652 call __ecp_nistz256_add_toq
1654 movq 96+0(%rsp),%r12
1655 movq 96+8(%rsp),%r13
1657 movq 96+16(%rsp),%r8
1658 movq 96+24(%rsp),%r9
1660 call __ecp_nistz256_sub_fromq
1665 movq 16+0(%rsp),%r15
1667 .byte 102,72,15,126,207
1668 call __ecp_nistz256_sqr_montq
1710 movq 8+32(%rsp),%r10
1711 leaq 0+32(%rsp),%rsi
1712 movq 16+32(%rsp),%r11
1713 movq 24+32(%rsp),%r12
1715 call __ecp_nistz256_mul_montq
1718 call __ecp_nistz256_mul_by_2q
1722 call __ecp_nistz256_add_toq
1729 movq 16+0(%rsp),%r11
1730 movq 24+0(%rsp),%r12
1732 call __ecp_nistz256_mul_montq
1735 call __ecp_nistz256_mul_by_2q
1737 movq 0+32(%rsp),%rax
1738 movq 8+32(%rsp),%r14
1739 leaq 0+32(%rsp),%rsi
1740 movq 16+32(%rsp),%r15
1741 movq 24+32(%rsp),%r8
1742 .byte 102,72,15,126,199
1743 call __ecp_nistz256_sqr_montq
1750 call __ecp_nistz256_sub_fromq
1754 movq 0+16(%rsp),%rcx
1755 movq 0+24(%rsp),%r10
1757 call __ecp_nistz256_subq
1773 call __ecp_nistz256_mul_montq
1775 .byte 102,72,15,126,203
1776 .byte 102,72,15,126,207
1777 call __ecp_nistz256_sub_fromq
1787 .size ecp_nistz256_point_double,.-ecp_nistz256_point_double
1788 .globl ecp_nistz256_point_add
1789 .type ecp_nistz256_point_add,@function
1791 ecp_nistz256_point_add:
1793 andl OPENSSL_ia32cap_P+8(%rip),%ecx
1804 movdqu 0(%rsi),%xmm0
1805 movdqu 16(%rsi),%xmm1
1806 movdqu 32(%rsi),%xmm2
1807 movdqu 48(%rsi),%xmm3
1808 movdqu 64(%rsi),%xmm4
1809 movdqu 80(%rsi),%xmm5
1812 movdqa %xmm0,384(%rsp)
1813 movdqa %xmm1,384+16(%rsp)
1815 movdqa %xmm2,416(%rsp)
1816 movdqa %xmm3,416+16(%rsp)
1818 movdqa %xmm4,448(%rsp)
1819 movdqa %xmm5,448+16(%rsp)
1822 movdqu 0(%rsi),%xmm0
1823 pshufd $0xb1,%xmm3,%xmm5
1824 movdqu 16(%rsi),%xmm1
1825 movdqu 32(%rsi),%xmm2
1827 movdqu 48(%rsi),%xmm3
1828 movq 64+0(%rsi),%rax
1829 movq 64+8(%rsi),%r14
1830 movq 64+16(%rsi),%r15
1831 movq 64+24(%rsi),%r8
1832 movdqa %xmm0,480(%rsp)
1833 pshufd $0x1e,%xmm5,%xmm4
1834 movdqa %xmm1,480+16(%rsp)
1836 .byte 102,72,15,110,199
1837 movdqa %xmm2,512(%rsp)
1838 movdqa %xmm3,512+16(%rsp)
1844 leaq 64-0(%rsi),%rsi
1845 movq %rax,544+0(%rsp)
1846 movq %r14,544+8(%rsp)
1847 movq %r15,544+16(%rsp)
1848 movq %r8,544+24(%rsp)
1850 call __ecp_nistz256_sqr_montq
1853 pshufd $0xb1,%xmm3,%xmm4
1855 pshufd $0,%xmm5,%xmm5
1856 pshufd $0x1e,%xmm4,%xmm3
1860 pshufd $0,%xmm4,%xmm4
1861 movq 64+0(%rbx),%rax
1862 movq 64+8(%rbx),%r14
1863 movq 64+16(%rbx),%r15
1864 movq 64+24(%rbx),%r8
1865 .byte 102,72,15,110,203
1867 leaq 64-0(%rbx),%rsi
1869 call __ecp_nistz256_sqr_montq
1874 movq 8+96(%rsp),%r10
1875 leaq 0+96(%rsp),%rsi
1876 movq 16+96(%rsp),%r11
1877 movq 24+96(%rsp),%r12
1879 call __ecp_nistz256_mul_montq
1884 movq 8+32(%rsp),%r10
1885 leaq 0+32(%rsp),%rsi
1886 movq 16+32(%rsp),%r11
1887 movq 24+32(%rsp),%r12
1889 call __ecp_nistz256_mul_montq
1893 movq 0+224(%rsp),%r9
1894 movq 8+224(%rsp),%r10
1895 leaq 0+224(%rsp),%rsi
1896 movq 16+224(%rsp),%r11
1897 movq 24+224(%rsp),%r12
1899 call __ecp_nistz256_mul_montq
1903 movq 0+256(%rsp),%r9
1904 movq 8+256(%rsp),%r10
1905 leaq 0+256(%rsp),%rsi
1906 movq 16+256(%rsp),%r11
1907 movq 24+256(%rsp),%r12
1909 call __ecp_nistz256_mul_montq
1913 call __ecp_nistz256_sub_fromq
1920 .byte 102,73,15,110,220
1925 movq 8+96(%rsp),%r10
1926 leaq 0+96(%rsp),%rsi
1927 movq 16+96(%rsp),%r11
1928 movq 24+96(%rsp),%r12
1930 call __ecp_nistz256_mul_montq
1935 movq 8+32(%rsp),%r10
1936 leaq 0+32(%rsp),%rsi
1937 movq 16+32(%rsp),%r11
1938 movq 24+32(%rsp),%r12
1940 call __ecp_nistz256_mul_montq
1944 call __ecp_nistz256_sub_fromq
1952 .byte 102,73,15,126,208
1953 .byte 102,73,15,126,217
1959 .byte 102,72,15,126,199
1961 movdqu %xmm0,0(%rdi)
1962 movdqu %xmm0,16(%rdi)
1963 movdqu %xmm0,32(%rdi)
1964 movdqu %xmm0,48(%rdi)
1965 movdqu %xmm0,64(%rdi)
1966 movdqu %xmm0,80(%rdi)
1971 .byte 102,72,15,126,206
1972 .byte 102,72,15,126,199
1974 jmp .Lpoint_double_shortcutq
1978 movq 0+64(%rsp),%rax
1979 movq 8+64(%rsp),%r14
1980 leaq 0+64(%rsp),%rsi
1981 movq 16+64(%rsp),%r15
1982 movq 24+64(%rsp),%r8
1984 call __ecp_nistz256_sqr_montq
1991 movq 16+0(%rsp),%r11
1992 movq 24+0(%rsp),%r12
1994 call __ecp_nistz256_mul_montq
1999 movq 16+0(%rsp),%r15
2002 call __ecp_nistz256_sqr_montq
2006 movq 0+352(%rsp),%r9
2007 movq 8+352(%rsp),%r10
2008 leaq 0+352(%rsp),%rsi
2009 movq 16+352(%rsp),%r11
2010 movq 24+352(%rsp),%r12
2012 call __ecp_nistz256_mul_montq
2017 movq 8+32(%rsp),%r10
2018 leaq 0+32(%rsp),%rsi
2019 movq 16+32(%rsp),%r11
2020 movq 24+32(%rsp),%r12
2022 call __ecp_nistz256_mul_montq
2027 movq 8+32(%rsp),%r10
2028 leaq 0+32(%rsp),%rsi
2029 movq 16+32(%rsp),%r11
2030 movq 24+32(%rsp),%r12
2032 call __ecp_nistz256_mul_montq
2063 call __ecp_nistz256_subq
2067 call __ecp_nistz256_sub_fromq
2069 movq 192+0(%rsp),%rax
2070 movq 192+8(%rsp),%rbp
2071 movq 192+16(%rsp),%rcx
2072 movq 192+24(%rsp),%r10
2075 call __ecp_nistz256_subq
2083 movq 0+224(%rsp),%r9
2084 movq 8+224(%rsp),%r10
2085 leaq 0+224(%rsp),%rsi
2086 movq 16+224(%rsp),%r11
2087 movq 24+224(%rsp),%r12
2089 call __ecp_nistz256_mul_montq
2094 movq 8+64(%rsp),%r10
2095 leaq 0+64(%rsp),%rsi
2096 movq 16+64(%rsp),%r11
2097 movq 24+64(%rsp),%r12
2099 call __ecp_nistz256_mul_montq
2103 call __ecp_nistz256_sub_fromq
2105 .byte 102,72,15,126,199
2109 pandn 352(%rsp),%xmm0
2111 pandn 352+16(%rsp),%xmm1
2113 pand 544(%rsp),%xmm2
2114 pand 544+16(%rsp),%xmm3
2124 pand 448(%rsp),%xmm2
2125 pand 448+16(%rsp),%xmm3
2128 movdqu %xmm2,64(%rdi)
2129 movdqu %xmm3,80(%rdi)
2133 pandn 288(%rsp),%xmm0
2135 pandn 288+16(%rsp),%xmm1
2137 pand 480(%rsp),%xmm2
2138 pand 480+16(%rsp),%xmm3
2148 pand 384(%rsp),%xmm2
2149 pand 384+16(%rsp),%xmm3
2152 movdqu %xmm2,0(%rdi)
2153 movdqu %xmm3,16(%rdi)
2157 pandn 320(%rsp),%xmm0
2159 pandn 320+16(%rsp),%xmm1
2161 pand 512(%rsp),%xmm2
2162 pand 512+16(%rsp),%xmm3
2172 pand 416(%rsp),%xmm2
2173 pand 416+16(%rsp),%xmm3
2176 movdqu %xmm2,32(%rdi)
2177 movdqu %xmm3,48(%rdi)
2188 .size ecp_nistz256_point_add,.-ecp_nistz256_point_add
2189 .globl ecp_nistz256_point_add_affine
2190 .type ecp_nistz256_point_add_affine,@function
2192 ecp_nistz256_point_add_affine:
2194 andl OPENSSL_ia32cap_P+8(%rip),%ecx
2196 je .Lpoint_add_affinex
2205 movdqu 0(%rsi),%xmm0
2207 movdqu 16(%rsi),%xmm1
2208 movdqu 32(%rsi),%xmm2
2209 movdqu 48(%rsi),%xmm3
2210 movdqu 64(%rsi),%xmm4
2211 movdqu 80(%rsi),%xmm5
2212 movq 64+0(%rsi),%rax
2213 movq 64+8(%rsi),%r14
2214 movq 64+16(%rsi),%r15
2215 movq 64+24(%rsi),%r8
2216 movdqa %xmm0,320(%rsp)
2217 movdqa %xmm1,320+16(%rsp)
2219 movdqa %xmm2,352(%rsp)
2220 movdqa %xmm3,352+16(%rsp)
2222 movdqa %xmm4,384(%rsp)
2223 movdqa %xmm5,384+16(%rsp)
2226 movdqu 0(%rbx),%xmm0
2227 pshufd $0xb1,%xmm3,%xmm5
2228 movdqu 16(%rbx),%xmm1
2229 movdqu 32(%rbx),%xmm2
2231 movdqu 48(%rbx),%xmm3
2232 movdqa %xmm0,416(%rsp)
2233 pshufd $0x1e,%xmm5,%xmm4
2234 movdqa %xmm1,416+16(%rsp)
2236 .byte 102,72,15,110,199
2237 movdqa %xmm2,448(%rsp)
2238 movdqa %xmm3,448+16(%rsp)
2244 leaq 64-0(%rsi),%rsi
2246 call __ecp_nistz256_sqr_montq
2249 pshufd $0xb1,%xmm3,%xmm4
2254 pshufd $0,%xmm5,%xmm5
2255 pshufd $0x1e,%xmm4,%xmm3
2261 pshufd $0,%xmm4,%xmm4
2263 leaq 32-0(%rsp),%rsi
2266 call __ecp_nistz256_mul_montq
2270 call __ecp_nistz256_sub_fromq
2275 movq 8+32(%rsp),%r10
2276 leaq 0+32(%rsp),%rsi
2277 movq 16+32(%rsp),%r11
2278 movq 24+32(%rsp),%r12
2280 call __ecp_nistz256_mul_montq
2285 movq 8+64(%rsp),%r10
2286 leaq 0+64(%rsp),%rsi
2287 movq 16+64(%rsp),%r11
2288 movq 24+64(%rsp),%r12
2290 call __ecp_nistz256_mul_montq
2295 movq 8+32(%rsp),%r10
2296 leaq 0+32(%rsp),%rsi
2297 movq 16+32(%rsp),%r11
2298 movq 24+32(%rsp),%r12
2300 call __ecp_nistz256_mul_montq
2304 call __ecp_nistz256_sub_fromq
2306 movq 0+64(%rsp),%rax
2307 movq 8+64(%rsp),%r14
2308 leaq 0+64(%rsp),%rsi
2309 movq 16+64(%rsp),%r15
2310 movq 24+64(%rsp),%r8
2312 call __ecp_nistz256_sqr_montq
2314 movq 0+96(%rsp),%rax
2315 movq 8+96(%rsp),%r14
2316 leaq 0+96(%rsp),%rsi
2317 movq 16+96(%rsp),%r15
2318 movq 24+96(%rsp),%r8
2320 call __ecp_nistz256_sqr_montq
2325 movq 8+64(%rsp),%r10
2326 leaq 0+64(%rsp),%rsi
2327 movq 16+64(%rsp),%r11
2328 movq 24+64(%rsp),%r12
2330 call __ecp_nistz256_mul_montq
2334 movq 0+128(%rsp),%r9
2335 movq 8+128(%rsp),%r10
2336 leaq 0+128(%rsp),%rsi
2337 movq 16+128(%rsp),%r11
2338 movq 24+128(%rsp),%r12
2340 call __ecp_nistz256_mul_montq
2371 call __ecp_nistz256_subq
2375 call __ecp_nistz256_sub_fromq
2379 movq 0+16(%rsp),%rcx
2380 movq 0+24(%rsp),%r10
2383 call __ecp_nistz256_subq
2391 movq 0+160(%rsp),%r9
2392 movq 8+160(%rsp),%r10
2393 leaq 0+160(%rsp),%rsi
2394 movq 16+160(%rsp),%r11
2395 movq 24+160(%rsp),%r12
2397 call __ecp_nistz256_mul_montq
2402 movq 8+64(%rsp),%r10
2403 leaq 0+64(%rsp),%rsi
2404 movq 16+64(%rsp),%r11
2405 movq 24+64(%rsp),%r12
2407 call __ecp_nistz256_mul_montq
2411 call __ecp_nistz256_sub_fromq
2413 .byte 102,72,15,126,199
2417 pandn 288(%rsp),%xmm0
2419 pandn 288+16(%rsp),%xmm1
2421 pand .LONE_mont(%rip),%xmm2
2422 pand .LONE_mont+16(%rip),%xmm3
2432 pand 384(%rsp),%xmm2
2433 pand 384+16(%rsp),%xmm3
2436 movdqu %xmm2,64(%rdi)
2437 movdqu %xmm3,80(%rdi)
2441 pandn 224(%rsp),%xmm0
2443 pandn 224+16(%rsp),%xmm1
2445 pand 416(%rsp),%xmm2
2446 pand 416+16(%rsp),%xmm3
2456 pand 320(%rsp),%xmm2
2457 pand 320+16(%rsp),%xmm3
2460 movdqu %xmm2,0(%rdi)
2461 movdqu %xmm3,16(%rdi)
2465 pandn 256(%rsp),%xmm0
2467 pandn 256+16(%rsp),%xmm1
2469 pand 448(%rsp),%xmm2
2470 pand 448+16(%rsp),%xmm3
2480 pand 352(%rsp),%xmm2
2481 pand 352+16(%rsp),%xmm3
2484 movdqu %xmm2,32(%rdi)
2485 movdqu %xmm3,48(%rdi)
2495 .size ecp_nistz256_point_add_affine,.-ecp_nistz256_point_add_affine
2496 .type __ecp_nistz256_add_tox,@function
2498 __ecp_nistz256_add_tox:
2527 .size __ecp_nistz256_add_tox,.-__ecp_nistz256_add_tox
2529 .type __ecp_nistz256_sub_fromx,@function
2531 __ecp_nistz256_sub_fromx:
2560 .size __ecp_nistz256_sub_fromx,.-__ecp_nistz256_sub_fromx
2562 .type __ecp_nistz256_subx,@function
2564 __ecp_nistz256_subx:
2589 .size __ecp_nistz256_subx,.-__ecp_nistz256_subx
2591 .type __ecp_nistz256_mul_by_2x,@function
2593 __ecp_nistz256_mul_by_2x:
2622 .size __ecp_nistz256_mul_by_2x,.-__ecp_nistz256_mul_by_2x
2623 .type ecp_nistz256_point_doublex,@function
2625 ecp_nistz256_point_doublex:
2635 .Lpoint_double_shortcutx:
2636 movdqu 0(%rsi),%xmm0
2638 movdqu 16(%rsi),%xmm1
2639 movq 32+0(%rsi),%r12
2640 movq 32+8(%rsi),%r13
2641 movq 32+16(%rsi),%r8
2642 movq 32+24(%rsi),%r9
2643 movq .Lpoly+8(%rip),%r14
2644 movq .Lpoly+24(%rip),%r15
2645 movdqa %xmm0,96(%rsp)
2646 movdqa %xmm1,96+16(%rsp)
2649 .byte 102,72,15,110,199
2650 .byte 102,73,15,110,202
2651 .byte 102,73,15,110,211
2654 call __ecp_nistz256_mul_by_2x
2656 movq 64+0(%rsi),%rdx
2657 movq 64+8(%rsi),%r14
2658 movq 64+16(%rsi),%r15
2659 movq 64+24(%rsi),%r8
2660 leaq 64-128(%rsi),%rsi
2662 call __ecp_nistz256_sqr_montx
2666 leaq -128+0(%rsp),%rsi
2667 movq 16+0(%rsp),%r15
2670 call __ecp_nistz256_sqr_montx
2674 movq 64+8(%rbx),%r10
2675 movq 64+16(%rbx),%r11
2676 movq 64+24(%rbx),%r12
2677 leaq 64-128(%rbx),%rsi
2679 .byte 102,72,15,126,215
2680 call __ecp_nistz256_mul_montx
2681 call __ecp_nistz256_mul_by_2x
2683 movq 96+0(%rsp),%r12
2684 movq 96+8(%rsp),%r13
2686 movq 96+16(%rsp),%r8
2687 movq 96+24(%rsp),%r9
2689 call __ecp_nistz256_add_tox
2691 movq 96+0(%rsp),%r12
2692 movq 96+8(%rsp),%r13
2694 movq 96+16(%rsp),%r8
2695 movq 96+24(%rsp),%r9
2697 call __ecp_nistz256_sub_fromx
2701 leaq -128+0(%rsp),%rsi
2702 movq 16+0(%rsp),%r15
2704 .byte 102,72,15,126,207
2705 call __ecp_nistz256_sqr_montx
2747 movq 8+32(%rsp),%r10
2748 leaq -128+32(%rsp),%rsi
2749 movq 16+32(%rsp),%r11
2750 movq 24+32(%rsp),%r12
2752 call __ecp_nistz256_mul_montx
2755 call __ecp_nistz256_mul_by_2x
2759 call __ecp_nistz256_add_tox
2765 leaq -128+0(%rsp),%rsi
2766 movq 16+0(%rsp),%r11
2767 movq 24+0(%rsp),%r12
2769 call __ecp_nistz256_mul_montx
2772 call __ecp_nistz256_mul_by_2x
2774 movq 0+32(%rsp),%rdx
2775 movq 8+32(%rsp),%r14
2776 leaq -128+32(%rsp),%rsi
2777 movq 16+32(%rsp),%r15
2778 movq 24+32(%rsp),%r8
2779 .byte 102,72,15,126,199
2780 call __ecp_nistz256_sqr_montx
2787 call __ecp_nistz256_sub_fromx
2791 movq 0+16(%rsp),%rcx
2792 movq 0+24(%rsp),%r10
2794 call __ecp_nistz256_subx
2805 leaq 0-128(%rsp),%rsi
2810 call __ecp_nistz256_mul_montx
2812 .byte 102,72,15,126,203
2813 .byte 102,72,15,126,207
2814 call __ecp_nistz256_sub_fromx
2824 .size ecp_nistz256_point_doublex,.-ecp_nistz256_point_doublex
2825 .type ecp_nistz256_point_addx,@function
2827 ecp_nistz256_point_addx:
2837 movdqu 0(%rsi),%xmm0
2838 movdqu 16(%rsi),%xmm1
2839 movdqu 32(%rsi),%xmm2
2840 movdqu 48(%rsi),%xmm3
2841 movdqu 64(%rsi),%xmm4
2842 movdqu 80(%rsi),%xmm5
2845 movdqa %xmm0,384(%rsp)
2846 movdqa %xmm1,384+16(%rsp)
2848 movdqa %xmm2,416(%rsp)
2849 movdqa %xmm3,416+16(%rsp)
2851 movdqa %xmm4,448(%rsp)
2852 movdqa %xmm5,448+16(%rsp)
2855 movdqu 0(%rsi),%xmm0
2856 pshufd $0xb1,%xmm3,%xmm5
2857 movdqu 16(%rsi),%xmm1
2858 movdqu 32(%rsi),%xmm2
2860 movdqu 48(%rsi),%xmm3
2861 movq 64+0(%rsi),%rdx
2862 movq 64+8(%rsi),%r14
2863 movq 64+16(%rsi),%r15
2864 movq 64+24(%rsi),%r8
2865 movdqa %xmm0,480(%rsp)
2866 pshufd $0x1e,%xmm5,%xmm4
2867 movdqa %xmm1,480+16(%rsp)
2869 .byte 102,72,15,110,199
2870 movdqa %xmm2,512(%rsp)
2871 movdqa %xmm3,512+16(%rsp)
2877 leaq 64-128(%rsi),%rsi
2878 movq %rdx,544+0(%rsp)
2879 movq %r14,544+8(%rsp)
2880 movq %r15,544+16(%rsp)
2881 movq %r8,544+24(%rsp)
2883 call __ecp_nistz256_sqr_montx
2886 pshufd $0xb1,%xmm3,%xmm4
2888 pshufd $0,%xmm5,%xmm5
2889 pshufd $0x1e,%xmm4,%xmm3
2893 pshufd $0,%xmm4,%xmm4
2894 movq 64+0(%rbx),%rdx
2895 movq 64+8(%rbx),%r14
2896 movq 64+16(%rbx),%r15
2897 movq 64+24(%rbx),%r8
2898 .byte 102,72,15,110,203
2900 leaq 64-128(%rbx),%rsi
2902 call __ecp_nistz256_sqr_montx
2907 movq 8+96(%rsp),%r10
2908 leaq -128+96(%rsp),%rsi
2909 movq 16+96(%rsp),%r11
2910 movq 24+96(%rsp),%r12
2912 call __ecp_nistz256_mul_montx
2917 movq 8+32(%rsp),%r10
2918 leaq -128+32(%rsp),%rsi
2919 movq 16+32(%rsp),%r11
2920 movq 24+32(%rsp),%r12
2922 call __ecp_nistz256_mul_montx
2926 movq 0+224(%rsp),%r9
2927 movq 8+224(%rsp),%r10
2928 leaq -128+224(%rsp),%rsi
2929 movq 16+224(%rsp),%r11
2930 movq 24+224(%rsp),%r12
2932 call __ecp_nistz256_mul_montx
2936 movq 0+256(%rsp),%r9
2937 movq 8+256(%rsp),%r10
2938 leaq -128+256(%rsp),%rsi
2939 movq 16+256(%rsp),%r11
2940 movq 24+256(%rsp),%r12
2942 call __ecp_nistz256_mul_montx
2946 call __ecp_nistz256_sub_fromx
2953 .byte 102,73,15,110,220
2958 movq 8+96(%rsp),%r10
2959 leaq -128+96(%rsp),%rsi
2960 movq 16+96(%rsp),%r11
2961 movq 24+96(%rsp),%r12
2963 call __ecp_nistz256_mul_montx
2968 movq 8+32(%rsp),%r10
2969 leaq -128+32(%rsp),%rsi
2970 movq 16+32(%rsp),%r11
2971 movq 24+32(%rsp),%r12
2973 call __ecp_nistz256_mul_montx
2977 call __ecp_nistz256_sub_fromx
2985 .byte 102,73,15,126,208
2986 .byte 102,73,15,126,217
2992 .byte 102,72,15,126,199
2994 movdqu %xmm0,0(%rdi)
2995 movdqu %xmm0,16(%rdi)
2996 movdqu %xmm0,32(%rdi)
2997 movdqu %xmm0,48(%rdi)
2998 movdqu %xmm0,64(%rdi)
2999 movdqu %xmm0,80(%rdi)
3004 .byte 102,72,15,126,206
3005 .byte 102,72,15,126,199
3007 jmp .Lpoint_double_shortcutx
3011 movq 0+64(%rsp),%rdx
3012 movq 8+64(%rsp),%r14
3013 leaq -128+64(%rsp),%rsi
3014 movq 16+64(%rsp),%r15
3015 movq 24+64(%rsp),%r8
3017 call __ecp_nistz256_sqr_montx
3023 leaq -128+0(%rsp),%rsi
3024 movq 16+0(%rsp),%r11
3025 movq 24+0(%rsp),%r12
3027 call __ecp_nistz256_mul_montx
3031 leaq -128+0(%rsp),%rsi
3032 movq 16+0(%rsp),%r15
3035 call __ecp_nistz256_sqr_montx
3039 movq 0+352(%rsp),%r9
3040 movq 8+352(%rsp),%r10
3041 leaq -128+352(%rsp),%rsi
3042 movq 16+352(%rsp),%r11
3043 movq 24+352(%rsp),%r12
3045 call __ecp_nistz256_mul_montx
3050 movq 8+32(%rsp),%r10
3051 leaq -128+32(%rsp),%rsi
3052 movq 16+32(%rsp),%r11
3053 movq 24+32(%rsp),%r12
3055 call __ecp_nistz256_mul_montx
3060 movq 8+32(%rsp),%r10
3061 leaq -128+32(%rsp),%rsi
3062 movq 16+32(%rsp),%r11
3063 movq 24+32(%rsp),%r12
3065 call __ecp_nistz256_mul_montx
3096 call __ecp_nistz256_subx
3100 call __ecp_nistz256_sub_fromx
3102 movq 192+0(%rsp),%rax
3103 movq 192+8(%rsp),%rbp
3104 movq 192+16(%rsp),%rcx
3105 movq 192+24(%rsp),%r10
3108 call __ecp_nistz256_subx
3116 movq 0+224(%rsp),%r9
3117 movq 8+224(%rsp),%r10
3118 leaq -128+224(%rsp),%rsi
3119 movq 16+224(%rsp),%r11
3120 movq 24+224(%rsp),%r12
3122 call __ecp_nistz256_mul_montx
3127 movq 8+64(%rsp),%r10
3128 leaq -128+64(%rsp),%rsi
3129 movq 16+64(%rsp),%r11
3130 movq 24+64(%rsp),%r12
3132 call __ecp_nistz256_mul_montx
3136 call __ecp_nistz256_sub_fromx
3138 .byte 102,72,15,126,199
3142 pandn 352(%rsp),%xmm0
3144 pandn 352+16(%rsp),%xmm1
3146 pand 544(%rsp),%xmm2
3147 pand 544+16(%rsp),%xmm3
3157 pand 448(%rsp),%xmm2
3158 pand 448+16(%rsp),%xmm3
3161 movdqu %xmm2,64(%rdi)
3162 movdqu %xmm3,80(%rdi)
3166 pandn 288(%rsp),%xmm0
3168 pandn 288+16(%rsp),%xmm1
3170 pand 480(%rsp),%xmm2
3171 pand 480+16(%rsp),%xmm3
3181 pand 384(%rsp),%xmm2
3182 pand 384+16(%rsp),%xmm3
3185 movdqu %xmm2,0(%rdi)
3186 movdqu %xmm3,16(%rdi)
3190 pandn 320(%rsp),%xmm0
3192 pandn 320+16(%rsp),%xmm1
3194 pand 512(%rsp),%xmm2
3195 pand 512+16(%rsp),%xmm3
3205 pand 416(%rsp),%xmm2
3206 pand 416+16(%rsp),%xmm3
3209 movdqu %xmm2,32(%rdi)
3210 movdqu %xmm3,48(%rdi)
3221 .size ecp_nistz256_point_addx,.-ecp_nistz256_point_addx
3222 .type ecp_nistz256_point_add_affinex,@function
3224 ecp_nistz256_point_add_affinex:
3225 .Lpoint_add_affinex:
3234 movdqu 0(%rsi),%xmm0
3236 movdqu 16(%rsi),%xmm1
3237 movdqu 32(%rsi),%xmm2
3238 movdqu 48(%rsi),%xmm3
3239 movdqu 64(%rsi),%xmm4
3240 movdqu 80(%rsi),%xmm5
3241 movq 64+0(%rsi),%rdx
3242 movq 64+8(%rsi),%r14
3243 movq 64+16(%rsi),%r15
3244 movq 64+24(%rsi),%r8
3245 movdqa %xmm0,320(%rsp)
3246 movdqa %xmm1,320+16(%rsp)
3248 movdqa %xmm2,352(%rsp)
3249 movdqa %xmm3,352+16(%rsp)
3251 movdqa %xmm4,384(%rsp)
3252 movdqa %xmm5,384+16(%rsp)
3255 movdqu 0(%rbx),%xmm0
3256 pshufd $0xb1,%xmm3,%xmm5
3257 movdqu 16(%rbx),%xmm1
3258 movdqu 32(%rbx),%xmm2
3260 movdqu 48(%rbx),%xmm3
3261 movdqa %xmm0,416(%rsp)
3262 pshufd $0x1e,%xmm5,%xmm4
3263 movdqa %xmm1,416+16(%rsp)
3265 .byte 102,72,15,110,199
3266 movdqa %xmm2,448(%rsp)
3267 movdqa %xmm3,448+16(%rsp)
3273 leaq 64-128(%rsi),%rsi
3275 call __ecp_nistz256_sqr_montx
3278 pshufd $0xb1,%xmm3,%xmm4
3283 pshufd $0,%xmm5,%xmm5
3284 pshufd $0x1e,%xmm4,%xmm3
3290 pshufd $0,%xmm4,%xmm4
3292 leaq 32-128(%rsp),%rsi
3295 call __ecp_nistz256_mul_montx
3299 call __ecp_nistz256_sub_fromx
3304 movq 8+32(%rsp),%r10
3305 leaq -128+32(%rsp),%rsi
3306 movq 16+32(%rsp),%r11
3307 movq 24+32(%rsp),%r12
3309 call __ecp_nistz256_mul_montx
3314 movq 8+64(%rsp),%r10
3315 leaq -128+64(%rsp),%rsi
3316 movq 16+64(%rsp),%r11
3317 movq 24+64(%rsp),%r12
3319 call __ecp_nistz256_mul_montx
3324 movq 8+32(%rsp),%r10
3325 leaq -128+32(%rsp),%rsi
3326 movq 16+32(%rsp),%r11
3327 movq 24+32(%rsp),%r12
3329 call __ecp_nistz256_mul_montx
3333 call __ecp_nistz256_sub_fromx
3335 movq 0+64(%rsp),%rdx
3336 movq 8+64(%rsp),%r14
3337 leaq -128+64(%rsp),%rsi
3338 movq 16+64(%rsp),%r15
3339 movq 24+64(%rsp),%r8
3341 call __ecp_nistz256_sqr_montx
3343 movq 0+96(%rsp),%rdx
3344 movq 8+96(%rsp),%r14
3345 leaq -128+96(%rsp),%rsi
3346 movq 16+96(%rsp),%r15
3347 movq 24+96(%rsp),%r8
3349 call __ecp_nistz256_sqr_montx
3354 movq 8+64(%rsp),%r10
3355 leaq -128+64(%rsp),%rsi
3356 movq 16+64(%rsp),%r11
3357 movq 24+64(%rsp),%r12
3359 call __ecp_nistz256_mul_montx
3363 movq 0+128(%rsp),%r9
3364 movq 8+128(%rsp),%r10
3365 leaq -128+128(%rsp),%rsi
3366 movq 16+128(%rsp),%r11
3367 movq 24+128(%rsp),%r12
3369 call __ecp_nistz256_mul_montx
3400 call __ecp_nistz256_subx
3404 call __ecp_nistz256_sub_fromx
3408 movq 0+16(%rsp),%rcx
3409 movq 0+24(%rsp),%r10
3412 call __ecp_nistz256_subx
3420 movq 0+160(%rsp),%r9
3421 movq 8+160(%rsp),%r10
3422 leaq -128+160(%rsp),%rsi
3423 movq 16+160(%rsp),%r11
3424 movq 24+160(%rsp),%r12
3426 call __ecp_nistz256_mul_montx
3431 movq 8+64(%rsp),%r10
3432 leaq -128+64(%rsp),%rsi
3433 movq 16+64(%rsp),%r11
3434 movq 24+64(%rsp),%r12
3436 call __ecp_nistz256_mul_montx
3440 call __ecp_nistz256_sub_fromx
3442 .byte 102,72,15,126,199
3446 pandn 288(%rsp),%xmm0
3448 pandn 288+16(%rsp),%xmm1
3450 pand .LONE_mont(%rip),%xmm2
3451 pand .LONE_mont+16(%rip),%xmm3
3461 pand 384(%rsp),%xmm2
3462 pand 384+16(%rsp),%xmm3
3465 movdqu %xmm2,64(%rdi)
3466 movdqu %xmm3,80(%rdi)
3470 pandn 224(%rsp),%xmm0
3472 pandn 224+16(%rsp),%xmm1
3474 pand 416(%rsp),%xmm2
3475 pand 416+16(%rsp),%xmm3
3485 pand 320(%rsp),%xmm2
3486 pand 320+16(%rsp),%xmm3
3489 movdqu %xmm2,0(%rdi)
3490 movdqu %xmm3,16(%rdi)
3494 pandn 256(%rsp),%xmm0
3496 pandn 256+16(%rsp),%xmm1
3498 pand 448(%rsp),%xmm2
3499 pand 448+16(%rsp),%xmm3
3509 pand 352(%rsp),%xmm2
3510 pand 352+16(%rsp),%xmm3
3513 movdqu %xmm2,32(%rdi)
3514 movdqu %xmm3,48(%rdi)
3524 .size ecp_nistz256_point_add_affinex,.-ecp_nistz256_point_add_affinex