/src/fftw3/rdft/scalar/r2cf/r2cf_10.c

Line	Count	Source
1		/*
2		* Copyright (c) 2003, 2007-14 Matteo Frigo
3		* Copyright (c) 2003, 2007-14 Massachusetts Institute of Technology
4		*
5		* This program is free software; you can redistribute it and/or modify
6		* it under the terms of the GNU General Public License as published by
7		* the Free Software Foundation; either version 2 of the License, or
8		* (at your option) any later version.
9		*
10		* This program is distributed in the hope that it will be useful,
11		* but WITHOUT ANY WARRANTY; without even the implied warranty of
12		* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
13		* GNU General Public License for more details.
14		*
15		* You should have received a copy of the GNU General Public License
16		* along with this program; if not, write to the Free Software
17		* Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
18		*
19		*/
20
21		/* This file was automatically generated --- DO NOT EDIT */
22		/* Generated on Sun Nov 9 07:05:28 UTC 2025 */
23
24		#include "rdft/codelet-rdft.h"
25
26		#if defined(ARCH_PREFERS_FMA) \|\| defined(ISA_EXTENSION_PREFERS_FMA)
27
28		/* Generated by: ../../../genfft/gen_r2cf.native -fma -compact -variables 4 -pipeline-latency 4 -n 10 -name r2cf_10 -include rdft/scalar/r2cf.h */
29
30		/*
31		* This function contains 34 FP additions, 14 FP multiplications,
32		* (or, 24 additions, 4 multiplications, 10 fused multiply/add),
33		* 26 stack variables, 4 constants, and 20 memory accesses
34		*/
35		#include "rdft/scalar/r2cf.h"
36
37		static void r2cf_10(R R0, R R1, R Cr, R Ci, stride rs, stride csr, stride csi, INT v, INT ivs, INT ovs)
38		{
39		DK(KP559016994, +0.559016994374947424102293417182819058860154590);
40		DK(KP250000000, +0.250000000000000000000000000000000000000000000);
41		DK(KP618033988, +0.618033988749894848204586834365638117720309180);
42		DK(KP951056516, +0.951056516295153572116439333379382143405698634);
43		{
44		INT i;
45		for (i = v; i > 0; i = i - 1, R0 = R0 + ivs, R1 = R1 + ivs, Cr = Cr + ovs, Ci = Ci + ovs, MAKE_VOLATILE_STRIDE(40, rs), MAKE_VOLATILE_STRIDE(40, csr), MAKE_VOLATILE_STRIDE(40, csi)) {
46		E T3, Tt, Td, Tn, Tg, To, Th, Tv, T6, Tq, T9, Tr, Ta, Tu, T1;
47		E T2;
48		T1 = R0[0];
49		T2 = R1[WS(rs, 2)];
50		T3 = T1 - T2;
51		Tt = T1 + T2;
52		{
53		E Tb, Tc, Te, Tf;
54		Tb = R0[WS(rs, 2)];
55		Tc = R1[WS(rs, 4)];
56		Td = Tb - Tc;
57		Tn = Tb + Tc;
58		Te = R0[WS(rs, 3)];
59		Tf = R1[0];
60		Tg = Te - Tf;
61		To = Te + Tf;
62		}
63		Th = Td + Tg;
64		Tv = Tn + To;
65		{
66		E T4, T5, T7, T8;
67		T4 = R0[WS(rs, 1)];
68		T5 = R1[WS(rs, 3)];
69		T6 = T4 - T5;
70		Tq = T4 + T5;
71		T7 = R0[WS(rs, 4)];
72		T8 = R1[WS(rs, 1)];
73		T9 = T7 - T8;
74		Tr = T7 + T8;
75		}
76		Ta = T6 + T9;
77		Tu = Tq + Tr;
78		{
79		E Tl, Tm, Tk, Ti, Tj;
80		Tl = T6 - T9;
81		Tm = Tg - Td;
82		Ci[WS(csi, 1)] = -(KP951056516 * (FNMS(KP618033988, Tm, Tl)));
83		Ci[WS(csi, 3)] = KP951056516 * (FMA(KP618033988, Tl, Tm));
84		Tk = Ta - Th;
85		Ti = Ta + Th;
86		Tj = FNMS(KP250000000, Ti, T3);
87		Cr[WS(csr, 1)] = FMA(KP559016994, Tk, Tj);
88		Cr[WS(csr, 5)] = T3 + Ti;
89		Cr[WS(csr, 3)] = FNMS(KP559016994, Tk, Tj);
90		}
91		{
92		E Tp, Ts, Ty, Tw, Tx;
93		Tp = Tn - To;
94		Ts = Tq - Tr;
95		Ci[WS(csi, 2)] = KP951056516 * (FNMS(KP618033988, Ts, Tp));
96		Ci[WS(csi, 4)] = KP951056516 * (FMA(KP618033988, Tp, Ts));
97		Ty = Tu - Tv;
98		Tw = Tu + Tv;
99		Tx = FNMS(KP250000000, Tw, Tt);
100		Cr[WS(csr, 2)] = FNMS(KP559016994, Ty, Tx);
101		Cr[0] = Tt + Tw;
102		Cr[WS(csr, 4)] = FMA(KP559016994, Ty, Tx);
103		}
104		}
105		}
106		}
107
108		static const kr2c_desc desc = { 10, "r2cf_10", { 24, 4, 10, 0 }, &GENUS };
109
110		void X(codelet_r2cf_10) (planner *p) { X(kr2c_register) (p, r2cf_10, &desc);
111		}
112
113		#else
114
115		/* Generated by: ../../../genfft/gen_r2cf.native -compact -variables 4 -pipeline-latency 4 -n 10 -name r2cf_10 -include rdft/scalar/r2cf.h */
116
117		/*
118		* This function contains 34 FP additions, 12 FP multiplications,
119		* (or, 28 additions, 6 multiplications, 6 fused multiply/add),
120		* 26 stack variables, 4 constants, and 20 memory accesses
121		*/
122		#include "rdft/scalar/r2cf.h"
123
124		static void r2cf_10(R R0, R R1, R Cr, R Ci, stride rs, stride csr, stride csi, INT v, INT ivs, INT ovs)
125	0	{
126	0	DK(KP250000000, +0.250000000000000000000000000000000000000000000);
127	0	DK(KP559016994, +0.559016994374947424102293417182819058860154590);
128	0	DK(KP951056516, +0.951056516295153572116439333379382143405698634);
129	0	DK(KP587785252, +0.587785252292473129168705954639072768597652438);
130	0	{
131	0	INT i;
132	0	for (i = v; i > 0; i = i - 1, R0 = R0 + ivs, R1 = R1 + ivs, Cr = Cr + ovs, Ci = Ci + ovs, MAKE_VOLATILE_STRIDE(40, rs), MAKE_VOLATILE_STRIDE(40, csr), MAKE_VOLATILE_STRIDE(40, csi)) {
133	0	E Ti, Tt, Ta, Tn, Td, To, Te, Tv, T3, Tq, T6, Tr, T7, Tu, Tg;
134	0	E Th;
135	0	Tg = R0[0];
136	0	Th = R1[WS(rs, 2)];
137	0	Ti = Tg - Th;
138	0	Tt = Tg + Th;
139	0	{
140	0	E T8, T9, Tb, Tc;
141	0	T8 = R0[WS(rs, 2)];
142	0	T9 = R1[WS(rs, 4)];
143	0	Ta = T8 - T9;
144	0	Tn = T8 + T9;
145	0	Tb = R0[WS(rs, 3)];
146	0	Tc = R1[0];
147	0	Td = Tb - Tc;
148	0	To = Tb + Tc;
149	0	}
150	0	Te = Ta + Td;
151	0	Tv = Tn + To;
152	0	{
153	0	E T1, T2, T4, T5;
154	0	T1 = R0[WS(rs, 1)];
155	0	T2 = R1[WS(rs, 3)];
156	0	T3 = T1 - T2;
157	0	Tq = T1 + T2;
158	0	T4 = R0[WS(rs, 4)];
159	0	T5 = R1[WS(rs, 1)];
160	0	T6 = T4 - T5;
161	0	Tr = T4 + T5;
162	0	}
163	0	T7 = T3 + T6;
164	0	Tu = Tq + Tr;
165	0	{
166	0	E Tl, Tm, Tf, Tj, Tk;
167	0	Tl = Td - Ta;
168	0	Tm = T3 - T6;
169	0	Ci[WS(csi, 1)] = FNMS(KP951056516, Tm, KP587785252 * Tl);
170	0	Ci[WS(csi, 3)] = FMA(KP587785252, Tm, KP951056516 * Tl);
171	0	Tf = KP559016994 * (T7 - Te);
172	0	Tj = T7 + Te;
173	0	Tk = FNMS(KP250000000, Tj, Ti);
174	0	Cr[WS(csr, 1)] = Tf + Tk;
175	0	Cr[WS(csr, 5)] = Ti + Tj;
176	0	Cr[WS(csr, 3)] = Tk - Tf;
177	0	}
178	0	{
179	0	E Tp, Ts, Ty, Tw, Tx;
180	0	Tp = Tn - To;
181	0	Ts = Tq - Tr;
182	0	Ci[WS(csi, 2)] = FNMS(KP587785252, Ts, KP951056516 * Tp);
183	0	Ci[WS(csi, 4)] = FMA(KP951056516, Ts, KP587785252 * Tp);
184	0	Ty = KP559016994 * (Tu - Tv);
185	0	Tw = Tu + Tv;
186	0	Tx = FNMS(KP250000000, Tw, Tt);
187	0	Cr[WS(csr, 2)] = Tx - Ty;
188	0	Cr[0] = Tt + Tw;
189	0	Cr[WS(csr, 4)] = Ty + Tx;
190	0	}
191	0	}
192	0	}
193	0	}
194
195		static const kr2c_desc desc = { 10, "r2cf_10", { 28, 6, 6, 0 }, &GENUS };
196
197	1	void X(codelet_r2cf_10) (planner *p) { X(kr2c_register) (p, r2cf_10, &desc);
198	1	}
199
200		#endif

Coverage Report

Created: 2025-11-09 07:07