/src/botan/src/lib/block/serpent/serpent_simd/serpent_simd.cpp
Line | Count | Source (jump to first uncovered line) |
1 | | /* |
2 | | * Serpent (SIMD) |
3 | | * (C) 2009,2013 Jack Lloyd |
4 | | * |
5 | | * Botan is released under the Simplified BSD License (see license.txt) |
6 | | */ |
7 | | |
8 | | #include <botan/internal/serpent.h> |
9 | | #include <botan/internal/simd_32.h> |
10 | | #include <botan/internal/serpent_sbox.h> |
11 | | |
12 | | namespace Botan { |
13 | | |
14 | | /* |
15 | | * SIMD Serpent Encryption of 4 blocks in parallel |
16 | | */ |
17 | | void Serpent::simd_encrypt_4(const uint8_t in[64], uint8_t out[64]) const |
18 | 0 | { |
19 | 0 | using namespace Botan::Serpent_F; |
20 | |
|
21 | 0 | SIMD_4x32 B0 = SIMD_4x32::load_le(in); |
22 | 0 | SIMD_4x32 B1 = SIMD_4x32::load_le(in + 16); |
23 | 0 | SIMD_4x32 B2 = SIMD_4x32::load_le(in + 32); |
24 | 0 | SIMD_4x32 B3 = SIMD_4x32::load_le(in + 48); |
25 | |
|
26 | 0 | SIMD_4x32::transpose(B0, B1, B2, B3); |
27 | |
|
28 | 0 | const Key_Inserter key_xor(m_round_key.data()); |
29 | |
|
30 | 0 | key_xor( 0,B0,B1,B2,B3); SBoxE0(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
31 | 0 | key_xor( 1,B0,B1,B2,B3); SBoxE1(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
32 | 0 | key_xor( 2,B0,B1,B2,B3); SBoxE2(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
33 | 0 | key_xor( 3,B0,B1,B2,B3); SBoxE3(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
34 | 0 | key_xor( 4,B0,B1,B2,B3); SBoxE4(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
35 | 0 | key_xor( 5,B0,B1,B2,B3); SBoxE5(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
36 | 0 | key_xor( 6,B0,B1,B2,B3); SBoxE6(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
37 | 0 | key_xor( 7,B0,B1,B2,B3); SBoxE7(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
38 | |
|
39 | 0 | key_xor( 8,B0,B1,B2,B3); SBoxE0(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
40 | 0 | key_xor( 9,B0,B1,B2,B3); SBoxE1(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
41 | 0 | key_xor(10,B0,B1,B2,B3); SBoxE2(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
42 | 0 | key_xor(11,B0,B1,B2,B3); SBoxE3(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
43 | 0 | key_xor(12,B0,B1,B2,B3); SBoxE4(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
44 | 0 | key_xor(13,B0,B1,B2,B3); SBoxE5(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
45 | 0 | key_xor(14,B0,B1,B2,B3); SBoxE6(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
46 | 0 | key_xor(15,B0,B1,B2,B3); SBoxE7(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
47 | |
|
48 | 0 | key_xor(16,B0,B1,B2,B3); SBoxE0(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
49 | 0 | key_xor(17,B0,B1,B2,B3); SBoxE1(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
50 | 0 | key_xor(18,B0,B1,B2,B3); SBoxE2(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
51 | 0 | key_xor(19,B0,B1,B2,B3); SBoxE3(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
52 | 0 | key_xor(20,B0,B1,B2,B3); SBoxE4(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
53 | 0 | key_xor(21,B0,B1,B2,B3); SBoxE5(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
54 | 0 | key_xor(22,B0,B1,B2,B3); SBoxE6(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
55 | 0 | key_xor(23,B0,B1,B2,B3); SBoxE7(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
56 | |
|
57 | 0 | key_xor(24,B0,B1,B2,B3); SBoxE0(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
58 | 0 | key_xor(25,B0,B1,B2,B3); SBoxE1(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
59 | 0 | key_xor(26,B0,B1,B2,B3); SBoxE2(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
60 | 0 | key_xor(27,B0,B1,B2,B3); SBoxE3(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
61 | 0 | key_xor(28,B0,B1,B2,B3); SBoxE4(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
62 | 0 | key_xor(29,B0,B1,B2,B3); SBoxE5(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
63 | 0 | key_xor(30,B0,B1,B2,B3); SBoxE6(B0,B1,B2,B3); transform(B0,B1,B2,B3); |
64 | 0 | key_xor(31,B0,B1,B2,B3); SBoxE7(B0,B1,B2,B3); key_xor(32,B0,B1,B2,B3); |
65 | |
|
66 | 0 | SIMD_4x32::transpose(B0, B1, B2, B3); |
67 | |
|
68 | 0 | B0.store_le(out); |
69 | 0 | B1.store_le(out + 16); |
70 | 0 | B2.store_le(out + 32); |
71 | 0 | B3.store_le(out + 48); |
72 | 0 | } |
73 | | |
74 | | /* |
75 | | * SIMD Serpent Decryption of 4 blocks in parallel |
76 | | */ |
77 | | void Serpent::simd_decrypt_4(const uint8_t in[64], uint8_t out[64]) const |
78 | 0 | { |
79 | 0 | using namespace Botan::Serpent_F; |
80 | |
|
81 | 0 | SIMD_4x32 B0 = SIMD_4x32::load_le(in); |
82 | 0 | SIMD_4x32 B1 = SIMD_4x32::load_le(in + 16); |
83 | 0 | SIMD_4x32 B2 = SIMD_4x32::load_le(in + 32); |
84 | 0 | SIMD_4x32 B3 = SIMD_4x32::load_le(in + 48); |
85 | |
|
86 | 0 | SIMD_4x32::transpose(B0, B1, B2, B3); |
87 | |
|
88 | 0 | const Key_Inserter key_xor(m_round_key.data()); |
89 | |
|
90 | 0 | key_xor(32,B0,B1,B2,B3); SBoxD7(B0,B1,B2,B3); key_xor(31,B0,B1,B2,B3); |
91 | 0 | i_transform(B0,B1,B2,B3); SBoxD6(B0,B1,B2,B3); key_xor(30,B0,B1,B2,B3); |
92 | 0 | i_transform(B0,B1,B2,B3); SBoxD5(B0,B1,B2,B3); key_xor(29,B0,B1,B2,B3); |
93 | 0 | i_transform(B0,B1,B2,B3); SBoxD4(B0,B1,B2,B3); key_xor(28,B0,B1,B2,B3); |
94 | 0 | i_transform(B0,B1,B2,B3); SBoxD3(B0,B1,B2,B3); key_xor(27,B0,B1,B2,B3); |
95 | 0 | i_transform(B0,B1,B2,B3); SBoxD2(B0,B1,B2,B3); key_xor(26,B0,B1,B2,B3); |
96 | 0 | i_transform(B0,B1,B2,B3); SBoxD1(B0,B1,B2,B3); key_xor(25,B0,B1,B2,B3); |
97 | 0 | i_transform(B0,B1,B2,B3); SBoxD0(B0,B1,B2,B3); key_xor(24,B0,B1,B2,B3); |
98 | |
|
99 | 0 | i_transform(B0,B1,B2,B3); SBoxD7(B0,B1,B2,B3); key_xor(23,B0,B1,B2,B3); |
100 | 0 | i_transform(B0,B1,B2,B3); SBoxD6(B0,B1,B2,B3); key_xor(22,B0,B1,B2,B3); |
101 | 0 | i_transform(B0,B1,B2,B3); SBoxD5(B0,B1,B2,B3); key_xor(21,B0,B1,B2,B3); |
102 | 0 | i_transform(B0,B1,B2,B3); SBoxD4(B0,B1,B2,B3); key_xor(20,B0,B1,B2,B3); |
103 | 0 | i_transform(B0,B1,B2,B3); SBoxD3(B0,B1,B2,B3); key_xor(19,B0,B1,B2,B3); |
104 | 0 | i_transform(B0,B1,B2,B3); SBoxD2(B0,B1,B2,B3); key_xor(18,B0,B1,B2,B3); |
105 | 0 | i_transform(B0,B1,B2,B3); SBoxD1(B0,B1,B2,B3); key_xor(17,B0,B1,B2,B3); |
106 | 0 | i_transform(B0,B1,B2,B3); SBoxD0(B0,B1,B2,B3); key_xor(16,B0,B1,B2,B3); |
107 | |
|
108 | 0 | i_transform(B0,B1,B2,B3); SBoxD7(B0,B1,B2,B3); key_xor(15,B0,B1,B2,B3); |
109 | 0 | i_transform(B0,B1,B2,B3); SBoxD6(B0,B1,B2,B3); key_xor(14,B0,B1,B2,B3); |
110 | 0 | i_transform(B0,B1,B2,B3); SBoxD5(B0,B1,B2,B3); key_xor(13,B0,B1,B2,B3); |
111 | 0 | i_transform(B0,B1,B2,B3); SBoxD4(B0,B1,B2,B3); key_xor(12,B0,B1,B2,B3); |
112 | 0 | i_transform(B0,B1,B2,B3); SBoxD3(B0,B1,B2,B3); key_xor(11,B0,B1,B2,B3); |
113 | 0 | i_transform(B0,B1,B2,B3); SBoxD2(B0,B1,B2,B3); key_xor(10,B0,B1,B2,B3); |
114 | 0 | i_transform(B0,B1,B2,B3); SBoxD1(B0,B1,B2,B3); key_xor( 9,B0,B1,B2,B3); |
115 | 0 | i_transform(B0,B1,B2,B3); SBoxD0(B0,B1,B2,B3); key_xor( 8,B0,B1,B2,B3); |
116 | |
|
117 | 0 | i_transform(B0,B1,B2,B3); SBoxD7(B0,B1,B2,B3); key_xor( 7,B0,B1,B2,B3); |
118 | 0 | i_transform(B0,B1,B2,B3); SBoxD6(B0,B1,B2,B3); key_xor( 6,B0,B1,B2,B3); |
119 | 0 | i_transform(B0,B1,B2,B3); SBoxD5(B0,B1,B2,B3); key_xor( 5,B0,B1,B2,B3); |
120 | 0 | i_transform(B0,B1,B2,B3); SBoxD4(B0,B1,B2,B3); key_xor( 4,B0,B1,B2,B3); |
121 | 0 | i_transform(B0,B1,B2,B3); SBoxD3(B0,B1,B2,B3); key_xor( 3,B0,B1,B2,B3); |
122 | 0 | i_transform(B0,B1,B2,B3); SBoxD2(B0,B1,B2,B3); key_xor( 2,B0,B1,B2,B3); |
123 | 0 | i_transform(B0,B1,B2,B3); SBoxD1(B0,B1,B2,B3); key_xor( 1,B0,B1,B2,B3); |
124 | 0 | i_transform(B0,B1,B2,B3); SBoxD0(B0,B1,B2,B3); key_xor( 0,B0,B1,B2,B3); |
125 | |
|
126 | 0 | SIMD_4x32::transpose(B0, B1, B2, B3); |
127 | |
|
128 | 0 | B0.store_le(out); |
129 | 0 | B1.store_le(out + 16); |
130 | 0 | B2.store_le(out + 32); |
131 | 0 | B3.store_le(out + 48); |
132 | 0 | } |
133 | | |
134 | | } |