Mercurial > vec
comparison src/impl/generic.c @ 31:bf6ad516f1e6
Backed out changeset c6c99ab1088a
| author | Paper <paper@tflc.us> |
|---|---|
| date | Fri, 25 Apr 2025 17:40:33 -0400 |
| parents | c6c99ab1088a |
| children | 8b5e0974fd41 |
comparison
equal
deleted
inserted
replaced
| 30:641d8c79b1da | 31:bf6ad516f1e6 |
|---|---|
| 1 /** | |
| 2 * vec - a tiny SIMD vector library in C99 | |
| 3 * | |
| 4 * Copyright (c) 2024 Paper | |
| 5 * | |
| 6 * Permission is hereby granted, free of charge, to any person obtaining a copy | |
| 7 * of this software and associated documentation files (the "Software"), to deal | |
| 8 * in the Software without restriction, including without limitation the rights | |
| 9 * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell | |
| 10 * copies of the Software, and to permit persons to whom the Software is | |
| 11 * furnished to do so, subject to the following conditions: | |
| 12 * | |
| 13 * The above copyright notice and this permission notice shall be included in all | |
| 14 * copies or substantial portions of the Software. | |
| 15 * | |
| 16 * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR | |
| 17 * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, | |
| 18 * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE | |
| 19 * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER | |
| 20 * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, | |
| 21 * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE | |
| 22 * SOFTWARE. | |
| 23 **/ | |
| 24 | |
| 25 #include "vec/impl/generic.h" | 1 #include "vec/impl/generic.h" |
| 26 | 2 |
| 27 #include <string.h> | 3 #include <string.h> |
| 28 | 4 |
| 29 // ----------------------------------------------------------------- | 5 // ----------------------------------------------------------------- |
| 48 union v##sign##int##bits##x##size##_impl_data { \ | 24 union v##sign##int##bits##x##size##_impl_data { \ |
| 49 v##sign##int##bits##x##size vec; \ | 25 v##sign##int##bits##x##size vec; \ |
| 50 vec_##sign##int##bits impl[size]; \ | 26 vec_##sign##int##bits impl[size]; \ |
| 51 }; \ | 27 }; \ |
| 52 \ | 28 \ |
| 53 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_splat(vec_##sign##int##bits x) \ | 29 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_splat(vec_##sign##int##bits x) \ |
| 54 { \ | 30 { \ |
| 55 v##sign##int##bits##x##size vec; \ | 31 v##sign##int##bits##x##size vec; \ |
| 56 for (int i = 0; i < size; i++) \ | 32 for (int i = 0; i < size; i++) \ |
| 57 ((union v##sign##int##bits##x##size##_impl_data *)&vec)->impl[i] = x; \ | 33 ((union v##sign##int##bits##x##size##_impl_data *)&vec)->impl[i] = x; \ |
| 58 return vec; \ | 34 return vec; \ |
| 59 } \ | 35 } \ |
| 60 \ | 36 \ |
| 61 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_load_aligned(const vec_##sign##int##bits in[size]) \ | 37 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_load_aligned(const vec_##sign##int##bits in[size]) \ |
| 62 { \ | 38 { \ |
| 63 v##sign##int##bits##x##size vec; \ | 39 v##sign##int##bits##x##size vec; \ |
| 64 memcpy(&vec, in, sizeof(vec_##sign##int##bits) * size); \ | 40 memcpy(&vec, in, sizeof(vec_##sign##int##bits) * size); \ |
| 65 return vec; \ | 41 return vec; \ |
| 66 } \ | 42 } \ |
| 67 \ | 43 \ |
| 68 VEC_FUNC_IMPL void v##sign##int##bits##x##size##_generic_store_aligned(v##sign##int##bits##x##size vec, vec_##sign##int##bits out[size]) \ | 44 void v##sign##int##bits##x##size##_generic_store_aligned(v##sign##int##bits##x##size vec, vec_##sign##int##bits out[size]) \ |
| 69 { \ | 45 { \ |
| 70 memcpy(out, &vec, sizeof(vec_##sign##int##bits) * size); \ | 46 memcpy(out, &vec, sizeof(vec_##sign##int##bits) * size); \ |
| 71 } \ | 47 } \ |
| 72 \ | 48 \ |
| 73 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_add(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 49 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_add(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 74 { \ | 50 { \ |
| 75 VEC_GENERIC_BUILTIN_OPERATION(+, sign, csign, bits, size); \ | 51 VEC_GENERIC_BUILTIN_OPERATION(+, sign, csign, bits, size); \ |
| 76 } \ | 52 } \ |
| 77 \ | 53 \ |
| 78 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_sub(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 54 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_sub(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 79 { \ | 55 { \ |
| 80 VEC_GENERIC_BUILTIN_OPERATION(-, sign, csign, bits, size); \ | 56 VEC_GENERIC_BUILTIN_OPERATION(-, sign, csign, bits, size); \ |
| 81 } \ | 57 } \ |
| 82 \ | 58 \ |
| 83 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_mul(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 59 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_mul(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 84 { \ | 60 { \ |
| 85 VEC_GENERIC_BUILTIN_OPERATION(*, sign, csign, bits, size); \ | 61 VEC_GENERIC_BUILTIN_OPERATION(*, sign, csign, bits, size); \ |
| 86 } \ | 62 } \ |
| 87 \ | 63 \ |
| 88 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_div(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 64 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_div(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 89 { \ | 65 { \ |
| 90 VEC_GENERIC_OPERATION(((union v##sign##int##bits##x##size##_impl_data *)&vec2)->impl[i] ? (((union v##sign##int##bits##x##size##_impl_data *)&vec1)->impl[i] / ((union v##sign##int##bits##x##size##_impl_data *)&vec2)->impl[i]) : 0, sign, csign, bits, size); \ | 66 VEC_GENERIC_OPERATION(((union v##sign##int##bits##x##size##_impl_data *)&vec2)->impl[i] ? (((union v##sign##int##bits##x##size##_impl_data *)&vec1)->impl[i] / ((union v##sign##int##bits##x##size##_impl_data *)&vec2)->impl[i]) : 0, sign, csign, bits, size); \ |
| 91 } \ | 67 } \ |
| 92 \ | 68 \ |
| 93 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_avg(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 69 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_avg(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 94 { \ | 70 { \ |
| 95 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 71 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 96 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 72 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 97 \ | 73 \ |
| 98 for (int i = 0; i < size; i++) \ | 74 for (int i = 0; i < size; i++) \ |
| 99 vec1d->impl[i] = vec_##sign##avg(vec1d->impl[i], vec2d->impl[i]); \ | 75 vec1d->impl[i] = vec_##sign##avg(vec1d->impl[i], vec2d->impl[i]); \ |
| 100 \ | 76 \ |
| 101 return vec1d->vec; \ | 77 return vec1d->vec; \ |
| 102 } \ | 78 } \ |
| 103 \ | 79 \ |
| 104 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_and(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 80 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_and(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 105 { \ | 81 { \ |
| 106 VEC_GENERIC_BUILTIN_OPERATION(&, sign, csign, bits, size); \ | 82 VEC_GENERIC_BUILTIN_OPERATION(&, sign, csign, bits, size); \ |
| 107 } \ | 83 } \ |
| 108 \ | 84 \ |
| 109 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_or(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 85 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_or(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 110 { \ | 86 { \ |
| 111 VEC_GENERIC_BUILTIN_OPERATION(|, sign, csign, bits, size); \ | 87 VEC_GENERIC_BUILTIN_OPERATION(|, sign, csign, bits, size); \ |
| 112 } \ | 88 } \ |
| 113 \ | 89 \ |
| 114 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_xor(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 90 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_xor(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 115 { \ | 91 { \ |
| 116 VEC_GENERIC_BUILTIN_OPERATION(^, sign, csign, bits, size); \ | 92 VEC_GENERIC_BUILTIN_OPERATION(^, sign, csign, bits, size); \ |
| 117 } \ | 93 } \ |
| 118 \ | 94 \ |
| 119 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmplt(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 95 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_not(v##sign##int##bits##x##size vec) \ |
| 96 { \ | |
| 97 return v##sign##int##bits##x##size##_generic_xor(vec, v##sign##int##bits##x##size##_generic_splat((vec_##sign##int##bits)VEC_UINT##bits##_MAX)); \ | |
| 98 } \ | |
| 99 \ | |
| 100 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmplt(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | |
| 120 { \ | 101 { \ |
| 121 VEC_GENERIC_CMP(<, sign, csign, bits, size); \ | 102 VEC_GENERIC_CMP(<, sign, csign, bits, size); \ |
| 122 } \ | 103 } \ |
| 123 \ | 104 \ |
| 124 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmple(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 105 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmple(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 125 { \ | 106 { \ |
| 126 return v##sign##int##bits##x##size##_not(v##sign##int##bits##x##size##_cmpgt(vec1, vec2)); \ | 107 VEC_GENERIC_CMP(<=, sign, csign, bits, size); \ |
| 127 } \ | 108 } \ |
| 128 \ | 109 \ |
| 129 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpeq(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 110 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpeq(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 130 { \ | 111 { \ |
| 131 VEC_GENERIC_CMP(==, sign, csign, bits, size); \ | 112 VEC_GENERIC_CMP(==, sign, csign, bits, size); \ |
| 132 } \ | 113 } \ |
| 133 \ | 114 \ |
| 134 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpge(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 115 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpge(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 135 { \ | 116 { \ |
| 136 return v##sign##int##bits##x##size##_not(v##sign##int##bits##x##size##_cmplt(vec1, vec2)); \ | 117 VEC_GENERIC_CMP(>=, sign, csign, bits, size); \ |
| 137 } \ | 118 } \ |
| 138 \ | 119 \ |
| 139 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpgt(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 120 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpgt(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 140 { \ | 121 { \ |
| 141 VEC_GENERIC_CMP(>, sign, csign, bits, size); \ | 122 VEC_GENERIC_CMP(>, sign, csign, bits, size); \ |
| 142 } \ | 123 } \ |
| 143 \ | 124 \ |
| 144 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_lshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ | 125 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_lshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ |
| 145 { \ | 126 { \ |
| 146 VEC_GENERIC_OPERATION(vec_##sign##lshift(((union v##sign##int##bits##x##size##_impl_data *)&vec1)->impl[i], ((union v##sign##int##bits##x##size##_impl_data *)&vec2)->impl[i]), sign, csign, bits, size); \ | 127 VEC_GENERIC_OPERATION(vec_##sign##lshift(((union v##sign##int##bits##x##size##_impl_data *)&vec1)->impl[i], ((union v##sign##int##bits##x##size##_impl_data *)&vec2)->impl[i]), sign, csign, bits, size); \ |
| 147 } \ | 128 } \ |
| 148 \ | 129 \ |
| 149 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_rshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ | 130 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_rshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ |
| 150 { \ | 131 { \ |
| 151 VEC_GENERIC_OPERATION(vec_##sign##rshift(((union v##sign##int##bits##x##size##_impl_data *)&vec1)->impl[i], ((union v##sign##int##bits##x##size##_impl_data *)&vec2)->impl[i]), sign, csign, bits, size); \ | 132 VEC_GENERIC_OPERATION(vec_##sign##rshift(((union v##sign##int##bits##x##size##_impl_data *)&vec1)->impl[i], ((union v##sign##int##bits##x##size##_impl_data *)&vec2)->impl[i]), sign, csign, bits, size); \ |
| 152 } \ | 133 } \ |
| 153 \ | 134 \ |
| 154 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_lrshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ | 135 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_lrshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ |
| 155 { \ | 136 { \ |
| 156 VEC_GENERIC_OPERATION(vec_lrshift((vec_uint##bits)(((union v##sign##int##bits##x##size##_impl_data *)&vec1)->impl[i]), ((union v##sign##int##bits##x##size##_impl_data *)&vec2)->impl[i]), sign, csign, bits, size); \ | 137 VEC_GENERIC_OPERATION(vec_lrshift((vec_uint##bits)(((union v##sign##int##bits##x##size##_impl_data *)&vec1)->impl[i]), ((union v##sign##int##bits##x##size##_impl_data *)&vec2)->impl[i]), sign, csign, bits, size); \ |
| 157 } \ | 138 } \ |
| 158 \ | 139 \ |
| 159 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_min(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | |
| 160 { \ | |
| 161 v##sign##int##bits##x##size cmplt = v##sign##int##bits##x##size##_cmplt(vec1, vec2); \ | |
| 162 \ | |
| 163 v##sign##int##bits##x##size a = v##sign##int##bits##x##size##_and(vec1, cmplt); \ | |
| 164 v##sign##int##bits##x##size b = v##sign##int##bits##x##size##_and(vec2, v##sign##int##bits##x##size##_not(cmplt)); \ | |
| 165 \ | |
| 166 return v##sign##int##bits##x##size##_or(a, b); \ | |
| 167 } \ | |
| 168 \ | |
| 169 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_max(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | |
| 170 { \ | |
| 171 v##sign##int##bits##x##size cmplt = v##sign##int##bits##x##size##_cmpgt(vec1, vec2); \ | |
| 172 \ | |
| 173 v##sign##int##bits##x##size a = v##sign##int##bits##x##size##_and(vec1, cmplt); \ | |
| 174 v##sign##int##bits##x##size b = v##sign##int##bits##x##size##_and(vec2, v##sign##int##bits##x##size##_not(cmplt)); \ | |
| 175 \ | |
| 176 return v##sign##int##bits##x##size##_or(a, b); \ | |
| 177 } \ | |
| 178 \ | |
| 179 const v##sign##int##bits##x##size##_impl v##sign##int##bits##x##size##_impl_generic = { \ | 140 const v##sign##int##bits##x##size##_impl v##sign##int##bits##x##size##_impl_generic = { \ |
| 180 .splat = v##sign##int##bits##x##size##_generic_splat, \ | 141 v##sign##int##bits##x##size##_generic_splat, \ |
| 181 .load_aligned = v##sign##int##bits##x##size##_generic_load_aligned, \ | 142 v##sign##int##bits##x##size##_generic_load_aligned, \ |
| 182 .load = v##sign##int##bits##x##size##_generic_load_aligned, \ | 143 v##sign##int##bits##x##size##_generic_load_aligned, \ |
| 183 .store_aligned = v##sign##int##bits##x##size##_generic_store_aligned, \ | 144 v##sign##int##bits##x##size##_generic_store_aligned, \ |
| 184 .store = v##sign##int##bits##x##size##_generic_store_aligned, \ | 145 v##sign##int##bits##x##size##_generic_store_aligned, \ |
| 185 .add = v##sign##int##bits##x##size##_generic_add, \ | 146 v##sign##int##bits##x##size##_generic_add, \ |
| 186 .sub = v##sign##int##bits##x##size##_generic_sub, \ | 147 v##sign##int##bits##x##size##_generic_sub, \ |
| 187 .mul = v##sign##int##bits##x##size##_generic_mul, \ | 148 v##sign##int##bits##x##size##_generic_mul, \ |
| 188 .div = v##sign##int##bits##x##size##_generic_div, \ | 149 v##sign##int##bits##x##size##_generic_div, \ |
| 189 .avg = v##sign##int##bits##x##size##_generic_avg, \ | 150 v##sign##int##bits##x##size##_generic_avg, \ |
| 190 .band = v##sign##int##bits##x##size##_generic_and, \ | 151 v##sign##int##bits##x##size##_generic_and, \ |
| 191 .bor = v##sign##int##bits##x##size##_generic_or, \ | 152 v##sign##int##bits##x##size##_generic_or, \ |
| 192 .bxor = v##sign##int##bits##x##size##_generic_xor, \ | 153 v##sign##int##bits##x##size##_generic_xor, \ |
| 193 .lshift = v##sign##int##bits##x##size##_generic_lshift, \ | 154 v##sign##int##bits##x##size##_generic_not, \ |
| 194 .rshift = v##sign##int##bits##x##size##_generic_rshift, \ | 155 v##sign##int##bits##x##size##_generic_lshift, \ |
| 195 .lrshift = v##sign##int##bits##x##size##_generic_lrshift, \ | 156 v##sign##int##bits##x##size##_generic_rshift, \ |
| 196 .cmplt = v##sign##int##bits##x##size##_generic_cmplt, \ | 157 v##sign##int##bits##x##size##_generic_lrshift, \ |
| 197 .cmple = v##sign##int##bits##x##size##_generic_cmple, \ | 158 v##sign##int##bits##x##size##_generic_cmplt, \ |
| 198 .cmpeq = v##sign##int##bits##x##size##_generic_cmpeq, \ | 159 v##sign##int##bits##x##size##_generic_cmple, \ |
| 199 .cmpge = v##sign##int##bits##x##size##_generic_cmpge, \ | 160 v##sign##int##bits##x##size##_generic_cmpeq, \ |
| 200 .cmpgt = v##sign##int##bits##x##size##_generic_cmpgt, \ | 161 v##sign##int##bits##x##size##_generic_cmpge, \ |
| 201 .min = v##sign##int##bits##x##size##_generic_min, \ | 162 v##sign##int##bits##x##size##_generic_cmpgt, \ |
| 202 .max = v##sign##int##bits##x##size##_generic_max, \ | |
| 203 }; | 163 }; |
| 204 | 164 |
| 205 #define VEC_GENERIC_DEFINE_OPERATIONS(bits, size) \ | 165 #define VEC_GENERIC_DEFINE_OPERATIONS(bits, size) \ |
| 206 VEC_GENERIC_DEFINE_OPERATIONS_SIGN(u, U, bits, size) \ | 166 VEC_GENERIC_DEFINE_OPERATIONS_SIGN(u, U, bits, size) \ |
| 207 VEC_GENERIC_DEFINE_OPERATIONS_SIGN( , , bits, size) | 167 VEC_GENERIC_DEFINE_OPERATIONS_SIGN( , , bits, size) |
| 221 union v##sign##int##bits##x##size##_impl_data { \ | 181 union v##sign##int##bits##x##size##_impl_data { \ |
| 222 v##sign##int##bits##x##size vec; \ | 182 v##sign##int##bits##x##size vec; \ |
| 223 v##sign##int##bits##x##halfsize impl[2]; \ | 183 v##sign##int##bits##x##halfsize impl[2]; \ |
| 224 }; \ | 184 }; \ |
| 225 \ | 185 \ |
| 226 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_splat(vec_##sign##int##bits x) \ | 186 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_splat(vec_##sign##int##bits x) \ |
| 227 { \ | 187 { \ |
| 228 union v##sign##int##bits##x##size##_impl_data vec; \ | 188 union v##sign##int##bits##x##size##_impl_data vec; \ |
| 229 vec.impl[0] = v##sign##int##bits##x##halfsize##_splat(x); \ | 189 vec.impl[0] = v##sign##int##bits##x##halfsize##_splat(x); \ |
| 230 vec.impl[1] = v##sign##int##bits##x##halfsize##_splat(x); \ | 190 vec.impl[1] = v##sign##int##bits##x##halfsize##_splat(x); \ |
| 231 return vec.vec; \ | 191 return vec.vec; \ |
| 232 } \ | 192 } \ |
| 233 \ | 193 \ |
| 234 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_load_aligned(const vec_##sign##int##bits in[size]) \ | 194 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_load_aligned(const vec_##sign##int##bits in[size]) \ |
| 235 { \ | 195 { \ |
| 236 union v##sign##int##bits##x##size##_impl_data vec; \ | 196 union v##sign##int##bits##x##size##_impl_data vec; \ |
| 237 vec.impl[0] = v##sign##int##bits##x##halfsize##_load_aligned(in); \ | 197 vec.impl[0] = v##sign##int##bits##x##halfsize##_load_aligned(in); \ |
| 238 vec.impl[1] = v##sign##int##bits##x##halfsize##_load_aligned(in + halfsize); \ | 198 vec.impl[1] = v##sign##int##bits##x##halfsize##_load_aligned(in + halfsize); \ |
| 239 return vec.vec; \ | 199 return vec.vec; \ |
| 240 } \ | 200 } \ |
| 241 \ | 201 \ |
| 242 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_load(const vec_##sign##int##bits in[size]) \ | 202 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_load(const vec_##sign##int##bits in[size]) \ |
| 243 { \ | 203 { \ |
| 244 union v##sign##int##bits##x##size##_impl_data vec; \ | 204 union v##sign##int##bits##x##size##_impl_data vec; \ |
| 245 vec.impl[0] = v##sign##int##bits##x##halfsize##_load(in); \ | 205 vec.impl[0] = v##sign##int##bits##x##halfsize##_load(in); \ |
| 246 vec.impl[1] = v##sign##int##bits##x##halfsize##_load(in + halfsize); \ | 206 vec.impl[1] = v##sign##int##bits##x##halfsize##_load(in + halfsize); \ |
| 247 return vec.vec; \ | 207 return vec.vec; \ |
| 248 } \ | 208 } \ |
| 249 \ | 209 \ |
| 250 VEC_FUNC_IMPL void v##sign##int##bits##x##size##_generic_store_aligned(v##sign##int##bits##x##size vec, vec_##sign##int##bits out[size]) \ | 210 void v##sign##int##bits##x##size##_generic_store_aligned(v##sign##int##bits##x##size vec, vec_##sign##int##bits out[size]) \ |
| 251 { \ | 211 { \ |
| 252 union v##sign##int##bits##x##size##_impl_data *vecd = (union v##sign##int##bits##x##size##_impl_data *)&vec; \ | 212 union v##sign##int##bits##x##size##_impl_data *vecd = (union v##sign##int##bits##x##size##_impl_data *)&vec; \ |
| 253 \ | 213 \ |
| 254 v##sign##int##bits##x##halfsize##_store_aligned(vecd->impl[0], out); \ | 214 v##sign##int##bits##x##halfsize##_store_aligned(vecd->impl[0], out); \ |
| 255 v##sign##int##bits##x##halfsize##_store_aligned(vecd->impl[1], out + halfsize); \ | 215 v##sign##int##bits##x##halfsize##_store_aligned(vecd->impl[1], out + halfsize); \ |
| 256 } \ | 216 } \ |
| 257 \ | 217 \ |
| 258 VEC_FUNC_IMPL void v##sign##int##bits##x##size##_generic_store(v##sign##int##bits##x##size vec, vec_##sign##int##bits out[size]) \ | 218 void v##sign##int##bits##x##size##_generic_store(v##sign##int##bits##x##size vec, vec_##sign##int##bits out[size]) \ |
| 259 { \ | 219 { \ |
| 260 union v##sign##int##bits##x##size##_impl_data *vecd = (union v##sign##int##bits##x##size##_impl_data *)&vec; \ | 220 union v##sign##int##bits##x##size##_impl_data *vecd = (union v##sign##int##bits##x##size##_impl_data *)&vec; \ |
| 261 \ | 221 \ |
| 262 v##sign##int##bits##x##halfsize##_store(vecd->impl[0], out); \ | 222 v##sign##int##bits##x##halfsize##_store(vecd->impl[0], out); \ |
| 263 v##sign##int##bits##x##halfsize##_store(vecd->impl[1], out + halfsize); \ | 223 v##sign##int##bits##x##halfsize##_store(vecd->impl[1], out + halfsize); \ |
| 264 } \ | 224 } \ |
| 265 \ | 225 \ |
| 266 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_add(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 226 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_add(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 267 { \ | 227 { \ |
| 268 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 228 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 269 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 229 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 270 \ | 230 \ |
| 271 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_add(vec1d->impl[0], vec2d->impl[0]); \ | 231 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_add(vec1d->impl[0], vec2d->impl[0]); \ |
| 272 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_add(vec1d->impl[1], vec2d->impl[1]); \ | 232 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_add(vec1d->impl[1], vec2d->impl[1]); \ |
| 273 \ | 233 \ |
| 274 return vec1d->vec; \ | 234 return vec1d->vec; \ |
| 275 } \ | 235 } \ |
| 276 \ | 236 \ |
| 277 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_sub(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 237 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_sub(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 278 { \ | 238 { \ |
| 279 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 239 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 280 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 240 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 281 \ | 241 \ |
| 282 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_sub(vec1d->impl[0], vec2d->impl[0]); \ | 242 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_sub(vec1d->impl[0], vec2d->impl[0]); \ |
| 283 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_sub(vec1d->impl[1], vec2d->impl[1]); \ | 243 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_sub(vec1d->impl[1], vec2d->impl[1]); \ |
| 284 \ | 244 \ |
| 285 return vec1d->vec; \ | 245 return vec1d->vec; \ |
| 286 } \ | 246 } \ |
| 287 \ | 247 \ |
| 288 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_mul(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 248 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_mul(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 289 { \ | 249 { \ |
| 290 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 250 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 291 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 251 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 292 \ | 252 \ |
| 293 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_mul(vec1d->impl[0], vec2d->impl[0]); \ | 253 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_mul(vec1d->impl[0], vec2d->impl[0]); \ |
| 294 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_mul(vec1d->impl[1], vec2d->impl[1]); \ | 254 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_mul(vec1d->impl[1], vec2d->impl[1]); \ |
| 295 \ | 255 \ |
| 296 return vec1d->vec; \ | 256 return vec1d->vec; \ |
| 297 } \ | 257 } \ |
| 298 \ | 258 \ |
| 299 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_div(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 259 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_div(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 300 { \ | 260 { \ |
| 301 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 261 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 302 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 262 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 303 \ | 263 \ |
| 304 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_div(vec1d->impl[0], vec2d->impl[0]); \ | 264 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_div(vec1d->impl[0], vec2d->impl[0]); \ |
| 305 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_div(vec1d->impl[1], vec2d->impl[1]); \ | 265 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_div(vec1d->impl[1], vec2d->impl[1]); \ |
| 306 \ | 266 \ |
| 307 return vec1d->vec; \ | 267 return vec1d->vec; \ |
| 308 } \ | 268 } \ |
| 309 \ | 269 \ |
| 310 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_avg(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 270 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_avg(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 311 { \ | 271 { \ |
| 312 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 272 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 313 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 273 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 314 \ | 274 \ |
| 315 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_avg(vec1d->impl[0], vec2d->impl[0]); \ | 275 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_avg(vec1d->impl[0], vec2d->impl[0]); \ |
| 316 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_avg(vec1d->impl[1], vec2d->impl[1]); \ | 276 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_avg(vec1d->impl[1], vec2d->impl[1]); \ |
| 317 \ | 277 \ |
| 318 return vec1d->vec; \ | 278 return vec1d->vec; \ |
| 319 } \ | 279 } \ |
| 320 \ | 280 \ |
| 321 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_and(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 281 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_and(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 322 { \ | 282 { \ |
| 323 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 283 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 324 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 284 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 325 \ | 285 \ |
| 326 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_and(vec1d->impl[0], vec2d->impl[0]); \ | 286 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_and(vec1d->impl[0], vec2d->impl[0]); \ |
| 327 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_and(vec1d->impl[1], vec2d->impl[1]); \ | 287 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_and(vec1d->impl[1], vec2d->impl[1]); \ |
| 328 \ | 288 \ |
| 329 return vec1d->vec; \ | 289 return vec1d->vec; \ |
| 330 } \ | 290 } \ |
| 331 \ | 291 \ |
| 332 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_or(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 292 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_or(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 333 { \ | 293 { \ |
| 334 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 294 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 335 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 295 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 336 \ | 296 \ |
| 337 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_or(vec1d->impl[0], vec2d->impl[0]); \ | 297 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_or(vec1d->impl[0], vec2d->impl[0]); \ |
| 338 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_or(vec1d->impl[1], vec2d->impl[1]); \ | 298 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_or(vec1d->impl[1], vec2d->impl[1]); \ |
| 339 \ | 299 \ |
| 340 return vec1d->vec; \ | 300 return vec1d->vec; \ |
| 341 } \ | 301 } \ |
| 342 \ | 302 \ |
| 343 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_xor(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 303 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_xor(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 344 { \ | 304 { \ |
| 345 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 305 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 346 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 306 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 347 \ | 307 \ |
| 348 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_xor(vec1d->impl[0], vec2d->impl[0]); \ | 308 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_xor(vec1d->impl[0], vec2d->impl[0]); \ |
| 349 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_xor(vec1d->impl[1], vec2d->impl[1]); \ | 309 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_xor(vec1d->impl[1], vec2d->impl[1]); \ |
| 350 \ | 310 \ |
| 351 return vec1d->vec; \ | 311 return vec1d->vec; \ |
| 352 } \ | 312 } \ |
| 353 \ | 313 \ |
| 354 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_lshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ | 314 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_not(v##sign##int##bits##x##size vec1) \ |
| 315 { \ | |
| 316 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | |
| 317 \ | |
| 318 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_not(vec1d->impl[0]); \ | |
| 319 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_not(vec1d->impl[1]); \ | |
| 320 \ | |
| 321 return vec1d->vec; \ | |
| 322 } \ | |
| 323 \ | |
| 324 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_lshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ | |
| 355 { \ | 325 { \ |
| 356 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 326 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 357 union vuint##bits##x##size##_impl_data *vec2d = (union vuint##bits##x##size##_impl_data *)&vec2; \ | 327 union vuint##bits##x##size##_impl_data *vec2d = (union vuint##bits##x##size##_impl_data *)&vec2; \ |
| 358 \ | 328 \ |
| 359 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_lshift(vec1d->impl[0], vec2d->impl[0]); \ | 329 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_lshift(vec1d->impl[0], vec2d->impl[0]); \ |
| 360 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_lshift(vec1d->impl[1], vec2d->impl[1]); \ | 330 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_lshift(vec1d->impl[1], vec2d->impl[1]); \ |
| 361 \ | 331 \ |
| 362 return vec1d->vec; \ | 332 return vec1d->vec; \ |
| 363 } \ | 333 } \ |
| 364 \ | 334 \ |
| 365 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_rshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ | 335 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_rshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ |
| 366 { \ | 336 { \ |
| 367 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 337 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 368 union vuint##bits##x##size##_impl_data *vec2d = (union vuint##bits##x##size##_impl_data *)&vec2; \ | 338 union vuint##bits##x##size##_impl_data *vec2d = (union vuint##bits##x##size##_impl_data *)&vec2; \ |
| 369 \ | 339 \ |
| 370 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_rshift(vec1d->impl[0], vec2d->impl[0]); \ | 340 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_rshift(vec1d->impl[0], vec2d->impl[0]); \ |
| 371 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_rshift(vec1d->impl[1], vec2d->impl[1]); \ | 341 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_rshift(vec1d->impl[1], vec2d->impl[1]); \ |
| 372 \ | 342 \ |
| 373 return vec1d->vec; \ | 343 return vec1d->vec; \ |
| 374 } \ | 344 } \ |
| 375 \ | 345 \ |
| 376 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_lrshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ | 346 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_lrshift(v##sign##int##bits##x##size vec1, vuint##bits##x##size vec2) \ |
| 377 { \ | 347 { \ |
| 378 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 348 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 379 union vuint##bits##x##size##_impl_data *vec2d = (union vuint##bits##x##size##_impl_data *)&vec2; \ | 349 union vuint##bits##x##size##_impl_data *vec2d = (union vuint##bits##x##size##_impl_data *)&vec2; \ |
| 380 \ | 350 \ |
| 381 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_lrshift(vec1d->impl[0], vec2d->impl[0]); \ | 351 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_lrshift(vec1d->impl[0], vec2d->impl[0]); \ |
| 382 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_lrshift(vec1d->impl[1], vec2d->impl[1]); \ | 352 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_lrshift(vec1d->impl[1], vec2d->impl[1]); \ |
| 383 \ | 353 \ |
| 384 return vec1d->vec; \ | 354 return vec1d->vec; \ |
| 385 } \ | 355 } \ |
| 386 \ | 356 \ |
| 387 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmplt(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 357 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmplt(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 388 { \ | 358 { \ |
| 389 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 359 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 390 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 360 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 391 \ | 361 \ |
| 392 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_cmplt(vec1d->impl[0], vec2d->impl[0]); \ | 362 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_cmplt(vec1d->impl[0], vec2d->impl[0]); \ |
| 393 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_cmplt(vec1d->impl[1], vec2d->impl[1]); \ | 363 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_cmplt(vec1d->impl[1], vec2d->impl[1]); \ |
| 394 \ | 364 \ |
| 395 return vec1d->vec; \ | 365 return vec1d->vec; \ |
| 396 } \ | 366 } \ |
| 397 \ | 367 \ |
| 398 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmple(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 368 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmple(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 399 { \ | 369 { \ |
| 400 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 370 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 401 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 371 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 402 \ | 372 \ |
| 403 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_cmple(vec1d->impl[0], vec2d->impl[0]); \ | 373 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_cmple(vec1d->impl[0], vec2d->impl[0]); \ |
| 404 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_cmple(vec1d->impl[1], vec2d->impl[1]); \ | 374 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_cmple(vec1d->impl[1], vec2d->impl[1]); \ |
| 405 \ | 375 \ |
| 406 return vec1d->vec; \ | 376 return vec1d->vec; \ |
| 407 } \ | 377 } \ |
| 408 \ | 378 \ |
| 409 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpeq(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 379 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpeq(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 410 { \ | 380 { \ |
| 411 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 381 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 412 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 382 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 413 \ | 383 \ |
| 414 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_cmpeq(vec1d->impl[0], vec2d->impl[0]); \ | 384 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_cmpeq(vec1d->impl[0], vec2d->impl[0]); \ |
| 415 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_cmpeq(vec1d->impl[1], vec2d->impl[1]); \ | 385 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_cmpeq(vec1d->impl[1], vec2d->impl[1]); \ |
| 416 \ | 386 \ |
| 417 return vec1d->vec; \ | 387 return vec1d->vec; \ |
| 418 } \ | 388 } \ |
| 419 \ | 389 \ |
| 420 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpge(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 390 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpge(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 421 { \ | 391 { \ |
| 422 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 392 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 423 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 393 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 424 \ | 394 \ |
| 425 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_cmpge(vec1d->impl[0], vec2d->impl[0]); \ | 395 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_cmpge(vec1d->impl[0], vec2d->impl[0]); \ |
| 426 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_cmpge(vec1d->impl[1], vec2d->impl[1]); \ | 396 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_cmpge(vec1d->impl[1], vec2d->impl[1]); \ |
| 427 \ | 397 \ |
| 428 return vec1d->vec; \ | 398 return vec1d->vec; \ |
| 429 } \ | 399 } \ |
| 430 \ | 400 \ |
| 431 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpgt(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | 401 v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_cmpgt(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ |
| 432 { \ | 402 { \ |
| 433 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | 403 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ |
| 434 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | 404 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ |
| 435 \ | 405 \ |
| 436 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_cmpgt(vec1d->impl[0], vec2d->impl[0]); \ | 406 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_cmpgt(vec1d->impl[0], vec2d->impl[0]); \ |
| 437 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_cmpgt(vec1d->impl[1], vec2d->impl[1]); \ | 407 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_cmpgt(vec1d->impl[1], vec2d->impl[1]); \ |
| 438 \ | 408 \ |
| 439 return vec1d->vec; \ | 409 return vec1d->vec; \ |
| 440 } \ | 410 } \ |
| 441 \ | 411 \ |
| 442 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_min(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | |
| 443 { \ | |
| 444 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | |
| 445 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | |
| 446 \ | |
| 447 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_min(vec1d->impl[0], vec2d->impl[0]); \ | |
| 448 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_min(vec1d->impl[1], vec2d->impl[1]); \ | |
| 449 \ | |
| 450 return vec1d->vec; \ | |
| 451 } \ | |
| 452 \ | |
| 453 VEC_FUNC_IMPL v##sign##int##bits##x##size v##sign##int##bits##x##size##_generic_max(v##sign##int##bits##x##size vec1, v##sign##int##bits##x##size vec2) \ | |
| 454 { \ | |
| 455 union v##sign##int##bits##x##size##_impl_data *vec1d = (union v##sign##int##bits##x##size##_impl_data *)&vec1; \ | |
| 456 union v##sign##int##bits##x##size##_impl_data *vec2d = (union v##sign##int##bits##x##size##_impl_data *)&vec2; \ | |
| 457 \ | |
| 458 vec1d->impl[0] = v##sign##int##bits##x##halfsize##_max(vec1d->impl[0], vec2d->impl[0]); \ | |
| 459 vec1d->impl[1] = v##sign##int##bits##x##halfsize##_max(vec1d->impl[1], vec2d->impl[1]); \ | |
| 460 \ | |
| 461 return vec1d->vec; \ | |
| 462 } \ | |
| 463 \ | |
| 464 const v##sign##int##bits##x##size##_impl v##sign##int##bits##x##size##_impl_generic = { \ | 412 const v##sign##int##bits##x##size##_impl v##sign##int##bits##x##size##_impl_generic = { \ |
| 465 .splat = v##sign##int##bits##x##size##_generic_splat, \ | 413 v##sign##int##bits##x##size##_generic_splat, \ |
| 466 .load_aligned = v##sign##int##bits##x##size##_generic_load_aligned, \ | 414 v##sign##int##bits##x##size##_generic_load_aligned, \ |
| 467 .load = v##sign##int##bits##x##size##_generic_load, \ | 415 v##sign##int##bits##x##size##_generic_load, \ |
| 468 .store_aligned = v##sign##int##bits##x##size##_generic_store_aligned, \ | 416 v##sign##int##bits##x##size##_generic_store_aligned, \ |
| 469 .store = v##sign##int##bits##x##size##_generic_store, \ | 417 v##sign##int##bits##x##size##_generic_store, \ |
| 470 .add = v##sign##int##bits##x##size##_generic_add, \ | 418 v##sign##int##bits##x##size##_generic_add, \ |
| 471 .sub = v##sign##int##bits##x##size##_generic_sub, \ | 419 v##sign##int##bits##x##size##_generic_sub, \ |
| 472 .mul = v##sign##int##bits##x##size##_generic_mul, \ | 420 v##sign##int##bits##x##size##_generic_mul, \ |
| 473 .div = v##sign##int##bits##x##size##_generic_div, \ | 421 v##sign##int##bits##x##size##_generic_div, \ |
| 474 .avg = v##sign##int##bits##x##size##_generic_avg, \ | 422 v##sign##int##bits##x##size##_generic_avg, \ |
| 475 .band = v##sign##int##bits##x##size##_generic_and, \ | 423 v##sign##int##bits##x##size##_generic_and, \ |
| 476 .bor = v##sign##int##bits##x##size##_generic_or, \ | 424 v##sign##int##bits##x##size##_generic_or, \ |
| 477 .bxor = v##sign##int##bits##x##size##_generic_xor, \ | 425 v##sign##int##bits##x##size##_generic_xor, \ |
| 478 .lshift = v##sign##int##bits##x##size##_generic_lshift, \ | 426 v##sign##int##bits##x##size##_generic_not, \ |
| 479 .rshift = v##sign##int##bits##x##size##_generic_rshift, \ | 427 v##sign##int##bits##x##size##_generic_lshift, \ |
| 480 .lrshift = v##sign##int##bits##x##size##_generic_lrshift, \ | 428 v##sign##int##bits##x##size##_generic_rshift, \ |
| 481 .cmplt = v##sign##int##bits##x##size##_generic_cmplt, \ | 429 v##sign##int##bits##x##size##_generic_lrshift, \ |
| 482 .cmple = v##sign##int##bits##x##size##_generic_cmple, \ | 430 v##sign##int##bits##x##size##_generic_cmplt, \ |
| 483 .cmpeq = v##sign##int##bits##x##size##_generic_cmpeq, \ | 431 v##sign##int##bits##x##size##_generic_cmple, \ |
| 484 .cmpge = v##sign##int##bits##x##size##_generic_cmpge, \ | 432 v##sign##int##bits##x##size##_generic_cmpeq, \ |
| 485 .cmpgt = v##sign##int##bits##x##size##_generic_cmpgt, \ | 433 v##sign##int##bits##x##size##_generic_cmpge, \ |
| 486 .min = v##sign##int##bits##x##size##_generic_min, \ | 434 v##sign##int##bits##x##size##_generic_cmpgt, \ |
| 487 .max = v##sign##int##bits##x##size##_generic_max, \ | |
| 488 }; | 435 }; |
| 489 | 436 |
| 490 #define VEC_GENERIC_DEFINE_OPERATIONS(bits, size, halfsize) \ | 437 #define VEC_GENERIC_DEFINE_OPERATIONS(bits, size, halfsize) \ |
| 491 VEC_GENERIC_DEFINE_OPERATIONS_SIGN(u, U, bits, size, halfsize) \ | 438 VEC_GENERIC_DEFINE_OPERATIONS_SIGN(u, U, bits, size, halfsize) \ |
| 492 VEC_GENERIC_DEFINE_OPERATIONS_SIGN( , , bits, size, halfsize) | 439 VEC_GENERIC_DEFINE_OPERATIONS_SIGN( , , bits, size, halfsize) |
