21
21
// test smaller input size
22
22
// test 8x16 block size
23
23
//
24
- #define DIM_SIZE (1 << 10 )
24
+ #define DIM_SIZE (1 << 13 )
25
25
#define SQUARE_SZ (DIM_SIZE * DIM_SIZE)
26
26
27
27
#define WIDTH 16
@@ -147,11 +147,6 @@ int main(void) {
147
147
vin.select <WIDTH, 1 >(GET_IDX (i + 2 , 5 )) * -0 .0333333333333f +
148
148
vin.select <WIDTH, 1 >(GET_IDX (i + 3 , 5 )) * -0 .05f +
149
149
vin.select <WIDTH, 1 >(GET_IDX (i + 4 , 5 )) * -0 .1f +
150
- vin.select <WIDTH, 1 >(GET_IDX (i + 6 , 5 )) * 0 .1f +
151
- vin.select <WIDTH, 1 >(GET_IDX (i + 7 , 5 )) * 0 .05f +
152
- vin.select <WIDTH, 1 >(GET_IDX (i + 8 , 5 )) * 0 .0333333333333f +
153
- vin.select <WIDTH, 1 >(GET_IDX (i + 9 , 5 )) * 0 .025f +
154
- vin.select <WIDTH, 1 >(GET_IDX (i + 10 , 5 )) * 0 .02f +
155
150
vin.select <WIDTH, 1 >(GET_IDX (i + 5 , 0 )) * -0 .02f +
156
151
vin.select <WIDTH, 1 >(GET_IDX (i + 5 , 1 )) * -0 .025f +
157
152
vin.select <WIDTH, 1 >(GET_IDX (i + 5 , 2 )) * -0 .0333333333333f +
@@ -161,7 +156,12 @@ int main(void) {
161
156
vin.select <WIDTH, 1 >(GET_IDX (i + 5 , 7 )) * 0 .05f +
162
157
vin.select <WIDTH, 1 >(GET_IDX (i + 5 , 8 )) * 0 .0333333333333f +
163
158
vin.select <WIDTH, 1 >(GET_IDX (i + 5 , 9 )) * 0 .025f +
164
- vin.select <WIDTH, 1 >(GET_IDX (i + 5 , 10 )) * 0 .02f ;
159
+ vin.select <WIDTH, 1 >(GET_IDX (i + 5 , 10 )) * 0 .02f +
160
+ vin.select <WIDTH, 1 >(GET_IDX (i + 6 , 5 )) * 0 .1f +
161
+ vin.select <WIDTH, 1 >(GET_IDX (i + 7 , 5 )) * 0 .05f +
162
+ vin.select <WIDTH, 1 >(GET_IDX (i + 8 , 5 )) * 0 .0333333333333f +
163
+ vin.select <WIDTH, 1 >(GET_IDX (i + 9 , 5 )) * 0 .025f +
164
+ vin.select <WIDTH, 1 >(GET_IDX (i + 10 , 5 )) * 0 .02f ;
165
165
166
166
// predciate output
167
167
simd<ushort, WIDTH> p = (elm16 + h_pos * WIDTH) < DIM_SIZE - 10 ;
0 commit comments