implement array_len_greater_than+jmp fusion
[ajla.git] / c1-arm64.inc
blobea5ca142f142ec777ef7c34fb6068133d5f92b2a
1 /*
2  * Copyright (C) 2024 Mikulas Patocka
3  *
4  * This file is part of Ajla.
5  *
6  * Ajla is free software: you can redistribute it and/or modify it under the
7  * terms of the GNU General Public License as published by the Free Software
8  * Foundation, either version 3 of the License, or (at your option) any later
9  * version.
10  *
11  * Ajla is distributed in the hope that it will be useful, but WITHOUT ANY
12  * WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR
13  * A PARTICULAR PURPOSE. See the GNU General Public License for more details.
14  *
15  * You should have received a copy of the GNU General Public License along with
16  * Ajla. If not, see <https://www.gnu.org/licenses/>.
17  */
19 #define OP_SIZE_NATIVE                  OP_SIZE_8
20 #define OP_SIZE_ADDRESS                 OP_SIZE_8
22 #define JMP_LIMIT                       JMP_LONG
24 #define UNALIGNED_TRAP                  0
26 #define ALU_WRITES_FLAGS(alu, im)       0
27 #define ALU1_WRITES_FLAGS(alu)          0
28 #define ROT_WRITES_FLAGS(alu, size, im) 0
29 #define COND_IS_LOGICAL(cond)           0
31 #define ARCH_PARTIAL_ALU(size)          0
32 #define ARCH_IS_3ADDRESS(alu, f)        1
33 #define ARCH_IS_3ADDRESS_IMM(alu, f)    1
34 #define ARCH_IS_3ADDRESS_ROT(alu, size) 1
35 #define ARCH_IS_3ADDRESS_ROT_IMM(alu)   1
36 #define ARCH_IS_2ADDRESS(alu)           1
37 #define ARCH_IS_3ADDRESS_FP             1
38 #define ARCH_HAS_JMP_2REGS(cond)        0
39 #define ARCH_HAS_FLAGS                  1
40 #define ARCH_PREFERS_SX(size)           0
41 #define ARCH_HAS_BWX                    1
42 #define ARCH_HAS_MUL                    1
43 #define ARCH_HAS_DIV                    1
44 #define ARCH_HAS_ANDN                   1
45 #define ARCH_HAS_SHIFTED_ADD(bits)      1
46 #define ARCH_HAS_BTX(btx, size, cnst)   0
47 #define ARCH_SHIFT_SIZE                 OP_SIZE_4
48 #define ARCH_HAS_FP_GP_MOV              1
49 #define ARCH_NEEDS_BARRIER              0
51 #define i_size(size)                    maximum(size, OP_SIZE_4)
52 #define i_size_rot(size)                maximum(size, OP_SIZE_4)
53 #define i_size_cmp(size)                maximum(size, OP_SIZE_4)
55 #define R_0             0x00
56 #define R_1             0x01
57 #define R_2             0x02
58 #define R_3             0x03
59 #define R_4             0x04
60 #define R_5             0x05
61 #define R_6             0x06
62 #define R_7             0x07
63 #define R_8             0x08
64 #define R_9             0x09
65 #define R_10            0x0a
66 #define R_11            0x0b
67 #define R_12            0x0c
68 #define R_13            0x0d
69 #define R_14            0x0e
70 #define R_15            0x0f
71 #define R_16            0x10
72 #define R_17            0x11
73 #define R_18            0x12
74 #define R_19            0x13
75 #define R_20            0x14
76 #define R_21            0x15
77 #define R_22            0x16
78 #define R_23            0x17
79 #define R_24            0x18
80 #define R_25            0x19
81 #define R_26            0x1a
82 #define R_27            0x1b
83 #define R_28            0x1c
84 #define R_FP            0x1d
85 #define R_LR            0x1e
86 #define R_SP            0x1f
88 #define FR_0            0x20
89 #define FR_1            0x21
90 #define FR_2            0x22
91 #define FR_3            0x23
92 #define FR_4            0x24
93 #define FR_5            0x25
94 #define FR_6            0x26
95 #define FR_7            0x27
96 #define FR_8            0x28
97 #define FR_9            0x29
98 #define FR_10           0x2a
99 #define FR_11           0x2b
100 #define FR_12           0x2c
101 #define FR_13           0x2d
102 #define FR_14           0x2e
103 #define FR_15           0x2f
104 #define FR_16           0x30
105 #define FR_17           0x31
106 #define FR_18           0x32
107 #define FR_19           0x33
108 #define FR_20           0x34
109 #define FR_21           0x35
110 #define FR_22           0x36
111 #define FR_23           0x37
112 #define FR_24           0x38
113 #define FR_25           0x39
114 #define FR_26           0x3a
115 #define FR_27           0x3b
116 #define FR_28           0x3c
117 #define FR_29           0x3d
118 #define FR_30           0x3e
119 #define FR_31           0x3f
121 #define FRAME_SIZE      0x60
123 #define R_FRAME         R_28
124 #define R_UPCALL        R_27
125 #define R_TIMESTAMP     R_26
126 #define R_SAVED_1       R_25
127 #define R_SAVED_2       R_24
128 #define R_SAVED_3       R_23
129 #define R_SAVED_4       R_22
130 #define R_SAVED_5       R_21
131 #define R_SAVED_6       R_20
132 #define R_SAVED_7       R_19
134 #define R_SCRATCH_1     R_0
135 #define R_SCRATCH_2     R_1
136 #define R_SCRATCH_3     R_2
137 #define R_SCRATCH_4     R_3
138 #define R_SCRATCH_NA_1  R_8
139 #define R_SCRATCH_NA_2  R_9
140 #ifdef HAVE_BITWISE_FRAME
141 #define R_SCRATCH_NA_3  R_10
142 #endif
143 #define R_OFFSET_IMM    R_16
144 #define R_CONST_IMM     R_17
146 #define R_ARG0          R_0
147 #define R_ARG1          R_1
148 #define R_ARG2          R_2
149 #define R_ARG3          R_3
150 #define R_RET0          R_0
151 #define R_RET1          R_1
153 #define FR_SCRATCH_1    FR_0
154 #define FR_SCRATCH_2    FR_1
156 #define SUPPORTED_FP            0x6
157 #define SUPPORTED_FP_HALF_CVT   0x1
159 static bool reg_is_fp(unsigned reg)
161         return reg >= 0x20 && reg < 0x40;
164 static const uint8_t regs_saved[] = { R_SAVED_7, R_SAVED_6, R_SAVED_5, R_SAVED_4, R_SAVED_3 };
165 static const uint8_t regs_volatile[] = { R_4, R_5, R_6, R_7,
166 #ifndef HAVE_BITWISE_FRAME
167         R_10,
168 #endif
169         R_11, R_12, R_13, R_14, R_15, R_LR };
170 static const uint8_t fp_saved[] = { 0 };
171 #define n_fp_saved 0U
172 static const uint8_t fp_volatile[] = { FR_2, FR_3, FR_4, FR_5, FR_6, FR_7, FR_16, FR_17, FR_18, FR_19, FR_20, FR_21, FR_22, FR_23, FR_24, FR_25, FR_26, FR_27, FR_28, FR_29, FR_30, FR_31 };
173 #define reg_is_saved(r) ((r) >= R_19 && (r) <= R_FP)
175 struct logical_imm {
176         uint64_t value;
177         uint16_t code;
180 static const struct logical_imm value_to_code_4_table[] = {
181 #include "arm64-w.inc"
184 static const struct logical_imm value_to_code_8_table[] = {
185 #include "arm64-x.inc"
188 static int16_t value_to_code(uint8_t size, uint64_t value)
190         size_t result;
191         if (size == OP_SIZE_4) {
192                 binary_search(size_t, n_array_elements(value_to_code_4_table), result, value_to_code_4_table[result].value == value, value_to_code_4_table[result].value < value, return -1);
193                 return value_to_code_4_table[result].code;
194         } else {
195                 binary_search(size_t, n_array_elements(value_to_code_8_table), result, value_to_code_8_table[result].value == value, value_to_code_8_table[result].value < value, return -1);
196                 return value_to_code_8_table[result].code;
197         }
200 static bool attr_w gen_load_constant(struct codegen_context *ctx, unsigned reg, uint64_t c)
202         int16_t code;
204         if (c < 0x10000)
205                 goto skip_lookup;
207         code = value_to_code(OP_SIZE_4, c);
208         if (code >= 0) {
209                 gen_insn(INSN_ALU, OP_SIZE_4, ALU_OR, 0);
210                 gen_one(reg);
211                 gen_one(0x1f);
212                 gen_one(ARG_IMM);
213                 gen_eight(c);
214                 return true;
215         }
217         code = value_to_code(OP_SIZE_8, c);
218         if (code >= 0) {
219                 gen_insn(INSN_ALU, OP_SIZE_8, ALU_OR, 0);
220                 gen_one(reg);
221                 gen_one(0x1f);
222                 gen_one(ARG_IMM);
223                 gen_eight(c);
224                 return true;
225         }
227 skip_lookup:
228         if ((int64_t)c < 0) {
229                 gen_insn(INSN_MOV, OP_SIZE_8, 0, 0);
230                 gen_one(reg);
231                 gen_one(ARG_IMM);
232                 gen_eight((c & 0xffff) | 0xffffffffffff0000ULL);
233                 if ((c & 0xffff0000ULL) != 0xffff0000ULL) {
234                         gen_insn(INSN_MOV_MASK, OP_SIZE_8, MOV_MASK_16_32, 0);
235                         gen_one(reg);
236                         gen_one(reg);
237                         gen_one(ARG_IMM);
238                         gen_eight((c >> 16) & 0xffff);
239                 }
240                 if ((c & 0xffff00000000ULL) != 0xffff00000000ULL) {
241                         gen_insn(INSN_MOV_MASK, OP_SIZE_8, MOV_MASK_32_48, 0);
242                         gen_one(reg);
243                         gen_one(reg);
244                         gen_one(ARG_IMM);
245                         gen_eight((c >> 32) & 0xffff);
246                 }
247                 if ((c & 0xffff000000000000ULL) != 0xffff000000000000ULL) {
248                         gen_insn(INSN_MOV_MASK, OP_SIZE_8, MOV_MASK_48_64, 0);
249                         gen_one(reg);
250                         gen_one(reg);
251                         gen_one(ARG_IMM);
252                         gen_eight((c >> 48) & 0xffff);
253                 }
254         } else {
255                 gen_insn(INSN_MOV, OP_SIZE_8, 0, 0);
256                 gen_one(reg);
257                 gen_one(ARG_IMM);
258                 gen_eight(c & 0xffff);
259                 if (c & 0xffff0000ULL) {
260                         gen_insn(INSN_MOV_MASK, OP_SIZE_8, MOV_MASK_16_32, 0);
261                         gen_one(reg);
262                         gen_one(reg);
263                         gen_one(ARG_IMM);
264                         gen_eight((c >> 16) & 0xffff);
265                 }
266                 if (c & 0xffff00000000ULL) {
267                         gen_insn(INSN_MOV_MASK, OP_SIZE_8, MOV_MASK_32_48, 0);
268                         gen_one(reg);
269                         gen_one(reg);
270                         gen_one(ARG_IMM);
271                         gen_eight((c >> 32) & 0xffff);
272                 }
273                 if (c & 0xffff000000000000ULL) {
274                         gen_insn(INSN_MOV_MASK, OP_SIZE_8, MOV_MASK_48_64, 0);
275                         gen_one(reg);
276                         gen_one(reg);
277                         gen_one(ARG_IMM);
278                         gen_eight((c >> 48) & 0xffff);
279                 }
280         }
281         return true;
284 static bool attr_w gen_address(struct codegen_context *ctx, unsigned base, int64_t imm, unsigned purpose, unsigned size)
286         ctx->base_reg = base;
287         ctx->offset_imm = imm;
288         ctx->offset_reg = false;
289         switch (purpose) {
290                 case IMM_PURPOSE_LDR_OFFSET:
291                 case IMM_PURPOSE_LDR_SX_OFFSET:
292                 case IMM_PURPOSE_STR_OFFSET:
293                 case IMM_PURPOSE_VLDR_VSTR_OFFSET:
294                 case IMM_PURPOSE_MVI_CLI_OFFSET:
295                         if (likely(imm >= -256) && likely(imm <= 255))
296                                 return true;
297                         if (likely(imm >= 0)) {
298                                 if (unlikely((imm & ((1 << size) - 1)) != 0))
299                                         break;
300                                 if (likely((imm >> size) <= 4095))
301                                         return true;
302                         }
303                         break;
304                 case IMM_PURPOSE_LDP_STP_OFFSET:
305                         if (unlikely((imm & ((1 << size) - 1)) != 0))
306                                 break;
307                         if (imm / (1 << size) >= -64 && imm / (1 << size) <= 63)
308                                 return true;
309                         break;
310                 default:
311                         internal(file_line, "gen_address: invalid purpose %d", purpose);
312         }
313         g(gen_load_constant(ctx, R_OFFSET_IMM, imm));
314         if (purpose == IMM_PURPOSE_LDP_STP_OFFSET) {
315                 gen_insn(INSN_ALU, OP_SIZE_ADDRESS, ALU_ADD, 0);
316                 gen_one(R_OFFSET_IMM);
317                 gen_one(R_OFFSET_IMM);
318                 gen_one(base);
319                 ctx->base_reg = R_OFFSET_IMM;
320                 ctx->offset_imm = 0;
321                 return true;
322         }
323         ctx->offset_reg = true;
324         return true;
328 static bool is_direct_const(int64_t imm, unsigned purpose, unsigned size)
330         switch (purpose) {
331                 case IMM_PURPOSE_STORE_VALUE:
332                         if (!imm)
333                                 return true;
334                         break;
335                 case IMM_PURPOSE_ADD:
336                 case IMM_PURPOSE_SUB:
337                 case IMM_PURPOSE_CMP:
338                 case IMM_PURPOSE_CMP_LOGICAL:
339                         if (imm >= 0 && imm < 4096)
340                                 return true;
341                         break;
342                 case IMM_PURPOSE_AND:
343                 case IMM_PURPOSE_OR:
344                 case IMM_PURPOSE_XOR:
345                 case IMM_PURPOSE_ANDN:
346                 case IMM_PURPOSE_TEST:
347                         if (value_to_code(size, imm) >= 0)
348                                 return true;
349                         break;
350                 case IMM_PURPOSE_MUL:
351                         break;
352                 default:
353                         internal(file_line, "is_direct_const: invalid purpose %u (imm %"PRIxMAX", size %u)", purpose, (uintmax_t)imm, size);
354         }
355         return false;
358 static bool attr_w gen_imm(struct codegen_context *ctx, int64_t imm, unsigned purpose, unsigned size)
360         if (is_direct_const(imm, purpose, size)) {
361                 ctx->const_imm = imm;
362                 ctx->const_reg = false;
363         } else {
364                 g(gen_load_constant(ctx, R_CONST_IMM, imm));
365                 ctx->const_reg = true;
366         }
367         return true;
370 static bool attr_w gen_entry(struct codegen_context *ctx)
372         gen_insn(INSN_STP, OP_SIZE_8, 0, 0);
373         gen_one(ARG_ADDRESS_1_PRE_I);
374         gen_one(R_SP);
375         gen_eight(-FRAME_SIZE);
376         gen_one(R_FP);
377         gen_one(R_LR);
379         gen_insn(INSN_MOV, OP_SIZE_8, 0, 0);
380         gen_one(R_FP);
381         gen_one(R_SP);
383         gen_insn(INSN_STP, OP_SIZE_8, 0, 0);
384         gen_one(ARG_ADDRESS_1);
385         gen_one(R_SP);
386         gen_eight(0x10);
387         gen_one(R_UPCALL);
388         gen_one(R_FRAME);
390         gen_insn(INSN_STP, OP_SIZE_8, 0, 0);
391         gen_one(ARG_ADDRESS_1);
392         gen_one(R_SP);
393         gen_eight(0x20);
394         gen_one(R_SAVED_1);
395         gen_one(R_TIMESTAMP);
397         gen_insn(INSN_STP, OP_SIZE_8, 0, 0);
398         gen_one(ARG_ADDRESS_1);
399         gen_one(R_SP);
400         gen_eight(0x30);
401         gen_one(R_SAVED_3);
402         gen_one(R_SAVED_2);
404         gen_insn(INSN_STP, OP_SIZE_8, 0, 0);
405         gen_one(ARG_ADDRESS_1);
406         gen_one(R_SP);
407         gen_eight(0x40);
408         gen_one(R_SAVED_5);
409         gen_one(R_SAVED_4);
411         gen_insn(INSN_STP, OP_SIZE_8, 0, 0);
412         gen_one(ARG_ADDRESS_1);
413         gen_one(R_SP);
414         gen_eight(0x50);
415         gen_one(R_SAVED_7);
416         gen_one(R_SAVED_6);
418         gen_insn(INSN_MOV, OP_SIZE_8, 0, 0);
419         gen_one(R_FRAME);
420         gen_one(R_ARG0);
422         gen_insn(INSN_MOV, OP_SIZE_8, 0, 0);
423         gen_one(R_UPCALL);
424         gen_one(R_ARG1);
426         gen_insn(INSN_MOV, OP_SIZE_8, 0, 0);
427         gen_one(R_TIMESTAMP);
428         gen_one(R_ARG2);
430         gen_insn(INSN_JMP_INDIRECT, 0, 0, 0);
431         gen_one(R_ARG3);
433         return true;
436 static bool attr_w gen_escape_arg(struct codegen_context *ctx, ip_t ip, uint32_t escape_label)
438         g(gen_load_constant(ctx, R_RET1, ip));
440         gen_insn(INSN_JMP, 0, 0, 0);
441         gen_four(escape_label);
443         return true;
446 static bool attr_w gen_escape(struct codegen_context *ctx)
448         gen_insn(INSN_MOV, OP_SIZE_8, 0, 0);
449         gen_one(R_RET0);
450         gen_one(R_FRAME);
452         gen_insn(INSN_LDP, OP_SIZE_8, 0, 0);
453         gen_one(R_SAVED_7);
454         gen_one(R_SAVED_6);
455         gen_one(ARG_ADDRESS_1);
456         gen_one(R_SP);
457         gen_eight(0x50);
459         gen_insn(INSN_LDP, OP_SIZE_8, 0, 0);
460         gen_one(R_SAVED_5);
461         gen_one(R_SAVED_4);
462         gen_one(ARG_ADDRESS_1);
463         gen_one(R_SP);
464         gen_eight(0x40);
466         gen_insn(INSN_LDP, OP_SIZE_8, 0, 0);
467         gen_one(R_SAVED_3);
468         gen_one(R_SAVED_2);
469         gen_one(ARG_ADDRESS_1);
470         gen_one(R_SP);
471         gen_eight(0x30);
473         gen_insn(INSN_LDP, OP_SIZE_8, 0, 0);
474         gen_one(R_SAVED_1);
475         gen_one(R_TIMESTAMP);
476         gen_one(ARG_ADDRESS_1);
477         gen_one(R_SP);
478         gen_eight(0x20);
480         gen_insn(INSN_LDP, OP_SIZE_8, 0, 0);
481         gen_one(R_UPCALL);
482         gen_one(R_FRAME);
483         gen_one(ARG_ADDRESS_1);
484         gen_one(R_SP);
485         gen_eight(0x10);
487         gen_insn(INSN_LDP, OP_SIZE_8, 0, 0);
488         gen_one(R_FP);
489         gen_one(R_LR);
490         gen_one(ARG_ADDRESS_1_POST_I);
491         gen_one(R_SP);
492         gen_eight(FRAME_SIZE);
494         gen_insn(INSN_RET, 0, 0, 0);
496         return true;
499 static bool attr_w gen_upcall_argument(struct codegen_context attr_unused *ctx, unsigned attr_unused arg)
501         return true;
504 static bool attr_w gen_upcall(struct codegen_context *ctx, unsigned offset, unsigned n_args)
506         g(gen_address(ctx, R_UPCALL, offset, IMM_PURPOSE_LDR_OFFSET, OP_SIZE_8));
507         gen_insn(INSN_MOV, OP_SIZE_8, 0, 0);
508         gen_one(R_SCRATCH_NA_1);
509         gen_address_offset();
511         gen_insn(INSN_CALL_INDIRECT, OP_SIZE_8, 0, 0);
512         gen_one(R_SCRATCH_NA_1);
514         g(gen_upcall_end(ctx, n_args));
516         return true;
519 static bool attr_w gen_timestamp_test(struct codegen_context *ctx, uint32_t escape_label)
521         g(gen_address(ctx, R_UPCALL, offsetof(struct cg_upcall_vector_s, ts), IMM_PURPOSE_LDR_OFFSET, OP_SIZE_4));
522         gen_insn(INSN_MOV, OP_SIZE_4, 0, 0);
523         gen_one(R_SCRATCH_1);
524         gen_address_offset();
526         gen_insn(INSN_CMP, OP_SIZE_4, 0, 1);
527         gen_one(R_SCRATCH_1);
528         gen_one(R_TIMESTAMP);
530         gen_insn(INSN_JMP_COND, OP_SIZE_4, COND_NE, 0);
531         gen_four(escape_label);
533         return true;