1 .. include:: ../disclaimer-ita.rst
3 :Original: :ref:`Documentation/process/coding-style.rst <codingstyle>`
4 :Translator: Federico Vaga <federico.vaga@vaga.pv.it>
8 Stile del codice per il kernel Linux
9 ====================================
11 Questo è un breve documento che descrive lo stile di codice preferito per
12 il kernel Linux. Lo stile di codifica è molto personale e non voglio
13 **forzare** nessuno ad accettare il mio, ma questo stile è quello che
14 dev'essere usato per qualsiasi cosa che io sia in grado di mantenere, e l'ho
15 preferito anche per molte altre cose. Per favore, almeno tenete in
16 considerazione le osservazioni espresse qui.
18 La prima cosa che suggerisco è quella di stamparsi una copia degli standard
19 di codifica GNU e di NON leggerla. Bruciatela, è un grande gesto simbolico.
21 Comunque, ecco i punti:
26 La tabulazione (tab) è di 8 caratteri e così anche le indentazioni. Ci sono
27 alcuni movimenti di eretici che vorrebbero l'indentazione a 4 (o perfino 2!)
28 caratteri di profondità, che è simile al tentativo di definire il valore del
31 Motivazione: l'idea dell'indentazione è di definire chiaramente dove un blocco
32 di controllo inizia e finisce. Specialmente quando siete rimasti a guardare lo
33 schermo per 20 ore a file, troverete molto più facile capire i livelli di
34 indentazione se questi sono larghi.
36 Ora, alcuni rivendicano che un'indentazione da 8 caratteri sposta il codice
37 troppo a destra e che quindi rende difficile la lettura su schermi a 80
38 caratteri. La risposta a questa affermazione è che se vi servono più di 3
39 livelli di indentazione, siete comunque fregati e dovreste correggere il vostro
42 In breve, l'indentazione ad 8 caratteri rende più facile la lettura, e in
43 aggiunta vi avvisa quando state annidando troppo le vostre funzioni.
44 Tenete ben a mente questo avviso.
46 Al fine di facilitare l'indentazione del costrutto switch, si preferisce
47 allineare sulla stessa colonna la parola chiave ``switch`` e i suoi
48 subordinati ``case``. In questo modo si evita una doppia indentazione per
49 i ``case``. Un esempio.:
70 A meno che non vogliate nascondere qualcosa, non mettete più istruzioni sulla
75 if (condition) do_this;
76 do_something_everytime;
78 né mettete più assegnamenti sulla stessa riga. Lo stile del kernel
79 è ultrasemplice. Evitate espressioni intricate.
81 Al di fuori dei commenti, della documentazione ed escludendo i Kconfig, gli
82 spazi non vengono mai usati per l'indentazione, e l'esempio qui sopra è
85 Procuratevi un buon editor di testo e non lasciate spazi bianchi alla fine
89 2) Spezzare righe lunghe e stringhe
90 -----------------------------------
92 Lo stile del codice riguarda la leggibilità e la manutenibilità utilizzando
95 Come limite di riga si preferiscono le 80 colonne.
97 Espressioni più lunghe di 80 colonne dovrebbero essere spezzettate in
98 pezzi più piccoli, a meno che eccedere le 80 colonne non aiuti ad
99 aumentare la leggibilità senza nascondere informazioni.
101 I nuovi pezzi derivati sono sostanzialmente più corti degli originali
102 e vengono posizionati più a destra. Uno stile molto comune è quello di
103 allineare i nuovi pezzi alla parentesi aperta di una funzione.
105 Lo stesso si applica, nei file d'intestazione, alle funzioni con una
106 lista di argomenti molto lunga.
108 Tuttavia, non spezzettate mai le stringhe visibili agli utenti come i
109 messaggi di printk, questo perché inibireste la possibilità
110 d'utilizzare grep per cercarle.
112 3) Posizionamento di parentesi graffe e spazi
113 ---------------------------------------------
115 Un altro problema che s'affronta sempre quando si parla di stile in C è
116 il posizionamento delle parentesi graffe. Al contrario della dimensione
117 dell'indentazione, non ci sono motivi tecnici sulla base dei quali scegliere
118 una strategia di posizionamento o un'altra; ma il modo qui preferito,
119 come mostratoci dai profeti Kernighan e Ritchie, è quello di
120 posizionare la parentesi graffa di apertura per ultima sulla riga, e quella
121 di chiusura per prima su una nuova riga, così:
129 Questo è valido per tutte le espressioni che non siano funzioni (if, switch,
130 for, while, do). Per esempio:
145 Tuttavia, c'è il caso speciale, le funzioni: queste hanno la parentesi graffa
146 di apertura all'inizio della riga successiva, quindi:
155 Eretici da tutto il mondo affermano che questa incoerenza è ...
156 insomma ... incoerente, ma tutte le persone ragionevoli sanno che (a)
157 K&R hanno **ragione** e (b) K&R hanno ragione. A parte questo, le funzioni
158 sono comunque speciali (non potete annidarle in C).
160 Notate che la graffa di chiusura è da sola su una riga propria, ad
161 **eccezione** di quei casi dove è seguita dalla continuazione della stessa
162 espressione, in pratica ``while`` nell'espressione do-while, oppure ``else``
163 nell'espressione if-else, come questo:
185 Inoltre, notate che questo posizionamento delle graffe minimizza il numero
186 di righe vuote senza perdere di leggibilità. In questo modo, dato che le
187 righe sul vostro schermo non sono una risorsa illimitata (pensate ad uno
188 terminale con 25 righe), avrete delle righe vuote da riempire con dei
191 Non usate inutilmente le graffe dove una singola espressione è sufficiente.
207 Questo non vale nel caso in cui solo un ramo dell'espressione if-else
208 contiene una sola espressione; in quest'ultimo caso usate le graffe per
220 Inoltre, usate le graffe se un ciclo contiene più di una semplice istruzione:
232 Lo stile del kernel Linux per quanto riguarda gli spazi, dipende
233 (principalmente) dalle funzioni e dalle parole chiave. Usate una spazio dopo
234 (quasi tutte) le parole chiave. L'eccezioni più evidenti sono sizeof, typeof,
235 alignof, e __attribute__, il cui aspetto è molto simile a quello delle
236 funzioni (e in Linux, solitamente, sono usate con le parentesi, anche se il
237 linguaggio non lo richiede; come ``sizeof info`` dopo aver dichiarato
238 ``struct fileinfo info``).
240 Quindi utilizzate uno spazio dopo le seguenti parole chiave::
242 if, switch, case, for, do, while
244 ma non con sizeof, typeof, alignof, o __attribute__. Ad esempio,
249 s = sizeof(struct file);
251 Non aggiungete spazi attorno (dentro) ad un'espressione fra parentesi. Questo
252 esempio è **brutto**:
257 s = sizeof( struct file );
259 Quando dichiarate un puntatore ad una variabile o una funzione che ritorna un
260 puntatore, il posto suggerito per l'asterisco ``*`` è adiacente al nome della
261 variabile o della funzione, e non adiacente al nome del tipo. Esempi:
267 unsigned long long memparse(char *ptr, char **retptr);
268 char *match_strdup(substring_t *s);
270 Usate uno spazio attorno (da ogni parte) alla maggior parte degli operatori
271 binari o ternari, come i seguenti::
273 = + - < > * / % | & ^ <= >= == != ? :
275 ma non mettete spazi dopo gli operatori unari::
277 & * + - ~ ! sizeof typeof alignof __attribute__ defined
279 nessuno spazio dopo l'operatore unario suffisso di incremento o decremento::
283 nessuno spazio dopo l'operatore unario prefisso di incremento o decremento::
287 e nessuno spazio attorno agli operatori dei membri di una struttura ``.`` e
290 Non lasciate spazi bianchi alla fine delle righe. Alcuni editor con
291 l'indentazione ``furba`` inseriranno gli spazi bianchi all'inizio di una nuova
292 riga in modo appropriato, quindi potrete scrivere la riga di codice successiva
293 immediatamente. Tuttavia, alcuni di questi stessi editor non rimuovono
294 questi spazi bianchi quando non scrivete nulla sulla nuova riga, ad esempio
295 perché volete lasciare una riga vuota. Il risultato è che finirete per avere
296 delle righe che contengono spazi bianchi in coda.
298 Git vi avviserà delle modifiche che aggiungono questi spazi vuoti di fine riga,
299 e può opzionalmente rimuoverli per conto vostro; tuttavia, se state applicando
300 una serie di modifiche, questo potrebbe far fallire delle modifiche successive
301 perché il contesto delle righe verrà cambiato.
306 C è un linguaggio spartano, e così dovrebbero esserlo i vostri nomi. Al
307 contrario dei programmatori Modula-2 o Pascal, i programmatori C non usano
308 nomi graziosi come ThisVariableIsATemporaryCounter. Un programmatore C
309 chiamerebbe questa variabile ``tmp``, che è molto più facile da scrivere e
310 non è una delle più difficili da capire.
312 TUTTAVIA, nonostante i nomi con notazione mista siano da condannare, i nomi
313 descrittivi per variabili globali sono un dovere. Chiamare una funzione
314 globale ``pippo`` è un insulto.
316 Le variabili GLOBALI (da usare solo se vi servono **davvero**) devono avere
317 dei nomi descrittivi, così come le funzioni globali. Se avete una funzione
318 che conta gli utenti attivi, dovreste chiamarla ``count_active_users()`` o
319 qualcosa di simile, **non** dovreste chiamarla ``cntusr()``.
321 Codificare il tipo di funzione nel suo nome (quella cosa chiamata notazione
322 ungherese) è stupido - il compilatore conosce comunque il tipo e
323 può verificarli, e inoltre confonde i programmatori. Non c'è da
324 sorprendersi che MicroSoft faccia programmi bacati.
326 Le variabili LOCALI dovrebbero avere nomi corti, e significativi. Se avete
327 un qualsiasi contatore di ciclo, probabilmente sarà chiamato ``i``.
328 Chiamarlo ``loop_counter`` non è produttivo, non ci sono possibilità che
329 ``i`` possa non essere capito. Analogamente, ``tmp`` può essere una qualsiasi
330 variabile che viene usata per salvare temporaneamente un valore.
332 Se avete paura di fare casino coi nomi delle vostre variabili locali, allora
333 avete un altro problema che è chiamato sindrome dello squilibrio dell'ormone
334 della crescita delle funzioni. Vedere il capitolo 6 (funzioni).
336 5) Definizione di tipi (typedef)
337 --------------------------------
339 Per favore non usate cose come ``vps_t``.
340 Usare il typedef per strutture e puntatori è uno **sbaglio**. Quando vedete:
346 nei sorgenti, cosa significa?
351 struct virtual_container *a;
353 potreste dire cos'è effettivamente ``a``.
355 Molte persone pensano che la definizione dei tipi ``migliori la leggibilità``.
356 Non molto. Sono utili per:
358 (a) gli oggetti completamente opachi (dove typedef viene proprio usato allo
359 scopo di **nascondere** cosa sia davvero l'oggetto).
361 Esempio: ``pte_t`` eccetera sono oggetti opachi che potete usare solamente
362 con le loro funzioni accessorie.
365 Gli oggetti opachi e le ``funzioni accessorie`` non sono, di per se,
366 una bella cosa. Il motivo per cui abbiamo cose come pte_t eccetera è
367 che davvero non c'è alcuna informazione portabile.
369 (b) i tipi chiaramente interi, dove l'astrazione **aiuta** ad evitare
370 confusione sul fatto che siano ``int`` oppure ``long``.
372 u8/u16/u32 sono typedef perfettamente accettabili, anche se ricadono
373 nella categoria (d) piuttosto che in questa.
377 Ancora - dev'esserci una **ragione** per farlo. Se qualcosa è
378 ``unsigned long``, non c'è alcun bisogno di avere:
380 typedef unsigned long myfalgs_t;
382 ma se ci sono chiare circostanze in cui potrebbe essere ``unsigned int``
383 e in altre configurazioni ``unsigned long``, allora certamente typedef
386 (c) quando di rado create letteralmente dei **nuovi** tipi su cui effettuare
389 (d) circostanze eccezionali, in cui si definiscono nuovi tipi identici a
390 quelli definiti dallo standard C99.
392 Nonostante ci voglia poco tempo per abituare occhi e cervello all'uso dei
393 tipi standard come ``uint32_t``, alcune persone ne obiettano l'uso.
395 Perciò, i tipi specifici di Linux ``u8/u16/u32/u64`` e i loro equivalenti
396 con segno, identici ai tipi standard, sono permessi- tuttavia, non sono
397 obbligatori per il nuovo codice.
399 (e) i tipi sicuri nella spazio utente.
401 In alcune strutture dati visibili dallo spazio utente non possiamo
402 richiedere l'uso dei tipi C99 e nemmeno i vari ``u32`` descritti prima.
403 Perciò, utilizziamo __u32 e tipi simili in tutte le strutture dati
404 condivise con lo spazio utente.
406 Magari ci sono altri casi validi, ma la regola di base dovrebbe essere di
407 non usare MAI MAI un typedef a meno che non rientri in una delle regole
410 In generale, un puntatore, o una struttura a cui si ha accesso diretto in
411 modo ragionevole, non dovrebbero **mai** essere definite con un typedef.
416 Le funzioni dovrebbero essere brevi e carine, e fare una cosa sola. Dovrebbero
417 occupare uno o due schermi di testo (come tutti sappiamo, la dimensione
418 di uno schermo secondo ISO/ANSI è di 80x24), e fare una cosa sola e bene.
420 La massima lunghezza di una funziona è inversamente proporzionale alla sua
421 complessità e al livello di indentazione di quella funzione. Quindi, se avete
422 una funzione che è concettualmente semplice ma che è implementata come un
423 lunga (ma semplice) sequenza di caso-istruzione, dove avete molte piccole cose
424 per molti casi differenti, allora va bene avere funzioni più lunghe.
426 Comunque, se avete una funzione complessa e sospettate che uno studente
427 non particolarmente dotato del primo anno delle scuole superiori potrebbe
428 non capire cosa faccia la funzione, allora dovreste attenervi strettamente ai
429 limiti. Usate funzioni di supporto con nomi descrittivi (potete chiedere al
430 compilatore di renderle inline se credete che sia necessario per le
431 prestazioni, e probabilmente farà un lavoro migliore di quanto avreste potuto
434 Un'altra misura delle funzioni sono il numero di variabili locali. Non
435 dovrebbero eccedere le 5-10, oppure state sbagliando qualcosa. Ripensate la
436 funzione, e dividetela in pezzettini. Generalmente, un cervello umano può
437 seguire facilmente circa 7 cose diverse, di più lo confonderebbe. Lo sai
438 d'essere brillante, ma magari vorresti riuscire a capire cos'avevi fatto due
441 Nei file sorgenti, separate le funzioni con una riga vuota. Se la funzione è
442 esportata, la macro **EXPORT** per questa funzione deve seguire immediatamente
443 la riga della parentesi graffa di chiusura. Ad esempio:
447 int system_is_up(void)
449 return system_state == SYSTEM_RUNNING;
451 EXPORT_SYMBOL(system_is_up);
453 Nei prototipi di funzione, includete i nomi dei parametri e i loro tipi.
454 Nonostante questo non sia richiesto dal linguaggio C, in Linux viene preferito
455 perché è un modo semplice per aggiungere informazioni importanti per il
458 Non usate la parola chiave ``extern`` coi prototipi di funzione perché
459 rende le righe più lunghe e non è strettamente necessario.
461 7) Centralizzare il ritorno delle funzioni
462 ------------------------------------------
464 Sebbene sia deprecata da molte persone, l'istruzione goto è impiegata di
465 frequente dai compilatori sotto forma di salto incondizionato.
467 L'istruzione goto diventa utile quando una funzione ha punti d'uscita multipli
468 e vanno eseguite alcune procedure di pulizia in comune. Se non è necessario
469 pulire alcunché, allora ritornate direttamente.
471 Assegnate un nome all'etichetta di modo che suggerisca cosa fa la goto o
472 perché esiste. Un esempio di un buon nome potrebbe essere ``out_free_buffer:``
473 se la goto libera (free) un ``buffer``. Evitate l'uso di nomi GW-BASIC come
474 ``err1:`` ed ``err2:``, potreste doverli riordinare se aggiungete o rimuovete
475 punti d'uscita, e inoltre rende difficile verificarne la correttezza.
477 I motivo per usare le goto sono:
479 - i salti incondizionati sono più facili da capire e seguire
480 - l'annidamento si riduce
481 - si evita di dimenticare, per errore, di aggiornare un singolo punto d'uscita
482 - aiuta il compilatore ad ottimizzare il codice ridondante ;)
491 buffer = kmalloc(SIZE, GFP_KERNEL);
500 goto out_free_buffer;
508 Un baco abbastanza comune di cui bisogna prendere nota è il ``one err bugs``
509 che assomiglia a questo:
518 Il baco in questo codice è che in alcuni punti d'uscita la variabile ``foo`` è
519 NULL. Normalmente si corregge questo baco dividendo la gestione dell'errore in
520 due parti ``err_free_bar:`` e ``err_free_foo:``:
530 Idealmente, dovreste simulare condizioni d'errore per verificare i vostri
537 I commenti sono una buona cosa, ma c'è anche il rischio di esagerare. MAI
538 spiegare COME funziona il vostro codice in un commento: è molto meglio
539 scrivere il codice di modo che il suo funzionamento sia ovvio, inoltre
540 spiegare codice scritto male è una perdita di tempo.
542 Solitamente, i commenti devono dire COSA fa il codice, e non COME lo fa.
543 Inoltre, cercate di evitare i commenti nel corpo della funzione: se la
544 funzione è così complessa che dovete commentarla a pezzi, allora dovreste
545 tornare al punto 6 per un momento. Potete mettere dei piccoli commenti per
546 annotare o avvisare il lettore circa un qualcosa di particolarmente arguto
547 (o brutto), ma cercate di non esagerare. Invece, mettete i commenti in
548 testa alla funzione spiegando alle persone cosa fa, e possibilmente anche
551 Per favore, quando commentate una funzione dell'API del kernel usate il
552 formato kernel-doc. Per maggiori dettagli, leggete i file in
553 :ref::ref:`Documentation/translations/it_IT/doc-guide/ <it_doc_guide>` e in
554 ``script/kernel-doc``.
556 Lo stile preferito per i commenti più lunghi (multi-riga) è:
561 * This is the preferred style for multi-line
562 * comments in the Linux kernel source code.
563 * Please use it consistently.
565 * Description: A column of asterisks on the left side,
566 * with beginning and ending almost-blank lines.
569 Per i file in net/ e in drivers/net/ lo stile preferito per i commenti
570 più lunghi (multi-riga) è leggermente diverso.
574 /* The preferred comment style for files in net/ and drivers/net
577 * It is nearly the same as the generally preferred comment style,
578 * but there is no initial almost-blank line.
581 È anche importante commentare i dati, sia per i tipi base che per tipi
582 derivati. A questo scopo, dichiarate un dato per riga (niente virgole
583 per una dichiarazione multipla). Questo vi lascerà spazio per un piccolo
584 commento per spiegarne l'uso.
587 9) Avete fatto un pasticcio
588 ---------------------------
590 Va bene, li facciamo tutti. Probabilmente vi è stato detto dal vostro
591 aiutante Unix di fiducia che ``GNU emacs`` formatta automaticamente il
592 codice C per conto vostro, e avete notato che sì, in effetti lo fa, ma che
593 i modi predefiniti non sono proprio allettanti (infatti, sono peggio che
594 premere tasti a caso - un numero infinito di scimmie che scrivono in
595 GNU emacs non faranno mai un buon programma).
597 Quindi, potete sbarazzarvi di GNU emacs, o riconfigurarlo con valori più
598 sensati. Per fare quest'ultima cosa, potete appiccicare il codice che
599 segue nel vostro file .emacs:
603 (defun c-lineup-arglist-tabs-only (ignored)
604 "Line up argument lists by tabs, not spaces"
605 (let* ((anchor (c-langelem-pos c-syntactic-element))
606 (column (c-langelem-2nd-pos c-syntactic-element))
607 (offset (- (1+ column) anchor))
608 (steps (floor offset c-basic-offset)))
612 (dir-locals-set-class-variables
616 (c-label-minimum-indentation . 0)
618 (arglist-close . c-lineup-arglist-tabs-only)
619 (arglist-cont-nonempty .
620 (c-lineup-gcc-asm-reg c-lineup-arglist-tabs-only))
622 (brace-list-intro . +)
623 (c . c-lineup-C-comments)
625 (comment-intro . c-lineup-comment)
626 (cpp-define-intro . +)
629 (defun-block-intro . +)
633 (inher-cont . c-lineup-multi-inher)
634 (knr-argdecl-intro . 0)
637 (statement-block-intro . +)
638 (statement-case-intro . +)
642 (indent-tabs-mode . t)
643 (show-trailing-whitespace . t)
646 (dir-locals-set-directory-class
647 (expand-file-name "~/src/linux-trees")
650 Questo farà funzionare meglio emacs con lo stile del kernel per i file che
651 si trovano nella cartella ``~/src/linux-trees``.
653 Ma anche se doveste fallire nell'ottenere una formattazione sensata in emacs
654 non tutto è perduto: usate ``indent``.
656 Ora, ancora, GNU indent ha la stessa configurazione decerebrata di GNU emacs,
657 ed è per questo che dovete passargli alcune opzioni da riga di comando.
658 Tuttavia, non è così terribile, perché perfino i creatori di GNU indent
659 riconoscono l'autorità di K&R (le persone del progetto GNU non sono cattive,
660 sono solo mal indirizzate sull'argomento), quindi date ad indent le opzioni
661 ``-kr -i8`` (che significa ``K&R, 8 caratteri di indentazione``), o utilizzate
662 ``scripts/Lindent`` che indenterà usando l'ultimo stile.
664 ``indent`` ha un sacco di opzioni, e specialmente quando si tratta di
665 riformattare i commenti dovreste dare un'occhiata alle pagine man.
666 Ma ricordatevi: ``indent`` non è un correttore per una cattiva programmazione.
668 Da notare che potete utilizzare anche ``clang-format`` per aiutarvi con queste
669 regole, per riformattare rapidamente ad automaticamente alcune parti del
670 vostro codice, e per revisionare interi file al fine di identificare errori
671 di stile, refusi e possibilmente anche delle migliorie. È anche utile per
672 ordinare gli ``#include``, per allineare variabili/macro, per ridistribuire
673 il testo e altre cose simili.
674 Per maggiori dettagli, consultate il file
675 :ref:`Documentation/translations/it_IT/process/clang-format.rst <it_clangformat>`.
678 10) File di configurazione Kconfig
679 ----------------------------------
681 Per tutti i file di configurazione Kconfig* che si possono trovare nei
682 sorgenti, l'indentazione è un po' differente. Le linee dopo un ``config``
683 sono indentate con un tab, mentre il testo descrittivo è indentato di
684 ulteriori due spazi. Esempio::
687 bool "Auditing support"
690 Enable auditing infrastructure that can be used with another
691 kernel subsystem, such as SELinux (which requires this for
692 logging of avc messages output). Does not do system-call
693 auditing without CONFIG_AUDITSYSCALL.
695 Le funzionalità davvero pericolose (per esempio il supporto alla scrittura
696 per certi filesystem) dovrebbero essere dichiarate chiaramente come tali
697 nella stringa di titolo::
700 bool "ADFS write support (DANGEROUS)"
704 Per la documentazione completa sui file di configurazione, consultate
705 il documento Documentation/kbuild/kconfig-language.rst
711 Le strutture dati che hanno una visibilità superiore al contesto del
712 singolo thread in cui vengono create e distrutte, dovrebbero sempre
713 avere un contatore di riferimenti. Nel kernel non esiste un
714 *garbage collector* (e fuori dal kernel i *garbage collector* sono lenti
715 e inefficienti), questo significa che **dovete** assolutamente avere un
716 contatore di riferimenti per ogni cosa che usate.
718 Avere un contatore di riferimenti significa che potete evitare la
719 sincronizzazione e permette a più utenti di accedere alla struttura dati
720 in parallelo - e non doversi preoccupare di una struttura dati che
721 improvvisamente sparisce dalla loro vista perché il loro processo dormiva
722 o stava facendo altro per un attimo.
724 Da notare che la sincronizzazione **non** si sostituisce al conteggio dei
725 riferimenti. La sincronizzazione ha lo scopo di mantenere le strutture
726 dati coerenti, mentre il conteggio dei riferimenti è una tecnica di gestione
727 della memoria. Solitamente servono entrambe le cose, e non vanno confuse fra
730 Quando si hanno diverse classi di utenti, le strutture dati possono avere
731 due livelli di contatori di riferimenti. Il contatore di classe conta
732 il numero dei suoi utenti, e il contatore globale viene decrementato una
733 sola volta quando il contatore di classe va a zero.
735 Un esempio di questo tipo di conteggio dei riferimenti multi-livello può
736 essere trovato nella gestore della memoria (``struct mm_sturct``: mm_user e
737 mm_count), e nel codice dei filesystem (``struct super_block``: s_count e
740 Ricordatevi: se un altro thread può trovare la vostra struttura dati, e non
741 avete un contatore di riferimenti per essa, quasi certamente avete un baco.
743 12) Macro, enumerati e RTL
744 ---------------------------
746 I nomi delle macro che definiscono delle costanti e le etichette degli
747 enumerati sono scritte in maiuscolo.
751 #define CONSTANT 0x12345
753 Gli enumerati sono da preferire quando si definiscono molte costanti correlate.
755 I nomi delle macro in MAIUSCOLO sono preferibili ma le macro che assomigliano
756 a delle funzioni possono essere scritte in minuscolo.
758 Generalmente, le funzioni inline sono preferibili rispetto alle macro che
761 Le macro che contengono più istruzioni dovrebbero essere sempre chiuse in un
766 #define macrofun(a, b, c) \
772 Cose da evitare quando si usano le macro:
774 1) le macro che hanno effetti sul flusso del codice:
784 sono **proprio** una pessima idea. Sembra una chiamata a funzione ma termina
785 la funzione chiamante; non cercate di rompere il decodificatore interno di
788 2) le macro che dipendono dall'uso di una variabile locale con un nome magico:
792 #define FOO(val) bar(index, val)
794 potrebbe sembrare una bella cosa, ma è dannatamente confusionario quando uno
795 legge il codice e potrebbe romperlo con una cambiamento che sembra innocente.
797 3) le macro con argomenti che sono utilizzati come l-values; questo potrebbe
798 ritorcervisi contro se qualcuno, per esempio, trasforma FOO in una funzione
801 4) dimenticatevi delle precedenze: le macro che definiscono espressioni devono
802 essere racchiuse fra parentesi. State attenti a problemi simili con le macro
807 #define CONSTANT 0x4000
808 #define CONSTEXP (CONSTANT | 3)
810 5) collisione nello spazio dei nomi quando si definisce una variabile locale in
811 una macro che sembra una funzione:
822 ret è un nome comune per una variabile locale - __foo_ret difficilmente
823 andrà in conflitto con una variabile già esistente.
825 Il manuale di cpp si occupa esaustivamente delle macro. Il manuale di sviluppo
826 di gcc copre anche l'RTL che viene usato frequentemente nel kernel per il
827 linguaggio assembler.
829 13) Visualizzare i messaggi del kernel
830 --------------------------------------
832 Agli sviluppatori del kernel piace essere visti come dotti. Tenete un occhio
833 di riguardo per l'ortografia e farete una belle figura. In inglese, evitate
834 l'uso incorretto di abbreviazioni come ``dont``: usate ``do not`` oppure
835 ``don't``. Scrivete messaggi concisi, chiari, e inequivocabili.
837 I messaggi del kernel non devono terminare con un punto fermo.
839 Scrivere i numeri fra parentesi (%d) non migliora alcunché e per questo
840 dovrebbero essere evitati.
842 Ci sono alcune macro per la diagnostica in <linux/device.h> che dovreste
843 usare per assicurarvi che i messaggi vengano associati correttamente ai
844 dispositivi e ai driver, e che siano etichettati correttamente: dev_err(),
845 dev_warn(), dev_info(), e così via. Per messaggi che non sono associati ad
846 alcun dispositivo, <linux/printk.h> definisce pr_info(), pr_warn(), pr_err(),
849 Tirar fuori un buon messaggio di debug può essere una vera sfida; e quando
850 l'avete può essere d'enorme aiuto per risolvere problemi da remoto.
851 Tuttavia, i messaggi di debug sono gestiti differentemente rispetto agli
852 altri. Le funzioni pr_XXX() stampano incondizionatamente ma pr_debug() no;
853 essa non viene compilata nella configurazione predefinita, a meno che
854 DEBUG o CONFIG_DYNAMIC_DEBUG non vengono impostati. Questo vale anche per
855 dev_dbg() e in aggiunta VERBOSE_DEBUG per aggiungere i messaggi dev_vdbg().
857 Molti sottosistemi hanno delle opzioni di debug in Kconfig che aggiungono
858 -DDEBUG nei corrispettivi Makefile, e in altri casi aggiungono #define DEBUG
859 in specifici file. Infine, quando un messaggio di debug dev'essere stampato
860 incondizionatamente, per esempio perché siete già in una sezione di debug
861 racchiusa in #ifdef, potete usare printk(KERN_DEBUG ...).
863 14) Assegnare memoria
864 ---------------------
866 Il kernel fornisce i seguenti assegnatori ad uso generico:
867 kmalloc(), kzalloc(), kmalloc_array(), kcalloc(), vmalloc(), e vzalloc().
868 Per maggiori informazioni, consultate la documentazione dell'API:
869 :ref:`Documentation/translations/it_IT/core-api/memory-allocation.rst <it_memory_allocation>`
871 Il modo preferito per passare la dimensione di una struttura è il seguente:
875 p = kmalloc(sizeof(*p), ...);
877 La forma alternativa, dove il nome della struttura viene scritto interamente,
878 peggiora la leggibilità e introduce possibili bachi quando il tipo di
879 puntatore cambia tipo ma il corrispondente sizeof non viene aggiornato.
881 Il valore di ritorno è un puntatore void, effettuare un cast su di esso è
882 ridondante. La conversione fra un puntatore void e un qualsiasi altro tipo
883 di puntatore è garantito dal linguaggio di programmazione C.
885 Il modo preferito per assegnare un vettore è il seguente:
889 p = kmalloc_array(n, sizeof(...), ...);
891 Il modo preferito per assegnare un vettore a zero è il seguente:
895 p = kcalloc(n, sizeof(...), ...);
897 Entrambe verificano la condizione di overflow per la dimensione
898 d'assegnamento n * sizeof(...), se accade ritorneranno NULL.
900 Questi allocatori generici producono uno *stack dump* in caso di fallimento
901 a meno che non venga esplicitamente specificato __GFP_NOWARN. Quindi, nella
902 maggior parte dei casi, è inutile stampare messaggi aggiuntivi quando uno di
903 questi allocatori ritornano un puntatore NULL.
908 Sembra che ci sia la percezione errata che gcc abbia una qualche magica
909 opzione "rendimi più veloce" chiamata ``inline``. In alcuni casi l'uso di
910 inline è appropriato (per esempio in sostituzione delle macro, vedi
911 capitolo 12), ma molto spesso non lo è. L'uso abbondante della parola chiave
912 inline porta ad avere un kernel più grande, che si traduce in un sistema nel
913 suo complesso più lento per via di una cache per le istruzioni della CPU più
914 grande e poi semplicemente perché ci sarà meno spazio disponibile per una
915 pagina di cache. Pensateci un attimo; una fallimento nella cache causa una
916 ricerca su disco che può tranquillamente richiedere 5 millisecondi. Ci sono
917 TANTI cicli di CPU che potrebbero essere usati in questi 5 millisecondi.
919 Spesso le persone dicono che aggiungere inline a delle funzioni dichiarate
920 static e utilizzare una sola volta è sempre una scelta vincente perché non
921 ci sono altri compromessi. Questo è tecnicamente vero ma gcc è in grado di
922 trasformare automaticamente queste funzioni in inline; i problemi di
923 manutenzione del codice per rimuovere gli inline quando compare un secondo
924 utente surclassano il potenziale vantaggio nel suggerire a gcc di fare una
925 cosa che avrebbe fatto comunque.
927 16) Nomi e valori di ritorno delle funzioni
928 -------------------------------------------
930 Le funzioni possono ritornare diversi tipi di valori, e uno dei più comuni
931 è quel valore che indica se una funzione ha completato con successo o meno.
932 Questo valore può essere rappresentato come un codice di errore intero
933 (-Exxx = fallimento, 0 = successo) oppure un booleano di successo
934 (0 = fallimento, non-zero = successo).
936 Mischiare questi due tipi di rappresentazioni è un terreno fertile per
937 i bachi più insidiosi. Se il linguaggio C includesse una forte distinzione
938 fra gli interi e i booleani, allora il compilatore potrebbe trovare questi
939 errori per conto nostro ... ma questo non c'è. Per evitare di imbattersi
940 in questo tipo di baco, seguite sempre la seguente convenzione::
942 Se il nome di una funzione è un'azione o un comando imperativo,
943 essa dovrebbe ritornare un codice di errore intero. Se il nome
944 è un predicato, la funzione dovrebbe ritornare un booleano di
947 Per esempio, ``add work`` è un comando, e la funzione add_work() ritorna 0
948 in caso di successo o -EBUSY in caso di fallimento. Allo stesso modo,
949 ``PCI device present`` è un predicato, e la funzione pci_dev_present() ritorna
950 1 se trova il dispositivo corrispondente con successo, altrimenti 0.
952 Tutte le funzioni esportate (EXPORT) devono rispettare questa convenzione, e
953 così dovrebbero anche tutte le funzioni pubbliche. Le funzioni private
954 (static) possono non seguire questa convenzione, ma è comunque raccomandato
957 Le funzioni il cui valore di ritorno è il risultato di una computazione,
958 piuttosto che l'indicazione sul successo di tale computazione, non sono
959 soggette a questa regola. Solitamente si indicano gli errori ritornando un
960 qualche valore fuori dai limiti. Un tipico esempio è quello delle funzioni
961 che ritornano un puntatore; queste utilizzano NULL o ERR_PTR come meccanismo
962 di notifica degli errori.
967 Nel kernel Linux il tipo bool deriva dal tipo _Bool dello standard C99.
968 Un valore bool può assumere solo i valori 0 o 1, e implicitamente o
969 esplicitamente la conversione a bool converte i valori in vero (*true*) o
970 falso (*false*). Quando si usa un tipo bool il costrutto !! non sarà più
971 necessario, e questo va ad eliminare una certa serie di bachi.
973 Quando si usano i valori booleani, dovreste utilizzare le definizioni di true
974 e false al posto dei valori 1 e 0.
976 Per il valore di ritorno delle funzioni e per le variabili sullo stack, l'uso
977 del tipo bool è sempre appropriato. L'uso di bool viene incoraggiato per
978 migliorare la leggibilità e spesso è molto meglio di 'int' nella gestione di
981 Non usate bool se per voi sono importanti l'ordine delle righe di cache o
982 la loro dimensione; la dimensione e l'allineamento cambia a seconda
983 dell'architettura per la quale è stato compilato. Le strutture che sono state
984 ottimizzate per l'allineamento o la dimensione non dovrebbero usare bool.
986 Se una struttura ha molti valori true/false, considerate l'idea di raggrupparli
987 in un intero usando campi da 1 bit, oppure usate un tipo dalla larghezza fissa,
990 Come per gli argomenti delle funzioni, molti valori true/false possono essere
991 raggruppati in un singolo argomento a bit denominato 'flags'; spesso 'flags' è
992 un'alternativa molto più leggibile se si hanno valori costanti per true/false.
994 Detto ciò, un uso parsimonioso di bool nelle strutture dati e negli argomenti
995 può migliorare la leggibilità.
997 18) Non reinventate le macro del kernel
998 ---------------------------------------
1000 Il file di intestazione include/linux/kernel.h contiene un certo numero
1001 di macro che dovreste usare piuttosto che implementarne una qualche variante.
1002 Per esempio, se dovete calcolare la lunghezza di un vettore, sfruttate la
1007 #define ARRAY_SIZE(x) (sizeof(x) / sizeof((x)[0]))
1009 Analogamente, se dovete calcolare la dimensione di un qualche campo di una
1014 #define sizeof_field(t, f) (sizeof(((t*)0)->f))
1016 Ci sono anche le macro min() e max() che, se vi serve, effettuano un controllo
1017 rigido sui tipi. Sentitevi liberi di leggere attentamente questo file
1018 d'intestazione per scoprire cos'altro è stato definito che non dovreste
1019 reinventare nel vostro codice.
1021 19) Linee di configurazione degli editor e altre schifezze
1022 -----------------------------------------------------------
1024 Alcuni editor possono interpretare dei parametri di configurazione integrati
1025 nei file sorgenti e indicati con dai marcatori speciali. Per esempio, emacs
1026 interpreta le linee marcate nel seguente modo:
1038 compile-command: "gcc -DMAGIC_DEBUG_FLAG foo.c"
1042 Vim interpreta i marcatori come questi:
1046 /* vim:set sw=8 noet */
1048 Non includete nessuna di queste cose nei file sorgenti. Le persone hanno le
1049 proprie configurazioni personali per l'editor, e i vostri sorgenti non
1050 dovrebbero sovrascrivergliele. Questo vale anche per i marcatori
1051 d'indentazione e di modalità d'uso. Le persone potrebbero aver configurato una
1052 modalità su misura, oppure potrebbero avere qualche altra magia per far
1053 funzionare bene l'indentazione.
1058 Nel codice specifico per un'architettura, potreste aver bisogno di codice
1059 *inline assembly* per interfacciarvi col processore o con una funzionalità
1060 specifica della piattaforma. Non esitate a farlo quando è necessario.
1061 Comunque, non usatele gratuitamente quando il C può fare la stessa cosa.
1062 Potete e dovreste punzecchiare l'hardware in C quando è possibile.
1064 Considerate la scrittura di una semplice funzione che racchiude pezzi comuni
1065 di codice assembler piuttosto che continuare a riscrivere delle piccole
1066 varianti. Ricordatevi che l' *inline assembly* può utilizzare i parametri C.
1068 Il codice assembler più corposo e non banale dovrebbe andare nei file .S,
1069 coi rispettivi prototipi C definiti nei file d'intestazione. I prototipi C
1070 per le funzioni assembler dovrebbero usare ``asmlinkage``.
1072 Potreste aver bisogno di marcare il vostro codice asm come volatile al fine
1073 d'evitare che GCC lo rimuova quando pensa che non ci siano effetti collaterali.
1074 Non c'è sempre bisogno di farlo, e farlo quando non serve limita le
1077 Quando scrivete una singola espressione *inline assembly* contenente più
1078 istruzioni, mettete ognuna di queste istruzioni in una stringa e riga diversa;
1079 ad eccezione dell'ultima stringa/istruzione, ognuna deve terminare con ``\n\t``
1080 al fine di allineare correttamente l'assembler che verrà generato:
1084 asm ("magic %reg1, #42\n\t"
1085 "more_magic %reg2, %reg3"
1086 : /* outputs */ : /* inputs */ : /* clobbers */);
1088 21) Compilazione sotto condizione
1089 ---------------------------------
1091 Ovunque sia possibile, non usate le direttive condizionali del preprocessore
1092 (#if, #ifdef) nei file .c; farlo rende il codice difficile da leggere e da
1093 seguire. Invece, usate queste direttive nei file d'intestazione per definire
1094 le funzioni usate nei file .c, fornendo i relativi stub nel caso #else,
1095 e quindi chiamate queste funzioni senza condizioni di preprocessore. Il
1096 compilatore non produrrà alcun codice per le funzioni stub, produrrà gli
1097 stessi risultati, e la logica rimarrà semplice da seguire.
1099 È preferibile non compilare intere funzioni piuttosto che porzioni d'esse o
1100 porzioni d'espressioni. Piuttosto che mettere una ifdef in un'espressione,
1101 fattorizzate parte dell'espressione, o interamente, in funzioni e applicate
1102 la direttiva condizionale su di esse.
1104 Se avete una variabile o funzione che potrebbe non essere usata in alcune
1105 configurazioni, e quindi il compilatore potrebbe avvisarvi circa la definizione
1106 inutilizzata, marcate questa definizione come __maybe_unused piuttosto che
1107 racchiuderla in una direttiva condizionale del preprocessore. (Comunque,
1108 se una variabile o funzione è *sempre* inutilizzata, rimuovetela).
1110 Nel codice, dov'è possibile, usate la macro IS_ENABLED per convertire i
1111 simboli Kconfig in espressioni booleane C, e quindi usatela nelle classiche
1116 if (IS_ENABLED(CONFIG_SOMETHING)) {
1120 Il compilatore valuterà la condizione come costante (constant-fold), e quindi
1121 includerà o escluderà il blocco di codice come se fosse in un #ifdef, quindi
1122 non ne aumenterà il tempo di esecuzione. Tuttavia, questo permette al
1123 compilatore C di vedere il codice nel blocco condizionale e verificarne la
1124 correttezza (sintassi, tipi, riferimenti ai simboli, eccetera). Quindi
1125 dovete comunque utilizzare #ifdef se il codice nel blocco condizionale esiste
1126 solo quando la condizione è soddisfatta.
1128 Alla fine di un blocco corposo di #if o #ifdef (più di alcune linee),
1129 mettete un commento sulla stessa riga di #endif, annotando la condizione
1130 che termina. Per esempio:
1134 #ifdef CONFIG_SOMETHING
1136 #endif /* CONFIG_SOMETHING */
1138 Appendice I) riferimenti
1139 ------------------------
1141 The C Programming Language, Second Edition
1142 by Brian W. Kernighan and Dennis M. Ritchie.
1143 Prentice Hall, Inc., 1988.
1144 ISBN 0-13-110362-8 (paperback), 0-13-110370-9 (hardback).
1146 The Practice of Programming
1147 by Brian W. Kernighan and Rob Pike.
1148 Addison-Wesley, Inc., 1999.
1151 Manuali GNU - nei casi in cui sono compatibili con K&R e questo documento -
1152 per indent, cpp, gcc e i suoi dettagli interni, tutto disponibile qui
1153 http://www.gnu.org/manual/
1155 WG14 è il gruppo internazionale di standardizzazione per il linguaggio C,
1156 URL: http://www.open-std.org/JTC1/SC22/WG14/
1158 Kernel process/coding-style.rst, by greg@kroah.com at OLS 2002:
1159 http://www.kroah.com/linux/talks/ols_2002_kernel_codingstyle_talk/html/