W3docs

ASCII

ASCII est le premier schéma d'encodage de caractères utilisé entre ordinateurs sur Internet. Consultez le tableau complet des caractères et codes d'entités HTML.

ASCII, acronyme de « American Standard Code for Information Interchange », est le premier schéma d'encodage de caractères utilisé entre ordinateurs sur Internet. Cette page est une référence : elle liste chaque caractère ASCII accompagné de sa référence de caractère numérique HTML (par exemple A pour A) que vous pouvez utiliser pour l'insérer.

Les schémas d'encodage modernes comme UTF-8 et ISO-8859 sont rétrocompatibles avec ASCII.

Quand a-t-on vraiment besoin des codes ASCII ?

En HTML moderne, vous déclarez l'encodage une seule fois avec <meta charset="UTF-8"> dans le <head>. Une fois UTF-8 activé, vous pouvez taper des lettres, des chiffres, de la ponctuation et même des caractères accentués ou non latins directement dans votre fichier source — il n'est pas nécessaire de remplacer A par &#65;. Les références numériques ASCII sont surtout utiles dans trois situations :

  • Caractères de balisage réservés. <, >, & et " ont une signification particulière en HTML. Pour les afficher comme du texte littéral, vous devez les échapper, par exemple &#60; (ou l'entité nommée &lt;) pour <.
  • Caractères invisibles ou ambigus. Une espace insécable (&#160; / &nbsp;) ou tout autre espace blanc que vous ne pouvez pas distinguer visuellement dans le code source.
  • Outils ne pouvant pas produire de l'UTF-8. Anciens systèmes ou générateurs qui ne produisent que de l'ASCII 7 bits.

Il existe deux façons équivalentes d'écrire n'importe quel point de code sous forme d'entité :

  • Décimal : &#38; (le nombre est la valeur ASCII/Unicode du caractère).
  • Hexadécimal : &#x26; (même caractère, valeur écrite en base 16, avec un préfixe x).

Pour les quelques caractères réservés, les entités nommées telles que &lt;, &gt;, &amp; et &quot; sont généralement préférées car elles se lisent plus clairement. Consultez Entités HTML pour la référence complète des entités nommées, et Encodage UTF-8 pour les caractères au-delà des 128 caractères de la plage ASCII.

Le jeu de caractères ASCII

Le jeu de caractères ASCII a été conçu dans les années 1960 comme standard pour les ordinateurs et les périphériques matériels, tels que les imprimantes et les lecteurs de bande.

À l'origine, ASCII était basé sur l'alphabet anglais. Il s'agit d'un jeu de caractères 7 bits contenant 128 caractères : les chiffres 0–9, les lettres anglaises majuscules et minuscules A–Z, les symboles de ponctuation de base et les caractères spéciaux.

La plupart des jeux de caractères utilisés dans les ordinateurs modernes, HTML et Internet sont rétrocompatibles avec ASCII.

Le tableau ci-dessous liste les 128 caractères ASCII et leurs codes d'entités HTML équivalents.

Caractères ASCII imprimables

Caractère ASCIICode d'entité HTMLDescription
espace
!!point d'exclamation
""guillemet
##signe dièse
$$signe dollar
%%signe pourcent
&&esperluette
''apostrophe
((parenthèse ouvrante
))parenthèse fermante
**astérisque
++signe plus
,,virgule
--trait d'union
..point
//barre oblique
00chiffre 0
11chiffre 1
22chiffre 2
33chiffre 3
44chiffre 4
55chiffre 5
66chiffre 6
77chiffre 7
88chiffre 8
99chiffre 9
::deux-points
;;point-virgule
<<inférieur à
==égal à
>>supérieur à
??point d'interrogation
@@arobase
AAA majuscule
BBB majuscule
CCC majuscule
DDD majuscule
EEE majuscule
FFF majuscule
GGG majuscule
HHH majuscule
III majuscule
JJJ majuscule
KKK majuscule
LLL majuscule
MMM majuscule
NNN majuscule
OOO majuscule
PPP majuscule
QQQ majuscule
RRR majuscule
SSS majuscule
TTT majuscule
UUU majuscule
VVV majuscule
WWW majuscule
XXX majuscule
YYY majuscule
ZZZ majuscule
[[crochet ouvrant
\\barre oblique inverse
]]crochet fermant
^^accent circonflexe
__tiret bas
``accent grave
aaa minuscule
bbb minuscule
ccc minuscule
ddd minuscule
eee minuscule
fff minuscule
ggg minuscule
hhh minuscule
iii minuscule
jjj minuscule
kkk minuscule
lll minuscule
mmm minuscule
nnn minuscule
ooo minuscule
ppp minuscule
qqq minuscule
rrr minuscule
sss minuscule
ttt minuscule
uuu minuscule
vvv minuscule
www minuscule
xxx minuscule
yyy minuscule
zzz minuscule
{{accolade ouvrante
||barre verticale
}}accolade fermante
~~tilde

Caractères de contrôle ASCII

Les caractères de contrôle ASCII (à l'exception de la tabulation horizontale, du saut de ligne et du retour chariot) sont rarement utilisés dans les documents HTML. À l'origine, les caractères de contrôle ASCII (plage 0–31, plus 127) étaient conçus pour contrôler des périphériques matériels.

Remarque : Écrivez ces codes sans zéros initiaux — les références décimales vont de &#0; à &#9;, et non &#00;/&#09;. La forme hexadécimale équivalente (par exemple &#x09; pour une tabulation) peut comporter un zéro de remplissage, mais pas la forme décimale. Ces caractères de contrôle sont non imprimables : la plupart ne produisent aucun affichage visible dans un navigateur, ils sont donc listés ici par souci d'exhaustivité plutôt que pour un usage quotidien.

Caractère ASCIICode d'entité HTMLDescription
NULcaractère nul
SOHdébut d'en-tête
STXdébut de texte
ETXfin de texte
EOTfin de transmission
ENQdemande
ACKaccusé de réception
BELsonnerie
BSretour arrière
HT tabulation horizontale
LF saut de ligne
VTtabulation verticale
FF saut de page
CR retour chariot
SOshift out
SIshift in
DLEéchappement de liaison de données
DC1contrôle de périphérique 1
DC2contrôle de périphérique 2
DC3contrôle de périphérique 3
DC4contrôle de périphérique 4
NAKaccusé de réception négatif
SYNsynchronisation
ETBfin de bloc de transmission
CANannulation
EMfin de support
SUBsubstitution
ESCéchappement
FSséparateur de fichier
GSséparateur de groupe
RSséparateur d'enregistrement
USséparateur d'unité
DELsuppression

DEL (code 127) est également un caractère de contrôle non imprimable — il était historiquement utilisé pour effacer un caractère sur bande perforée, et non pour afficher quoi que ce soit.

Exemple d'utilisation pratique

Les cas où les références sont vraiment indispensables concernent les caractères de balisage réservés. Ci-dessous, &#34; permet d'insérer un guillemet littéral à l'intérieur d'une valeur d'attribut entre guillemets doubles, et &#60;/&#62; affichent des chevrons littéraux dans le contenu sans que le navigateur les interprète comme une balise :

<!-- &#34; (a quote) inside a double-quoted attribute -->
<a href="#" title="The &#34;best&#34; link">Hover me</a>

<!-- &#60; and &#62; render as < and > instead of starting a tag -->
<p>Use the &#60;p&#62; element for paragraphs.</p>

<!-- &#38; (an ampersand) shown as literal text -->
<p>Fish &#38; Chips</p>

Ces trois mêmes caractères ont des équivalents nommés — &quot;, &lt;, &gt; et &amp; — que la plupart des auteurs préfèrent pour leur lisibilité :

<a href="#" title="The &quot;best&quot; link">Hover me</a>
<p>Use the &lt;p&gt; element for paragraphs.</p>
<p>Fish &amp; Chips</p>

Exercice

Pratique
Dans un document HTML en UTF-8, quel caractère nécessite le plus souvent encore une référence d'entité comme < ou < ?
Dans un document HTML en UTF-8, quel caractère nécessite le plus souvent encore une référence d'entité comme < ou < ?
Was this page helpful?