Une URL peut comprendre plusieurs parties. Il existe un nom d’hôte qui mappe sur l’adresse IP d’une ressource spécifique sur Internet et une foule d’informations supplémentaires qui indiquent à votre navigateur et au serveur comment gérer les choses. Vous pouvez penser à une adresse IP comme à un numéro de téléphone. Un nom d'hôte ressemble au nom d'une personne dont vous souhaitez rechercher le numéro de téléphone. Et un standard appelé DNS (Domain Name System) fonctionne en arrière-plan comme un annuaire téléphonique, traduisant les noms d’hôte plus conviviaux en adresses IP utilisées par les réseaux pour acheminer le trafic.
En gardant cette analogie à l’esprit, examinons la structure d’une URL et son fonctionnement pour vous amener à l’endroit où vous voulez aller.
Comment une URL est structurée
Sir Tim Berners-Lee - le créateur du Web et du premier navigateur Web - a défini pour la première fois la structure d'une URL en 1994. Les URL associent essentiellement l'idée de noms de domaine à l'idée d'utiliser un chemin de fichier pour identifier un fichier spécifique. structure des dossiers et des fichiers. Donc, cela ressemble à utiliser un chemin tel que C: Documents Personal Myfile.txt dans Windows, mais avec quelques éléments supplémentaires au début pour aider à trouver le bon serveur sur Internet où ce chemin existe et le protocole utilisé pour accéder au information.
Une URL est composée de plusieurs parties différentes. Prenez, par exemple, une URL de base telle que celle montrée dans l'image ci-dessous.
Schème
De nombreuses personnes considèrent l’URL comme une simple adresse Web, mais ce n’est pas aussi simple. Une adresse Web est une URL, mais toutes les URL ne sont pas des adresses Web. Les autres services auxquels vous pouvez accéder sur Internet - tels que FTP - ou même localement - comme MAILTO - sont également des URL. La partie schéma d'une URL (ces lettres suivies de deux points) indique le protocole avec lequel une application (comme votre navigateur Web) et le serveur doivent communiquer.
Les adresses Web sont l'URL la plus commune, mais il en existe d'autres. Donc, vous pourriez voir des schémas comme:
- Protocole HTTP (HyperText Transfer Protocol): Il s'agit du protocole sous-jacent du Web. Il détermine les actions que les serveurs et les navigateurs Web doivent entreprendre en réponse à certaines commandes.
- HTTP sécurisé (HTTPS): Il s'agit d'une forme de HTTP qui fonctionne sur une couche sécurisée et chiffrée pour un transport plus sûr des informations.
- Protocole de transfert de fichier (FTP): Ce protocole est encore souvent utilisé pour transférer des fichiers sur Internet.
Dans les navigateurs modernes, le schéma n’est pas techniquement requis dans le cadre de l’URL. Si vous entrez sur un site Web tel que «www.howtogeek.com», votre navigateur déterminera automatiquement le bon protocole à utiliser. Néanmoins, certaines autres applications (et protocoles) nécessitent l’utilisation d’un schéma.
Autorité
La partie autorité d'une URL (précédée de deux barres obliques) est elle-même divisée en plusieurs parties. Commençons par une URL très simple, celle qui vous mènerait à la page d’accueil d’un site Web.
Mais lors de l’analyse du nom d’hôte, il est utile de le lire en arrière pour comprendre ce qui se passe. Voici donc ces composants:
- Domaine de premier niveau: Dans l'exemple ci-dessous, «com» est le domaine de premier niveau. Il s'agit du niveau le plus élevé de la hiérarchie DNS (Domain Name System) utilisé pour traduire les adresses IP en adresses de langage simples qu'il est plus facile pour les humains de se rappeler. Ces domaines de premier niveau sont créés et gérés par Internet Corporation (ICANN). Les trois domaines de premier niveau les plus courants sont.com,.net et.gov. La plupart des pays ont également leur propre domaine de premier niveau à deux lettres. Vous verrez donc des domaines tels que.us (États-Unis),.uk (Royaume-Uni),.ca (Canada) et bien d’autres. Il existe également des domaines de premier niveau supplémentaires (tels que.museum) qui sont sponsorisés et gérés par des organisations privées. En plus de ceux-ci, il existe également des domaines génériques de premier niveau (tels que.club,.life et.news).
- Sous-domaine: Puisque le DNS est un système hiérarchique, les parties «www» et «exemple» de notre exemple d’URL sont considérées comme des sous-domaines. La partie «www» est un sous-domaine du domaine de premier niveau «com» et la partie «www» est un sous-domaine du domaine «exemple». C'est pourquoi vous verrez souvent une entreprise avec un nom enregistré tel que "google.com" divisée en sous-domaines distincts tels que "www.google.com", "news.google.com", "mail.google.com" et bientôt.
C’est l’exemple le plus élémentaire de la section d’autorité d’une URL, mais les choses peuvent devenir plus compliquées. La section d'autorité peut contenir deux autres composants:
- Informations de l'utilisateur: La section autorité peut également contenir un nom d'utilisateur et un mot de passe pour le site auquel vous accédez. Il est rare de voir cette structure dans les URL aujourd'hui, mais cela peut arriver. Si elle est présente, la partie informations utilisateur précède le nom d’hôte et est suivie du signe @.Ainsi, vous pourriez voir quelque chose comme «//nomdutilisateur: [email protected]» si cela inclut les informations de l'utilisateur.
- Numéro de port: Les périphériques réseau utilisent des adresses IP pour obtenir des informations sur le bon ordinateur du réseau. Lorsque ce trafic arrive, un numéro de port indique à l'ordinateur l'application à laquelle ce trafic est destiné. Le numéro de port est un autre élément que vous ne verrez pas souvent lorsque vous naviguez sur le Web, mais vous le verrez peut-être dans les applications réseau (comme les jeux) nécessitant la saisie d’une URL. Si l'URL comprend un numéro de port, il vient après le nom d'hôte et est précédé de deux points. Cela ressemblerait à quelque chose comme ceci: “//www.example.com:8080.”
C’est donc le schéma et les parties autorité d’une URL, mais comme vous l’auriez peut-être deviné après avoir consulté de nombreuses URL lors de la navigation sur le Web, elles peuvent inclure encore plus de choses.
Chemins, requêtes et fragments
Vous pouvez voir trois parties supplémentaires d'une URL après la partie autorité: les chemins, les requêtes et les fragments. Voici comment ceux-ci fonctionnent.
Chemin
La section autorité d'une URL permet à votre navigateur (ou à une application quelconque) d'accéder au bon serveur sur un réseau. Le chemin qui suit, qui fonctionne exactement comme un chemin sous Windows, macOS ou Linux, vous permet d'accéder au bon dossier ou fichier sur ce serveur. Le chemin est précédé d’une barre oblique et il y a une barre oblique entre chaque répertoire et sous-répertoire, comme ceci:
www.example.com/folder/subfolder/filename.html
La dernière pièce est le nom du fichier qui est ouvert lorsque vous accédez au site Web. Bien que vous ne puissiez pas le voir dans la barre d’adresse, cela ne signifie pas qu’il n’est pas là. Certaines langues utilisées pour créer des pages Web masquent le nom de fichier et l’extension que vous visualisez. Cela facilite la mémorisation et la saisie de l'URL et lui donne un aspect plus net.
Question
La partie requête d'une URL est utilisée pour identifier des éléments qui ne font pas partie d'une structure de chemin d'accès strict. Le plus souvent, vous les verrez utilisées lorsque vous effectuez une recherche ou lorsqu'une page Web transmet des données via un formulaire. La partie requête est précédée d'un point d'interrogation et vient après le chemin (ou après le nom d'hôte si aucun chemin n'est inclus).
A titre d'exemple, prenons cette URL présentée lorsque nous avons recherché sur Amazon les mots clés «extension wi-fi»:
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
Le formulaire de recherche a transmis des informations au moteur de recherche d'Amazon. Après le point d'interrogation, vous pouvez voir que la requête comporte deux parties: une URL pour la recherche (la partie «url = recherche-alias% 3Daps & field») et les mots-clés que nous avons saisis (ce sont les mots-clés = wi-fi + extender”).
C’est un exemple assez simple, et vous verrez souvent des URL avec des variables supplémentaires (et plus compliquées). Par exemple, voici l'URL lorsque nous avons cherché dans Google le mot clé "howtogeek":
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome..69i57j69i60l4j0.1839j1j4&sourceid=chrome&ie=UTF-8
Comme vous pouvez le constater, il existe différentes informations. Dans ce cas, vous pouvez voir que des informations supplémentaires indiquent la langue de recherche, le navigateur que nous avons utilisé (Chrome) et même le numéro de version du navigateur.
Fragment
Le dernier composant d'une URL que vous pourriez voir s'appelle un fragment. Le fragment est précédé d'un signe dièse (#) et sert à indiquer un emplacement spécifique sur une page Web. Lors du codage d'une page Web, les concepteurs peuvent créer des ancres pour un texte spécifique, par exemple des en-têtes. Lorsque le fragment approprié est utilisé à la fin d'une URL, votre navigateur charge la page, puis passe à cette ancre. Les ancres et les URL contenant des fragments sont souvent utilisés pour créer des tableaux de contenu sur des pages Web afin de faciliter la navigation.
Voici un exemple. La page de Wikipedia sur la Renaissance est un document assez long. Il est divisé en 11 sections, chacune comprenant plusieurs sous-sections. Toutefois, chaque en-tête de la page comporte une ancre et une table des matières en haut de l'article contient des liens vous permettant de passer d'une section à l'autre. Ces liens fonctionnent en incluant des fragments.
Vous pouvez également utiliser ces fragments directement dans votre barre d’adresse ou en tant que liens partageables. Supposons, par exemple, que vous vouliez montrer à quelqu'un la section de cette page qui couvre la Russie. Vous pouvez simplement leur envoyer ce lien:
https://en.wikipedia.org/wiki/Renaissance#Russia
Cette partie «#Russia» à la fin de l'URL les ramène directement à cette section après avoir chargé la page.
Voilà donc tout ce que vous avez toujours voulu savoir sur le fonctionnement des URL.