Aller au contenu

Comprendre Internet et le Web

animation

Le World Wide Web date des années 70. Comme vous le savez, il rend accessible des documents quelque soit leur localisation sur des machines en réseau.
Le W3C utilise le concept des liens hypertextes qui permet une lecture non-linéaire des documents contrairement aux livres. La technique de l’hypertexte a grandement contribué au succès du Web.

schéma web

Architecture

schéma web

Internet est constitué de réseaux connectés entre eux grâce au protocole TCP/IP.

Les composants d’Internet sont :

En fin de compte, pour tous les hosts, le réseau est représenté comme une seule entité, un seul réseau, le nom ou l’adresse du destinataire étant suffisante pour établir le contact.

Modèle Client/Serveur

schéma web

Le modèle Client/Serveur constitue Internet :

L’ordinateur client dispose d’un programme (Navigateur) qui formule une requête ou exécute un programme, alors que le serveur contient la puissance et la capacité pour accéder aux données qu’il détient.

Un même client peut accéder à n’importe quelle application serveur, de même, un serveur unique peut répondre à de nombreux clients, d’où une flexibilité dans la conception des applications.

L’illustration plus haut représente une configuration standard chez un(e) Internaute :

Le serveur

schéma web

Le navigateur émet une requête GET reçue sur le port 80 du serveur Web. On dit que le serveur Web écoute sur le port 80.

Tout ce qui est reçu sur ce port est pris en charge par le serveur, aussi appellé HTTP serveur ou HTTPD (démon) sous Unix. Lorsque la totalité des éléments d’une page est chargée, la connexion avec le serveur Web s’arrête :

Le client

schéma web

Le navigateur fait le travail de formattage.

La requête GET ne va pas chercher tous les fichiers inclus dans une page. Lorsque le navigateur lit la page et demande les objets nécessaires qui seront chargés un à un.

Une histoire de protocole : TCP/IP

schéma web

TCP/IP est une suite de protocoles qui ont été développés pour permettre d’établir des communications dans un environnement réseau hétérogène.

(APPL : pour Application dans le schéma)

TCP/IP peut fonctionner sur n’importe quelle machine, que ce soit un PC portable ou un autre. Il peut également assurer le transport des paquets au travers de moyens divers et variés qui utilisent différents protocoles.

Il fonctionne aussi bien sur un LAN (Local Area Network) que sur un WAN (Wide Area Network). (TCP/IP étant constitué de quatre couches de protocoles, on parle de suite de protocoles).

Pile du protocole TCP/IP

schéma web

TCP/IP est un protocole en couche, chacune d’elle ayant un rôle disctinct dans le réseau. Lorsque deux réseaux échangent des données, chacune des couches d’un système, communique de manière logique avec les couches équivalentes sur l’autre système.

1 - La couche application

C’est la couche que les utilisateur.trices.s connaissent le mieux. A ce niveau, les protocoles sont définis pour des programmes applicatifs qui mettent en oeuvre des fonctionnalités spécifiques comme l’e-mail ou le surf. Il existe des centaines de protocoles d’application.

Voici les trois les plus connus sur le net aujourd’hui :

HTTP en vidéo

2 - La couche Transport - TCP (Transport Control Protocol)

3 - La couche réseau - IP (Internet Protocol)

Fonctionnement : IP envoie, un point c’est tout. Les détections d’erreurs et récupération prennant du temps, on a préféré assurer un acheminement rapide et laisser aux protocoles supérieurs (TCP) le soin de vérifier la fiabilité de la livraison des paquets.

4 - La couche physique

Quelques protocoles

schéma web

Adressage réseau IP

schéma web

Afin d’acheminer les données au bon destinataire, chaque machine (host) doit avoir une adresse unique.

IP fournit un système basé sur des adresses sur 32 bits. Afin de faciliter la compréhension, ces adresses sont exprimées en format décimal. Chaque partie de 8 bits est séparée par un point. La première partie de cette adresse sert à identifier le réseau, l’autre identifie la machine sur ce réseau. Chaque machine appartenant à un réseau, dispose d’une adresse unique à l’intérieur de ce réseau.

A la limite, si on n’a pas l’intention de connecter son réseau à Internet, on pourrait utiliser n’importe quelle adresse, mais il est recommandé aux administrateurs réseaux d’obtenir des adresses Internet officielles.

Des millions d’utilisateurs étant connectés à Internet, comment les informations leur parviennent-elles ?

Chaque utilisateur est associé à un réseau spécifique avec une adresse unique. A l’intérieur de ce réseau, chaque machine dispose également d’une adresse unique. Les routeurs utilisent les adresses réseaux pour acheminer les paquets à ce réseau. Cette adresse reconnait ses utilisateurs sur Internet (éventuellement grâce à un fichier de configuration). L’adresse peut aussi être dynamiquement attribuée par le fournisseur d’accès Internet.

Noms de Domaines

Top Level Domains (TLD)

Au début d’Internet aux Etat-Unis, il a été décidé d'utiliser une convention de noms pour éviter d'avoir à se souvenir de l'adresse 32 bits. Ces noms sont enregistrés par l’ICANN (Internet Corporation for Assigned Names and Numbers) ou le NIC (Network Information Center) local.

Des serveurs de noms DNS (Domain Name System) sont utilisés pour les traductions d’adresses.

Ces TLD sont toujours en vigueur et de nouveaux TLD s’ajoutent au fils des ans. Lorsqu’Internet s’est internationalisé, une convention de noms alternative a été créée par l’ISO (International Standards Organization) basée sur les noms des pays. Ces dénominations géographiques sont très utilisées hors Etats-Unis (exemple .fr pour la France)

Voir les noms de domaines actuellement valables (sur wikipédia) : https://fr.wikipedia.org/wiki/Nom_de_domaine

schéma web

URL (Uniform Resource Locator)

Format générique : protocol://servername.domain/[:port#/][path/][fileName[.extension]]

Exemples :

L’URL sert à identifier de manière unique une ressource sur un réseau TCP/IP. Elle sert aussi à trouver cette ressource.

En règle générale, on assigne au protocole son port par défaut : par exemple le port 80 pour HTTP. Si le port par défaut est utilisé, il est inutile de le préciser.

Note : On appelle socket la paire constituée par un protocole et son port.

Pour les serveurs Web, certains fichiers par défaut sont définis, comme par exemple le fichier index.htm. En conséquence, il est suffisant de saisir le nom de domaine pour faire apparaitre dans le navigateur la page d’accueil.

Si plusieurs serveurs existent dans un domaine, il faut spécifier le nom du serveur. Les noms peuvent s’inscrire en cascade, par exemple, dans blog.simplon.com

blog est connu du domaine simplon lui même connu du domaine com (un TLD)

Attention : Le chemin ne reflète pas le chemin physique du fichier. Les serveurs Web ont leur propre mapping logique aux disques physiques et aux répertoires.

Universalité

schéma web

Connaître l’IP de sa machine

Dans mon cas, mon IPv6 est fe80::f8c7:e515:fa0b:caa2%18 et mon IPv4 est 192.168.1.16

Lancez votre terminal windows et entrez ipconfig

Pour Linux, je crois que c’est ip addr mais je pense qu’ipconfig fonctionne aussi (à vérifier)

Voici ce que vous pouvez obtenir avec une IP différente.

Carte Ethernet Ethernet :
   Suffixe DNS propre à la connexion. . . : lan
   Adresse IPv6 de liaison locale. . . . .: fe80::f8c7:e515:fa0b:caa2%18
   Adresse IPv4. . . . . . . . . . . . . .: 192.168.1.16
   Masque de sous-réseau. . . . . . . . . : 255.255.255.0
   Passerelle par défaut. . . . . . . . . : 192.168.1.254

Remarque : je n’ai pas abordé la notion de proxy, voici ce à quoi ça correspond (source wikipédia). Nous verrons cela ultérieurement.

Mise en pratique

Un exercice simple

Auteur : Philippe Bouget