Serveurs Web   Olivier Perret 30/10/01

World Wide Web


Qu'est-ce que le web


Panorama des serveurs

Comment ça marche ?

Un programme ou processus (httpd) installé sur une machine multi-tâche quelconque traite des requêtes venant de clients situés n'importe où sur Internet

L'unité d'information est le document

Document: tout type de texte (ASCII ou formatté), images (fixes ou animées), sons, et liens vers d'autres documents identifiés par un URL

Pour traiter des transactions HTTP

une requête = méthode + path + version du protocole

ex: GET /pasteur/index.html HTTP/1.0

Une réponse: code HTTP, en-tête MIME + données

HTTP/1.0 200 OK Content-type: text/html [.../...]


Autres protocoles

Le serveur sait relayer des requêtes pour un autre service:

Ne pas confondre avec les services supplémentaires du navigateur (mail, news, telnet,...)


Rappel: format des URL

Exemple: http://www.pasteur.fr/pasteur/bioterrorisme.html

Exemples


Page dynamique vs page statique


Administration des pages dynamiques

Sur le serveur, une arborescence centralise les scripts utilisables

Appelée  cgi-bin Common Gateway Interface (pour du code PERL) ou PHP3 (ou PHP4), c'est une interface commune aux applications via le web

Nécessite un contrôle accru car vu du serveur web, ces programmes sont déclenchées par un événement extérieur au serveur (sur le client)


Pages animées

Envoi d'un programme au logiciel client destiné à créer des pages animées


Cas de Java

basé sur le concept de machine virtuelle

orienté pogrammation objet

nouvelle technologie inventée par Sun dans un but de portabilité et adoptée par la communauté du Web (donc ouvert aux bugs...)


ActiveX et Javascript

ActiveX est à Java ce que NetBIOS est à TCP/IP: l'implémentation par Microsoft d'un produit rendant les mêmes services

Javascript est la même chose, mais fait par Netscape

Avantages: exploitation optimale des outils de la plate-forme client, développement spectaculaire d'outils simples

Inconvénients: failles de sécurité, manque d'ouverture


Administration d'un site web: serveur/contenu/sécurité

  1. Le serveur demande des compétences techniques; souvent c'est un Admin Réseau ou Admin Système
  2. Le contenu demande des compétences en communication et en graphisme
    Dans un établissement non technique, confier l'administration du contenu à l'informaticien est au pire une erreur et au moins une provocation (vis-à-vis du reste de l'entreprise)
  3. Sécurité

Administration du serveur

Administrateur du contenu

Sécurité


Sécurité du contenu

Beaucoup de problèmes associés à la technologie Internet sont liés aux législations différentes d'un pays à un autre:
Internet n'est pas une zone de non-droit, la loi s'y applique


Sécurité système, robustesse des sytèmes

L'administrateur système garantit la disponibilité, l'intégrité et de la confidentialité du contenu

WWW est un service de plus à administrer, surveiller, contrôler...

C'est parfois le seul service en ligne de l'établissement; il pose des problèmes nouveaux de garantie de service, surtout quand il sert de vitrine à l'établissement

WWW est un nouveau support de diffusion de programmes, donc de virus.


Trucs et Outils

Mettre en place un serveur de mises à jour en interne, différent du serveur officiel, et assurer une mise en ligne différée avec un outil comme rsync ou webcopy.

Installer un serveur-relais qui centralise les requêtes pour les enregistrer et/ou les contrôler. Peut aussi améliorer sensiblement les performances.

Distribuer aux utilisateurs une configuration sécurisée des clients (Netscape et IE). Ils ne s'apercevront souvent de rien, car les bons services, pour rester compatibles avec tous les clients, n'exploitent pas les fonctionnalités bizarres.

Les opérations qui suivent sont à faire de concert avec l'administrateur de contenu:


Install Apache

Configuration Apache

Tout est réuni dans un fichier httpd.conf


Configuration squid

Squid est le logiciel de proxy/cache installé à Pasteur, il tient lieu de lui configurer:


Liens contextuels