Temps d'arrêt
Les temps d'arrêt sont une période pendant laquelle un système n'est pas disponible. Il peut s’appliquer à ordinateur or réseau, mais est le plus couramment utilisé en référence à serveurs. En particulier, le serveur web la fiabilité est souvent mesurée en termes de temps d'arrêt, où peu ou pas de temps d'arrêt est idéal.
Il existe plusieurs raisons pour lesquelles un serveur peut rencontrer des temps d'arrêt:
- Redémarrage du serveur - Le redémarrage d'un serveur peut nécessiter quelques minutes d'indisponibilité, car le système doit être arrêté, redémarré, puis redémarrer les processus nécessaires pour pouvoir répondre aux demandes entrantes.
- Redémarrage du logiciel - Redémarrer un processus, comme Apache sur un serveur Web, peut entraîner quelques secondes d’indisponibilité pendant le redémarrage du processus.
- Déconnexion du réseau - Si un serveur est physiquement déconnecté d'un réseau, il ne sera pas accessible par les systèmes du réseau.
- Panne du réseau - Si une partie du réseau (y compris Internet) ne fonctionne pas entre le serveur et client, le client ne pourra pas communiquer avec le serveur.
- Surcharge de trafic - Si un serveur reçoit plus de trafic qu'il ne peut en gérer, il ne pourra pas répondre à toutes les demandes. Les utilisateurs peuvent subir des temps d'arrêt jusqu'à ce que le trafic diminue. Ceci peut être causé par une pointe de trafic ou une DDoS attaque.
- Erreur matérielle - Si un matériel important composant, Tel qu'un HDD or SSD En cas d'échec, le serveur peut cesser de fonctionner.
- Échec du logiciel - Si un processus sur un serveur, tel que httpd (HTTP) le service s’arrête de fonctionner, le serveur ne répondra plus aux demandes jusqu’à ce que le processus soit redémarré.
- Panne de courant - Si le courant est coupé et qu’aucune alimentation de secours n’est disponible (par exemple, un générateur ou UPS), tous les systèmes affectés seront hors ligne jusqu'à ce que le courant soit rétabli.
- Attaque de pirate - Si un pirate prend le contrôle d'un serveur, il peut empêcher l'accès aux services requis, ce qui entraîne l'arrêt du serveur.
Afin de minimiser les temps d'arrêt, les administrateurs de serveur doivent mettre en œuvre des mesures de sécurité strictes et redondance. La sécurité du réseau contribue à la protection contre les activités malveillantes, telles que les connexions non autorisées et les attaques DDoS. Redondance, telle que RAID Les systèmes de stockage et les générateurs de secours permettent d'éviter les temps d'arrêt dus à une défaillance matérielle. Dans certains cas, plusieurs serveurs peuvent être configurés pour qu'un serveur secondaire puisse prendre le relais en cas de panne du serveur principal.
Tandis que les administrateurs de serveur essaient de minimiser autant que possible les temps d'arrêt, ils sont parfois inévitables. Par exemple, lors de la migration d'un serveur, plusieurs minutes, voire quelques heures, peuvent être nécessaires. Ce type de "temps d'arrêt planifié" est généralement programmé tôt le matin ou le week-end lorsque le trafic est le plus faible.