En ce moment
 
 

Comment fonctionnent les grands data centers? Nous avons visité celui de Proximus

 
proximus
 

Quelques mois après la "panne" (on en sait plus aujourd'hui) dans un des data centers de Proximus, l'opérateur nous a ouvert les portes de ses infrastructures d'une ampleur inégalée en Belgique. De quoi rassurer l'ensemble de clients de Proximus, directs et indirects, sur la fiabilité du matériel. Mais il y a toujours la partie logicielle, plus capricieuse…

L'été dernier, plusieurs entreprises ont connu une importante interruption d'accès à leurs services en ligne (email, données dans le cloud, parfois téléphonie). Un bug logiciel, en réalité, qui a affecté le fonctionnement d'un data center de Proximus, un de ces "entrepôts" remplis d'ordinateurs qui hébergent différents types de données et de services (voir plus bas).

Un impact considérable sur le fonctionnement quotidien de n'importe quelle structure, y compris l'asbl de Frank Chezza, directeur de CEFOVERRE, un centre de compétence pour les métiers du verre dans la région de Charleroi.

"Nous aidons les entreprises actives dans l'industrie du verre à trouver de formations, des cadres, des ouvriers", nous a-t-il expliqué après avoir contacté la rédaction de RTL info via le bouton orange Alertez-nous.

"Trois jours sans communiquer"

Au mois d'août, "on est resté trois jours sans pouvoir communiquer: aucune boîte mail disponible… Pas de contact possible avec les clients, les fournisseurs, les formateurs". L'asbl de Frank "n'est pas une grosse boîte, on est 6 personnes à travailler mais l'impact est important, on était proche de l'inactivité pendant trois jours, car à part le téléphone, rien ne fonctionnait". Or en 2019, envoyer et recevoir des emails est le lot quotidien de la majorité des travailleurs. Et il ne s'agit pas que d'envoi de courrier électronique: dans les emails importants, il y a des informations essentielles qu'on conserve précieusement…

Frank n'a pourtant aucun lien direct avec Proximus, alors comment cette panne a-t-elle eu des répercussions jusqu'à son association ? "Nous avons un contrat avec SPIE", nous a-t-il expliqué. SPIE est une grande entreprise belge qui fournit plusieurs types de services d'envergure pour les entreprises (infrastructures, etc) ; et depuis le rachat de Systemat, également des solutions informatiques au sens large.

"On les a contactés mais le premier jour, ils n'avaient même plus le téléphone, ça ne répondait pas. Donc on ne savait vraiment pas ce qu'il se passait. Puis le lendemain on a réussi à les contacter par GSM, ils nous ont dit que le problème était généralisé".

Les conséquences ne sont finalement pas trop graves, avec le recul. "Certains clients ou collaborateurs nous ont appelés car ils se demandaient pourquoi ils n'avaient plus de nos nouvelles. C'est surtout le personnel qui était un peu énervé de ne pas savoir quand il allait récupérer l'accès à ses emails. On n'aurait jamais cru qu'on pouvait rester aussi longtemps, trois jours, sans être connecté".

Un problème survenu lors d'une mise à jour logicielle prévue d'un commutateur réseau

Cascade de conséquences: quelle est l'origine du problème ?

Frank n'en veut pas à SPIE. "On est ravi de notre contrat avec eux, ça fait au moins 5 ou 6 ans que je suis là et tout se passe toujours très bien. Durant la panne, ils ont fait leur possible au niveau du service clientèle", mais ont rapidement expliqué qu'ils étaient eux-mêmes "victime d'un problème chez Proximus".

Effectivement, les services fournis par SPIE à l'asbl de Frank sont en réalité hébergés sur des serveurs situés dans l'un des data centers de Proximus. La "panne" qui a eu lieu l'été dernier a donc eu des conséquences en cascade. Des gros clients comme SPIE ont été impactés, tout comme les "petits" clients à qui SPIE vend ses services numériques.

L'asbl de Frank paie tout de même 2.840€ HTVA par an à SPIE pour "19 licences Office, 6 boîtes mail sur leur cloud et le maintien du nom de domaine". Une coquette somme pour l'hébergement d'un site web et quelques adresses email, qui justifie donc une certaine exigence de sa part. "On ne sait pas encore s'il y aura un dédommagement".

Nous avons contacté SPIE pour avoir une réaction de leur part quant aux conséquences de l'incident à leur niveau (car ils ont des centaines de clients comme Frank, a priori), mais "l’entreprise est actuellement en pourparlers avec Proximus pour le compte de ses clients. Le timing n’est dès lors pas opportun", nous a répondu le service de communication.

Mais quel était le problème, finalement ? L'explication officielle de la panne de Proximus nous est parvenue récemment. "En raison d'un problème survenu lors d'une mise à jour logicielle prévue d'un commutateur réseau, nous avons rencontré des problèmes techniques dans notre centre de données à Evere le 12 août. Par conséquent, certains de nos clients utilisant les solutions vHosting ou vContainer ont rencontré des problèmes de connectivité. Nos équipes techniques ont travaillé d'arrache-pied pour rétablir la situation le plus rapidement possible. Une solution technique a été trouvée et les services ont été progressivement rétablis", nous a communiqué l'opérateur.


 
 L'intérieur du data center d'Evere, dans une des salles hébergeant les services de Proximus

A quoi servent les data center de Proximus ?

La panne de Proximus ne concerne donc pas vraiment le data center en lui-même, mais plutôt le logiciel d'une partie des infrastructures, celle, essentielle, qui gère la transmission des données vers et depuis le data center (pour faire très simple). Un bug très isolé et rare, a-t-on appris. A tel point que l'opérateur a tenu à nous faire visiter ses infrastructures dernier cri à Bruxelles.

Vous l'ignorez sans doute, mais Proximus est l'un des acteurs principaux des data centers en Belgique. Lors de la numérisation des télécommunications, donc en schématisant, lorsqu'on est passé de la téléphonie fixe (son unique business il y a 25 ans) à internet et la téléphonie mobile, il était aux premiers postes pour créer et gérer des centres de données.

L'opérateur a rapidement eu besoin d'un nombre croissant de serveurs pour des raisons internes: comptabilité et facturation, par exemple, mais aussi pour amener les contenus de Proximus TV auprès de millions de foyers belges, ou tout simplement pour donner l'accès à l'internet fixe et mobile. Au début des années 2000, plusieurs "petits data centers éparpillés en Belgique ont été consolidés", rassemblés si l'on veut, à Evere, Machelen et Malines, nous a expliqué Patrick Dirickx, responsable des data centers de Proximus depuis cette époque.

Au fil des ans, les activités liées à ces data center ont évolué vers l'extérieur. "On propose désormais de l'housing et du hosting". Le housing, cela signifie que des entreprises, comme des banques par exemple, peuvent louer des mètres carrés du data center et y installer son propre matériel. "On leur fournit un environnement sécurisé et une garantie de continuité". En cas de problème sur son matériel, le client intervient lui-même ou demande aux techniciens de Proximus si la résolution est simple (par exemple forcer le redémarrage d'un serveur). 

Le hosting est différent. "C'est notre matériel, on et le met à disposition du client. Il est également possible de leur fournir des logiciels". Par exemple, une PME qui a besoin d'une solution de gestion de clientèle, mais qui ne veut gérer en interne ni les serveurs, ni les logiciels, confie tout à Proximus. Et paie donc un genre d'abonnement pour y avoir accès, un peu comme Franck et son asbl, même si lui passe par un intermédiaire, SPIE.

Un mot sur la taille des data centers de Proximus. On sait que Google en opère plusieurs à Mons, et qu'il en fait construire un nouveau. Mais l'entreprise américaine reste très discrète sur le nombre de mètres carrés exploités et les activités précises qu'il y conduit. Donc avec ses 14.200 mètres carrés au total, donc 700 très efficaces à Evere (voir plus bas), Proximus peut être considéré comme l'acteur N.1 en Belgique, mais il n'y a rien d'officiel dans ce constat.

En cas de panne électrique, un système intelligent permet de gérer la transition entre l'électricité de la ville et nos générateurs diesel

Comment fonctionnent les data centers de Proximus ?

Vous l'avez compris, la base d'un data center, c'est d'héberger des salles remplies de couloirs, dans lesquels sont empilés des serveurs (ordinateurs et disques durs), qui sont utilisés en interne par Proximus pour son propre fonctionnement, ou pilotés de l'extérieur par des entreprises qui louent l'espace et l'environnement physique sécurisé.

Le but premier d'un data center est donc de garantir un niveau maximal de disponibilité des machines (anticiper toutes les pannes et prévoir des procédures rapides pour les solutionner), et de limiter au maximum la consommation d'électricité (pour des raisons écologiques mais surtout économiques).

Respect de normes très strictes (ISO, ISAE, etc), ingénierie ultra-pointue : les data centers sont les pièces d'orfèvrerie du génie civile du 21e sicèle. Il faut des infrastructures très spécifiques, car les salles abritant les serveurs doivent être refroidies, à cause de la chaleur importante produite par ces milliers d'ordinateurs qui tournent 24h sur 24. Et ce refroidissement consomme beaucoup d'énergie, en plus de l'alimentation de base de ces armoires d'ordinateurs et de disques durs.

Dans le nouveau data center d'Evere, dit "de haute densité" (car pouvant abriter plus de serveurs au mètre carré), Proximus a fait installer une impressionnante "roue de Kyoto" qui permet de rafraîchir l'air intérieur grâce à l'air extérieur, mais sans mélanger les deux. "L'investissement était important, mais en Belgique, ça vaut la peine. On obtient donc à ce niveau un PUE de 1,04, ce qui signifie que refroidir les serveurs ne consomment pratiquement rien", nous a expliqué Patrick Dirickx, responsable des data centers de Proximus. Le PUE (Power Usage Effectiveness) est un indicateur de l'efficacité énergétique d'un data center. Il est calculé en divisant le total de l'énergie consommée par le data center par le total de l'énergie utilisée par les équipements informatiques (serveur, stockage, réseau, etc).

L'opérateur a joué la carte de la transparence et nous a fait visiter l'entièreté des installations bruxelloise, des racks de serveurs à la cave où se trouve le système d'alimentation d'urgence. "En cas de panne électrique, un système intelligent permet de gérer la transition entre l'électricité de la ville et nos générateurs diesel". Soit 4 moteurs de bateau prêts en permanence à prendre le relais. Ce qui, hélas, fait grimper le PUE global à 1,3. "Mais c'est logique, il faut de la sécurité pour les clients".

Un début d'incendie ? "Il y a un système d'extinction avec injection sous haute pression d'argonite, un gaz très rare qui fait descendre le taux d'oxygène tellement bas que le feu s'éteint tout seul". Un gaz qui n'est dangereux ni pour l'être humain, ni pour les machines. "Mais il coûte très cher: si le gaz doit éteindre un compartiment, ça nous coûte 70.000€ de remplacer les bonbonnes…".

Autre niveau important à mesurer: l'humidité. "Les fabricants ont fait des efforts, et les plages de températures et de taux d'humidité supportés sont de plus en plus grandes. Mais on doit tout de même y faire attention et prévoir des capteurs, et des moyens pour humidifier ces pièces".

Bref, un tas de précautions qui font grimper le taux de fiabilité à 99,99%. "Je vise toujours les 100%, mais le risque zéro n'existe pas".


 
 La "roue de Kyoto", vue d'en bas et d'en haut

Très chère redondance

La grande contrainte d'un data center, "c'est la redondance", poursuit Patrick Dirickx. Il y a une solution de secours pour chaque problème envisageable.

Un disque dur qui plante avec des données importantes ? Elles sont dédoublées en permanence, donc stockées dans un autre data center de Proximus. Le client ne se rendra pas compte car le relais entre les serveurs est immédiat. Il fait trop chaud dehors pour que la roue de Tokyo soit efficace ? Un système de refroidissement prendra le relais. Et bien sûr, on l'a dit, en cas de panne d'électricité, des générateurs se mettent en route.

Tout ce dédoublement coûte beaucoup d'argent, en matériel comme en entretien. "Imaginez qu'il faut vérifier, par exemple, l'état des grandes cuves de diesel qui nous permettent de tenir trois jours sans électricité. Il y a peu, on a remarqué qu'il y avait des algues qui étaient apparues à cause du diesel qui est devenu du bio-diesel. On a du les vider et les filtrer".

La mission d'un directeur de data center, "c'est de garder le juste niveau de redondance et de modularité, car l'impact sur les coûts est important". Si Proximus doit trop augmenter le prix à cause du coût de ses infrastructures, il risque de perdre des clients qui pourraient prendre le risque de s'orienter vers des concurrents légèrement moins fiables, mais moins chers.


 

Vos commentaires