Site WWW de Laurent Bloch
Slogan du site

ISSN 2271-3905
Cliquez ici si vous voulez visiter mon autre site, orienté vers des sujets moins techniques.

Pour recevoir (au plus une fois par semaine) les nouveautés de ce site, indiquez ici votre adresse électronique :

Informatique en nuage et réseaux de distribution de données
Cloud Computing & CDN
Article mis en ligne le 30 août 2017
dernière modification le 31 décembre 2020

par Laurent Bloch

Principes de l’Informatique en nuage (Cloud Computing)

L’informatique en nuage (en anglais Cloud Computing) est un service d’hébergement informatique en réseau dont la première apparition fut le lancement en 2006 par Amazon de son offre Amazon Web Services (AWS). Il s’agissait alors pour Amazon de commercialiser la puissance de calcul inutilisée des serveurs déployés de par le monde pour son propre usage et qui n’étaient utilisés qu’à 10 % de leur capacité, afin de pouvoir faire face aux pointes saisonnières, notamment lors des fêtes de fin d’année.

L’originalité de l’informatique en nuage par rapport aux offres traditionnelles d’hébergement de données, de sites Web ou de serveurs de calcul repose sur les cinq caractéristiques suivantes :
 déploiement et arrêt des services à la demande, en self-service, généralement par une interface Web, quasi instantanément ;
 accès par réseau à haut débit ;
 mutualisation de ressources non localisées : infrastructures, réseau, logiciel, stockage ;
 allocation et désallocation rapide des ressources (« élasticité ») ;
 facturation à la consommation, typiquement heure par heure.

Cette souplesse est permise par la disponibilité de quatre technologies déjà bien connues, mais dont les performances ont accompli récemment des progrès considérables : l’informatique répartie, un réseau à haut débit omniprésent, le système de noms de domaines (DNS), enfin des plates-formes efficaces pour machines virtuelles. Une machine virtuelle est un logiciel programmé pour se comporter comme un ordinateur physique, par rapport auquel il offre l’avantage de pouvoir être déplacé, avec ses données, par le réseau. Un ordinateur physique peut héberger des dizaines de machines virtuelles.

L’informatique en nuage peut être offerte selon trois formes :
 IaaS (Infrastructure as a Service) : le client se voit livrer une machine (virtuelle) nue, c’est-à-dire sans système d’exploitation installé, mais avec de l’espace disque et une ou plusieurs interfaces réseau (virtuelles) ; il installe sur cette machine le système et les logiciels de son choix, et fait son affaire des mises à jour, notamment de sécurité ;
 PaaS (Platform as a Service) : le client reçoit une machine virtuelle dotée du système d’exploitation qu’il aura choisi sur le catalogue du fournisseur, ainsi que de quelques programmes utilitaires (base de données, serveur Web par exemple) ; c’est le fournisseur qui assurera les mises à jour des logiciels qu’il aura installés, cependant que le client sera responsable de la gestion des données et des logiciels d’application qu’il aura installés lui-même ;
 SaaS (Software as a Service) : le client reçoit les droits d’accès à un système entièrement configuré avec les logiciels choisis sur le catalogue du fournisseur (par exemple paie, messagerie, blog, wiki ou gestion financière), il n’a plus qu’à les utiliser avec ses propres données.

Grâce à la virtualisation des serveurs et du réseau, l’utilisateur de services en nuage ne sait où se trouvent ni ses données, ni l’ordinateur qui les exploite. D’ailleurs leur emplacement physique peut changer à tout instant, même en cours de travail.

La plupart des services en réseau destinés au grand public ou aux entreprises, tels que Google Apps, Facebook, Dropbox, etc., fonctionnent en nuage (cloud) : on ne sait où sont ni les données, ni les ordinateurs qui les créent et qui les transforment.

Réseaux de distribution de données (Content delivery networks, CDN)

Les protocoles de l’Internet, TCP/IP principalement, sont conçus pour transmettre des données d’une machine à une autre. Si un serveur de diffusion vidéo ou de jeux en ligne installé au Malawi a 50 000 amateurs en Bolivie, chaque jeu de données sera transmis 50 000 fois, ce qui est tout sauf efficace. Il existe des méthodes pour diminuer, dans certains cas, cette consommation excessive de bande passante, comme la transmission multicast pour des diffusions simultanées, qui permet de n’émettre chaque paquet qu’une seule fois et de garantir qu’il ne sera transmis qu’une seule fois sur chaque segment physique de réseau utilisé pour être ensuite distribué à chaque abonné, mais cette méthode ne vaut que pour une diffusion de type programme de télévision et de toute façon sa mise en œuvre est trop délicate, ce qui a empêché sa popularisation.

Comme le trajet des données entre le Malawi et la Bolivie est long, compliqué et qu’il emprunte des liaisons dont le débit n’est pas toujours excellent, il y a un grand intérêt à rapprocher les données de leurs utilisateurs et comme les protocoles de la famille TCP/IP ne procurent pas de solutions satisfaisantes, des techniques non-standard sont apparues, qui reposent sur la multiplication de serveurs relais en des points géographiques judicieusement placés.

L’entreprise Akamai est spécialisée dans la fourniture de tels services, désignés par l’acronyme CDN (pour Content Delivery Network, ou Réseau de distribution de contenu). Akamai assure aujourd’hui une part significative du trafic Web dans le monde au moyen de 275 000 serveurs installés dans 136 pays, pour un chiffre d’affaires de près de trois milliards de dollars. Akamai procure à ses clients, essentiellement des diffuseurs de contenus sur le Web tels que Twitter, Facebook, la BBC, Adobe, Yahoo !, Netflix et beaucoup d’autres, un service de duplication transparente de leurs données, c’est-à-dire qu’en fonction de sa position géographique, un internaute désireux d’accéder à Twitter sera, sans qu’il s’en aperçoive, redirigé vers un serveur Akamai proche de chez lui, qui lui délivrera les pages Web désirées avec de meilleurs temps d’accès que s’il y accédait en traversant les océans.

Techniquement, le réseau d’Akamai utilise intensivement les techniques de l’informatique en nuage et des algorithmes non publiés perfectionnés pour assurer la disponibilité et l’intégrité des données.

La domination de ce marché des CDN par Akamai tient à la qualité de ses algorithmes originaux, à sa présence mondiale et à des économies d’échelle qui font qu’il est rentable, même pour un gros diffuseur, de faire appel à eux plutôt que de monter sa propre infrastructure de distribution. Mais Akamai est surtout intéressant pour un site qui vise une clientèle mondiale. Apparaissent donc des opérateurs de CDN locaux ou régionaux qui s’adressent à des diffuseurs dont la clientèle est concentrée pour l’essentiel dans un pays donné ou dans une région particulière.

Observons que cette dissémination des données aux quatre coins de la planète par l’effet des CDN et de l’informatique en nuage anéantit toute velléité de contrôle territorial du stockage de données : les efforts de réglementation dans ce domaine doivent donc être menés à l’échelle internationale.

Avantages et inconvénients du Cloud

Le cloud procure des avantages économiques et techniques considérables. Pour un simple stockage de données, les coûts de l’hébergement en nuage sont divisés par trois par rapport à l’hébergement classique, mais pour un client dont l’activité subit de fortes variations dans le temps et qui sait optimiser son usage des ressources le gain peut être bien supérieur.

Cette optimisation de l’usage des ressources est une technique complexe dont la mise en œuvre demande des ingénieurs compétents.

Un autre avantage de l’informatique en nuage est qu’elle procure une sauvegarde implicite des données. Des données stockées sur Dropbox et partagées entre plusieurs machines sont mises à jour automatiquement et implicitement sur toutes ces machines à chaque modification, ce qui donne une sécurité bien supérieure à celle d’un système de sauvegarde local. Le système de Dropbox est techniquement robuste, sa confidentialité est bonne, sauf à l’égard des ingénieurs de Dropbox, qui peuvent faire l’objet d’une réquisition des autorités américaines.

L’inconvénient principal du cloud est le revers de ses avantages : l’utilisateur ne sait pas où sont ses données, et s’il est le client d’une opérateur international tel qu’Amazon cet emplacement peut être dans un pays dont la législation ne respecte pas ses exigences de confidentialité. Il faut savoir que le Patriot Act donne au gouvernement américain un droit total d’accès à toutes données détenues non seulement par un opérateur américain, mais aussi par un opérateur exerçant sur le territoire américain (ce qui est le cas d’Orange, de British Telecom, etc.). Jusqu’à présent Microsoft a obtenu gain de cause dans son différend avec les autorités américaines et a pu refuser de livrer les données d’un de ses clients stockées en Irlande, mais ce résultat pourrait être remis en cause par une nouvelle décision de justice.

Safe Harbor, Patriot Act, Privacy Shield

Le Patriot Act du 26 octobre 2001 ne laisse aucun doute sur le fait qu’une entreprise, quelle que soit sa nationalité, qui exerce son activité sur le territoire des États-Unis, est tenue de répondre positivement aux demandes d’accès aux données de ses clients qui lui seraient adressées par la NSA (ou une autre agence fédérale de sécurité).

Ainsi, de grands opérateurs tels que BT ou Orange, bien que britannique ou français, sont soumis au Patriot Act du fait de leur présence commerciale et technique aux États-Unis, au contraire jusqu’à une date récente du Français OVH, dont les activités nord-américaines étaient basées au Canada, mais qui s’est implanté aux États-Unis.

Il est à noter que le Patriot Act réduit à néant les garanties de protection des données personnelles obtenues par la Commission européenne au titre d’un accord avec le Département du Commerce des États-Unis ratifié le 26 juillet 2000, qui a instauré un cadre juridique dénommé Safe Harbor (Sphère de sécurité).

L’accord connu sous le nom de Privacy Shield (« bouclier de protection des données »), approuvé par l’UE le 8 juillet 2016, et qui était censé donner des garanties de confidentialité des données transférées aux États-Unis, a finalement été révoqué le 16 juillet 2020 après qu’il eut été établi que ces garanties étaient illusoires.

Acteurs français de l’informatique en nuage

Existe-t-il des entreprises françaises qui réussissent dans ces domaines ? Oui heureusement. Les opérateurs Internet Free, OVH et Gandi, pour ne citer que les plus importants, sont des entreprises en pointe dans leur domaine. OVH est particulièrement admirable : créée il y a une quinzaine d’années par une famille d’immigrés polonais sans un sou de capital, elle est aujourd’hui un acteur de poids dans le domaine de l’informatique en nuage (cloud computing) et de l’hébergement de centres de données (datacenters), au cœur et à la pointe de l’i-économie. Cela dit, leur éloignement de ce que Pierre Bourdieu appelait la « noblesse d’État » les rend invisibles aux cercles du pouvoir.

Exigences de souveraineté envisageables

Les objectifs suivants pourraient être fixés :
 Tout acteur européen, public ou privé, entreprise ou particulier, doit pouvoir obtenir que ses données, stockées selon un système d’hébergement traditionnel ou en nuage (dans le Cloud), soient conservées sur le territoire de l’Union européenne selon des modalités conformes au droit européen sur les données (un procès entre Microsoft et le gouvernement américain a montré que ce dernier considérait que les données détenues en Europe par un opérateur soumis au droit américain relevaient des tribunaux américains).
 Tout acteur européen, public ou privé, entreprise ou particulier, doit être considéré propriétaire non seulement des données qu’il communique explicitement aux opérateurs avec lesquels il interagit sur l’Internet (données primaires), mais aussi des données recueillies par ces opérateurs à l’occasion de ces interactions, telles qu’adresses électroniques, localisation, heures et dates de connexion, adresses physiques, identifiants, correspondants, etc. (données secondaires). Ces données, appelées métadonnées, ne doivent pouvoir être utilisées qu’avec son consentement et selon des conditions à négocier.

Pour atteindre des objectifs de ce type, l’UE compte sur son territoire des opérateurs de dimension internationale, parfaitement à même d’en procurer les fonctions techniques et les infrastructures. Cela suppose une politique industrielle.

Recommandations de politique

Les solutions de l’avenir sont dans le cloud (ou informatique en nuage). Plutôt que de créer un enième cloud alors qu’une offre européenne solide existe déjà, mieux vaudrait stimuler les usages, par exemple en subventionnant les abonnements pendant une période de démarrage, et en donnant aux PME dépourvues des compétences nécessaires une assistance technique et de la formation.

Avoir sur le Web un affichage des réseaux d’entreprises et de leurs offres technologiques constituerait une vitrine utile de nos capacités industrielles, surtout pour les PME qui peuvent éprouver des difficultés à se faire connaître à l’international.

Quant aux chercheurs, leur souci d’indépendance et les différences de besoins entre disciplines différentes donnent à penser que plutôt que de vouloir les regrouper sur un Cloud unique, mieux vaudrait se concentrer sur l’indexation et le référencement des publications et des données sur une base européenne, afin de ne pas dépendre entièrement des grands éditeurs internationaux Elsevier et Thomson/Reuters.

Les priorités à haute valeur ajoutée, à l’issue de notre enquête, pourraient être :
 Hub collaboratif pour que des entreprises créent ensemble de nouveaux produits et multiplient les relations et les coopérations.
 Places de marché, intermédiation.
 L’Europe doit pousser à l’essor de la ville intelligente par des programmes de développement de l’IOT (Internet des objets) : flux logistiques, sécurité, santé, transport, réseaux (eau, gaz, électricité), services (crèches, écoles). Cet essor se fera notamment grâce au cloud.
 Automates programmables sur les chaînes de production (industrie 4.0) : aujourd’hui ce sont de gros appareils peu flexibles, dont les données et les traitements ont vocation à déménager dans le Cloud, cependant que ne resteront sur la machine que de très petits contrôleurs, reliés en réseau (5G, WiFi, LoRaWAN...) au système d’information industriel.