aquila_cloud big data compatibilité

Cloud & Big Data : Potes pour la vie ?

Le Cloud Computing et le Big Data sont considérés comme les deux principaux vecteurs d’innovation informatique de ces cinq dernières années. Le Cloud Computing, en accompagnant la mobilité et l’agilité. Le Big Data, en augmentant la capacité d’analyse.

Le Cloud a généré un nombre croissant de données hétérogènes comme les logs, la géolocalisation et tant d’autres. Historiquement, c’est un peu le « père » du Big Data, une technologie mise au point pour traiter efficacement ces nouveau flux de données « anarchiques ».

Mais dans cette photo de famille, il existe une confusion qui voudrait faire croire que l’un n’existe pas sans l’autre. Elle est aujourd’hui renforcée par des offres de fournisseurs de Cloud proposant du Big Data As a Service. Il convient pourtant et simplement de différencier trois approches pour distancer cette idée reçue.

Première approche : SaaS & Analytique

De plus en plus de solutions reposent sur de l’analytique et du Big Data en SaaS. C’est le cas, très majoritairement pour les DMP (Data Management Platform) et les différents outils de Data Visualisation / Text Mining. L’arrivée des réseaux IOT (Llora et Sigfox pour citer les plus connus) ne se borne pour l’instant qu’à fournir un service de capture des données issus des objets et de les restituer de manière plus ou moins brute. Il semble évident que l’étape suivante sera de proposer des services d’analyse de ces données. Un éco-système d’acteurs spécialisés par secteur d’activités ou par typologie de traitement va logiquement voir le jour.

De la même façon qu’aucune entreprise ne s’amuserait aujourd’hui à développer un ERP et utiliserait même volontiers SalesForce, le Big Data se verra normalisé sur un certain nombre d’usages. Notamment grâce à des fournisseurs capables d’offrir un service maîtrisé, tant au niveau du retour d’expérience, de la connaissance métier que du paiement à l’usage en fonction du résultat.

C’est un aspect certes encore marginal du Big Data, mais c’est aussi l’un des plus prometteurs.

Deuxième approche : Big Data as a Service (PaaS)

Le Big Data as a Service est un terme en vogue. Que ce soit en Cloud Public (AWS, Google, Azure, IBM) ou en mode Cloud privé « packagé » en interne, il doit pourtant être envisagé avec un minimum de recul et ce pour les raisons suivantes :

  • Couverture fonctionnelle — Les solutions « clefs en main » ne peuvent pas tout offrir. C’est pourquoi, elles s’appuient sur des spécificités et ne proposent pas tous les outils (notamment la Data Visualisation). Quelques exemples : IBM et Watson orientés Data Science, AWS et sa profusion d’outils, Azure et ses ponts naturels vers Power BI et Excel, etc.
  • Mise en production — Au delà de la sécurité, des développements spécifiques à mener, des compétences à mettre en oeuvre ou encore des déploiements d’ETL, c’est la politique de tarification qui devra être surveillée de près, de façon à ne pas perdre l’avantage Cloud (pics d’usage).

En résumé, le Big Data As a Service est sans doute un outil efficace pour déployer des projets en mode POC, mais il devient plus discutable pour de la production.

Troisième approche : Infrastructure Big Data en IaaS

Si l’on ne devait parler que d’infrastructures (y compris en mode PaaS) se rajouteraient les deux contraintes suivantes :

  • Puissance — La virtualisation des clusters aboutit naturellement à une perte de puissance de l’ordre de 10%.
  • Latence — Transférer 1 PO de données par le Web est une démarche compliquée. Une forte latence est évidemment une contrainte (y compris au niveau du calcul et de l’ordonnancement des paquets), notamment lorsqu’il s’agit de faire du temps réel.

Pour remédier à ces problèmes, les fournisseurs de Cloud proposent du Bare Metal. Ce qui revient, peu ou prou, à relativiser les économies d’échelle de la virtualisation (surtout au niveau des tarifs).

Beaucoup d’entreprises utilisant du Big Data dans leur cœur de métier comme Critéo ou Netflix ont d’ailleurs choisi — ou fini par choisir, de privilégier des solutions physiques et internes.

Ceci dit, comme il ne faut pas jeter le bébé avec l’eau du bain, il existe bien évidemment des vertus au Big Data en mode Cloud :

  • Montée en charge maîtrisée / scalabilité / coûts limités en phase de POC et développement
  • Mode « go fast and fail quick » à savoir la possibilité de traiter des jeux de données et voir rapidement l’intérêt à déployer des solutions plus lourdes.
  • Urbanisation SI, consistant à faire transiter des offres packagées par le biais d’un portail permettra de les agréger plus facilement par la suite. Ce n’est pas le cas aujourd’hui et les DSI se retrouvent souvent à devoir intégrer de nombreux projets Big Data ayant utilisé des technologies complètement différentes. C’est aussi l’innovation qui est favorisée à travers ces offres.
  • Mode collaboratif pour impliquer plus facilement différentes filiales (surtout si elles sont très éloignées les unes des autres), par  une mise à disposition de plateforme en mode Cloud. Les Data Lake sont aussi mieux appréhendés — au moins techniquement par ce biais.

Comment aborder le Big Data en mode Cloud ?

  • Regarder d’abord tout ce qui peut être réalisé par le biais d’outils en SaaS. Ils vont se développer et constitueront, de plus en plus, une alternative à l’approche « forgeron ».
  • Passer par des POC en IaaS / PaaS à la condition de les avoir normalisé en interne.
  • Les déployer en production à condition qu’ils répondent à un périmètre défini (pics d’usage, pas ou peu de contraintes de temps réel, intégration faible, nécessité d’ouverture de la plateforme). Dans le cas contraire (puissance de calcul importante, temps réel avec un fort volume de données, utilisation continue, sécurisation forte), privilégier les serveurs physiques en interne.

S’y greffent bien sûr des questions de sécurité, de gouvernance, de localisation des données, et, plus généralement de déploiement de plateformes personnalisées, d’analyse des données et de machine learning pour lesquelles les consultants d’Aquila Consulting vous accompagneront volontiers.

0 réponses

Répondre

Want to join the discussion?
Feel free to contribute!

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *