Et après, est apparu le BigData…

Avec le flot incessant de données qui sont créées dans […]

August 14, 2012

Avec le flot incessant de données qui sont créées dans les systèmes d’information, un point de non-retour a été franchi. Comment tirer l’épingle de la botte de foin ? Seul BigData peut le faire…

Comment extraire la valeur de toutes ces données ? Le phénomène BigData a été lancé par les grandes compagnies internet (Google, Yahoo, Facebook…) qui ne peuvent manipuler, tout le temps et pour toujours, toute la somme des données qui leur ont été confiées. Pour traiter ces données massives, BigData arrive au secours des entreprises avec des outils, naturellement issus de la communauté open-source.

C’est ainsi qu’Hadoop s’est largement imposé, soutenu et porté par la fondation Apache. Aujourd’hui, l’inventeur d’Hadoop, Doug Cutting (ex-Yahoo; en photo) est l’architecte en chef de Cloudera, l’éditeur de solutions et de service sur le framework. Lors de l’IT Press Tour 2012 qui a emmené une dizaine de médias européens en Valley, Doug Cutting a exhibé l’éternelle peluche éléphant de son fils qui a donné le nom au projet de la fondation, aujourd’hui embrassé par de nombreux acteurs et utilisateurs.

Cloudera, pionnier de la distribution d’Hadoop

Dans le framework Hadoop, outre les librairies générales et le File System propre qui permet d’attaquer les données en accès high-throughput, on trouve MapReduce, un ensemble de techniques qui permettent le mapping de données et la réduction. C’est la force d’Hadoop.

Pour Cloudera, pionnier dans la professionnalisation des solutions et services sur la technologie, la solution Hadoop est particulièrement adaptée aux grandes plateformes web et de streaming, à des besoins de détection de la fraude, de calcul des risques de crédit, de définition de stratégie de trading, de BI générique et détaillée, de connaissance de la clientèle, de rapports de logs, etc.

Présentant Hadoop comme le Data Operating System, Cloudera n’a cesse d’éprouver la qualité, la flexibilité et la scalabilité de la solution. Elle inclut dans sa Cloudera Hadoop Distribution (CDH) une solution complète, disponible gratuitement à l’essai, qui permet de répondre aux besoins de : collect, store, process, analyse and serve datas…

Ma Big Data DB Hadoop

Première base de données native sur le système de fichier distribué Hadoop, Rainstor, une autre start-up californienne, se positionne à la croisée de deux chemins dans l’univers BigData. En effet, la base de l’éditeur supporte tant SQL que MapReduce ouvrant la voix à une utilisation facilitée de BigData.

Fondée en 2004, Rainstor a pour ambition de délivrer une plateforme pour le BigData Management. Actuellement, sa solution est utilisée dans de très grands environnements telco, des services financiers ou des institutions gouvernementales. Avec plus de 150 déploiements et des partenaires technologiques comme EMC, HP, Dell et Teradata,… Rainstor veut profiter de l’essor BigData.

En effet, Rainstor vise à relever trois défis qui permettent d’accélérer l’adoption du BigData :

  • cheap and deep : avec des années de données accumulées, les grands environnements utilisent l’opportunité de traitement et d’analyse de données dans la mouvance BigData. Pour rendre cette utilisation fiable et abordable, Rainstor propose une base sur Hadoop.
  • deliver fast : c’est la promesse BigData tenue. « Analyse it ! », réclament les entreprises. Avec l’opportunité d’utiliser SQL sur Hadoop, la solution Rainstor se distingue de la grande masse d’outils qui accompagne le phénomène BigData.
  • safe and sure : la solution se veut Entreprise Grade, éprouvée pour les très grands volumes et les très grandes entreprises, au-delà de NoSQL.
Watch video

In the same category