big data Apache Spark 3 - Utiliser le shell Spark avec Scala Pour démarrer avec Apache Spark en Scala : voici vos premiers pas afin de pouvoir mettre vos mains dans la manipulation de gros jeux de données avec le shell ou REPL spark. Vous trouverez quelques exemples de prototypage d'analyses de données.
big data Restitution de données et création de tableaux de bords Metabase est un outil de restitution de données et de création de tableaux de bord orienté utilisateurs. Il se connecte à vos sources de données, vous propose de les découvrir et d'en produire des dashboards ergonomiques.
big data Scala pour Apache Spark - Cheatsheet Nous présentons ici une aide-mémoire de codes en scala pour gérer des traitements de données distribués à l'aide d'Apache Spark.
tutoriaux Apache Spark : Les sources de données externes Généralité sur Apache Spark : Spark est un système de calcul distribué sur des collections de données répliquées et résilientes. Les calculs sont exécutés avec un fort parallélisme. Spark supporte plusieurs languages : Scala, Java, Python et R. Le schéma classique d'une application Spark est le suivant : * Chargement des données