big data - Goovy Lab

Goovy Lab

Sign in Subscribe

big data

Les sujets relatifs aux grosses données

Apache Spark 3 - Utiliser le shell Spark avec Scala

Apache Spark 3 - Utiliser le shell Spark avec Scala

Pour démarrer avec Apache Spark en Scala : voici vos premiers pas afin de pouvoir mettre vos mains dans la manipulation de gros jeux de données avec le shell ou REPL spark. Vous trouverez quelques exemples de prototypage d'analyses de données.

Restitution de données et création de tableaux de bords

Restitution de données et création de tableaux de bords

Metabase est un outil de restitution de données et de création de tableaux de bord orienté utilisateurs. Il se connecte à vos sources de données, vous propose de les découvrir et d'en produire des dashboards ergonomiques.

Scala pour Apache Spark - Cheatsheet

Scala pour Apache Spark - Cheatsheet

Nous présentons ici une aide-mémoire de codes en scala pour gérer des traitements de données distribués à l'aide d'Apache Spark.

Apache Spark : Les sources de données externes

Apache Spark : Les sources de données externes

Généralité sur Apache Spark : Spark est un système de calcul distribué sur des collections de données répliquées et résilientes. Les calculs sont exécutés avec un fort parallélisme. Spark supporte plusieurs languages : Scala, Java, Python et R. Le schéma classique d'une application Spark est le suivant : * Chargement des données