Ce document présente les concepts du Big Data, du calcul distribué et du paradigme MapReduce avec Hadoop et Spark. Il explique comment Hadoop utilise HDFS et YARN pour stocker et traiter efficacement de grandes quantités de données sur plusieurs machines. Des exemples pratiques comme le comptage de mots ou la recherche d’amis en commun illustrent le fonctionnement des opérations MAP et REDUCE