As a Big Data consultant for almost 10 years, I have acquired in-depth expertise by successfully completing the "Cloudera Administrator Training for Apache Hadoop" offered by a Cloudera partner institution. My passion for Big Data technologies and machine learning algorithms has led me to play a key role in numerous projects. My main objective has been to assist clients in efficiently migrating from traditional data management solutions to new Big Data solutions.
Within this scope, I have designed and developed innovative Big Data projects, utilizing technologies such as Hadoop, Spark, and Kafka. My role extended beyond design and development; I was also responsible for the administration and maintenance of Big Data platforms, ensuring their optimal health and performance.
Additionally, I keep abreast of the latest technological advancements in the Big Data field. That's why I actively participate in Meetups where I discuss the latest trends in Big Data, artificial intelligence, and open-source software.
Outside of my Big Data-focused professional career, I have a passionate interest in sports and activities such as cycling, motorcycling, skydiving, as well as photography, aviation and space exploration. This diversity of interests enriches my professional journey by bringing a holistic perspective to my projects and collaborations.
• Rattaché à l’équipe audit IT du groupe Saint Gobain (plus de 800 sociétés dans le monde entier), l’objectif de la mission est de réaliser un POC sur la migration des données vers une architecture BIG Data afin d’augmenter la capacité de stockage tout en augmentant la performance de la restitution des données. • Installation et configuration des outils permettant de: o Etablir une connexion entre SSIS et Impala. o Etablir une connexion entre Tableau Software et Impala. • Extraction des données depuis SAP de plusieurs entités du groupe. • Ingestion des données dans HDFS • Développement de plusieurs scripts en PySpark de transformation de données. • Création de centaines de tables dans Impala et chargement des données. • Evaluation de la capacité et de la performance du cluster. • Recommandation sur le resizing du cluster afin de mieux répondre aux besoins. • Environnement technologique : Cloudera: Hadoop, Hive, Impala, hue, Cloudera manager, Spark, Linux : shell, Python, Jupyter, SQL Server, Sql, MobaXterm, SAP, Tableau Software, SSIS, Microsoft Virtual Studio.
Description de l'entreprise
Saint-Gobain est une entreprise française spécialisée dans la production, la transformation et distribution de matériaux.
Création 1665 Dates clés 1971 : Fusion avec Pont-à-Mousson 1996 : Rachat du groupe Point P Fondateurs Colbert Forme juridique Société anonyme Action Euronext : SGO [archive] Slogan Saint-Gobain construit votre futur & the future of glass since 1665 Siège social Courbevoie Drapeau de France France Direction Pierre-André de Chalendar, PDG Actionnaires Wendel : 11,7 % Actionnaires salariés : 7,5 % Caisse des dépôts et consignations : 2,3 % Autodétention : 0,6 % Activité Producteur, transformateur et distributeur de matériaux de construction Filiales Saint-Gobain Glass, Saint-Gobain Sekurit, Norton, Saint-Gobain SEFPRO (en), British Gypsum, CertainTeed, Ecophon, Eurocoustic, Gyproc, Isover, Saint-Gobain PAM, Placoplatre, Rigips, Weber, Groupe Lapeyre, La Plateforme du Bâtiment, Point P, Saint-Gobain Emballage, Solcera Effectif 172 063 (en déc. 2016) Site web Site officiel [archive] Capitalisation 22,67 mds d'€ (23 avril 2015) Fonds propres 17,870 milliards d'€ (2013) Dette 11,912 milliards d'€ (2013) Chiffre d’affaires 39,1 milliards d'€ (2016) Résultat net 1,40 milliard d'€ (2016)