Skip to content

Latest commit

 

History

History
263 lines (186 loc) · 29.1 KB

File metadata and controls

263 lines (186 loc) · 29.1 KB

Data Science pour débutants - Un programme

Open in GitHub Codespaces

GitHub license GitHub contributors GitHub issues GitHub pull-requests PRs Welcome

GitHub watchers GitHub forks GitHub stars

Microsoft Foundry Discord

Microsoft Foundry Developer Forum

Les Azure Cloud Advocates de Microsoft sont heureux de proposer un programme de 10 semaines, 20 leçons, entièrement consacré à la science des données. Chaque leçon comprend des quiz pré- et post-leçon, des instructions écrites pour compléter la leçon, une solution, et une tâche. Notre pédagogie basée sur des projets vous permet d'apprendre tout en construisant, une méthode éprouvée pour que les nouvelles compétences « collent ».

Un grand merci à nos auteurs : Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.

🙏 Remerciements particuliers 🙏 à nos auteurs, relecteurs et contributeurs de contenu Microsoft Student Ambassador, notamment Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi

Sketchnote by @sketchthedocs https://sketchthedocs.dev
Data Science For Beginners - Sketchnote par @nitya

🌐 Support multilingue

Pris en charge via GitHub Action (Automatisé & toujours à jour)

Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese

Préférez-vous cloner localement ?

Ce dépôt inclut plus de 50 traductions, ce qui augmente considérablement la taille du téléchargement. Pour cloner sans les traductions, utilisez le « sparse checkout » :

Bash / macOS / Linux :

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD (Windows) :

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

Cela vous fournit tout ce dont vous avez besoin pour compléter le cours avec un téléchargement beaucoup plus rapide.

Si vous souhaitez que d’autres langues soient prises en charge, elles sont listées ici

Rejoignez notre communauté

Microsoft Foundry Discord

Nous avons une série Discord « apprendre avec l’IA » en cours, apprenez-en plus et rejoignez-nous à Learn with AI Series du 18 au 30 septembre 2025. Vous recevrez des astuces et conseils pour utiliser GitHub Copilot en science des données.

Learn with AI series

Êtes-vous étudiant ?

Commencez avec les ressources suivantes :

  • Page Student Hub Sur cette page, vous trouverez des ressources pour débutants, des packs étudiants et même des moyens d’obtenir un bon de certification gratuit. C’est une page à mettre en favori et à consulter régulièrement car nous renouvelons le contenu au minimum chaque mois.
  • Microsoft Learn Student Ambassadors Rejoignez une communauté mondiale d’ambassadeurs étudiants, cela peut être votre porte d’entrée chez Microsoft.

Démarrage

📚 Documentation

👨‍🎓 Pour les étudiants

Débutants complets : Nouveau en science des données ? Commencez par nos exemples adaptés aux débutants ! Ces exemples simples et bien commentés vous aideront à comprendre les bases avant de plonger dans le programme complet. Étudiants : pour utiliser ce programme de manière autonome, forkez tout le dépôt et réalisez les exercices par vous-même, en commençant par un quiz pré-conférence. Ensuite, lisez la leçon et complétez le reste des activités. Essayez de créer les projets en comprenant les leçons plutôt qu’en copiant le code solution ; cependant, ce code est disponible dans les dossiers /solutions de chaque leçon orientée projet. Une autre idée serait de former un groupe d’étude avec des amis et de parcourir le contenu ensemble. Pour approfondir, nous recommandons Microsoft Learn.

Démarrage rapide :

  1. Consultez le Guide d’installation pour configurer votre environnement
  2. Lisez le Guide d’utilisation pour savoir comment travailler avec le programme
  3. Commencez par la Leçon 1 et suivez-les séquentiellement
  4. Rejoignez notre communauté Discord pour obtenir de l’aide

👩‍🏫 Pour les enseignants

Enseignants : nous avons inclus quelques suggestions sur la façon d'utiliser ce programme. Nous serions ravis de recevoir vos commentaires sur notre forum de discussion !

Rencontrez l'équipe

Vidéo promo

Gif par Mohit Jaisal

🎥 Cliquez sur l'image ci-dessus pour une vidéo sur le projet et les personnes qui l'ont créé !

Pédagogie

Nous avons choisi deux principes pédagogiques lors de la création de ce programme : garantir qu’il soit basé sur des projets et qu’il inclue des quiz fréquents. À la fin de cette série, les étudiants auront appris les principes de base de la science des données, y compris les concepts éthiques, la préparation des données, différentes façons de travailler avec les données, la visualisation des données, l’analyse des données, des cas d’utilisation réels de la science des données, et bien plus encore.

De plus, un quiz à faible enjeu avant un cours fixe l’intention de l’étudiant à apprendre un sujet, tandis qu’un second quiz après le cours assure une meilleure rétention. Ce programme a été conçu pour être flexible et ludique et peut être suivi en totalité ou en partie. Les projets commencent petits et deviennent de plus en plus complexes à la fin du cycle de 10 semaines.

Retrouvez notre Code de conduite, les directives de Contribution, Traduction. Nous accueillons volontiers vos retours constructifs !

Chaque leçon comprend :

  • Sketchnote optionnel
  • Vidéo complémentaire optionnelle
  • Quiz d’échauffement avant la leçon
  • Leçon écrite
  • Pour les leçons basées sur projet, des guides étape par étape pour réaliser le projet
  • Contrôles de connaissances
  • Un défi
  • Lecture complémentaire
  • Devoir
  • Quiz post-leçon

Une note sur les quiz : Tous les quiz sont contenus dans le dossier Quiz-App, pour un total de 40 quiz de trois questions chacun. Ils sont liés depuis les leçons, mais l’application de quiz peut être exécutée localement ou déployée sur Azure ; suivez les instructions dans le dossier quiz-app. Ils sont progressivement traduits.

🎓 Exemples adaptés aux débutants

Nouveau en science des données ? Nous avons créé un répertoire spécial d’exemples avec du code simple et bien commenté pour vous aider à démarrer :

  • 🌟 Hello World - Votre premier programme de science des données
  • 📂 Chargement des données - Apprenez à lire et explorer des ensembles de données
  • 📊 Analyse simple - Calculez des statistiques et trouvez des motifs
  • 📈 Visualisation de base - Créez des graphiques et diagrammes
  • 🔬 Projet réel - Flux de travail complet du début à la fin

Chaque exemple inclut des commentaires détaillés expliquant chaque étape, parfait pour les débutants absolus !

👉 Commencez avec les exemples 👈

Leçons

 Sketchnote par @sketchthedocs https://sketchthedocs.dev
Science des données pour débutants : feuille de route - Sketchnote par @nitya
Numéro de leçon Sujet Regroupement de leçons Objectifs d’apprentissage Leçon liée Auteur
01 Définir la science des données Introduction Apprenez les concepts de base derrière la science des données et sa relation avec l’intelligence artificielle, l’apprentissage automatique, et le big data. leçon vidéo Dmitry
02 Éthique de la science des données Introduction Concepts, défis et cadres de l’éthique des données. leçon Nitya
03 Définir les données Introduction Comment les données sont classifiées et leurs sources communes. leçon Jasmine
04 Introduction aux statistiques et probabilité Introduction Les techniques mathématiques de probabilité et statistiques pour comprendre les données. leçon vidéo Dmitry
05 Travailler avec des données relationnelles Working With Data Introduction aux données relationnelles et bases de l’exploration et de l’analyse de données relationnelles avec le Structured Query Language, aussi appelé SQL (prononcé “see-quell”). leçon Christopher
06 Travailler avec des données NoSQL Working With Data Introduction aux données non relationnelles, leurs différents types et bases de l’exploration et de l’analyse de bases de données documentaires. leçon Jasmine
07 Travailler avec Python Working With Data Notions de base de l’utilisation de Python pour l’exploration de données avec des bibliothèques telles que Pandas. Une compréhension de base de la programmation Python est recommandée. leçon vidéo Dmitry
08 Préparation des données Working With Data Sujets sur les techniques de nettoyage et de transformation des données pour gérer les problèmes de données manquantes, inexactes ou incomplètes. leçon Jasmine
09 Visualiser les quantités Data Visualization Apprenez à utiliser Matplotlib pour visualiser des données d’oiseaux 🦆 leçon Jen
10 Visualiser les distributions de données Data Visualization Visualisation des observations et tendances dans un intervalle. leçon Jen
11 Visualiser les proportions Data Visualization Visualisation de pourcentages discrets et regroupés. leçon Jen
12 Visualiser les relations Data Visualization Visualisation des connexions et corrélations entre ensembles de données et leurs variables. leçon Jen
13 Visualisations significatives Data Visualization Techniques et conseils pour rendre vos visualisations précieuses pour une résolution efficace de problèmes et de compréhension. leçon Jen
14 Introduction au cycle de vie de la science des données Lifecycle Introduction au cycle de vie de la science des données et sa première étape d’acquisition et d’extraction des données. leçon Jasmine
15 Analyse Lifecycle Cette phase du cycle de vie de la science des données se concentre sur les techniques d’analyse des données. leçon Jasmine
16 Communication Lifecycle Cette phase du cycle de vie de la science des données se concentre sur la présentation des insights issus des données pour faciliter la compréhension des décideurs. leçon Jalen
17 Science des données dans le cloud Cloud Data Cette série de leçons introduit la science des données dans le cloud et ses avantages. leçon Tiffany et Maud
18 Science des données dans le cloud Cloud Data Entraînement de modèles avec des outils Low Code. leçon Tiffany et Maud
19 Science des données dans le cloud Cloud Data Déploiement de modèles avec Azure Machine Learning Studio. leçon Tiffany et Maud
20 Science des données sur le terrain In the Wild Projets de science des données appliqués au monde réel. leçon Nitya

GitHub Codespaces

Suivez ces étapes pour ouvrir cet exemple dans un Codespace :

  1. Cliquez sur le menu déroulant Code et sélectionnez l’option Ouvrir avec Codespaces.
  2. Sélectionnez + Nouveau codespace en bas du panneau.
    Pour plus d’informations, consultez la documentation GitHub.

VSCode Remote - Containers

Suivez ces étapes pour ouvrir ce dépôt dans un conteneur en utilisant votre machine locale et VSCode via l’extension VS Code Remote - Containers :

  1. Si c’est votre première utilisation d’un conteneur de développement, veuillez vérifier que votre système répond aux prérequis (ex. : Docker installé) dans la documentation de démarrage.

Pour utiliser ce dépôt, vous pouvez soit ouvrir le dépôt dans un volume Docker isolé :

Remarque : Sous le capot, cette méthode utilisera la commande Remote-Containers : Clone Repository in Container Volume... pour cloner le code source dans un volume Docker au lieu du système de fichiers local. Les volumes sont le mécanisme recommandé pour persister les données de conteneur.

Ou ouvrir une version clonée localement ou téléchargée du dépôt :

  • Clonez ce dépôt sur votre système de fichiers local.
  • Appuyez sur F1 et sélectionnez la commande Remote-Containers : Ouvrir un dossier dans un conteneur...
  • Sélectionnez la copie clonée de ce dossier, attendez le démarrage du conteneur, puis testez.

Accès hors ligne

Vous pouvez consulter cette documentation hors ligne en utilisant Docsify. Forkez ce dépôt, installez Docsify sur votre machine locale, puis dans le dossier racine de ce dépôt, tapez docsify serve. Le site sera servi sur le port 3000 de votre localhost : localhost:3000.

Notez que les notebooks ne seront pas rendus via Docsify, donc lorsque vous devez exécuter un notebook, faites-le séparément dans VS Code avec un noyau Python.

Autres programmes

Notre équipe produit d’autres programmes ! Découvrez :

LangChain

LangChain4j for Beginners LangChain.js pour débutants LangChain pour débutants

Azure / Edge / MCP / Agents

AZD pour débutants Edge AI pour débutants MCP pour débutants Agents IA pour débutants


Série IA générative

IA générative pour débutants IA générative (.NET) IA générative (Java) IA générative (JavaScript)


Apprentissage de base

ML pour débutants Science des données pour débutants IA pour débutants Cybersécurité pour débutants Développement web pour débutants IoT pour débutants Développement XR pour débutants


Série Copilot

Copilot pour programmation assistée par IA Copilot pour C#/.NET Aventure Copilot

Obtenir de l'aide

Vous rencontrez des problèmes ? Consultez notre Guide de dépannage pour des solutions aux problèmes courants.

Si vous êtes bloqué ou avez des questions sur la création d'applications d'IA. Rejoignez d'autres apprenants et développeurs expérimentés pour discuter du MCP. C'est une communauté bienveillante où les questions sont les bienvenues et où les connaissances sont partagées librement.

Microsoft Foundry Discord

Si vous avez des retours sur les produits ou rencontrez des erreurs lors de la création, visitez :

Microsoft Foundry Developer Forum


Avertissement :
Ce document a été traduit à l'aide du service de traduction par IA Co-op Translator. Bien que nous nous efforcions d'assurer l'exactitude, veuillez noter que les traductions automatiques peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue native doit être considéré comme la source faisant foi. Pour les informations critiques, une traduction professionnelle réalisée par un humain est recommandée. Nous déclinons toute responsabilité en cas de malentendus ou de mauvaises interprétations résultant de l'utilisation de cette traduction.