Skip to content

Latest commit

 

History

History
263 lines (186 loc) · 36.6 KB

File metadata and controls

263 lines (186 loc) · 36.6 KB

Data Science для начинающих - Учебная программа

Open in GitHub Codespaces

GitHub license GitHub contributors GitHub issues GitHub pull-requests PRs Welcome

GitHub watchers GitHub forks GitHub stars

Microsoft Foundry Discord

Microsoft Foundry Developer Forum

Azure Cloud Advocates в Microsoft рады предложить 10-недельную программу из 20 уроков, полностью посвящённую Data Science. Каждый урок включает тесты до и после занятия, письменные инструкции для выполнения урока, решение и задание. Наша проектно-ориентированная методика обучения позволяет учиться на практике — это проверенный способ закрепления новых навыков.

Большое спасибо нашим авторам: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.

🙏 Особая благодарность 🙏 нашим автором, рецензентам и контрибьюторам из числа студенческих послов Microsoft, в частности Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi

Sketchnote by @sketchthedocs https://sketchthedocs.dev
Data Science для начинающих - Скетчноут от @nitya

🌐 Поддержка нескольких языков

Поддерживается с помощью GitHub Action (Автоматизировано и всегда актуально)

Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese

Предпочитаете клонировать локально?

Этот репозиторий содержит более 50 переводов, что значительно увеличивает размер загрузки. Чтобы клонировать без переводов, используйте разреженную загрузку (sparse checkout):

Bash / macOS / Linux:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD (Windows):

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

Это даст вам всё необходимое для прохождения курса с гораздо более быстрой загрузкой.

Если вы хотите поддерживать дополнительные языки перевода, они перечислены здесь

Присоединяйтесь к нашему сообществу

Microsoft Foundry Discord

У нас проходит серия на Discord с обучением ИИ, узнайте больше и присоединяйтесь к нам на Learn with AI Series с 18 по 30 сентября 2025 года. Вы получите советы и трюки по использованию GitHub Copilot для Data Science.

Learn with AI series

Вы студент?

Начните с следующих ресурсов:

  • Страница студента Здесь вы найдете материалы для начинающих, студенческие пакеты и даже способы получить бесплатный ваучер на сертификацию. Это страница, которую стоит добавить в закладки и периодически проверять, так как мы обновляем контент как минимум раз в месяц.
  • Microsoft Learn Student Ambassadors Присоединяйтесь к глобальному сообществу студенческих послов, это может стать вашим путём в Microsoft.

Начало работы

📚 Документация

👨‍🎓 Для студентов

Полные новички: Новый в Data Science? Начните с наших простых примеров для начинающих! Эти простые, хорошо прокомментированные примеры помогут вам разобраться с основами перед тем, как перейти к полной программе. Студенты: чтобы использовать эту учебную программу самостоятельно, форкните весь репозиторий и выполняйте упражнения самостоятельно, начиная с теста перед лекцией. Затем прочитайте лекцию и выполните остальные задания. Пытайтесь создавать проекты, понимая уроки, а не просто копируйте код решения; однако код можно найти в папках /solutions в каждом проектно-ориентированном уроке. Другой вариант — сформировать учебную группу с друзьями и проходить материал вместе. Для дальнейшего изучения рекомендуем Microsoft Learn.

Быстрый старт:

  1. Ознакомьтесь с Руководством по установке для настройки вашей среды
  2. Просмотрите Руководство пользователя, чтобы узнать как работать с учебной программой
  3. Начните с Урока 1 и проходите последовательно
  4. Присоединяйтесь к нашему сообществу в Discord для поддержки

👩‍🏫 Для преподавателей

Учителям: мы включили некоторые рекомендации о том, как использовать эту учебную программу. Мы будем рады вашим отзывам на нашем форуме для обсуждений!

Встречайте команду

Промо-видео

Gif от Mohit Jaisal

🎥 Нажмите на изображение выше, чтобы посмотреть видео о проекте и людях, его создавших!

Педагогика

При создании этой учебной программы мы выбрали два педагогических принципа: обеспечение проектной направленности и частое проведение викторин. К концу этой серии студенты изучат основные принципы науки о данных, включая этические концепции, подготовку данных, различные способы работы с данными, визуализацию данных, анализ данных, реальные примеры использования науки о данных и многое другое.

Кроме того, викторина с низкой ставкой перед занятиями задаёт намерение студента для изучения темы, а вторая викторина после занятия обеспечивает лучшее усвоение материала. Эта учебная программа разработана так, чтобы быть гибкой и увлекательной, её можно пройти полностью или частично. Проекты начинают с простого и постепенно усложняются к концу 10-недельного цикла.

Ознакомьтесь с нашим Кодексом поведения, Правилами участия, Руководством по переводам. Мы приветствуем ваши конструктивные отзывы!

Каждое занятие включает:

  • Необязательную скетчноут
  • Необязательное дополнительное видео
  • Разминочную викторину перед занятием
  • Письменное занятие
  • Для проектных занятий — пошаговые руководства по созданию проекта
  • Проверку знаний
  • Задание-челлендж
  • Дополнительное чтение
  • Домашнее задание
  • Викторину после занятия

Заметка о викторинах: Все викторины находятся в папке Quiz-App, всего 40 викторин по три вопроса в каждой. Они связаны с уроками, но приложение викторин можно запускать локально или развертывать в Azure; следуйте инструкциям в папке quiz-app. Викторины постепенно локализуются.

🎓 Примеры для начинающих

Новичок в науке о данных? Мы создали специальный каталог примеров с простым, хорошо прокомментированным кодом, чтобы помочь начать:

  • 🌟 Hello World — Ваша первая программа по науке о данных
  • 📂 Загрузка данных — Научитесь читать и исследовать наборы данных
  • 📊 Простой анализ — Вычисление статистики и поиск закономерностей
  • 📈 Базовая визуализация — Создание диаграмм и графиков
  • 🔬 Реальный проект — Полный рабочий процесс от начала до конца

Каждый пример включает подробные комментарии, объясняющие каждый шаг — идеален для абсолютных новичков!

👉 Начните с примеров 👈

Уроки

 Скетчноут от @sketchthedocs https://sketchthedocs.dev
Наука о данных для начинающих: Дорожная карта — скетчноут от @nitya
Номер урока Тема Группа уроков Цели обучения Связанный урок Автор
01 Определение науки о данных Введение Изучить основные понятия науки о данных и её связь с искусственным интеллектом, машинным обучением и большими данными. урок видео Дмитрий
02 Этика в науке о данных Введение Понятия, вызовы и рамки этики данных. урок Нитя
03 Определение данных Введение Как классифицируются данные и их основные источники. урок Жасмин
04 Введение в статистику и вероятность Введение Математические методы вероятности и статистики для понимания данных. урок видео Дмитрий
05 Работа с реляционными данными Работа с данными Введение в реляционные данные и основы изучения и анализа реляционных данных с помощью языка структурированных запросов SQL (произносится «си-квел»). урок Кристофер
06 Работа с NoSQL данными Работа с данными Введение в нереляционные данные, их различные типы и основы изучения и анализа документных баз данных. урок Жасмин
07 Работа с Python Работа с данными Основы использования Python для исследования данных с библиотеками, такими как Pandas. Рекомендуется базовое понимание программирования на Python. урок видео Дмитрий
08 Подготовка данных Работа с данными Темы по методам очистки и трансформации данных для обработки проблем с отсутствующими, неточными или неполными данными. урок Жасмин
09 Визуализация количеств Визуализация данных Научитесь использовать Matplotlib для визуализации данных о птицах 🦆 урок Джен
10 Визуализация распределений данных Визуализация данных Визуализация наблюдений и трендов в рамках интервала. урок Джен
11 Визуализация пропорций Визуализация данных Визуализация дискретных и сгруппированных процентов. урок Джен
12 Визуализация взаимосвязей Визуализация данных Визуализация связей и корреляций между наборами данных и их переменными. урок Джен
13 Значимые визуализации Визуализация данных Методики и рекомендации для создания ценных визуализаций для эффективного решения проблем и получения инсайтов. урок Джен
14 Введение в жизненный цикл науки о данных Жизненный цикл Введение в жизненный цикл науки о данных и его первый этап — получение и извлечение данных. урок Жасмин
15 Анализ Жизненный цикл Эта фаза жизненного цикла науки о данных посвящена методам анализа данных. урок Жасмин
16 Коммуникация Жизненный цикл Эта фаза жизненного цикла науки о данных посвящена представлению инсайтов из данных таким образом, чтобы облегчить понимание лицам, принимающим решения. урок Джейлен
17 Наука о данных в облаке Облачные данные Эта серия уроков знакомит с наукой о данных в облаке и её преимуществами. урок Тиффани и Мод
18 Наука о данных в облаке Облачные данные Обучение моделей с помощью инструментов низкокодового программирования. урок Тиффани и Мод
19 Наука о данных в облаке Облачные данные Развертывание моделей с Azure Machine Learning Studio. урок Тиффани и Мод
20 Наука о данных в реальном мире В реальном мире Проекты, основанные на науке о данных в реальной жизни. урок Нитя

GitHub Codespaces

Следуйте этим шагам, чтобы открыть этот пример в Codespace:

  1. Нажмите меню Code и выберите опцию Open with Codespaces.
  2. Выберите + New codespace внизу панели. Более подробную информацию смотрите в документации GitHub.

VSCode Remote - Containers

Следуйте этим шагам, чтобы открыть этот репозиторий в контейнере, используя локальную машину и VSCode с расширением VS Code Remote - Containers:

  1. Если вы используете контейнер разработки впервые, убедитесь, что ваша система соответствует требованиям (например, установлен Docker) в документации по началу работы.

Для работы с этим репозиторием можно открыть репозиторий в изолированном Docker volume:

Примечание: В этом случае будет использована команда Remote-Containers: Clone Repository in Container Volume... для клонирования исходного кода в Docker volume вместо локальной файловой системы. Volumes — предпочтительный механизм для сохранения данных контейнера.

Или откройте локально клонированную или загруженную копию репозитория:

  • Клонируйте этот репозиторий в локальную файловую систему.
  • Нажмите F1 и выберите команду Remote-Containers: Open Folder in Container....
  • Выберите склонированную копию этой папки, дождитесь запуска контейнера и начните работать.

Оффлайн-доступ

Вы можете просматривать эту документацию оффлайн, используя Docsify. Форкните этот репозиторий, установите Docsify на свой локальный компьютер, затем в корневой папке этого репозитория выполните команду docsify serve. Сайт будет доступен на порту 3000 вашего localhost: localhost:3000.

Обратите внимание, что блокноты не будут отображаться через Docsify, поэтому для запуска блокнотов используйте VS Code с Python kernel отдельно.

Другие учебные программы

Наша команда создает и другие учебные программы! Ознакомьтесь с:

LangChain

LangChain4j для начинающих LangChain.js для начинающих LangChain для начинающих

Azure / Edge / MCP / Агенты

AZD для начинающих Edge AI для начинающих MCP для начинающих AI агенты для начинающих


Серия по генеративному ИИ

Генеративный ИИ для начинающих Генеративный ИИ (.NET) Генеративный ИИ (Java) Генеративный ИИ (JavaScript)


Основное обучение

МО для начинающих Наука о данных для начинающих ИИ для начинающих Кибербезопасность для начинающих Веб-разработка для начинающих IoT для начинающих Разработка XR для начинающих


Серия Copilot

Copilot для AI-парного программирования Copilot для C#/.NET Приключения Copilot

Получение помощи

Возникли проблемы? Ознакомьтесь с нашим Руководством по устранению неполадок для решения общих проблем.

Если вы застряли или у вас есть вопросы по созданию AI-приложений, присоединяйтесь к сообществу учащихся и опытных разработчиков для обсуждений о MCP. Это поддерживающее сообщество, где вопросы приветствуются, а знания свободно обмениваются.

Microsoft Foundry Discord

Если у вас есть отзывы о продукте или вы столкнулись с ошибками во время разработки, посетите:

Microsoft Foundry Developer Forum


Отказ от ответственности:
Этот документ был переведен с использованием сервиса автоматического перевода Co-op Translator. Несмотря на наши усилия обеспечить точность, обратите внимание, что автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его исходном языке должен считаться авторитетным источником. Для критически важной информации рекомендуется профессиональный перевод человеком. Мы не несем ответственности за любые недоразумения или неправильные толкования, возникшие в результате использования данного перевода.