Рубрика: Data Science

  • Новые функции в Pandas 2.0

    Новые функции в Pandas 2.0

    Благодаря своей обширной функциональности и универсальности, pandas завоевала место в сердце каждого специалиста data science. В этой статье мы посмотрим на новые функции в Pandas 2.0 Pandas — это библиотека Python для обработки и анализа структурированных данных, её название происходит от «panel data» («панельные данные»).

  • Многоуровневая архитектура MLOps

    Многоуровневая архитектура MLOps

    В настоящее время MLOps (Machine Learning Operations) — популярная тема с множеством книг, статей, конференций и других ресурсов, посвященных созданию масштабируемого, повторяемого и готового к продакшн рабочего процесса машинного обучения. Несмотря на интерес, многоуровневая архитектура MLOps остается развивающейся областью, и существует множество различных подходов к реализации. Различия вызваны отсутствием единого мнения о том, как внедрить…

  • Уменьшение размерности данных в Python

    Уменьшение размерности данных в Python

    Уменьшение размерности данных — это подход упрощения сложных наборов данных для облегчения их обработки. По мере того как данные растут и становятся более сложными, извлекать информацию становится все труднее. Визуализация становится более накладной. Методы уменьшения размерности данных решают эту проблему. Предоставляя меньшее количество измерений (столбцов) при сохранении наиболее важной информации. Мы можем потерять некоторые детали, но…

  • 25 полезных возможностей Pandas

    25 полезных возможностей Pandas

    Новые и малоизвестные возможности Pandas, о которых полезно знать каждому специалисту по Data Science. Сколько раз вы говорили: «было бы здорово, если бы я мог это сделать в Pandas»? Возможно, вы это и можете! Pandas настолько огромна и глубока, что она позволяет выполнять практически любые операции с таблицами, которые вы можете себе представить. 25 полезных…