mPyPl: функциональный способ организовать обработку данных в Python

DevOps & MLOps

Сложность -

При подготовке данных для машинного обучения часто приходится совершать над данными серию преобразований, чтобы подготовить датасет для обучения.

В докладе пойдет речь про небольшую библиотеку, которую разработали в группе Microsoft Commercial Software Engineering, и которая позволяет описывать обработку данных в виде единого конвейера именованными потоками данных. С помощью такой библиотеки удобно обрабатывать данные, которые слишком велики, чтобы поместиться в Pandas DataFrame, но слишком малы, чтобы использовать Spark/Databricks.

#data pipelines
#functional programming
#pipe
#pipelines

Спикеры

Дмитрий Сошников
МАИ / НИУ ВШЭ / ex-Microsoft

Приглашенные эксперты

Алексей Пирогов

Другие доклады по теме «DevOps & MLOps»
- Смотреть запись
  Build and automate your own StackOverflow question analyzer with NLP and DevOps
  William Arias
  Open Source Evangelist MLOps
  На английском языкеСложность -
- Смотреть запись
  Оптимизация GAN-нейросети под мобильное устройство
  Алексей Романов
  Grid Dynamics
  Сложность -
- Смотреть запись
  Как экономить железо для продового машинлёрнинга
  Олег Бугримов
  Авито
  Сложность -

Расписание

mPyPl: функциональный способ организовать обработку данных в Python

Спикеры

Приглашенные эксперты

Другие доклады по теме «DevOps & MLOps»