Доклад

Джун против панды: антипаттерны библиотеки pandas

  • На русском языке
Презентация pdf

Pandas — классика при работе с данными. Использовать его начинаешь еще новичком в программировании, и на уровне новичка знания этой библиотеки зачастую и остаются. Остаются, едут в прод, и превращаются в джобы, работающие год, а то и больше.

В докладе спикер расскажет про странные и не очень кейсы использования библиотеки pandas и их не всегда очевидные замены, позволяющие ускорить код (суммарно — аж в 60 раз! Что меньше, чем обещают хабростатьи, но отражает ситуацию в реальном проекте) и сделать его более стабильным по времени выполнения и качеству данных на выходе.

Сам доклад состоит из:

  • солянки информации из хабростатей;
  • сравнения подходов на бенчмарках (чего часто нет в хабростатьях про ускорение);
  • лежащей за докладом душераздирающей истории переписывания джунового проекта.

Так что, если вдруг, читая этот текст, вы вспомнили парочку своих проектов с pandas и срочно захотели их отрефакторить, или просто хотите послушать историю эпичной битвы с дедлайном — приходите на доклад!

  • #pandas
  • #data_processing
  • #etl
  • #optimization

Спикеры

Приглашенные эксперты

Расписание