Доклад

Process Mining и большие данные: о чем не говорят создатели сервисов и библиотек

  • На русском языке

Process Mining набирает обороты, и специалисты по работе с данными стремятся помочь бизнесу получать инсайты из хаотичных действий пользователей и строить красивые графы. Инженерно мы хотим собирать как можно больше действий, что порождает проблемы: множественные вложенные циклы поведения, большой объем действий без целевых эффектов, обилие нод и ребер в процессах. И оказывается, что на больших данных решения популярных библиотек начинают работать значительно хуже.

Александр с командой проанализировали работу популярных библиотек и сервисов и подготовили инженерные подходы по оптимизации работы с графами. Спикер расскажет про плюсы и минусы таких библиотек, как pm4py, retentioneering, SberGraph и других. Рассмотрим пайплайн для оптимизации работы этих сервисов, а также выявим наиболее эффективные способы использования библиотек и ускорения работы с помощью готовых решений.

Спикеры

Приглашенные эксперты

Расписание