15 декабря 2021 года пройдёт бесплатный онлайн-митап DATA Christmas, посвящённый достижениям в отрасли Data Science за последний год. Мероприятие будет проходить на специализированной платформе spatial.chat. Для участия необходимо зарегистрироваться по ссылке. В ответ на отправленную заявку вы получите ссылку на трансляцию.
Программа мероприятия
- Больше слоёв. Сквозная регрессия и неопределённость табличных данных без каких-либо деревьев решений — Иван Бондаренко, старший преподаватель кафедры фундаментальной и прикладной лингвистики НГУ, научный сотрудник лаборатории прикладных цифровых технологий ММФ НГУ.
- Доклад будет посвящён обсуждению способов решения ML-задач (в частности, регрессионных) на классических табличных данных только с помощью end-to-end глубоких нейронных сетей, без всякого замысловатого фича-инжиниринга и, главное, без «деревянных» ансамблей типа градиентного бустинга, которые многими считаются «вершиной эволюции» применительно к обработке табличных данных. Кроме того, будет поднят и тщательно проанализирован очень важный вопрос об умении алгоритма оценивать собственную неуверенность в ответе. Умный алгоритм, как и умный человек, должен осознавать границы своей компетентности и отказываться выносить любое суждение касательно предметов, с которыми незнаком (как Сократ: «я знаю, что ничего не знаю»). И тут, как выясняется, глубокие нейронные сети тоже оказываются лучше других алгоритмов типа деревьев решений, ближайших соседей и т.п. От совсем простых вещей мы перейдём к более общим проблемам, связанным с проблемой смещения-дисперсии в классических и нейросетевых алгоритмах. Поговорим также о регуляризации, ансамблировании и затухании/взрыве градиентов в глубоких нейросетях.
- Как устроена жизнь дата-саентиса в Центре Финансовых Технологий или не одним фит-предиктом сыты — Владимир Козлов, Руководитель отдела «Аналитика», Машинное отделение ЦФТ.
- Выступление будет полезно начинающим специалистам, которые хотят погрузиться в область data science, проходят или уже прошли несколько курсов по алгоритмам машинного обучения, но всё ещё не сталкивались с реальными задачами. В выступлении будут затронуты следующие темы:
- Задачи, с которыми сталкивается data scientist на работе.
- Цикл подготовки модели от логов до мониторингов.
- Взаимодействие с другими командами.
- Выступление будет полезно начинающим специалистам, которые хотят погрузиться в область data science, проходят или уже прошли несколько курсов по алгоритмам машинного обучения, но всё ещё не сталкивались с реальными задачами. В выступлении будут затронуты следующие темы:
- Жизнь Data Scientist во Франции — интервью с экспатом.
- Как 2GIS соревнование по Computer Vision делал — Михаил Лиз, Специалист по анализу данных, 2ГИС.
- В докладе будет разбор соревнования по компьютерному зрению от 2ГИС на платформе AI Journey. Задача заключалась в распознавании направлений движения по полосам на дорожных знаках 5.15.1 и 5.15.2. Посмотрим на разные подходы к решению, предложенные школьниками. Поговорим о плюсах и минусах.
- ODS Lab — что мы делаем для развития сообщества — Дмитрий Колодезев, директор ООО Промсофт.