Всякий раз, когда специалист по анализу данных думает о разработке конвейера, он пытается внедрить автоматизированное машинное обучение, чтобы упростить задачу. Однако, из-за непоследовательного синтаксиса и ограниченной поддержки расширенных функций, таких как поиск топологии или операторов высшего порядка, разработка становится утомительной. Для решения этой проблемы IBM Research опубликовала исследование о LALE — библиотеке Python, которая упрощает автоматизацию машинного обучения.
Исследование направлено на преодоление недостатков предыдущих недостатков библиотек Auto-ML:
- Существует несовместимость в синтаксисе спецификации конвейера в ручном и автоматическом диапазоне.
- Пользователь должен изучить другой синтаксис, чтобы переписать код при переключении между различными инструментами Auto-ML.
- Предыдущие инструменты не оптимизируют топологию конвейера.
- Неверная конфигурация при объединении разных гиперпараметров.
Характеристики LALE:
- LALE помогает в выборе алгоритмов и настройке гиперпараметров конвейеров, совместимых с scikit-learn.
- LALE обеспечивает согласованный интерфейс с существующими инструментами, такими как Hyperopt, SMAC и GridSearchCV для автоматизации.
- LALE использует схему JSON для проверки правильности.
- LALE имеет расширенную библиотеку оценочных функций и преобразователей для совместимости.
- LALE использует подклассы Python для реализации состояний жизненного цикла.
Пользователи могут установить LALE, как любой другой пакет Python, и отредактировать его с помощью стандартных инструментов Python, таких как Jupyter.