Подборка открытых библиотек по искусственному интеллекту и машинному обучению

Существуют различные библиотеки с открытым исходным кодом, которые можно использовать для выполнения задач, связанных с искусственным интеллектом и машинным обучением. Эти библиотеки работают как структурные элементы в построении успешной модели машинного обучения. Библиотеки избавляют разработчиков от необходимости писать код и позволяют сократить временные затраты. Среди самых известных open source-библиотек выделяют Tensorflow, которая используется для создания и развёртывания моделей машинного обучения, и OpenCV для компьютерного зрения. В этой статье собраны другие примеры библиотек с открытым исходным кодом, которые могут быть использованы для разработки проектов по искусственному интеллекту и машинному обучению.

1. Transformers

Библиотека моделей машинного обучения, предназначенных для выполнения задач с преобразованием последовательностей, распознаванием текста, речи, изображения, преобразованием текста в речь и наоборот, машинным переводом. Используются в различных областях, например при работе с текстами, изображениями, речью, а также помогают исследователям, разрабатывающим лекарства, распознавать цепочки генов в ДНК и аминокислоты в белках.

2. FauxPilot

Программа генерации кода с использованием искусственного интеллекта. Основная цель новой программы — устранить необходимость делиться информацией с третьими лицами и избежать потенциальных проблем с авторским правом, а также помочь разработчикам программного обеспечения писать более функциональный код, не делая его менее безопасным. Система обучается на существующем производственном коде и извлекает из него знания, чтобы создавать структурированные комментарии и предложения. Проект был разработан на основе GitHub Copilot.

3. YOLOv7

YOLO (You Only Look Once) расшифровывается как «Вы смотрите только один раз». Относится к семейству алгоритмов обнаружения объектов в реальном времени. Оригинальный детектор объектов YOLO был впервые создан в 2016 году. YOLOv7 — это последняя официальная версия YOLO. YOLOv7 обучается на наборе данных COCO, который имеет 17 базовых топологий. Реализована в PyTorch.

4. PaddleNLP

Библиотека обработки естественного языка (NLP) с открытым исходным кодом для классификации настроений и извлечения настроений. Механизмы выполняют нейронный поиск и анализ настроений, затем извлекают и представляют информацию для пользователей и машин.

5. SpeechT5: Automatic Speech Recognition

Модель машинного обучения, предназначенная для преобразования текста в речь, речи в текст, текста в текст и речи в речь. В основе лежит принцип кодера-декодера, который моделирует преобразование последовательности в последовательность, используя скрытые представления. Speech T5 не ограничивается созданием речи для одного говорящего. Встроенные динамики фиксируют голосовые характеристики конкретного говорящего.

6. State-of-the-art Parameter-Efficient Fine-Tuning (PEFT) methods

Библиотека методов, которые позволяют эффективно адаптировать предварительно обученные языковые модели к различным приложениям без точной настройки всех параметров модели. Параметры интегрируются с Transformers и Accelerate.

7. In-N-Out: Face Video Inversion and Editing with Volumetric Decomposition

Метод редактирования видео с лицами с использованием предварительно обученной генеративной модели с поддержкой 3D. Основная идея состоит в том, чтобы представить лицо в видео, используя два поля нейронного излучения. Одно для данных, входящих в распределение, а другое для данных, не входящих в распределение, и скомпоновать их вместе для редактирования.

8. Hard Prompts Made Easy: Gradient-Based Discrete Optimization for Prompt Tuning and Discovery

Модель для преобразования изображений в текстовые подсказки. В режиме преобразования текста в изображение метод создает подсказки для диффузионных моделей, позволяя пользователям API легко генерировать, обнаруживать, смешивать и сопоставлять концепции изображений без предварительных знаний о том, как запрашивать модель. Сгенерированные изображения показывают, что подсказки эффективно отражают семантические особенности целевых изображений.

9. PhyCV: The First Physics-inspired Computer Vision Library

Первая библиотека компьютерного зрения, которая использует алгоритмы, непосредственно выведенные из физических уравнений, управляющих физическими явлениями. Алгоритмы используют физические законы природы и имитируют распространение света через физическую среду с естественными и спроектированными дифракционными свойствами с последующим когерентным обнаружением.

10. RecTools

Библиотека Python для создания рекомендательных систем. Включает встроенные наборы инструментов для обработки данных и расчёта метрик, а также множество рекомендательных моделей. Цель библиотеки состоит в том, чтобы собрать готовые к использованию решения и лучшие практики в одном месте и чтобы сделать процессы создания и развёртывания модели максимально быстрыми и простыми.

1. Transformers

2. FauxPilot

3. YOLOv7

4. PaddleNLP

5. SpeechT5: Automatic Speech Recognition

6. State-of-the-art Parameter-Efficient Fine-Tuning (PEFT) methods

7. In-N-Out: Face Video Inversion and Editing with Volumetric Decomposition

8. Hard Prompts Made Easy: Gradient-Based Discrete Optimization for Prompt Tuning and Discovery

9. PhyCV: The First Physics-inspired Computer Vision Library

10. RecTools

Дарья Тимакова

Вам также может понравиться

В Москве пройдёт забег для IT-специалистов RUNIT

Исследователи научили нейросеть различать породы деревьев

Нейросеть научилась находить сорняки