Google выпустила набор данных, чтобы обучать ML-модели лучше распознавать 3D-объекты

Компания Google выпустила Objectron Dataset — набор коротких объектно-ориентированных видеоклипов, на которых запечатлён более широкий набор общих объектов под разными углами. Objectron Dataset размещён на GitHub.

Каждый видеоклип сопровождается метаданными сеанса AR, которые включают позы камеры и облака точек. Данные также содержат вручную аннотированные трёхмерные ограничительные рамки для каждого объекта, которые описывают положение, ориентацию и размеры объекта.

Набор данных состоит из 15 тысяч размеченных видеоклипов, дополненных более чем 4 млн размеченных изображений, собранных из географически разнородной выборки (охватывающей 10 стран на пяти континентах).

Наряду с набором данных Google также предоставила решение для обнаружения трёхмерных объектов в четырёх категориях — обувь, стулья, кружки и камеры. Эти модели работают на MediaPipe , фреймворке Google с открытым исходным кодом для кросс-платформенных настраиваемых решений машинного обучения для живых и потоковых мультимедиа.

Ссылка на Objectron Dataset.

Алексей Клёсов

Вам также может понравиться

Создана роботизированная рука, которая вращает предметы с помощью осязания, а не зрения

Искусственный интеллект научился дрессировать собак без помощи человека

В московских кафе начали работать роботы‑официанты