26.04.2024
Подписывайтесь на Telegram-канал по ссылке

Китай создал самый большой в мире датасет из спутниковых изображений

FAIR1M датасет спутниковых изображений

В Китае создана база данных FAIR1M из спутниковых изображений в высоком разрешении, которая заявлена как самая большая в мире. Она в десятки и даже сотни раз превышает предыдущие наборы данных для обучения искусственного интеллекта. С помощью новой базы можно обучить ИИ определять объекты с точностью до идентификации моделей самолётов и назначения сооружений. FAIR1M — это разработка для гражданских целей. Датасет доступен по ссылке. Статья с описанием опубликована на arXiv.org.

В базе FAIR1M около 80 % изображений в высоком разрешении получены с помощью китайских спутников дистанционного зондирования земли «Гаофэнь». Эти спутники Китай запускает с 2013 года, и сегодня они являются для Китая основными поставщиками высококачественных изображений Земли из космоса. Остальные 20 % изображений для базы FAIR1M были взяты из Google Earth. Датасет насчитывает 15 тыс. изображений с одним миллионом объектов, помеченных как «сцена». До этого крупнейшей подобной базой была французская VEDAI с выделением 3600 сцен.

Распознавание сцены сложнее, чем идентификация объекта. В случае сцены необходимо оценить несколько объектов на изображении, связать их и определить контекст. Китайская база FAIR1M позволяет обучить искусственный интеллект на примере целого миллиона выделенных вручную сцен, что открывает перед разработчиками алгоритмов распознавания массу возможностей. Если верить китайским источникам, база FAIR1M выбрана Международным обществом фотограмметрии и дистанционного зондирования в качестве эталона для обучения ИИ.