НПО «Мобильные Информационные Системы» искусственный интеллект (далее – ИИ) внедряет в разрабатываемые программные продукты в различных сферах, где нужно автоматизировать процессы, проанализировать большие данные и принять решения на основе полученной информации.
Наиболее глубокие познания, результативные наработки и компетенции во внедрении ИИ предприятие имеет в обработке геопространственных данных полученных при воздушной мультиспектральной съемке.
Данная технология позволяет на основе одиночного спутникового снимка создавать трёхмерные сцены в общепринятом формате Wavefront Object с разделением на сущности каждого объекта, что обеспечит простую интеграцию в необходимые системы.
Принцип работы основан на взаимодействии двух независимых моделей глубокого обучения, которые решают задачи инстанс-сегментации и восстановления высот.
Первая модель создает векторизованное представление объектов, а вторая генерирует попиксельную карту высот, которая соответствует исходному спутниковому снимку и содержит значения высоты в метрах для каждого пикселя. После этого результаты работы обеих моделей объединяются, и на их основе формируются объекты сцены.
Особенность технологии заключается в её способности работать с изображениями любой размерности благодаря разработанной библиотеке обработки изображений, использующей индексы H3.
Для обучения модели инстанс-сегментации был собран набор из пяти различных датасетов, содержащих более 85 тысяч изображений. Эти изображения охватывают различные регионы, объекты и имеют различное пространственное разрешение.
Также возможно дообучение модели на LiDAR и контурных данных моделей сегментации и восстановления высот.
Разработанная технология представляет собой программно-алгоритмический комплекс, позволяющий автоматически восстанавливать трёхмерные сцены городской и природной среды по одиночному спутниковому снимку. На выходе формируется полноценная 3D-модель в общепринятом формате Wavefront Object (OBJ) с явным разделением сцены на отдельные объекты, что делает результат пригодным для дальнейшего анализа, визуализации и интеграции в сторонние системы.
Ключевая ценность решения заключается в том, что для построения 3D-сцены не требуется стереопара, лидар или многовременные данные — достаточно одного спутникового изображения. Это принципиально снижает стоимость входных данных и расширяет применимость технологии для масштабных территорий.
В основе технологии лежит взаимодействие двух независимых моделей глубокого обучения, каждая из которых решает свою фундаментальную задачу.
Первая модель выполняет задачу инстанс-сегментации, автоматически обнаруживая и разделяя отдельные объекты сцены (здания, инфраструктурные элементы и др.) на исходном спутниковом изображении. Результатом её работы является векторизованное представление объектов, где каждая сущность имеет чётко определённые геометрические границы и принадлежность к отдельному объекту сцены.
Вторая модель решает задачу восстановления геометрии сцены и генерирует попиксельную карту высот, строго согласованную с исходным спутниковым изображением. Каждому пикселю соответствует значение высоты в метрах, что позволяет описывать форму поверхности и объектов с высокой детализацией.
На финальном этапе результаты обеих моделей объединяются:
На их основе автоматически формируются трёхмерные объекты сцены, которые экспортируются в формат OBJ с корректной топологией и разделением по сущностям.
Одним из ключевых технологических преимуществ решения является возможность работы с изображениями произвольного размера — от локальных участков до целых регионов.
Это достигается за счёт использования специализированной библиотеки пространственной индексации, основанной на H3-индексах. Изображения автоматически разбиваются на иерархические пространственные ячейки, что позволяет:
Данный подход делает технологию применимой для задач регионального и национального масштаба.
Для обучения модели инстанс-сегментации был сформирован крупный объединённый датасет, включающий:
Это обеспечивает высокую обобщающую способность модели и устойчивость к вариативности входных данных.
Модель восстановления высот обучалась на специализированном датасете, содержащем пары спутниковых изображений и соответствующих карт высот. Совокупное покрытие обучающих данных составляет 775 квадратных километров, что позволяет модели корректно восстанавливать геометрию как плотной застройки, так и менее структурированных территорий.
Технология ориентирована на практическое использование и может применяться в следующих областях:
Формат OBJ и объектная структура сцены позволяют без дополнительной обработки интегрировать результат в существующие пайплайны.
Обратная связь