Для решения задач классификации и анализа данных широко применяются методы машинного обучения, объединяющие самые разные подходы, включая статистику, теорию вероятностей и вычислительную оптимизацию. Одним из направлений применения подобных технологий является распознавание объектов на изображениях.
Существует множество алгоритмов и специализированного программного обеспечения, способного производить классификацию данных дистанционного зондирования Земли. Однако большая часть подобных методов, так или иначе, связана с обработкой снимков, сделанных при помощи мультиспектральных сенсоров. При работе с подобными материалами задача классификации значительно облегчается благодаря спектральной информации об отражении. Учитывая, что для удешевления и оптимизации аэрофотосъемочных работ при помощи беспилотных летательных аппаратов часто используются обычные фотоаппараты, неспособные производить спектрозональную съемку, многие существующие методы классификации не могут быть эффективно использованы. Именно поэтому для решения задачи классификации залесенных участков местности по снимкам в видимом диапазоне предпочтительно использование методов машинного обучения.
В данном случае был выбран метод «случайный лес» («random forest»). Этот метод достаточно универсален и может быть использован для многоклассовой классификации. Задачу классификации залесенных участков предлагается решить при помощи свободно распространяемого программного обеспечения QGIS и библиотеки алгоритмов Orfeo Toolbox, в рамках которой реализованы требуемые методы машинного обучения.
Общая схема предлагаемого метода обработки следующая:
- Сбор и подготовка тренировочных данных (рис. 1). На данном этапе следует создать выборку основных типов поверхности, изображенных на ортофотоплане (лес, луг, открытая почва и т.д.);
- Классификация тренировочных данных - создание модели (дерева). Данная модель может быть использована для классификации множества других ортофотопланов при условии сохранения на них подобия изображенных природных объектов.
- Применение модели классификации и получение результата.
- Фильтрация шума, появившегося в результате классификации. Классификация производится попиксельно, поэтому возможно появление нежелательного шума.
- Извлечение полигонального слоя залесенных участков местности в векторном формате.
Рис. 1 Сбор и подготовка тренировочных данных.
Предлагаемый метод предусматривает пакетную классификацию ортофотопланов, то есть существует возможность автоматической обработки большого массива данных.
Результат на выбранную область исследования можно увидеть на рис. 2 и рис. 3.
Рис. 2 Результат классификации.
Рис. 3 . Результат классификации в приближении.
Таким образом, при помощи предложенного метода обработки можно практически в автоматическом режиме грубо выделять залесенные участки на высокодетальных ортофотопланах. Следует отметить, что в данном случае использовался метод, который предусматривает лишь попиксельную классификацию. В настоящее время широко используются и развиваются методы текстурного анализа изображений. В будущем планируется совместное применение данных технологий, благодаря чему возможно значительное увеличение точности классификации.
Автор: Андрей Кот