Классификация облаков точек

Конактное лицо: Александр Велижев (avelizhev@graphics.cs.msu.ru)
Задача проекта — анализ трёхмерных облаков точек, полученных лазерной съёмкой. Более конкретно, решается задача классификации точек облака. Каждой точке назначается метка класса из заранее определённого множества. Классификатор настраивается с помощью методов машинного обучения. Помимо локальных признаков точек он учитывает контекст. Для решения этой задачи часто используются ассоциативные Марковские сети (associative Markov networks, AMNs). Мы используем Марковские сети общего вида, совмещённые с классификатором Random Forest для назначения унарных потенциалов. Парные потенциалы обучаются с помощью наивного Байесовского классификатора. Мы оцениваем качество классификации на лазерных сканах, полученных аэросъёмкой.

Алгоритм

Схема работы стадий обучения и классификации похожи. Сначала строится пространственный индекс над сканом обучающей/тестовой выборки с помощью библиотеки LidarK, который затем служит сегментацией. Затем строится граф над медоидами сегментов. После этого вычисляются признаки для вершин и рёбер графа. Для назначения унарных потенциалов используется классификатор Random Forest, для обучения которого вычисляются признаки для сокращённого набора точек. Во время классификации вычисляются признаки для медоидов сегментов и подаются на вход обученному Random Forest. Для назначения парных потенциалов Марковской сети используется наивный Байесовский классификатор либо структурный SVM, которые обучается на признаках, извлечённых для рёбер графа, построенного над сканом обучающей выборки. Когда вычислены значения всех потенциалов, финальный результат классификации получается в результате вывода в Марковской сети.

Наборы данных

Лазерные сканы, используемые для экспериментов в статье с PCV 2010: Набор A, zipped asc Набор B, zipped asc Описание формата файлов, plain text
Оба набора данных разделены на обучающую и тестовую части приблизительно равного размера (около миллиона точек в каждой). Облака сохранены в текстовом формате. Каждая точка хранится как три вещественных числа, записанных на отдельной строке. В случае обучающей выборки четвёртым числом в строке является метка класса. Метки классов расшифрованы в файле с описанием формата файлов.

Результаты

По сравнению с ассоциативными Марковскими сетями (классический подход), предложенный метод возвращает более точный результат, без артефактов излишнего сглаживания:
Результаты на части скана "dataset A":

Легенда: красный/земля, чёрный/здание, синий/автомобиль, зелёный/дерево, голубой/кусты.

References

Point Cloud Library — an open-source library for 3D point cloud processing

Участники

Публикации