Хранение и обработка данных спутниковых мульти- и гиперспектральных снимков на основе формата Apache Parquet

14 сентября 2018
294
Предметная область
Выходные данные
Ключевые слова
Вид публикации Статья
Контактные данные автора публикации
Ссылка на публикацию в интернете novtex.ru/prin/rus/10.17587/prin.9.123-131.html

Аннотация

Рассмотрены способы хранения и алгоритмы последующей обработки данных мульти- и гиперспектральных спутниковых снимков, которые реализуются механизмами распределенных вычислительных систем, входящих в экосистему Apache Hadoop. Отличительной особенностью представленных в работе решений является способ хранения данных дистанционного зондирования. Такой способ позволяет снизить объем хранимой информации за счет архивации посредством технологии Apache Parquet, а также дает возможность работы с данными с использованием запросов Spark SQL. Приведены решения конкретных задач на примере вычисления нормализованных вегетационных индексов спутниковых снимков космических аппаратов Ресурс-П и Sentinel-2A на базе фрэйворков Apache Spark и Apache Flink.
Подробнее
Для того чтобы оставить комментарий необходимо авторизоваться.