Анализ больших массивов астрономических данных в облаке
Мещеряков Александр Валерьевич
Институт космических исследований РАН
Авторы: Сергей Герасимов ((ВМиК МГУ), Александр Мещеряков (ИКИ РАН)
Методы машинного обучения позволяют прогнозировать фотометрическое красное смещение галактик и строить объемные карты распределения астрономических объектов во Вселенной, которые в настоящее время широко используются в фундаментальных задачах внегалактической астрономии и наблюдательной космологии. Однако применение построенных прогностических моделей к доступным астрономическим каталогам, содержащим данные широкополосной фотометрии для объектов на всем небе, требует значительных вычислительных ресурсов. В данной работе был обобщен успешный опыт по применению технологии Apache Spark в облачной инфраструктуре Microsoft Azure для решения задачи точного прогнозирования фотометрических красных смещений галактик на большом массиве данных астрономических каталогов из обзора SDSS. Работа поддержана Российским фондом фундаментальных исследований (гранты РФФИ №14-22-03111 офи_м и №15-29-07085 офи_м).