Статья Сравнение эффективности платформ распределенных вычислений Hadoop и Apache Spark на примере алгоритма перемножения матриц | Научно-практический журнал широкого профиля «Наука, техника и образование»

Сравнение эффективности платформ распределенных вычислений Hadoop и Apache Spark на примере алгоритма перемножения матриц

Авторы: Драган Мария Николаевна , Короходкин Денис Валерьевич , Крысин Иван Александрович

Опубликовано в выпуске: 1/2019 (23) , 02.04.2019

перемножение матриц, map-reduce, Apache Spark, Big Data, Hadoop

В статье рассматривается проблема обработки больших данных. Приводятся краткие характеристики платформ распределенной обработки данных с открытым исходным кодом Hadoop и Apache Spark. Рассматривается map-reduce алгоритм перемножения матриц. Описывается эксперимент для сравнения временных затрат алгоритма, реализованного на платформе Hadoop с применением Hadoop-MapReduce и на платформе Apache Spark при различном объеме входных данных. Приводятся результаты эксперимента.

Добавить статью