Облака как альтернатива дорогостоящей локальной инфраструктуре
Mail.Ru Cloud Solutions (MCS) представила новый масштабируемый PaaS-сервис для компаний, которые собирают и анализируют большие данные. Сервис Mail.Ru Cloud Big Data на базе Apache Hadoop и Apache Spark позволяет вынести обработку данных в облако и вместе с тем ускорить анализ больших данных и снизить расходы на создание и обслуживание инфраструктуры.
Анализ больших данных позволяет решать широкий спектр задач: от кредитного скоринга, разбора операционной деятельности компании и распределения транспортной нагрузки до поиска ископаемых, проведения исследований в области медицины, социологии, астрономии. Для эффективной работы с большими объемами информации требуются огромные вычислительные мощности: множество дорогих серверов, которые будут обслуживать специально нанятые профессионалы. Однако не каждому предприятию нужна собственная инфраструктура для работы с большими данными. Особенно актуальным решение может оказаться для организаций, основная деятельность которых не связана непосредственно с анализом данных, и в силу этого не способных обеспечить полноценную загрузку профильного парка оборудования и штата специалистов в непрерывном режиме работы.
Сервис Mail.Ru Cloud Big Data выступает в качестве альтернативы дорогостоящей локальной инфраструктуре для обработки больших данных и предоставляет возможность использования мощной облачной среды в аренду.
Гибкий подход к задаче обработки больших данных
Применение платформ с открытым исходным кодом Apache Hadoop и Apache Spark позволяет быстро и точно обрабатывать огромные объемы данных из разнородных источников. Hadoop оптимален для индексации веб-сайтов, научных исследований (data lake). Spark – для потоковой обработки и анализа данных в реальном времени: сегментации посетителей сайтов, обнаружения мошенничества, мониторинга транспорта.
При необходимости вычислительные ресурсы масштабируются от пары серверов до сотен и обратно за несколько минут, а потребитель оплачивает только те мощности, которые использует: в Mail.Ru Cloud Big Data действует посекундная тарификация. Кроме этого, предусмотрена приватная сеть с компонентами Hadoop и другими сервисами в клиентской ИТ-системе для создания гибридного облака, а также миграция приложений для Hadoop из облака Amazon и Azure без изменения кода.
«На международном рынке облачных услуг доля PaaS доходит до 20%, а в России не превышает и 3%. Вызвано это рядом факторов: сравнительной молодостью рынка в целом, низкими, хоть и растущими, объемами использования отечественным бизнесом облачных услуг, ограниченностью набора предложений от самих провайдеров облачных сервисов, – комментирует руководитель направления облачных и бизнес-сервисов группы Mail.Ru Егор Ганин. – В числе своих задач мы видим популяризацию использования облачных услуг в России, в том числе за счет увеличения перечня готовых к использованию IaaS- и PaaS-решений».
Предложения Mail.Ru Cloud Big Data рассчитаны на предоставление облачной платформы, где любой желающий может создавать собственную инфраструктуру и решать ресурсоемкие задачи по анализу данных в корпоративных приложениях, индексации сайтов, финансовому анализу, научным исследованиям и вычислениям, а также машинному обучению.
Для организаций, заинтересованных в использовании больших данных, но не разобравшихся с этим решением самостоятельно, в Mail.Ru Group c 2015 г. работает направление Predictive Analytic Solutions. Команда направления занимается разработкой сервисов класса AaaS (Analytics As A Service) на основе предиктивных моделей для решения бизнес-задач. Собственные технологии и инфраструктура, а также накопленная экспертиза в области data science позволяют предоставлять такие услуги потребителям вне зависимости от специфики их бизнеса.