MWS Data Bridge
Наш продукт — это инструменты и сервисы для реализации пакетных процессов выгрузки, загрузки и трансформации данных (ETL\ELT).
Инструменты, которые мы предоставляем
-
Универсальная Python библиотека для ETL/ELT, базируется на Apache Spark
-
Сервис хранения меток High Water Mark (HWM)
-
Инструмент для сбора и отображения Data Motion Lineage
-
No-code инструмент для переноса данных
-
Java-библиотека для исправления проблем совместимости типов между реляционными СУБД и Spark
-
D-van v.0.3.1
Low-code Python библиотека для организации батчевых загрузок из реляционных СУБД в Hadoop
-
MTSpark v.4.4.3
Python-библиотека для упрощения работы со Spark в окружении MTS Big Data
-
EverProject v.7
Готовая структура репозитория + шаблон CI/CD для развертывания ETL кода в Apache Airflow
-
Partcour v.1.1.2
Python-библиотека для работы с партициями в Hive metastore
-
hydra-hvac-plugin v.0.0.6
Плагин для системы конфигурации Hydra, позволяющий использовать подстановку секретов из Hashicorp Vault
-
Lavash v.0.0.1
Набор переиспользуемых трансформаций для Apache Spark
-
Replick v0.4.1
Cервис для быстрой репликации данных между Hadoop кластерами