Введение
MWS Data Query — это мощное решение для выполнения высокопроизводительных распределённых SQL-запросов к различным данным, построенное на основе open-source проекта Trino (ранее известного как PrestoSQL). Продукт представляет собой улучшенную и коммерчески поддерживаемую версию Trino, включающую доработанные компоненты, дополнительные плагины, автоматизацию процессов сборки и установки, а также интеграцию с экосистемой MWS Data. MWS Data Query доступен в двух вариантах: как облачный сервис в рамках платформы MWS Cloud или как локальное развертывание (on-premise).
Продукт разработан для компаний, которым требуется надёжный инструмент для анализа данных из разнородных источников — от Hadoop (поверх S3 или HDFS) до класических РСУБД (PostgreSQL, MySQL и т.д.) и стриминговых платформ (Kafka). MWS Data Query упрощает работу с большими объёмами данных, предоставляя единый SQL-интерфейс и автоматизированные процессы настройки.
Основные возможности
- Гибкость подключения: Поддержка множества источников данных через коннекторы (Hive, Cassandra, Elasticsearch и др.).
- Высокая производительность: Параллельная обработка запросов на кластере серверов.
- Простота использования: Единый SQL совместимый интерфейс для работы с разнородными системами.
- Масштабируемость: Лёгкое добавление узлов для увеличения вычислительной мощности.
- Интеграция с платформой MWS Data: Легкое управление общими метаданными, управление доступом и взаимодействие компонентов между собой.
Целевая аудитория
- Аналитики данных: выполнение аналитических запросов в гетерогенной среде с использованием SQL.
- Инженеры данных: выполнение прототипирования и построение регламентных процессов преобразования данных.
- Любые специалисты, которым нужно работать с данными различных источников в едином интерфейсе(аd-hoc запросы).
Примечание
Так как Trino лежит в основе MWS Data Query, мы настоятельно рекомендуем читателям ознакомиться с официальной документацией Trino (доступной на сайте trino.io). В данной документации мы не будем дублировать информацию, уже описанную в документации Trino, а сосредоточимся на наших доработках, нововведениях и специфических возможностях продукта.