Skip to content

Введение

MWS Data Query — это мощное решение для выполнения высокопроизводительных распределённых SQL-запросов к различным данным, построенное на основе open-source проекта Trino (ранее известного как PrestoSQL). Продукт представляет собой улучшенную и коммерчески поддерживаемую версию Trino, включающую доработанные компоненты, дополнительные плагины, автоматизацию процессов сборки и установки, а также интеграцию с экосистемой MWS Data. MWS Data Query доступен в двух вариантах: как облачный сервис в рамках платформы MWS Cloud или как локальное развертывание (on-premise).

Продукт разработан для компаний, которым требуется надёжный инструмент для анализа данных из разнородных источников — от Hadoop (поверх S3 или HDFS) до класических РСУБД (PostgreSQL, MySQL и т.д.) и стриминговых платформ (Kafka). MWS Data Query упрощает работу с большими объёмами данных, предоставляя единый SQL-интерфейс и автоматизированные процессы настройки.

Основные возможности

  • Гибкость подключения: Поддержка множества источников данных через коннекторы (Hive, Cassandra, Elasticsearch и др.).
  • Высокая производительность: Параллельная обработка запросов на кластере серверов.
  • Простота использования: Единый SQL совместимый интерфейс для работы с разнородными системами.
  • Масштабируемость: Лёгкое добавление узлов для увеличения вычислительной мощности.
  • Интеграция с платформой MWS Data: Легкое управление общими метаданными, управление доступом и взаимодействие компонентов между собой.

Целевая аудитория

  • Аналитики данных: выполнение аналитических запросов в гетерогенной среде с использованием SQL.
  • Инженеры данных: выполнение прототипирования и построение регламентных процессов преобразования данных.
  • Любые специалисты, которым нужно работать с данными различных источников в едином интерфейсе(аd-hoc запросы).

Примечание

Так как Trino лежит в основе MWS Data Query, мы настоятельно рекомендуем читателям ознакомиться с официальной документацией Trino (доступной на сайте trino.io). В данной документации мы не будем дублировать информацию, уже описанную в документации Trino, а сосредоточимся на наших доработках, нововведениях и специфических возможностях продукта.