Поиск
Для поиска в Каталоге данных используется встроенный поисковой движок. Вы можете просто ввести запрос в поисковую строку и нажать Enter для отображения результатов или воспользоваться фильтрами по категориям (таким как домены, продукты, тип платформы и другими), Advanced фильтрами, фильтрами с помощью булевых операторов.
По умолчанию поиск происходит по всем атрибутам (View all) различных объектов в Каталоге данных, включая наименования, описания, теги, термины, владельцев, описания колонок в датасетах. На главной странице также доступен выбор бейджа (Hive, SQL Server, MySQL ...) для фильтрации по нему. Поиск поддерживает как русский, так и английский языки.
Фильтры
После ввода запроса вы будете перенаправлены на страницу поисковой выдачи. В левой боковой панели окна, находятся фильтры, позволяющие уменьшить область поиска. Фильтры разделены на четыре категории: Charts (графики), Dashboards (дашборды), Datasets (датасеты), Pipelines (пайплайны). Нажатие на любую из под-категорий добавит соответствующий фильтр к поисковому запросу.
В верхней части страницы находится еще один блок фильтров. В зависимости от подключенных источников и других особенностей состав фильтров может меняться:
- Platform - по типу используемой источником данных технологии (Oracle, Hive, PostgreSQL, OpenApi),
- Domain - по домену,
- Type - по типу и подтипу объектов (Products, Term Group, Tags и другие),
- Platform Instance - по наименованию платформ-инстанса,
- Product - по наименованию продукта,
- Glossary Term - по связи с термином глоссария,
- Owned by - по владельцу,
- Tag - по связи с тегом,
- Container - по связи с контейнером,
- Markup tags - по связи с тегом разметки,
- Product cluster - по связи с кластером,
- Chart Type - по типу графика,
- Term Type - по типу термина (сущность, справочник, атрибут, метрика),
- Role - по типу роли, назначенной пользователю (Reader, Editor, Admin),
- With Critical Fields - по наличию полей с критичными данными,
- With Incident Management - по наличию флага управления инцидентами,
- Is master source - по наличию отметки Master source,
- Link label - по названию ссылки,
- With DQ Checks - по наличию проверки качества данных.
Применение фильтра
По умолчанию при нажатии на фильтр в выпадающем списке видно до двадцати категорий, однако при наборе символов в поисковой строке значения внутри фильтра будут отсортированы по релевантности запроса. Чтобы применить фильтр необходимо выбрать необходимую категорию нажать Update. Примененные фильтры отображаются как бейджа под строкой фильтров, сам фильтр подсвечивается синим цветом. Для удаления фильтра необходимо нажать крестик рядом с названием.
Продвинутые (advanced) фильтры
Используя продвинутые фильтры, можно применить более сложную логику фильтрации. Для перехода в режим advanced фильтров нажмите Advanced Filters в правой части страницы.
Чтобы добавить новый фильтр, нажмите Add filter, выберите тип фильтра, а затем введите значения, по которым вы хотите отфильтровать результаты.
По умолчанию при выборе нескольких фильтров результаты фильтрации применяются с логическим оператором AND. Это означает, что в результаты поиска будут включены только те объекты, которые соответствуют всем указанным условиям одновременно. Кроме того, можно объединить фильтры с помощью логического оператора OR, благодаря чему в результаты поиска попадут объекты, соответствующие хотя бы одному из условий. Сделать это можно нажав all filters и выбрав any filter из выпадающего меню.
Каждый из используемых фильтров Advanced можно настроить таким образом, чтобы выбранные значения включались или исключались из результатов. Для этого нужно изменить значение с is any of
на is not
.
Расширенные поисковые запросы
Поиск в Каталоге данных поддерживает использование расширенных запросов, позволяющих осуществлять поиск по паттернам, использовать логические выражения и фильтры по конкретным атрибутам объектов. Такой поиск использует определенные символы, которые интерпретируются поисковым движком специальным образом. Далее приведены примеры применения таких запросов.
Поиск по точному совпадению
Заключение запроса в кавычки " "
гарантирует точное совпадение результатов с введённым запросом. Пример запроса: "Каталог данных"
.
Исключение слов/словосочетаний
Чтобы исключить определенное слово из запроса, перед ним ставится символ -
перед исключаемым словом. Пробел между символом и исключаемым словом не допускается. Пример запроса: Каталог данных -источник
.
Применение булевых операторов:
Поисковый движок позволяет применять булевы операторы для построения более сложных запросов:
|
- объединение результатов через логическое ИЛИ (OR);
+
- объединение результатов через логическое И (AND);
-
- символ исключения из результата, ставится перед исключаемым словом;
( )
- установление приоритетов, первым выполняется запрос в скобках.
Примеры запросов:
-
Каталог данных | Качество данных
- результаты, соответствующие запросу "Каталог данных" или "Качество данных". Результаты запроса -
(Каталог данных | Качество данных) + клиент
- результаты, соответствующие запросу запросу "Каталог данных" или "Качество данных", причем каждый из запросов должен включать результаты, соответствующие запросу "клиент". Результаты запроса -
(Каталог данных | Качество данных) -МТС
- результаты, соответствующие запросу "Каталог данных" или "Качество данных", причем каждый из запросов должен исключать результаты, соответствующие запросу "МТС". Результаты запроса
Поиск по маске в определенных атрибутах объекта
В запросах можно использовать подстановочный символ *
, обозначающий любую последовательность символов. Так запрос *каталог* выдаст совпадения, где слово каталог может находиться в начале, в середине или в конце слова. Чтобы указать в каком атрибуте объекта искать совпадения, например, в имени или описании используют сочетание \q
. Например:
-
/q name:*Каталог*
- результаты, в которых запрос Каталог входит в наименование объект. Результаты запроса -
/q description:Каталог*
- результаты, в которых слово Каталог находится в начале описания объекта. Результаты запроса
Атрибуты, поиск внутри которых можно выполнять:
name
- наименование объекта,description
- описание объекта из метаданных источника,editedDescription
- описание объекта, введенное через пользовательский интерфейс,fieldPaths
- наименование столбца/поля датасета (например, столбец в таблице, поле API эндпоинта),browsePaths
- полный путь до объекта. Например, путь - /datasets/prod/hive/SampleKafkaDataset хранится как строка, поэтому для поиска по вхождению нужно воспользоваться подстановочным символом*
.
Различные элементы запроса можно объединять операторами AND
и OR
, с помощью -
можно инвертировать смысл отдельного элемента запроса.
Примеры
-
/q name:*Каталог* AND description:*данных* AND -fieldPaths:*data*
- объекты, в наименование которых входит "Каталог", и в описание которых входит подстрока "данных", и в наименовании столбцов нет подстрокиdata
. Результаты запроса -
Найти все объекты без описания (description и editedDescription пустые):
/q -description:* AND -editedDescription:*
ИЛИ/q -_exists_:description AND -_exists_: editedDescription
. Результаты запроса -
Найти все объекты с НЕпустым описанием (description ИЛИ editedDescription непустой):
/q description:* OR editedDescription:*
ИЛИ/q _exists_:description OR _exists_: editedDescription
. Результаты запроса
Поиск по URN
Для поиска по URN необходимо скопировать URN ресурса скопировать URN ресурса и ввести его в поисковую строку, таким образом вы однозначно найдёте интересующий вас объект.