Перейти к основному содержимому
Перейти к основному содержимому

Движок таблицы Join

Необязательная подготовленная структура данных для использования в JOIN операциях.

примечание

Это не статья о условии JOIN самом по себе.

Создание таблицы

Смотрите подробное описание запроса CREATE TABLE.

Параметры движка

join_strictness

join_strictnessстрогость JOIN.

join_type

join_typeтип JOIN.

Ключевые колонки

k1[, k2, ...] – Ключевые колонки из условия USING, с которыми производится операция JOIN.

Введите параметры join_strictness и join_type без кавычек, например, Join(ANY, LEFT, col1). Они должны соответствовать операции JOIN, для которой будет использоваться таблица. Если параметры не совпадают, ClickHouse не вызывает исключение и может вернуть неправильные данные.

Особенности и рекомендации

Хранение данных

Данные таблицы Join всегда находятся в ОЗУ. При вставке строк в таблицу ClickHouse записывает блоки данных в директорию на диске, чтобы их можно было восстановить при перезапуске сервера.

Если сервер перезагружается некорректно, блок данных на диске может быть утерян или поврежден. В этом случае может понадобиться вручную удалить файл с поврежденными данными.

Выбор и вставка данных

Вы можете использовать запросы INSERT, чтобы добавить данные в таблицы с движком Join. Если таблица была создана с ANY строгой, данные для дублирующих ключей игнорируются. С ALL строгой добавляются все строки.

Основные сценарии использования таблиц с движком Join следующие:

  • Разместить таблицу с правой стороны в условии JOIN.
  • Вызвать функцию joinGet, которая позволяет извлекать данные из таблицы так же, как из словаря.

Удаление данных

Запросы ALTER DELETE для таблиц с движком Join реализованы как мутации. DELETE мутация читает отфильтрованные данные и перезаписывает данные в памяти и на диске.

Ограничения и настройки

При создании таблицы применяются следующие настройки:

join_use_nulls

join_use_nulls

max_rows_in_join

max_rows_in_join

max_bytes_in_join

max_bytes_in_join

join_overflow_mode

join_overflow_mode

join_any_take_last_row

join_any_take_last_row

join_use_nulls

persistent

Отключает постоянство для движков таблиц Join и Set.

Снижает накладные расходы на I/O. Подходит для сценариев, нацеленных на производительность и не требующих постоянства.

Возможные значения:

  • 1 — Включено.
  • 0 — Выключено.

Значение по умолчанию: 1.

Таблицы с движком Join не могут использоваться в операциях GLOBAL JOIN.

Движок Join позволяет указать настройку join_use_nulls в выражении CREATE TABLE. Запрос SELECT должен иметь то же значение join_use_nulls.

Примеры использования

Создание таблицы с левой стороны:

Создание таблицы Join с правой стороны:

Объединение таблиц:

В качестве альтернативы вы можете извлечь данные из таблицы Join, указав значение ключа объединения:

Удаление строки из таблицы Join: