Перейти к основному содержимому
Перейти к основному содержимому

TPC-DS (2012)

Аналогично Star Schema Benchmark (SSB), TPC-DS основан на TPC-H, но пошел противоположным путем, т.е. увеличил количество необходимых соединений, сохраняя данные в сложной схеме снежинки (24 вместо 8 таблиц). Распределение данных нестабильно (например, нормальное и распределение Пуассона). Содержит 99 отчетов и ад-хок запросов с произвольными заменами.

Ссылки

Во-первых, клонируйте репозиторий TPC-DS и скомпилируйте генератор данных:

Затем сгенерируйте данные. Параметр -scale указывает масштабный коэффициент.

Затем сгенерируйте запросы (используйте тот же масштабный коэффициент):

Теперь создайте таблицы в ClickHouse. Вы можете использовать оригинальные определения таблиц в tools/tpcds.sql или "настроенные" определения таблиц с правильно определенными индексами первичного ключа и колонками типа LowCardinality там, где это имеет смысл.

Данные можно импортировать следующим образом:

Затем выполните сгенерированные запросы.

осторожно

TPC-DS активно использует коррелированные подзапросы, которые на момент написания этого текста (сентябрь 2024 года) не поддерживаются ClickHouse (issue #6697). В результате многие из вышеупомянутых тестовых запросов завершатся с ошибками.