TPC-DS (2012)
Аналогично Star Schema Benchmark (SSB), TPC-DS основан на TPC-H, но пошел противоположным путем, т.е. увеличил количество необходимых соединений, сохраняя данные в сложной схеме снежинки (24 вместо 8 таблиц). Распределение данных нестабильно (например, нормальное и распределение Пуассона). Содержит 99 отчетов и ад-хок запросов с произвольными заменами.
Ссылки
- Создание TPC-DS (Nambiar), 2006
Во-первых, клонируйте репозиторий TPC-DS и скомпилируйте генератор данных:
Затем сгенерируйте данные. Параметр -scale
указывает масштабный коэффициент.
Затем сгенерируйте запросы (используйте тот же масштабный коэффициент):
Теперь создайте таблицы в ClickHouse. Вы можете использовать оригинальные определения таблиц в tools/tpcds.sql или "настроенные" определения таблиц с правильно определенными индексами первичного ключа и колонками типа LowCardinality там, где это имеет смысл.
Данные можно импортировать следующим образом:
Затем выполните сгенерированные запросы.
TPC-DS активно использует коррелированные подзапросы, которые на момент написания этого текста (сентябрь 2024 года) не поддерживаются ClickHouse (issue #6697). В результате многие из вышеупомянутых тестовых запросов завершатся с ошибками.