Анонимные данные веб-аналитики
Этот набор данных состоит из двух таблиц с анонимными данными веб-аналитики с хитами (hits_v1
) и визитами (visits_v1
).
Таблицы можно скачать в виде сжатых файлов tsv.xz
. В дополнение к образцу, с которым работали в этом документе, доступна расширенная (7,5 ГБ) версия таблицы hits
, содержащая 100 миллионов строк, в формате TSV по адресу https://datasets.clickhouse.com/hits/tsv/hits_100m_obfuscated_v1.tsv.xz.
Загрузка и импорт данных
Загрузите сжатый файл TSV с хитами:
Создайте базу данных и таблицу
Для hits_v1
Или для hits_100m_obfuscated
Импортируйте данные хитров:
Проверьте количество строк
Загрузите сжатый файл TSV с визитами:
Создайте таблицу визитов
Импортируйте данные визитов
Проверьте количество строк
Пример JOIN
Набор данных с хитами и визитами используется в тестах ClickHouse, это один из запросов из набора тестов. Остальные тесты упоминаются в разделе Следующие шаги в конце этой страницы.
Следующие шаги
Практическое введение в разреженные первичные индексы в ClickHouse использует набор данных с хитами для обсуждения различий в индексировании ClickHouse по сравнению с традиционными реляционными базами данных, как ClickHouse строит и использует разреженный первичный индекс, и лучшие практики индексирования.
Дополнительные примеры запросов к этим таблицам можно найти среди состояния тестов ClickHouse.
Набор тестов использует имя базы данных test
, и таблицы называются hits
и visits
. Вы можете изменить имя вашей базы данных и таблиц или отредактировать SQL из тестового файла.