Перейти к основному содержимому
Перейти к основному содержимому

Анонимные данные веб-аналитики

Этот набор данных состоит из двух таблиц с анонимными данными веб-аналитики с хитами (hits_v1) и визитами (visits_v1).

Таблицы можно скачать в виде сжатых файлов tsv.xz. В дополнение к образцу, с которым работали в этом документе, доступна расширенная (7,5 ГБ) версия таблицы hits, содержащая 100 миллионов строк, в формате TSV по адресу https://datasets.clickhouse.com/hits/tsv/hits_100m_obfuscated_v1.tsv.xz.

Загрузка и импорт данных

Загрузите сжатый файл TSV с хитами:

Создайте базу данных и таблицу

Для hits_v1

Или для hits_100m_obfuscated

Импортируйте данные хитров:

Проверьте количество строк

Загрузите сжатый файл TSV с визитами:

Создайте таблицу визитов

Импортируйте данные визитов

Проверьте количество строк

Пример JOIN

Набор данных с хитами и визитами используется в тестах ClickHouse, это один из запросов из набора тестов. Остальные тесты упоминаются в разделе Следующие шаги в конце этой страницы.

Следующие шаги

Практическое введение в разреженные первичные индексы в ClickHouse использует набор данных с хитами для обсуждения различий в индексировании ClickHouse по сравнению с традиционными реляционными базами данных, как ClickHouse строит и использует разреженный первичный индекс, и лучшие практики индексирования.

Дополнительные примеры запросов к этим таблицам можно найти среди состояния тестов ClickHouse.

примечание

Набор тестов использует имя базы данных test, и таблицы называются hits и visits. Вы можете изменить имя вашей базы данных и таблиц или отредактировать SQL из тестового файла.