Перейти к основному содержимому
Перейти к основному содержимому

Учебники и Примеры Наборов Данных

У нас есть много ресурсов, которые помогут вам начать работу и понять, как работает ClickHouse:

Кроме того, примеры наборов данных предоставляют отличный опыт работы с ClickHouse, изучения важных техник и приемов, а также демонстрируют, как воспользоваться многими мощными функциями ClickHouse. Примеры наборов данных включают:

СтраницаОписание
Данные Такси Нью-ЙоркаДанные о миллиардах поездок на такси и машинах для аренды (Uber, Lyft и др.) из Нью-Йорка с 2009 года
Логи Клика в CriteoТерабайт логов кликов от Criteo
WikiStatИзучите набор данных WikiStat, содержащий 0.5 триллионов записей.
TPC-DS (2012)Набор данных и запросы для бенчмарка TPC-DS.
Набор данных РецептовНабор данных RecipeNLG, содержащий 2.2 миллиона рецептов
Открытые Данные COVID-19Открытые данные COVID-19 - это большая база данных эпидемиологических данных COVID-19 и связанных факторов, таких как демография, экономика и ответы правительства
Глобальная Историческая Сеть Климата NOAA2.5 миллиарда строк климатических данных за последние 120 лет
Набор Данных Событий GitHubНабор данных, содержащий все события на GitHub с 2011 года по 6 декабря 2020 года, с размером 3.1 миллиарда записей.
Отзывы Клиентов AmazonБолее 150 миллионов отзывов о продуктах Amazon
Бенчмарк Университета БраунаНовый аналитический бенчмарк для данных логов, сгенерированных машинами
Запись Запросов в ClickHouse с Использованием Данных GitHubНабор данных, содержащий все коммиты и изменения для репозитория ClickHouse
Анализ Данных Stack Overflow с помощью ClickHouseАнализ данных Stack Overflow с помощью ClickHouse
Бенчмарк Больших Данных AMPLabНабор данных для бенчмарка, используемый для сравнения производительности решений для хранения данных.
Набор Данных Библиотеки Нью-Йорка "Что в Меню?"Набор данных, содержащий 1.3 миллиона записей исторических данных о меню отелей, ресторанов и кафе с блюдами и их ценами.
Набор данных Laion-400MНабор данных, содержащий 400 миллионов изображений с подписями на английском языке
Бенчмарк Звездной Схемы (SSB, 2009)Набор данных и запросы для бенчмарка Звездной Схемы (SSB)
Набор Данных Цен Недвижимости ВеликобританииУзнайте, как использовать проекции для улучшения производительности запросов, которые вы выполняете часто, используя набор данных о ценах на недвижимость в Великобритании, который содержит данные о ценах, уплаченных за недвижимость в Англии и Уэльсе
Набор Данных Комментариев RedditНабор данных, содержащий общедоступные комментарии на Reddit с декабря 2005 года по март 2023 года с более чем 14 миллиардами строк данных в формате JSON
OnTimeНабор данных, содержащий данные о своевременности выполнения авиарейсов
Исторические Наборы Данных Погоды Тайваня131 миллион строк данных о погодных наблюдениях за последние 128 лет
Краудсорсинговые данные о воздушном движении от The OpenSky Network 2020Данные в этом наборе получены и очищены из полного набора данных OpenSky, чтобы проиллюстрировать развитие воздушного движения во время пандемии COVID-19.
Данные Жалоб NYPDИмпортируйте и запрашивайте данные в формате Tab Separated Value за 5 шагов
TPC-H (1999)Набор данных и запросы для бенчмарка TPC-H.
Набор данных "дизлайков" YouTubeКоллекция дизлайков видео на YouTube.
Геоданные с использованием Набора Данных Башен Сотовой СвязиУзнайте, как загрузить данные OpenCelliD в ClickHouse, подключить Apache Superset к ClickHouse и создать панель управления на основе данных
Данные Экологического МониторингаБолее 20 миллиардов записей данных от Sensor.Community, глобальной сети датчиков, созданной участниками, которая генерирует открытые экологические данные.
Анонимная Веб-аналитикаНабор данных, состоящий из двух таблиц, содержащих анонимные данные веб-аналитики с посещениями и показами