Учебники и Примеры Наборов Данных
У нас есть много ресурсов, которые помогут вам начать работу и понять, как работает ClickHouse:
- Если вам нужно развернуть ClickHouse, ознакомьтесь с нашим Руководством по Быстрому Запуску
- Учебник по ClickHouse анализирует набор данных поездок такси в Нью-Йорке
Кроме того, примеры наборов данных предоставляют отличный опыт работы с ClickHouse, изучения важных техник и приемов, а также демонстрируют, как воспользоваться многими мощными функциями ClickHouse. Примеры наборов данных включают:
Страница | Описание |
---|---|
Данные Такси Нью-Йорка | Данные о миллиардах поездок на такси и машинах для аренды (Uber, Lyft и др.) из Нью-Йорка с 2009 года |
Логи Клика в Criteo | Терабайт логов кликов от Criteo |
WikiStat | Изучите набор данных WikiStat, содержащий 0.5 триллионов записей. |
TPC-DS (2012) | Набор данных и запросы для бенчмарка TPC-DS. |
Набор данных Рецептов | Набор данных RecipeNLG, содержащий 2.2 миллиона рецептов |
Открытые Данные COVID-19 | Открытые данные COVID-19 - это большая база данных эпидемиологических данных COVID-19 и связанных факторов, таких как демография, экономика и ответы правительства |
Глобальная Историческая Сеть Климата NOAA | 2.5 миллиарда строк климатических данных за последние 120 лет |
Набор Данных Событий GitHub | Набор данных, содержащий все события на GitHub с 2011 года по 6 декабря 2020 года, с размером 3.1 миллиарда записей. |
Отзывы Клиентов Amazon | Более 150 миллионов отзывов о продуктах Amazon |
Бенчмарк Университета Брауна | Новый аналитический бенчмарк для данных логов, сгенерированных машинами |
Запись Запросов в ClickHouse с Использованием Данных GitHub | Набор данных, содержащий все коммиты и изменения для репозитория ClickHouse |
Анализ Данных Stack Overflow с помощью ClickHouse | Анализ данных Stack Overflow с помощью ClickHouse |
Бенчмарк Больших Данных AMPLab | Набор данных для бенчмарка, используемый для сравнения производительности решений для хранения данных. |
Набор Данных Библиотеки Нью-Йорка "Что в Меню?" | Набор данных, содержащий 1.3 миллиона записей исторических данных о меню отелей, ресторанов и кафе с блюдами и их ценами. |
Набор данных Laion-400M | Набор данных, содержащий 400 миллионов изображений с подписями на английском языке |
Бенчмарк Звездной Схемы (SSB, 2009) | Набор данных и запросы для бенчмарка Звездной Схемы (SSB) |
Набор Данных Цен Недвижимости Великобритании | Узнайте, как использовать проекции для улучшения производительности запросов, которые вы выполняете часто, используя набор данных о ценах на недвижимость в Великобритании, который содержит данные о ценах, уплаченных за недвижимость в Англии и Уэльсе |
Набор Данных Комментариев Reddit | Набор данных, содержащий общедоступные комментарии на Reddit с декабря 2005 года по март 2023 года с более чем 14 миллиардами строк данных в формате JSON |
OnTime | Набор данных, содержащий данные о своевременности выполнения авиарейсов |
Исторические Наборы Данных Погоды Тайваня | 131 миллион строк данных о погодных наблюдениях за последние 128 лет |
Краудсорсинговые данные о воздушном движении от The OpenSky Network 2020 | Данные в этом наборе получены и очищены из полного набора данных OpenSky, чтобы проиллюстрировать развитие воздушного движения во время пандемии COVID-19. |
Данные Жалоб NYPD | Импортируйте и запрашивайте данные в формате Tab Separated Value за 5 шагов |
TPC-H (1999) | Набор данных и запросы для бенчмарка TPC-H. |
Набор данных "дизлайков" YouTube | Коллекция дизлайков видео на YouTube. |
Геоданные с использованием Набора Данных Башен Сотовой Связи | Узнайте, как загрузить данные OpenCelliD в ClickHouse, подключить Apache Superset к ClickHouse и создать панель управления на основе данных |
Данные Экологического Мониторинга | Более 20 миллиардов записей данных от Sensor.Community, глобальной сети датчиков, созданной участниками, которая генерирует открытые экологические данные. |
Анонимная Веб-аналитика | Набор данных, состоящий из двух таблиц, содержащих анонимные данные веб-аналитики с посещениями и показами |