Перейти к основному содержимому
Перейти к основному содержимому

system.asynchronous_metrics

Запросы в ClickHouse Cloud

Данные в этой системной таблице хранятся локально на каждом узле в ClickHouse Cloud. Для получения полного представления о всех данных необходимо использовать функцию clusterAllReplicas. Подробности см. здесь.

Содержит метрики, которые вычисляются периодически в фоновом режиме. Например, количество используемой оперативной памяти.

Колонки:

  • metric (String) — Название метрики.
  • value (Float64) — Значение метрики.
  • description (String) - Описание метрики.

Пример

Описание метрик

AsynchronousHeavyMetricsCalculationTimeSpent

Время в секундах, затраченное на вычисление асинхронных тяжелых (связанных с таблицами) метрик (это накладные расходы асинхронных метрик).

AsynchronousHeavyMetricsUpdateInterval

Интервал обновления тяжелых (связанных с таблицами) метрик.

AsynchronousMetricsCalculationTimeSpent

Время в секундах, затраченное на вычисление асинхронных метрик (это накладные расходы асинхронных метрик).

AsynchronousMetricsUpdateInterval

Интервал обновления метрик.

BlockActiveTime_name

Время в секундах, в течение которого блочное устройство имело запросы ввода-вывода в очереди. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardBytes_name

Количество отброшенных байт на блочном устройстве. Эти операции имеют отношение к SSD. Операции по удалению не используются ClickHouse, но могут быть использованы другими процессами в системе. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardMerges_name

Количество операций удаления, запрошенных от блочного устройства и объединенных вместе планировщиком ввода-вывода ОС. Эти операции имеют отношение к SSD. Операции по удалению не используются ClickHouse, но могут быть использованы другими процессами в системе. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardOps_name

Количество операций удаления, запрошенных от блочного устройства. Эти операции имеют отношение к SSD. Операции по удалению не используются ClickHouse, но могут быть использованы другими процессами в системе. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardTime_name

Время в секундах, затраченное на операции удаления, запрошенные от блочного устройства, суммированное по всем операциям. Эти операции имеют отношение к SSD. Операции по удалению не используются ClickHouse, но могут быть использованы другими процессами в системе. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockInFlightOps_name

Это значение подсчитывает количество запросов ввода-вывода, которые были отправлены драйверу устройства, но еще не завершены. Оно не включает запросы ввода-вывода, которые находятся в очереди, но еще не отправлены драйверу устройства. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockQueueTime_name

Это значение подсчитывает количество миллисекунд, которые запросы ввода-вывода ожидали на этом блочном устройстве. Если есть несколько запросов ввода-вывода в ожидании, это значение увеличится как произведение количества миллисекунд на количество ожидающих запросов. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadBytes_name

Количество байт, прочитанных с блочного устройства. Оно может быть меньше количества байт, прочитанных из файловой системы из-за использования кэша страниц ОС, который сохраняет ввод-вывод. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadMerges_name

Количество операций чтения, запрошенных с блочного устройства и объединенных вместе планировщиком ввода-вывода ОС. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadOps_name

Количество операций чтения, запрошенных с блочного устройства. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadTime_name

Время в секундах, затраченное на операции чтения, запрошенные с блочного устройства, суммированное по всем операциям. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteBytes_name

Количество байт, записанных на блочное устройство. Оно может быть меньше количества байт, записанных в файловую систему из-за использования кэша страниц ОС, который сохраняет ввод-вывод. Запись на блочное устройство может произойти позже соответствующей записи в файловую систему из-за кеширования записи. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteMerges_name

Количество операций записи, запрошенных от блочного устройства и объединенных вместе планировщиком ввода-вывода ОС. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteOps_name

Количество операций записи, запрошенных от блочного устройства. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteTime_name

Время в секундах, затраченное на операции записи, запрошенные от блочного устройства, суммированное по всем операциям. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

CPUFrequencyMHz_name

Текущая частота процессора в МГц. Большинство современных процессоров динамически регулируют частоту для экономии энергии и увеличения производительности.

CompiledExpressionCacheBytes

Общее количество байт, используемых для кэша JIT-скомпилированного кода.

CompiledExpressionCacheCount

Общее количество записей в кэше JIT-скомпилированного кода.

DiskAvailable_name

Доступные байты на диске (виртуальная файловая система). Удаленные файловые системы могут показать большое значение, например, 16 EiB.

DiskTotal_name

Общий размер диска в байтах (виртуальная файловая система). Удаленные файловые системы могут показать большое значение, например, 16 EiB.

DiskUnreserved_name

Доступные байты на диске (виртуальная файловая система) без резервов для слияний, загрузок и перемещений. Удаленные файловые системы могут показать большое значение, например, 16 EiB.

DiskUsed_name

Использованные байты на диске (виртуальная файловая система). Удаленные файловые системы не всегда предоставляют эту информацию.

FilesystemCacheBytes

Общее количество байт в виртуальной файловой системе cache. Этот кэш хранится на диске.

FilesystemCacheFiles

Общее количество сегментов файлов, кэшированных в виртуальной файловой системе cache. Этот кэш хранится на диске.

FilesystemLogsPathAvailableBytes

Доступные байты на том разделе, где смонтирован путь логов ClickHouse. Если это значение приближается к нулю, вам следует настроить ротацию логов в конфигурационном файле.

FilesystemLogsPathAvailableINodes

Количество доступных инодов на том разделе, где смонтирован путь логов ClickHouse.

FilesystemLogsPathTotalBytes

Размер раздела, на котором смонтирован путь логов ClickHouse, в байтах. Рекомендуется иметь не менее 10 ГБ для логов.

FilesystemLogsPathTotalINodes

Общее количество инодов на том разделе, где смонтирован путь логов ClickHouse.

FilesystemLogsPathUsedBytes

Использованные байты на том разделе, где смонтирован путь логов ClickHouse.

FilesystemLogsPathUsedINodes

Количество использованных инодов на том разделе, где смонтирован путь логов ClickHouse.

FilesystemMainPathAvailableBytes

Доступные байты на том разделе, где смонтирован основной путь ClickHouse.

FilesystemMainPathAvailableINodes

Количество доступных инодов на том разделе, где смонтирован основной путь ClickHouse. Если он близок к нулю, это указывает на неправильную конфигурацию, и вы получите сообщение 'нет места на устройстве', даже если диск не заполнен.

FilesystemMainPathTotalBytes

Размер раздела, на котором смонтирован основной путь ClickHouse, в байтах.

FilesystemMainPathTotalINodes

Общее количество инодов на том разделе, где смонтирован основной путь ClickHouse. Если он меньше 25 миллионов, это указывает на неправильную конфигурацию.

FilesystemMainPathUsedBytes

Использованные байты на том разделе, где смонтирован основной путь ClickHouse.

FilesystemMainPathUsedINodes

Количество использованных инодов на том разделе, где смонтирован основной путь ClickHouse. Это значение в основном соответствует количеству файлов.

HTTPThreads

Количество потоков в сервере HTTP-интерфейса (без TLS).

InterserverThreads

Количество потоков в сервере протокола связи реплик (без TLS).

Jitter

Разница во времени, когда поток для вычисления асинхронных метрик был запланирован на пробуждение и временем, когда он фактически пробудился. Косвенный показатель общей задержки системы и ее отзывчивости.

LoadAverageN

Общая нагрузка системы, усредненная с экспоненциальным сглаживанием за 1 минуту. Нагрузка представляет количество потоков во всех процессах (сущностях планирования ядра ОС), которые в данный момент работают на ЦП или ожидают ввода-вывода, или готовы к выполнению, но не планируются в данный момент. Это число включает все процессы, а не только clickhouse-server. Нормальное значение может быть больше количества ядер ЦП, если система перегружена, и многие процессы готовы к выполнению, но ожидают ЦП или ввода-вывода.

MMapCacheCells

Количество файлов, открытых с помощью mmap (отображенные в памяти). Это используется для запросов с установленным параметром local_filesystem_read_method на mmap. Файлы, открытые с помощью mmap, хранятся в кэше, чтобы избежать затратных сбросов TLB.

MarkCacheBytes

Общий размер кэша меток в байтах.

MarkCacheFiles

Общее количество файлов меток, кэшированных в кэше меток.

MaxPartCountForPartition

Максимальное количество частей на партицию во всех партициях всех таблиц семейства MergeTree. Значения больше 300 указывают на неправильную настройку, перегрузку или массовую загрузку данных.

MemoryCode

Количество виртуальной памяти, отображенной для страниц машинного кода процесса сервера, в байтах.

MemoryDataAndStack

Количество виртуальной памяти, отображенной для использования стека и для выделенной памяти, в байтах. Не уточняется, включает ли она стеки на каждую нить и большую часть выделенной памяти, которая выделяется с помощью системного вызова 'mmap'. Эта метрика существует только для полноты. Я рекомендую использовать метрику MemoryResident для мониторинга.

MemoryResidentMax

Максимальное количество физической памяти, используемой процессом сервера, в байтах.

MemoryResident

Количество физической памяти, используемой процессом сервера, в байтах.

MemoryShared

Количество памяти, используемой процессом сервера, которая также разделяется с другими процессами, в байтах. ClickHouse не использует разделяемую память, но какая-то память может быть помечена ОС как разделяемая по своим причинам. Эта метрика не имеет большого смысла для наблюдения, и она существует только для полноты.

MemoryVirtual

Размер пространства виртуальных адресов, выделенного процессом сервера, в байтах. Размер пространства виртуальных адресов обычно значительно больше, чем потребление физической памяти, и не должен использоваться как оценка потребления памяти. Большие значения этой метрики совершенно нормальны и имеют только технический смысл.

MySQLThreads

Количество потоков в сервере протокола совместимости MySQL.

NetworkReceiveBytes_name

Количество байт, полученных через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkReceiveDrop_name

Количество байт, потерянных при получении через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkReceiveErrors_name

Количество ошибок, произошедших при получении через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkReceivePackets_name

Количество сетевых пакетов, полученных через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendBytes_name

Количество байт, отправленных через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendDrop_name

Количество раз, когда пакет был потерян во время отправки через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendErrors_name

Количество ошибок (например, повторная передача TCP), произошедших при отправке через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendPackets_name

Количество сетевых пакетов, отправленных через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

NumberOfDatabases

Общее количество баз данных на сервере.

NumberOfDetachedByUserParts

Общее количество частей, отделенных от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH (в отличие от неожиданных, поврежденных или проигнорированных частей). Сервер не учитывает отделенные части, их можно удалить.

NumberOfDetachedParts

Общее количество частей, отделенных от таблиц MergeTree. Часть может быть отделена пользователем с помощью запроса ALTER TABLE DETACH или самим сервером, если часть повреждена, неожиданна или не нужна. Сервер не учитывает отделенные части, их можно удалить.

NumberOfTables

Общее количество таблиц, суммированное по всем базам данных на сервере, за исключением баз данных, которые не могут содержать таблицы MergeTree. Исключенные механизмы баз данных - это те, которые генерируют набор таблиц на лету, такие как Lazy, MySQL, PostgreSQL, SQLite.

OSContextSwitches

Количество переключений контекста, которые система претерпела на хост-машине. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

OSGuestNiceTime

Соотношение времени, затраченного на выполнение виртуального ЦП для гостевых операционных систем под управлением ядра Linux, когда гость был установлен на более высокий приоритет (см. man procfs). Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет отношения к ClickHouse, но все же существует для полноты. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].

OSGuestNiceTimeCPU_N

Соотношение времени, затраченного на выполнение виртуального ЦП для гостевых операционных систем под управлением ядра Linux, когда гость был установлен на более высокий приоритет (см. man procfs). Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет отношения к ClickHouse, но все же существует для полноты. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].

OSGuestNiceTimeNormalized

Значение похоже на OSGuestNiceTime, но делится на количество ядер ЦП, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения данной метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов.

OSGuestTime

Соотношение времени, затраченного на выполнение виртуального ЦП для гостевых операционных систем под управлением ядра Linux (см. man procfs). Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет отношения к ClickHouse, но все же существует для полноты. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].

OSGuestTimeCPU_N

Соотношение времени, затраченного на выполнение виртуального ЦП для гостевых операционных систем под управлением ядра Linux (см. man procfs). Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет отношения к ClickHouse, но все же существует для полноты. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].

OSGuestTimeNormalized

Значение похоже на OSGuestTime, но делится на количество ядер ЦП, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения данной метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов.

OSIOWaitTime

Соотношение времени, когда ядро ЦП не выполняло код, но при этом ядро ОС не запускало никаких других процессов на этом ЦП, так как процессы ожидали ввода-вывода. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].

OSIOWaitTimeCPU_N

Соотношение времени, когда ядро ЦП не выполняло код, но при этом ядро ОС не запускало никаких других процессов на этом ЦП, так как процессы ожидали ввода-вывода. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].

OSIOWaitTimeNormalized

Значение похоже на OSIOWaitTime, но делится на количество ядер ЦП, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения данной метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов.

OSIdleTime

Соотношение времени, в течение которого ядро ЦП было бездействующим (даже не готовым к запуску процесса, ожидающего ввода-вывода) с точки зрения ядра ОС. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда ЦП использовался недостаточно из-за причин, не зависящих от ЦП (нагрузки на память, остановки конвейера, ошибки предсказания ветвления и т. д.). Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].

OSIdleTimeCPU_N

Соотношение времени, в течение которого ядро ЦП было бездействующим (даже не готовым к запуску процесса, ожидающего ввода-вывода) с точки зрения ядра ОС. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда ЦП использовался недостаточно из-за причин, не зависящих от ЦП (нагрузки на память, остановки конвейера, ошибки предсказания ветвления и т. д.). Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].

OSIdleTimeNormalized

Значение похоже на OSIdleTime, но делится на количество ядер ЦП, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения данной метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов.

OSInterrupts

Количество прерываний на хост-машине. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

OSIrqTime

Соотношение времени, затраченного на выполнение запросов аппаратных прерываний на ЦП. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную настройку оборудования или очень высокую сетевую нагрузку. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].

OSIrqTimeCPU_N

Соотношение времени, затраченного на выполнение запросов аппаратных прерываний на ЦП. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную настройку оборудования или очень высокую сетевую нагрузку. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].

OSIrqTimeNormalized

Значение похоже на OSIrqTime, но делится на количество ядер ЦП, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения данной метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов.

OSMemoryAvailable

Количество памяти, доступной для использования программами, в байтах. Это очень похоже на метрику OSMemoryFreePlusCached. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryBuffers

Количество памяти, используемой буферами ядра ОС, в байтах. Это обычно должно быть небольшим значением, и большие значения могут указывать на неправильную настройку ОС. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryCached

Количество памяти, используемой кэшем страниц ОС, в байтах. Обычно почти вся доступная память используется кэшем страниц ОС - высокие значения этой метрики нормальны и ожидаемы. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryFreePlusCached

Количество свободной памяти плюс память кэша страниц ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень похоже на OSMemoryAvailable. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryFreeWithoutCached

Объем свободной памяти на хост-системе в байтах. Это значение не включает память, используемую памятью кеша страниц ОС, в байтах. Память кеша страниц также доступна для использования программами, поэтому значение этой метрики может быть запутанным. Вместо этого смотрите метрику OSMemoryAvailable. Для удобства мы также предоставляем метрику OSMemoryFreePlusCached, которая должна быть похожа на OSMemoryAvailable. Смотрите также https://www.linuxatemyram.com/. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryTotal

Общее количество памяти на хост-системе в байтах.

OSNiceTime

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].

OSNiceTimeCPU_N

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].

OSNiceTimeNormalized

Значение похоже на OSNiceTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от числа ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неоднородное, и все равно получать метрику среднему использованию ресурсов.

OSOpenFiles

Общее количество открытых файлов на хост-машине. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server.

OSProcessesBlocked

Количество потоков, заблокированных в ожидании завершения ввода-вывода (man procfs). Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server.

OSProcessesCreated

Количество созданных процессов. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server.

OSProcessesRunning

Количество исполняемых (работающих или готовых к выполнению) потоков операционной системой. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server.

OSSoftIrqTime

Соотношение времени, потраченного на выполнение запросов программных прерываний на CPU. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работающее на системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].

OSSoftIrqTimeCPU_N

Соотношение времени, потраченного на выполнение запросов программных прерываний на CPU. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работающее на системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].

OSSoftIrqTimeNormalized

Значение похоже на OSSoftIrqTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неоднородное, и все равно получать метрику среднему использованию ресурсов.

OSStealTime

Соотношение времени, проведенного в других операционных системах CPU при работе в виртуализированной среде. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Не все виртуализированные среды предоставляют эту метрику, и большинство из них этого не делают. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].

OSStealTimeCPU_N

Соотношение времени, проведенного в других операционных системах CPU при работе в виртуализированной среде. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Не все виртуализированные среды предоставляют эту метрику, и большинство из них этого не делают. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].

OSStealTimeNormalized

Значение похоже на OSStealTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неоднородное, и все равно получать метрику среднему использованию ресурсов.

OSSystemTime

Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].

OSSystemTimeCPU_N

Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].

OSSystemTimeNormalized

Значение похоже на OSSystemTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неоднородное, и все равно получать метрику среднему использованию ресурсов.

OSThreadsRunnable

Общее количество «выполняемых» потоков, как это видит планировщик ядра ОС.

OSThreadsTotal

Общее количество потоков, как это видит планировщик ядра ОС.

OSUptime

Время работы хост-сервера (машины, на которой работает ClickHouse) в секундах.

OSUserTime

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был недозагружен по причинам, связанным с его внутренними процессами (загрузки памяти, зависания конвейера, ошибки предсказания ветвлений, работа другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].

OSUserTimeCPU_N

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был недозагружен по причинам, связанным с его внутренними процессами (загрузки памяти, зависания конвейера, ошибки предсказания ветвлений, работа другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].

OSUserTimeNormalized

Значение похоже на OSUserTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неоднородное, и все равно получать метрику среднему использованию ресурсов.

PostgreSQLThreads

Количество потоков в сервере протокола совместимости с PostgreSQL.

QueryCacheBytes

Общий размер кеша запросов в байтах.

QueryCacheEntries

Общее количество записей в кеше запросов.

ReplicasMaxAbsoluteDelay

Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, которая еще должна быть реплицирована, по распределенным таблицам. Очень высокое значение указывает на реплику без данных.

ReplicasMaxInsertsInQueue

Максимальное количество операций INSERT в очереди (еще не реплицированы) по распределенным таблицам.

ReplicasMaxMergesInQueue

Максимальное количество операций слияния в очереди (еще не применены) по распределенным таблицам.

ReplicasMaxQueueSize

Максимальный размер очереди (в количестве операций, таких как получение, слияние) по распределенным таблицам.

ReplicasMaxRelativeDelay

Максимальная разница между задержкой реплики и задержкой самой актуальной реплики той же таблицы по распределенным таблицам.

ReplicasSumInsertsInQueue

Сумма операций INSERT в очереди (еще не реплицированы) по распределенным таблицам.

ReplicasSumMergesInQueue

Сумма операций слияния в очереди (еще не применены) по распределенным таблицам.

ReplicasSumQueueSize

Суммарный размер очереди (в количестве операций, таких как получение, слияние) по распределенным таблицам.

TCPThreads

Количество потоков в сервере протокола TCP (без TLS).

Temperature_N

Температура соответствующего устройства в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/thermal

Temperature_name

Температура, сообщаемая соответствующим монитором оборудования и соответствующим датчиком в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon

TotalBytesOfMergeTreeTables

Общее количество байт (сжатых, включая данные и индексы), хранящихся во всех таблицах семейства MergeTree.

TotalPartsOfMergeTreeTables

Общее количество частей данных во всех таблицах семейства MergeTree. Числа больше 10 000 негативно скажутся на времени запуска сервера и могут указывать на неразумный выбор ключа партиции.

TotalPrimaryKeyBytesInMemory

Общее количество памяти (в байтах), используемое значениями первичного ключа (учитывает только активные части).

TotalPrimaryKeyBytesInMemoryAllocated

Общее количество памяти (в байтах), зарезервированной для значений первичного ключа (учитывает только активные части).

TotalRowsOfMergeTreeTables

Общее количество строк (записей), хранящихся во всех таблицах семейства MergeTree.

UncompressedCacheBytes

Общий размер несжатого кеша в байтах. Несжатый кеш обычно не улучшает производительность и следует в основном избегать.

UncompressedCacheCells

Общее количество записей в несжатом кеше. Каждая запись представляет собой распакованный блок данных. Несжатый кеш обычно не улучшает производительность и следует в основном избегать.

Uptime

Время работы сервера в секундах. Оно включает время, затраченное на инициализацию сервера перед принятием соединений.

jemalloc.active

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.allocated

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.dirty_purged

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.muzzy_purged

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pactive

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pdirty

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pmuzzy

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_runs

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_threads

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.run_intervals

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.epoch

Внутренний инкрементальный номер обновления статистики jemalloc (аллокатор памяти Джейсона Эванса), используемый во всех других метриках jemalloc.

jemalloc.mapped

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.metadata

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.metadata_thp

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.resident

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.retained

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

jemalloc.prof.active

Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html

Смотрите также

  • Мониторинг — Основные концепции мониторинга ClickHouse.
  • system.metrics — Содержит мгновенно рассчитанные метрики.
  • system.events — Содержит ряд произошедших событий.
  • system.metric_log — Содержит историю значений метрик из таблиц system.metrics и system.events.