system.asynchronous_metrics
Данные в этой системной таблице хранятся локально на каждом узле в ClickHouse Cloud. Для получения полного представления о всех данных необходимо использовать функцию clusterAllReplicas
. Подробности см. здесь.
Содержит метрики, которые вычисляются периодически в фоновом режиме. Например, количество используемой оперативной памяти.
Колонки:
metric
(String) — Название метрики.value
(Float64) — Значение метрики.description
(String) - Описание метрики.
Пример
Описание метрик
AsynchronousHeavyMetricsCalculationTimeSpent
Время в секундах, затраченное на вычисление асинхронных тяжелых (связанных с таблицами) метрик (это накладные расходы асинхронных метрик).
AsynchronousHeavyMetricsUpdateInterval
Интервал обновления тяжелых (связанных с таблицами) метрик.
AsynchronousMetricsCalculationTimeSpent
Время в секундах, затраченное на вычисление асинхронных метрик (это накладные расходы асинхронных метрик).
AsynchronousMetricsUpdateInterval
Интервал обновления метрик.
BlockActiveTime_name
Время в секундах, в течение которого блочное устройство имело запросы ввода-вывода в очереди. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardBytes_name
Количество отброшенных байт на блочном устройстве. Эти операции имеют отношение к SSD. Операции по удалению не используются ClickHouse, но могут быть использованы другими процессами в системе. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardMerges_name
Количество операций удаления, запрошенных от блочного устройства и объединенных вместе планировщиком ввода-вывода ОС. Эти операции имеют отношение к SSD. Операции по удалению не используются ClickHouse, но могут быть использованы другими процессами в системе. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardOps_name
Количество операций удаления, запрошенных от блочного устройства. Эти операции имеют отношение к SSD. Операции по удалению не используются ClickHouse, но могут быть использованы другими процессами в системе. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardTime_name
Время в секундах, затраченное на операции удаления, запрошенные от блочного устройства, суммированное по всем операциям. Эти операции имеют отношение к SSD. Операции по удалению не используются ClickHouse, но могут быть использованы другими процессами в системе. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockInFlightOps_name
Это значение подсчитывает количество запросов ввода-вывода, которые были отправлены драйверу устройства, но еще не завершены. Оно не включает запросы ввода-вывода, которые находятся в очереди, но еще не отправлены драйверу устройства. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockQueueTime_name
Это значение подсчитывает количество миллисекунд, которые запросы ввода-вывода ожидали на этом блочном устройстве. Если есть несколько запросов ввода-вывода в ожидании, это значение увеличится как произведение количества миллисекунд на количество ожидающих запросов. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadBytes_name
Количество байт, прочитанных с блочного устройства. Оно может быть меньше количества байт, прочитанных из файловой системы из-за использования кэша страниц ОС, который сохраняет ввод-вывод. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadMerges_name
Количество операций чтения, запрошенных с блочного устройства и объединенных вместе планировщиком ввода-вывода ОС. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadOps_name
Количество операций чтения, запрошенных с блочного устройства. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadTime_name
Время в секундах, затраченное на операции чтения, запрошенные с блочного устройства, суммированное по всем операциям. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteBytes_name
Количество байт, записанных на блочное устройство. Оно может быть меньше количества байт, записанных в файловую систему из-за использования кэша страниц ОС, который сохраняет ввод-вывод. Запись на блочное устройство может произойти позже соответствующей записи в файловую систему из-за кеширования записи. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteMerges_name
Количество операций записи, запрошенных от блочного устройства и объединенных вместе планировщиком ввода-вывода ОС. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteOps_name
Количество операций записи, запрошенных от блочного устройства. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteTime_name
Время в секундах, затраченное на операции записи, запрошенные от блочного устройства, суммированное по всем операциям. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
CPUFrequencyMHz_name
Текущая частота процессора в МГц. Большинство современных процессоров динамически регулируют частоту для экономии энергии и увеличения производительности.
CompiledExpressionCacheBytes
Общее количество байт, используемых для кэша JIT-скомпилированного кода.
CompiledExpressionCacheCount
Общее количество записей в кэше JIT-скомпилированного кода.
DiskAvailable_name
Доступные байты на диске (виртуальная файловая система). Удаленные файловые системы могут показать большое значение, например, 16 EiB.
DiskTotal_name
Общий размер диска в байтах (виртуальная файловая система). Удаленные файловые системы могут показать большое значение, например, 16 EiB.
DiskUnreserved_name
Доступные байты на диске (виртуальная файловая система) без резервов для слияний, загрузок и перемещений. Удаленные файловые системы могут показать большое значение, например, 16 EiB.
DiskUsed_name
Использованные байты на диске (виртуальная файловая система). Удаленные файловые системы не всегда предоставляют эту информацию.
FilesystemCacheBytes
Общее количество байт в виртуальной файловой системе cache
. Этот кэш хранится на диске.
FilesystemCacheFiles
Общее количество сегментов файлов, кэшированных в виртуальной файловой системе cache
. Этот кэш хранится на диске.
FilesystemLogsPathAvailableBytes
Доступные байты на том разделе, где смонтирован путь логов ClickHouse. Если это значение приближается к нулю, вам следует настроить ротацию логов в конфигурационном файле.
FilesystemLogsPathAvailableINodes
Количество доступных инодов на том разделе, где смонтирован путь логов ClickHouse.
FilesystemLogsPathTotalBytes
Размер раздела, на котором смонтирован путь логов ClickHouse, в байтах. Рекомендуется иметь не менее 10 ГБ для логов.
FilesystemLogsPathTotalINodes
Общее количество инодов на том разделе, где смонтирован путь логов ClickHouse.
FilesystemLogsPathUsedBytes
Использованные байты на том разделе, где смонтирован путь логов ClickHouse.
FilesystemLogsPathUsedINodes
Количество использованных инодов на том разделе, где смонтирован путь логов ClickHouse.
FilesystemMainPathAvailableBytes
Доступные байты на том разделе, где смонтирован основной путь ClickHouse.
FilesystemMainPathAvailableINodes
Количество доступных инодов на том разделе, где смонтирован основной путь ClickHouse. Если он близок к нулю, это указывает на неправильную конфигурацию, и вы получите сообщение 'нет места на устройстве', даже если диск не заполнен.
FilesystemMainPathTotalBytes
Размер раздела, на котором смонтирован основной путь ClickHouse, в байтах.
FilesystemMainPathTotalINodes
Общее количество инодов на том разделе, где смонтирован основной путь ClickHouse. Если он меньше 25 миллионов, это указывает на неправильную конфигурацию.
FilesystemMainPathUsedBytes
Использованные байты на том разделе, где смонтирован основной путь ClickHouse.
FilesystemMainPathUsedINodes
Количество использованных инодов на том разделе, где смонтирован основной путь ClickHouse. Это значение в основном соответствует количеству файлов.
HTTPThreads
Количество потоков в сервере HTTP-интерфейса (без TLS).
InterserverThreads
Количество потоков в сервере протокола связи реплик (без TLS).
Jitter
Разница во времени, когда поток для вычисления асинхронных метрик был запланирован на пробуждение и временем, когда он фактически пробудился. Косвенный показатель общей задержки системы и ее отзывчивости.
LoadAverageN
Общая нагрузка системы, усредненная с экспоненциальным сглаживанием за 1 минуту. Нагрузка представляет количество потоков во всех процессах (сущностях планирования ядра ОС), которые в данный момент работают на ЦП или ожидают ввода-вывода, или готовы к выполнению, но не планируются в данный момент. Это число включает все процессы, а не только clickhouse-server. Нормальное значение может быть больше количества ядер ЦП, если система перегружена, и многие процессы готовы к выполнению, но ожидают ЦП или ввода-вывода.
MMapCacheCells
Количество файлов, открытых с помощью mmap
(отображенные в памяти). Это используется для запросов с установленным параметром local_filesystem_read_method
на mmap
. Файлы, открытые с помощью mmap
, хранятся в кэше, чтобы избежать затратных сбросов TLB.
MarkCacheBytes
Общий размер кэша меток в байтах.
MarkCacheFiles
Общее количество файлов меток, кэшированных в кэше меток.
MaxPartCountForPartition
Максимальное количество частей на партицию во всех партициях всех таблиц семейства MergeTree. Значения больше 300 указывают на неправильную настройку, перегрузку или массовую загрузку данных.
MemoryCode
Количество виртуальной памяти, отображенной для страниц машинного кода процесса сервера, в байтах.
MemoryDataAndStack
Количество виртуальной памяти, отображенной для использования стека и для выделенной памяти, в байтах. Не уточняется, включает ли она стеки на каждую нить и большую часть выделенной памяти, которая выделяется с помощью системного вызова 'mmap'. Эта метрика существует только для полноты. Я рекомендую использовать метрику MemoryResident
для мониторинга.
MemoryResidentMax
Максимальное количество физической памяти, используемой процессом сервера, в байтах.
MemoryResident
Количество физической памяти, используемой процессом сервера, в байтах.
MemoryShared
Количество памяти, используемой процессом сервера, которая также разделяется с другими процессами, в байтах. ClickHouse не использует разделяемую память, но какая-то память может быть помечена ОС как разделяемая по своим причинам. Эта метрика не имеет большого смысла для наблюдения, и она существует только для полноты.
MemoryVirtual
Размер пространства виртуальных адресов, выделенного процессом сервера, в байтах. Размер пространства виртуальных адресов обычно значительно больше, чем потребление физической памяти, и не должен использоваться как оценка потребления памяти. Большие значения этой метрики совершенно нормальны и имеют только технический смысл.
MySQLThreads
Количество потоков в сервере протокола совместимости MySQL.
NetworkReceiveBytes_name
Количество байт, полученных через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceiveDrop_name
Количество байт, потерянных при получении через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceiveErrors_name
Количество ошибок, произошедших при получении через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceivePackets_name
Количество сетевых пакетов, полученных через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendBytes_name
Количество байт, отправленных через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendDrop_name
Количество раз, когда пакет был потерян во время отправки через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendErrors_name
Количество ошибок (например, повторная передача TCP), произошедших при отправке через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendPackets_name
Количество сетевых пакетов, отправленных через сетевой интерфейс. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
NumberOfDatabases
Общее количество баз данных на сервере.
NumberOfDetachedByUserParts
Общее количество частей, отделенных от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH
(в отличие от неожиданных, поврежденных или проигнорированных частей). Сервер не учитывает отделенные части, их можно удалить.
NumberOfDetachedParts
Общее количество частей, отделенных от таблиц MergeTree. Часть может быть отделена пользователем с помощью запроса ALTER TABLE DETACH
или самим сервером, если часть повреждена, неожиданна или не нужна. Сервер не учитывает отделенные части, их можно удалить.
NumberOfTables
Общее количество таблиц, суммированное по всем базам данных на сервере, за исключением баз данных, которые не могут содержать таблицы MergeTree. Исключенные механизмы баз данных - это те, которые генерируют набор таблиц на лету, такие как Lazy
, MySQL
, PostgreSQL
, SQLite
.
OSContextSwitches
Количество переключений контекста, которые система претерпела на хост-машине. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
OSGuestNiceTime
Соотношение времени, затраченного на выполнение виртуального ЦП для гостевых операционных систем под управлением ядра Linux, когда гость был установлен на более высокий приоритет (см. man procfs
). Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет отношения к ClickHouse, но все же существует для полноты. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].
OSGuestNiceTimeCPU_N
Соотношение времени, затраченного на выполнение виртуального ЦП для гостевых операционных систем под управлением ядра Linux, когда гость был установлен на более высокий приоритет (см. man procfs
). Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет отношения к ClickHouse, но все же существует для полноты. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].
OSGuestNiceTimeNormalized
Значение похоже на OSGuestNiceTime
, но делится на количество ядер ЦП, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения данной метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов.
OSGuestTime
Соотношение времени, затраченного на выполнение виртуального ЦП для гостевых операционных систем под управлением ядра Linux (см. man procfs
). Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет отношения к ClickHouse, но все же существует для полноты. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].
OSGuestTimeCPU_N
Соотношение времени, затраченного на выполнение виртуального ЦП для гостевых операционных систем под управлением ядра Linux (см. man procfs
). Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет отношения к ClickHouse, но все же существует для полноты. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].
OSGuestTimeNormalized
Значение похоже на OSGuestTime
, но делится на количество ядер ЦП, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения данной метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов.
OSIOWaitTime
Соотношение времени, когда ядро ЦП не выполняло код, но при этом ядро ОС не запускало никаких других процессов на этом ЦП, так как процессы ожидали ввода-вывода. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].
OSIOWaitTimeCPU_N
Соотношение времени, когда ядро ЦП не выполняло код, но при этом ядро ОС не запускало никаких других процессов на этом ЦП, так как процессы ожидали ввода-вывода. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].
OSIOWaitTimeNormalized
Значение похоже на OSIOWaitTime
, но делится на количество ядер ЦП, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения данной метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов.
OSIdleTime
Соотношение времени, в течение которого ядро ЦП было бездействующим (даже не готовым к запуску процесса, ожидающего ввода-вывода) с точки зрения ядра ОС. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда ЦП использовался недостаточно из-за причин, не зависящих от ЦП (нагрузки на память, остановки конвейера, ошибки предсказания ветвления и т. д.). Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].
OSIdleTimeCPU_N
Соотношение времени, в течение которого ядро ЦП было бездействующим (даже не готовым к запуску процесса, ожидающего ввода-вывода) с точки зрения ядра ОС. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда ЦП использовался недостаточно из-за причин, не зависящих от ЦП (нагрузки на память, остановки конвейера, ошибки предсказания ветвления и т. д.). Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].
OSIdleTimeNormalized
Значение похоже на OSIdleTime
, но делится на количество ядер ЦП, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения данной метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов.
OSInterrupts
Количество прерываний на хост-машине. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
OSIrqTime
Соотношение времени, затраченного на выполнение запросов аппаратных прерываний на ЦП. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную настройку оборудования или очень высокую сетевую нагрузку. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].
OSIrqTimeCPU_N
Соотношение времени, затраченного на выполнение запросов аппаратных прерываний на ЦП. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную настройку оборудования или очень высокую сетевую нагрузку. Значение для одного ядра ЦП будет находиться в интервале [0..1]. Значение для всех ядер ЦП рассчитывается как сумма по ним [0..число ядер].
OSIrqTimeNormalized
Значение похоже на OSIrqTime
, но делится на количество ядер ЦП, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения данной метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов.
OSMemoryAvailable
Количество памяти, доступной для использования программами, в байтах. Это очень похоже на метрику OSMemoryFreePlusCached
. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryBuffers
Количество памяти, используемой буферами ядра ОС, в байтах. Это обычно должно быть небольшим значением, и большие значения могут указывать на неправильную настройку ОС. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryCached
Количество памяти, используемой кэшем страниц ОС, в байтах. Обычно почти вся доступная память используется кэшем страниц ОС - высокие значения этой метрики нормальны и ожидаемы. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryFreePlusCached
Количество свободной памяти плюс память кэша страниц ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень похоже на OSMemoryAvailable
. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryFreeWithoutCached
Объем свободной памяти на хост-системе в байтах. Это значение не включает память, используемую памятью кеша страниц ОС, в байтах. Память кеша страниц также доступна для использования программами, поэтому значение этой метрики может быть запутанным. Вместо этого смотрите метрику OSMemoryAvailable
. Для удобства мы также предоставляем метрику OSMemoryFreePlusCached
, которая должна быть похожа на OSMemoryAvailable. Смотрите также https://www.linuxatemyram.com/. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryTotal
Общее количество памяти на хост-системе в байтах.
OSNiceTime
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].
OSNiceTimeCPU_N
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].
OSNiceTimeNormalized
Значение похоже на OSNiceTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от числа ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неоднородное, и все равно получать метрику среднему использованию ресурсов.
OSOpenFiles
Общее количество открытых файлов на хост-машине. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server.
OSProcessesBlocked
Количество потоков, заблокированных в ожидании завершения ввода-вывода (man procfs
). Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server.
OSProcessesCreated
Количество созданных процессов. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server.
OSProcessesRunning
Количество исполняемых (работающих или готовых к выполнению) потоков операционной системой. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server.
OSSoftIrqTime
Соотношение времени, потраченного на выполнение запросов программных прерываний на CPU. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работающее на системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].
OSSoftIrqTimeCPU_N
Соотношение времени, потраченного на выполнение запросов программных прерываний на CPU. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работающее на системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].
OSSoftIrqTimeNormalized
Значение похоже на OSSoftIrqTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неоднородное, и все равно получать метрику среднему использованию ресурсов.
OSStealTime
Соотношение времени, проведенного в других операционных системах CPU при работе в виртуализированной среде. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Не все виртуализированные среды предоставляют эту метрику, и большинство из них этого не делают. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].
OSStealTimeCPU_N
Соотношение времени, проведенного в других операционных системах CPU при работе в виртуализированной среде. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Не все виртуализированные среды предоставляют эту метрику, и большинство из них этого не делают. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].
OSStealTimeNormalized
Значение похоже на OSStealTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неоднородное, и все равно получать метрику среднему использованию ресурсов.
OSSystemTime
Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].
OSSystemTimeCPU_N
Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].
OSSystemTimeNormalized
Значение похоже на OSSystemTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неоднородное, и все равно получать метрику среднему использованию ресурсов.
OSThreadsRunnable
Общее количество «выполняемых» потоков, как это видит планировщик ядра ОС.
OSThreadsTotal
Общее количество потоков, как это видит планировщик ядра ОС.
OSUptime
Время работы хост-сервера (машины, на которой работает ClickHouse) в секундах.
OSUserTime
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был недозагружен по причинам, связанным с его внутренними процессами (загрузки памяти, зависания конвейера, ошибки предсказания ветвлений, работа другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].
OSUserTimeCPU_N
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика системного уровня, которая включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был недозагружен по причинам, связанным с его внутренними процессами (загрузки памяти, зависания конвейера, ошибки предсказания ветвлений, работа другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..число ядер].
OSUserTimeNormalized
Значение похоже на OSUserTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неоднородное, и все равно получать метрику среднему использованию ресурсов.
PostgreSQLThreads
Количество потоков в сервере протокола совместимости с PostgreSQL.
QueryCacheBytes
Общий размер кеша запросов в байтах.
QueryCacheEntries
Общее количество записей в кеше запросов.
ReplicasMaxAbsoluteDelay
Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, которая еще должна быть реплицирована, по распределенным таблицам. Очень высокое значение указывает на реплику без данных.
ReplicasMaxInsertsInQueue
Максимальное количество операций INSERT в очереди (еще не реплицированы) по распределенным таблицам.
ReplicasMaxMergesInQueue
Максимальное количество операций слияния в очереди (еще не применены) по распределенным таблицам.
ReplicasMaxQueueSize
Максимальный размер очереди (в количестве операций, таких как получение, слияние) по распределенным таблицам.
ReplicasMaxRelativeDelay
Максимальная разница между задержкой реплики и задержкой самой актуальной реплики той же таблицы по распределенным таблицам.
ReplicasSumInsertsInQueue
Сумма операций INSERT в очереди (еще не реплицированы) по распределенным таблицам.
ReplicasSumMergesInQueue
Сумма операций слияния в очереди (еще не применены) по распределенным таблицам.
ReplicasSumQueueSize
Суммарный размер очереди (в количестве операций, таких как получение, слияние) по распределенным таблицам.
TCPThreads
Количество потоков в сервере протокола TCP (без TLS).
Temperature_N
Температура соответствующего устройства в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/thermal
Temperature_name
Температура, сообщаемая соответствующим монитором оборудования и соответствующим датчиком в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon
TotalBytesOfMergeTreeTables
Общее количество байт (сжатых, включая данные и индексы), хранящихся во всех таблицах семейства MergeTree.
TotalPartsOfMergeTreeTables
Общее количество частей данных во всех таблицах семейства MergeTree. Числа больше 10 000 негативно скажутся на времени запуска сервера и могут указывать на неразумный выбор ключа партиции.
TotalPrimaryKeyBytesInMemory
Общее количество памяти (в байтах), используемое значениями первичного ключа (учитывает только активные части).
TotalPrimaryKeyBytesInMemoryAllocated
Общее количество памяти (в байтах), зарезервированной для значений первичного ключа (учитывает только активные части).
TotalRowsOfMergeTreeTables
Общее количество строк (записей), хранящихся во всех таблицах семейства MergeTree.
UncompressedCacheBytes
Общий размер несжатого кеша в байтах. Несжатый кеш обычно не улучшает производительность и следует в основном избегать.
UncompressedCacheCells
Общее количество записей в несжатом кеше. Каждая запись представляет собой распакованный блок данных. Несжатый кеш обычно не улучшает производительность и следует в основном избегать.
Uptime
Время работы сервера в секундах. Оно включает время, затраченное на инициализацию сервера перед принятием соединений.
jemalloc.active
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.allocated
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.dirty_purged
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.muzzy_purged
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pactive
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pdirty
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pmuzzy
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_runs
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_threads
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.run_intervals
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.epoch
Внутренний инкрементальный номер обновления статистики jemalloc (аллокатор памяти Джейсона Эванса), используемый во всех других метриках jemalloc
.
jemalloc.mapped
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.metadata
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.metadata_thp
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.resident
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.retained
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
jemalloc.prof.active
Внутренняя метрика низкоуровневого альлокатора памяти (jemalloc). Смотрите https://jemalloc.net/jemalloc.3.html
Смотрите также
- Мониторинг — Основные концепции мониторинга ClickHouse.
- system.metrics — Содержит мгновенно рассчитанные метрики.
- system.events — Содержит ряд произошедших событий.
- system.metric_log — Содержит историю значений метрик из таблиц
system.metrics
иsystem.events
.