Перейти к основному содержимому
Перейти к основному содержимому

approx_top_sum

Возвращает массив приблизительно наиболее частых значений и их количеств в указанной колонке. Результирующий массив отсортирован в порядке убывания приблизительной частоты значений (а не по самим значениям). Дополнительно учитывается вес значения.

Эта функция не обеспечивает гарантированный результат. В определенных ситуациях могут возникать ошибки, и она может возвращать частые значения, которые не являются наиболее частыми.

Мы рекомендуем использовать значение N < 10; производительность снижается с большими значениями N. Максимальное значение N = 65536.

Параметры

  • N — Количество элементов для возврата. Необязательный. Значение по умолчанию: 10.
  • reserved — Определяет, сколько ячеек зарезервировано для значений. Если uniq(column) > reserved, результат функции topK будет приблизительным. Необязательный. Значение по умолчанию: N * 3.

Аргументы

  • column — Значение для расчета частоты.
  • weight — Вес. Каждое значение учитывается weight раз для расчета частоты. UInt64.

Пример

Запрос:

Результат:

См. также