§

Вставьте или введите

§

Metrics

Символы 0
Символы (без пробелов) 0
Слова 0
Предложения 0
Абзацы 0
Время чтения
Время речи
§

Options

§

Наиболее частые слова

Слово Кол-во Частота

Большинство онлайн-счётчиков слов были написаны в эпоху, когда веб был ориентирован на английский язык, и они по-прежнему разбивают текст по ASCII-пробелам. Это ломается, стоит вставить китайский (пробелы между словами отсутствуют), арабский (письмо справа налево, слитные буквы) или деванагари (гласные огласовки присоединены к согласным). Этот инструмент использует нативный API браузера Intl.Segmenter, который содержит правила сегментации слов Unicode CLDR для каждого поддерживаемого скрипта. Для русского текста каждое слово, разделённое пробелом, считается отдельно, а счётчик символов подсчитывает кодовые точки Unicode, поэтому результат совпадает с тем, который ожидает носитель языка.

Как подсчитываются слова?

Этот инструмент подсчитывает слова с помощью встроенного API браузера Intl.Segmenter (Chrome 87+, Firefox 125+, Safari 14.1+), когда он доступен, — этот API корректно обрабатывает все скрипты: латиницу, китайский, арабский, деванагари, японский, корейский, кириллицу — с лингвистически точными границами слов на основе Unicode CLDR. Когда Intl.Segmenter недоступен, используется резервное юникод-регулярное выражение (/\p{L}+/gu), совпадающее с любой последовательностью букв Unicode. Большинство конкурирующих инструментов разбивают на ASCII-пробелах и молча неверно считают всё, что выходит за рамки латинского алфавита; этот — нет.

Как работает подсчёт

При каждом нажатии клавиши в браузере выполняются шесть шагов. Ни один из них не обращается к сети. Весь пайплайн выполняется менее чем за миллисекунду для обычного текста объёмом абзаца и обрабатывает рукопись из 100 000 слов без пропуска кадров.

  1. Ваш текст считывается из текстового поля и хранится в памяти браузера — ничего не покидает ваше устройство.
  2. Количество символов вычисляется с помощью оператора spread JavaScript ([...text].length) для подсчёта кодовых точек Unicode, поэтому эмодзи вроде 🙂 считается как 1 символ вне зависимости от внутренней кодировки UTF-16.
  3. Количество слов опирается на Intl.Segmenter с параметром granularity: 'word', фильтруя сегменты, где isWordLike равно true. Для китайского и японского текста, где слова не разделены пробелами, засчитывается один сегмент на символ.
  4. Количество предложений использует Intl.Segmenter с granularity: 'sentence', что позволяет лучше обрабатывать сокращения, многоточия и пограничные случаи пунктуации, чем простое разбиение по точке.
  5. Количество абзацев определяется разбиением по одной или нескольким пустым строкам (\n\s*\n) с фильтрацией пустых сегментов.
  6. Время чтения и речи вычисляется делением количества слов на настроенную скорость (по умолчанию: 200 — чтение, 130 — речь) и форматированием результата в минуты и секунды.

Зачем считать слова?

  • Ограничения по объёму эссе и заявок. Задания для университетов ограничивают личные заявления — например, 650 слов (Common App) или 4 000 символов с пробелами (UCAS). Знать свой счётчик заранее значит не делать срочных сокращений в последний момент.
  • SEO и контент-планирование. Команды по качеству поиска используют количество слов как приблизительный показатель глубины раскрытия темы, а лонгриды от 1 500 до 2 500 слов стабильно опережают короткие публикации по конкурентным запросам. Отслеживание счётчика в процессе написания удерживает черновики в этом диапазоне без искусственного раздувания.
  • Ограничения социальных сетей. X ограничивает посты до 280 символов, Instagram подписи — до 2 200, мета-описания — примерно до 160. Плитка символов показывает точное значение ещё до вставки в редактор платформы.
  • Расшифровки и оценка презентаций. Время чтения при 200 сл/мин соответствует среднему темпу чтения; время речи при 130 сл/мин — разговорной речи. Используйте оба показателя, чтобы прикинуть длину подкаст-сегмента, спланировать пятиминутный доклад или оценить хронометраж перед записью.

Типичные применения

Подсчёт слов и символов встречается в письменной работе, контент-производстве и разработке, причём юникод-осведомлённый движок инструмента особенно важен для команд, публикующих контент на нескольких языках:

  • Академическое письмо: отслеживайте прогресс к целевому объёму главы диссертации или проверяйте, что аннотация вписывается в лимит символов журнала перед подачей.
  • Маркетинговые и UX-тексты: измеряйте строку темы, заголовок hero или подпись кнопки CTA относительно бюджета символов, установленного дизайнером в Figma.
  • Написание речей и подкастинг: переводите скрипт в ожидаемую продолжительность, чтобы знать заранее, не выйдет ли доклад за рамки, до дня репетиции.

Как выглядит пример подсчёта слов?

Возьмём этот пример из трёх абзацев. The quick brown fox jumps over the lazy dog. Предложение выше — это панграмма: в нём встречается каждая буква английского алфавита, поэтому типографы и дизайнеры шрифтов используют её для предпросмотра гарнитуры. Панграммы восходят как минимум к XIX веку, когда телеграфисты использовали короткие предложения с полным набором букв для проверки точности передачи. Сегодня они встречаются в образцах шрифтов, тестах клавиатуры и тексте-заполнителе по умолчанию в каждом дизайн-приложении — от Figma до InDesign. Вставьте это в поле ввода, и плитки метрик покажут: 71 слово, 410 символов с пробелами, 340 символов без пробелов, 4 предложения, 3 абзаца, время чтения около 21 секунды при 200 сл/мин, время речи около 33 секунд при 130 сл/мин. Панель наиболее частых слов пропускает стоп-слова вроде the и a и выводит содержательные слова, которые преобладают — здесь это pangram, letter и sentence. Переключитесь на китайский, арабский или хинди — и каждая плитка пересчитается по правилам сегментации соответствующего скрипта.

Как подсчитываются слова?

В браузерах, поддерживающих Intl.Segmenter (Chrome 87+, Firefox 125+, Safari 14.1+), инструмент использует new Intl.Segmenter(locale, { granularity: 'word' }) и подсчитывает сегменты, где isWordLike равно true. Это корректно обрабатывает китайский, японский, арабский, деванагари и все другие юникод-скрипты. В старых браузерах резервное регулярное выражение /\p{L}+/gu совпадает с любой последовательностью букв Unicode — хорошо работает для языков с латинским алфавитом, но считает весь китайский или японский текст без пробелов как одно слово.

Почему счётчик отличается от MS Word?

Алгоритм подсчёта слов Microsoft Word является проприетарным и по-разному обрабатывает составные слова через дефис, сокращения и специальные символы в разных версиях. Этот инструмент считает «не» как одно слово (один сегмент isWordLike), тогда как Word может считать его как два. Для большинства прозы счётчики совпадают в пределах 1–2%; для текстов с дефисами расхождение может быть больше. Счётчики символов всегда совпадают при одинаковой UTF-8 строке источника.

Поддерживаются ли нелатинские скрипты (китайский, арабский, кириллица)?

Да. API Intl.Segmenter изначально поддерживает Unicode. Арабский и иврит (письмо справа налево) считаются корректно; кириллица и греческий считаются как обычные латиноподобные границы слов; китайский и японский дают один словоподобный сегмент на символ, поскольку эти письменные системы не используют пробелы между словами. Счётчик символов (через [...text].length) всегда подсчитывает кодовые точки Unicode вне зависимости от скрипта, поэтому эмодзи, символы CJK и буквы с диакритикой считаются как 1.

Загружается ли мой текст куда-либо?

Нет. Все вычисления выполняются внутри вкладки браузера с помощью нативных JavaScript API. Ничего не отправляется на серверы Ultim8Soft или какой-либо сторонний сервис. Вы можете проверить это, открыв DevTools браузера, перейдя на вкладку «Сеть», очистив лог, набрав что-нибудь в поле ввода и убедившись, что для шага подсчёта не появляется ни одного сетевого запроса.

Этот счётчик слов работает полностью в вашем браузере. Без загрузки, без аккаунта, без сторонних библиотек, без аналитики посчитанного текста. Вставьте любой текст на любом языке, наблюдайте, как семь плиток метрик обновляются по мере ввода, и скопируйте то, что нужно. Весь инструмент — это примерно 12 КБ JavaScript, загружаемых один раз и работающих офлайн после первого визита.