Question 1

Как подсчитываются слова?

Accepted Answer

Этот инструмент подсчитывает слова с помощью встроенного API браузера Intl.Segmenter (Chrome 87+, Firefox 125+, Safari 14.1+), когда он доступен, — этот API корректно обрабатывает все скрипты: латиницу, китайский, арабский, деванагари, японский, корейский, кириллицу — с лингвистически точными границами слов на основе Unicode CLDR. Когда Intl.Segmenter недоступен, используется резервное юникод-регулярное выражение (/\p{L}+/gu), совпадающее с любой последовательностью букв Unicode. Большинство конкурирующих инструментов разбивают на ASCII-пробелах и молча неверно считают всё, что выходит за рамки латинского алфавита; этот — нет.

Question 2

Как выглядит пример подсчёта слов?

Accepted Answer

Возьмём этот пример из трёх абзацев. The quick brown fox jumps over the lazy dog. Предложение выше — это панграмма: в нём встречается каждая буква английского алфавита, поэтому типографы и дизайнеры шрифтов используют её для предпросмотра гарнитуры. Панграммы восходят как минимум к XIX веку, когда телеграфисты использовали короткие предложения с полным набором букв для проверки точности передачи. Сегодня они встречаются в образцах шрифтов, тестах клавиатуры и тексте-заполнителе по умолчанию в каждом дизайн-приложении — от Figma до InDesign. Вставьте это в поле ввода, и плитки метрик покажут: 71 слово, 410 символов с пробелами, 340 символов без пробелов, 4 предложения, 3 абзаца, время чтения около 21 секунды при 200 сл/мин, время речи около 33 секунд при 130 сл/мин. Панель наиболее частых слов пропускает стоп-слова вроде the и a и выводит содержательные слова, которые преобладают — здесь это pangram, letter и sentence. Переключитесь на китайский, арабский или хинди — и каждая плитка пересчитается по правилам сегментации соответствующего скрипта.

Question 3

Как подсчитываются слова?

Accepted Answer

В браузерах, поддерживающих Intl.Segmenter (Chrome 87+, Firefox 125+, Safari 14.1+), инструмент использует new Intl.Segmenter(locale, { granularity: 'word' }) и подсчитывает сегменты, где isWordLike равно true. Это корректно обрабатывает китайский, японский, арабский, деванагари и все другие юникод-скрипты. В старых браузерах резервное регулярное выражение /\p{L}+/gu совпадает с любой последовательностью букв Unicode — хорошо работает для языков с латинским алфавитом, но считает весь китайский или японский текст без пробелов как одно слово.

Question 4

Почему счётчик отличается от MS Word?

Accepted Answer

Алгоритм подсчёта слов Microsoft Word является проприетарным и по-разному обрабатывает составные слова через дефис, сокращения и специальные символы в разных версиях. Этот инструмент считает «не» как одно слово (один сегмент isWordLike), тогда как Word может считать его как два. Для большинства прозы счётчики совпадают в пределах 1–2%; для текстов с дефисами расхождение может быть больше. Счётчики символов всегда совпадают при одинаковой UTF-8 строке источника.

Question 5

Поддерживаются ли нелатинские скрипты (китайский, арабский, кириллица)?

Accepted Answer

Да. API Intl.Segmenter изначально поддерживает Unicode. Арабский и иврит (письмо справа налево) считаются корректно; кириллица и греческий считаются как обычные латиноподобные границы слов; китайский и японский дают один словоподобный сегмент на символ, поскольку эти письменные системы не используют пробелы между словами. Счётчик символов (через [...text].length) всегда подсчитывает кодовые точки Unicode вне зависимости от скрипта, поэтому эмодзи, символы CJK и буквы с диакритикой считаются как 1.

Question 6

Загружается ли мой текст куда-либо?

Accepted Answer

Нет. Все вычисления выполняются внутри вкладки браузера с помощью нативных JavaScript API. Ничего не отправляется на серверы Ultim8Soft или какой-либо сторонний сервис. Вы можете проверить это, открыв DevTools браузера, перейдя на вкладку «Сеть», очистив лог, набрав что-нибудь в поле ввода и убедившись, что для шага подсчёта не появляется ни одного сетевого запроса.

Подсчёт слов, символов и времени чтения _

Как подсчитываются слова?

Как работает подсчёт

Зачем считать слова?

Типичные применения

Как выглядит пример подсчёта слов?

Как подсчитываются слова?

Почему счётчик отличается от MS Word?

Поддерживаются ли нелатинские скрипты (китайский, арабский, кириллица)?

Загружается ли мой текст куда-либо?

Подсчёт слов, символов и времени чтения _

// Похожие инструменты

Как подсчитываются слова?

Как работает подсчёт

Зачем считать слова?

Типичные применения

Как выглядит пример подсчёта слов?

Как подсчитываются слова?

Почему счётчик отличается от MS Word?

Поддерживаются ли нелатинские скрипты (китайский, арабский, кириллица)?

Загружается ли мой текст куда-либо?