Comment les mots sont-ils comptés ?
Cet outil compte les mots grâce à l'API native Intl.Segmenter de votre navigateur (Chrome 87+, Firefox 125+, Safari 14.1+) lorsqu'elle est disponible, laquelle gère chaque alphabet — latin, chinois, arabe, devanagari, japonais, coréen, cyrillique — avec des limites de mots linguistiquement précises dérivées du CLDR Unicode. Lorsque Intl.Segmenter n'est pas disponible, un repli vers une expression régulière compatible Unicode (/\p{L}+/gu) qui correspond à toute suite de lettres Unicode est utilisé. La plupart des outils concurrents découpent sur les espaces ASCII et comptent silencieusement de travers tout ce qui est hors de l'alphabet latin ; ce n'est pas le cas de celui-ci.
Comment fonctionne le comptage
Six étapes se produisent dans votre navigateur à chaque frappe. Aucune ne touche le réseau. L'ensemble du pipeline s'exécute en moins d'une milliseconde pour une saisie de longueur typique et gère un manuscrit de 100 000 mots sans perdre une image.
- Votre texte est lu depuis la zone de saisie et conservé en mémoire du navigateur — rien ne quitte votre appareil.
- Le nombre de caractères utilise l'opérateur de décomposition JavaScript (
[...text].length) pour dénombrer les points de code Unicode, de sorte qu'un emoji comme 🙂 compte pour 1 caractère quelle que soit son encodage UTF-16 interne. - Le nombre de mots repose sur
Intl.Segmenteravecgranularity: 'word', filtré sur les segments oùisWordLikeest vrai. Les textes chinois et japonais où les mots ne sont pas séparés par des espaces comptent un segment par caractère. - Le nombre de phrases utilise
Intl.Segmenteravecgranularity: 'sentence', qui gère mieux les abréviations, les points de suspension et les cas limites de ponctuation qu'un simple découpage sur les points. - Le nombre de paragraphes découpe sur une ou plusieurs lignes vides (
\n\s*\n) et filtre les segments vides. - Les temps de lecture et de parole divisent le nombre de mots par le débit MPM configuré (défauts : 200 pour la lecture, 130 pour la parole) et formatent le résultat en minutes et secondes.
Pourquoi compter les mots ?
- Limites de dissertations et de soumissions. Les appels à candidatures universitaires plafonnent les lettres de motivation (Common App à 650 mots, la plupart des dossiers UCAS au Royaume-Uni à 500 mots) ou les caractères avec espaces. Connaître votre décompte avant de soumettre évite des coupes de dernière minute sous pression.
- SEO et planification de contenu. Les équipes d'assurance qualité de contenu utilisent le nombre de mots comme indicateur approximatif de la profondeur thématique, et les pages longues entre 1 500 et 2 500 mots se classent régulièrement mieux que les publications légères pour les requêtes concurrentielles. Suivre votre décompte pendant la rédaction maintient les brouillons dans cette plage sans rembourrage artificiel.
- Dimensionnement pour les réseaux sociaux. X plafonne les publications à 280 caractères, les articles LinkedIn à 110 000, les légendes Instagram à 2 200 et les méta-descriptions à environ 160. La tuile caractères vous donne le chiffre exact avant de coller dans l'éditeur de la plateforme et de découvrir une troncature.
- Estimations de transcription et de présentation. Le temps de lecture à 200 MPM correspond à la lecture silencieuse moyenne ; le temps de parole à 130 MPM correspond à la vitesse de conversation. Utilisez les deux pour dimensionner un segment de podcast, planifier un lightning talk de 5 minutes ou estimer la durée de narration avant une session d'enregistrement.
Applications courantes
Le comptage de mots et de caractères intervient dans la rédaction, le contenu et le développement, et le moteur compatible Unicode de l'outil compte le plus pour les équipes livrant du contenu en plusieurs langues :
- Rédaction académique : suivre la progression vers l'objectif d'un chapitre de thèse ou vérifier qu'un résumé reste dans la limite de caractères d'une revue avant soumission.
- Copywriting et textes UX : mesurer une ligne d'objet, un titre hero ou un libellé de bouton CTA par rapport au budget de caractères fixé par votre designer dans Figma.
- Rédaction de discours et podcasting : convertir un script en durée attendue pour savoir si une keynote dépasse le temps imparti avant la répétition.
À quoi ressemble un exemple de comptage de mots ?
Prenez cet échantillon en trois paragraphes. The quick brown fox jumps over the lazy dog. The sentence above is a pangram — it contains every letter of the English alphabet, which is why typographers and font designers use it to preview a typeface. Pangrams date back at least to the 19th century, when telegraph operators used short letter-complete sentences to test transmission accuracy. Today they show up in font specimens, keyboard tests, and the default placeholder text of every design app from Figma to InDesign. Collez-le dans la saisie et les tuiles de métriques rapportent : 71 mots, 410 caractères avec espaces, 340 caractères sans espaces, 4 phrases, 3 paragraphes, temps de lecture d'environ 21 secondes à 200 MPM et temps de parole d'environ 33 secondes à 130 MPM. Le panneau des mots les plus fréquents ignore les mots vides comme the et a et fait remonter les mots de contenu qui dominent — ici, pangram, letter et sentence. Passez en texte chinois, arabe ou hindi et chaque tuile recalcule en fonction des règles de segmentation propres à l'alphabet.
Comment les mots sont-ils comptés ?
Dans les navigateurs qui supportent Intl.Segmenter (Chrome 87+, Firefox 125+, Safari 14.1+), l'outil utilise new Intl.Segmenter(locale, { granularity: 'word' }) et compte les segments où isWordLike est vrai. Cela gère correctement le chinois, le japonais, l'arabe, le devanagari et tout autre alphabet Unicode. Dans les navigateurs plus anciens, l'expression régulière de repli /\p{L}+/gu correspond à toute suite de lettres Unicode, ce qui fonctionne bien pour les langues à alphabet latin mais traite un mot chinois ou japonais entier comme un seul segment quelle que soit l'absence d'espaces.
Pourquoi le décompte diffère-t-il de MS Word ?
L'algorithme de comptage de mots de Microsoft Word est propriétaire et gère différemment les composés avec traits d'union, les contractions et les caractères spéciaux selon les versions. Cet outil compte « won't » comme un seul mot (un segment isWordLike), tandis que Word peut le compter comme deux. Pour la plupart des textes en prose les décomptes concordent à 1–2 % près ; pour les textes avec traits d'union ils peuvent diverger davantage. Les décomptes de caractères concordent toujours lorsque le texte source est la même chaîne UTF-8.
Est-ce que cela supporte les alphabets non latins (chinois, arabe, cyrillique) ?
Oui. L'API Intl.Segmenter est compatible Unicode par conception. L'arabe et l'hébreu (alphabets de droite à gauche) comptent correctement ; le cyrillique et le grec comptent comme des découpages de mots de style latin normal ; le chinois et le japonais rapportent un segment semblable à un mot par caractère car ces systèmes d'écriture n'utilisent pas d'espaces entre les mots. Le décompte de caractères (avec [...text].length) dénombre toujours les points de code Unicode quel que soit l'alphabet, de sorte qu'un emoji, un caractère CJK et un caractère latin accentué comptent tous pour 1.
Mon texte est-il envoyé ?
Non. Chaque calcul s'exécute dans votre onglet de navigateur en utilisant les API JavaScript natives. Rien n'est envoyé aux serveurs d'Ultim8Soft ni à aucun service tiers. Vous pouvez vérifier cela en ouvrant les DevTools du navigateur, en passant à l'onglet Réseau, en effaçant le journal, en tapant dans la saisie et en confirmant qu'aucune requête réseau n'apparaît pour l'étape de comptage.
Ce compteur de mots s'exécute entièrement dans votre navigateur. Aucun envoi, aucun compte, aucune bibliothèque fournisseur, aucune analytique sur le texte compté. Collez n'importe quel texte dans n'importe quel alphabet, regardez les sept tuiles de métriques se mettre à jour pendant que vous tapez, et copiez ce dont vous avez besoin. L'outil entier fait environ 12 Ko de JavaScript qui se charge une fois et fonctionne hors ligne après la première visite.