§

Επικολλήστε ή πληκτρολογήστε

§

Metrics

Χαρακτήρες 0
Χαρακτήρες (χωρίς κενά) 0
Λέξεις 0
Προτάσεις 0
Παράγραφοι 0
Χρόνος ανάγνωσης
Χρόνος ομιλίας
§

Options

§

Πιο συχνές λέξεις

# Λέξη Πλήθος Συχνότητα

Οι περισσότεροι online μετρητές λέξεων γράφτηκαν όταν ο ιστός ήταν πρώτα Αγγλικός και ακόμα χωρίζουν το κείμενο σε λευκό διάστημα ASCII. Αυτό σπάει τη στιγμή που επικολλάτε Κινεζικά (χωρίς κενά μεταξύ λέξεων), Αραβικά (δεξιά-προς-αριστερά, ενωμένα γράμματα) ή Devanagari (φωνητικά σημάδια προσαρτημένα σε σύμφωνα). Αυτό το εργαλείο χρησιμοποιεί το εγγενές API Intl.Segmenter του προγράμματος περιήγησης, το οποίο φέρει τους κανόνες τμηματοποίησης λέξεων Unicode CLDR για κάθε γραφή που καλύπτει το πρότυπο. Μια κινεζική πρόταση αναφέρει ένα τμήμα που μοιάζει με λέξη ανά χαρακτήρα, ταιριάζοντας με το πώς μετρούν οι Κινέζοι συντάκτες. Τα Αραβικά μετρούν κάθε διακριτικό που διαχωρίζεται με κενό, ενώ το πλακίδιο χαρακτήρων μετρά κωδικά σημεία, οπότε μια ligature όπως το لا εξακολουθεί να μετρά ως δύο χαρακτήρες. Για πολύγλωσσους συγγραφείς, μεταφραστές και οποιονδήποτε συντάσσει τεκμηρίωση που αποστέλλεται σε περισσότερες από μία γλώσσες, η μέτρηση που βλέπετε εδώ είναι η μέτρηση που θα περίμενε ένας αναγνώστης μητρικής γραφής.

Πώς μετρώνται οι λέξεις;

Αυτό το εργαλείο μετρά λέξεις χρησιμοποιώντας το ενσωματωμένο API Intl.Segmenter του προγράμματος περιήγησής σας (Chrome 87+, Firefox 125+, Safari 14.1+) όταν είναι διαθέσιμο, το οποίο χειρίζεται κάθε γραφή — Λατινική, Κινεζική, Αραβική, Devanagari, Ιαπωνική, Κορεατική, Κυριλλική — με γλωσσικά ακριβή όρια λέξεων που προέρχονται από το Unicode CLDR. Όταν το Intl.Segmenter δεν είναι διαθέσιμο, υποχωρεί σε μια κανονική έκφραση με επίγνωση Unicode (/\p{L}+/gu) που αντιστοιχεί σε οποιαδήποτε ακολουθία γραμμάτων Unicode. Τα περισσότερα ανταγωνιστικά εργαλεία χωρίζουν σε λευκό διάστημα ASCII και μετρούν σιωπηλά λάθος οτιδήποτε εκτός του λατινικού αλφαβήτου· αυτό δεν το κάνει.

Πώς λειτουργεί η μέτρηση

Έξι βήματα γίνονται στο πρόγραμμα περιήγησής σας σε κάθε πληκτρολόγηση. Κανένα δεν αγγίζει το δίκτυο. Ολόκληρος ο αγωγός τρέχει σε λιγότερο από ένα χιλιοστό του δευτερολέπτου για τυπική είσοδο μήκους παραγράφου και χειρίζεται ένα χειρόγραφο 100.000 λέξεων χωρίς να ρίξει καρέ.

  1. Το κείμενό σας διαβάζεται από το πεδίο κειμένου και κρατείται στη μνήμη του προγράμματος περιήγησης — τίποτα δεν φεύγει από τη συσκευή σας.
  2. Η μέτρηση χαρακτήρων χρησιμοποιεί τον τελεστή διασποράς ([...text].length) για να μετρήσει κωδικά σημεία Unicode, οπότε emoji όπως 🙂 μετρούν ως 1 χαρακτήρας ανεξάρτητα από την εσωτερική κωδικοποίηση UTF-16.
  3. Η μέτρηση λέξεων βασίζεται στο Intl.Segmenter με granularity: 'word', φιλτράροντας σε τμήματα όπου isWordLike είναι true. Τα κινεζικά και ιαπωνικά κείμενα όπου οι λέξεις δεν διαχωρίζονται με κενά μετρούν ένα τμήμα ανά χαρακτήρα.
  4. Η μέτρηση προτάσεων χρησιμοποιεί Intl.Segmenter με granularity: 'sentence', το οποίο χειρίζεται συντομογραφίες, αποσιωπητικά και ακραίες περιπτώσεις στίξης καλύτερα από ένα απλό split στην τελεία.
  5. Η μέτρηση παραγράφων χωρίζει σε μία ή περισσότερες κενές γραμμές (\n\s*\n) και φιλτράρει κενά τμήματα.
  6. Οι χρόνοι ανάγνωσης και ομιλίας διαιρούν τον αριθμό λέξεων με τον ρυθμό WPM που έχει ρυθμιστεί (προεπιλογές: 200 ανάγνωση, 130 ομιλία) και μορφοποιούν το αποτέλεσμα σε λεπτά και δευτερόλεπτα.

Γιατί να μετράτε λέξεις;

  • Όρια δοκιμίων και υποβολών. Οι προτροπές πανεπιστημίων οριοθετούν τις προσωπικές δηλώσεις στις 650 λέξεις (Common App), 500 λέξεις (περισσότερες UCAS του ΗΒ) ή 4.000 χαρακτήρες με κενά. Το να γνωρίζετε το πλήθος σας πριν υποβάλετε σημαίνει ότι δεν θα χρειαστεί να κάνετε περικοπές της τελευταίας στιγμής υπό πίεση.
  • SEO και σχεδιασμός περιεχομένου. Οι ομάδες ποιότητας αναζήτησης χρησιμοποιούν τον αριθμό λέξεων ως χονδρικό δείκτη βάθους θεματολογίας και οι σελίδες μακράς μορφής μεταξύ 1.500 και 2.500 λέξεων ξεπερνούν σταθερά τις λεπτές αναρτήσεις για ανταγωνιστικά ερωτήματα. Η παρακολούθηση του αριθμού σας καθώς γράφετε κρατά τα προσχέδια σε αυτό το εύρος χωρίς παραγεμίσματα.
  • Μέγεθος μέσων κοινωνικής δικτύωσης. Το X οριοθετεί αναρτήσεις σε 280 χαρακτήρες, τα άρθρα LinkedIn σε 110.000, οι λεζάντες Instagram σε 2.200 και οι μετα-περιγραφές σε περίπου 160. Το πλακίδιο χαρακτήρων σας δείχνει το ακριβές νούμερο πριν επικολλήσετε στον επεξεργαστή της πλατφόρμας και ανακαλύψετε ότι είναι περικομμένο.
  • Εκτιμήσεις μεταγραφής και παρουσίασης. Ο χρόνος ανάγνωσης σε 200 WPM ταιριάζει με τη μέση σιωπηρή ανάγνωση· ο χρόνος ομιλίας σε 130 WPM ταιριάζει με τη συνομιλιακή απόδοση. Χρησιμοποιήστε και τους δύο για να μεγεθύνετε ένα τμήμα podcast, να σχεδιάσετε μια ομιλία 5 λεπτών ή να εκτιμήσετε τον χρόνο αφήγησης πριν από μια συνεδρία ηχογράφησης.

Συνήθεις εφαρμογές

Η μέτρηση λέξεων και χαρακτήρων εμφανίζεται στη συγγραφή, το περιεχόμενο και την ανάπτυξη και η μηχανή με επίγνωση Unicode του εργαλείου έχει μεγαλύτερη σημασία για ομάδες που αποστέλλουν περιεχόμενο σε περισσότερες από μία γλώσσες:

  • Ακαδημαϊκή γραφή: παρακολουθήστε την πρόοδο προς έναν στόχο κεφαλαίου διατριβής ή επαληθεύστε ότι μια περίληψη παραμένει εντός του ορίου χαρακτήρων του περιοδικού πριν από την υποβολή.
  • Κείμενο μάρκετινγκ και UX: μετρήστε μια γραμμή θέματος, μια κεντρική επικεφαλίδα ή μια ετικέτα κουμπιού CTA έναντι του προϋπολογισμού χαρακτήρων που όρισε ο σχεδιαστής σας στο Figma.
  • Συγγραφή ομιλίας και podcast: μετατρέψτε ένα σενάριο σε αναμενόμενη διάρκεια ώστε να γνωρίζετε αν μια κεντρική ομιλία διαρκεί πολύ πριν από την πρόβα.

Πώς μοιάζει ένα παράδειγμα μέτρησης λέξεων;

Πάρτε αυτό το δείγμα τριών παραγράφων. The quick brown fox jumps over the lazy dog. The sentence above is a pangram — it contains every letter of the English alphabet, which is why typographers and font designers use it to preview a typeface. Pangrams date back at least to the 19th century, when telegraph operators used short letter-complete sentences to test transmission accuracy. Today they show up in font specimens, keyboard tests, and the default placeholder text of every design app from Figma to InDesign. Επικολλήστε αυτό στην είσοδο και τα πλακίδια μετρήσεων αναφέρουν: 71 λέξεις, 410 χαρακτήρες με κενά, 340 χαρακτήρες χωρίς κενά, 4 προτάσεις, 3 παράγραφοι, χρόνος ανάγνωσης περίπου 21 δευτερόλεπτα σε 200 WPM και χρόνος ομιλίας περίπου 33 δευτερόλεπτα σε 130 WPM. Ο πίνακας πιο συχνών λέξεων παρακάμπτει λέξεις-κλειδιά όπως το the και a και αναδεικνύει τις λέξεις περιεχομένου που κυριαρχούν — εδώ, pangram, letter και sentence. Μεταβείτε σε κείμενο Κινεζικών, Αραβικών ή Χίντι και κάθε πλακίδιο επαναϋπολογίζεται έναντι των δικών του κανόνων τμηματοποίησης γραφής.

Πώς μετρώνται οι λέξεις;

Σε προγράμματα περιήγησης που υποστηρίζουν Intl.Segmenter (Chrome 87+, Firefox 125+, Safari 14.1+) το εργαλείο χρησιμοποιεί new Intl.Segmenter(locale, { granularity: 'word' }) και μετρά τμήματα όπου isWordLike είναι true. Αυτό χειρίζεται σωστά τις γραφές Κινεζικών, Ιαπωνικών, Αραβικών, Devanagari και κάθε άλλη γραφή Unicode. Σε παλαιότερα προγράμματα περιήγησης, η εφεδρική regex /\p{L}+/gu αντιστοιχεί σε οποιαδήποτε ακολουθία γραμμάτων Unicode, που λειτουργεί καλά για γλώσσες λατινικής γραφής αλλά αντιμετωπίζει μια ολόκληρη κινεζική ή ιαπωνική λέξη ως ένα τμήμα ανεξάρτητα από την απουσία κενών.

Γιατί η μέτρηση είναι διαφορετική από το MS Word;

Ο αλγόριθμος μέτρησης λέξεων του Microsoft Word είναι ιδιόκτητος και χειρίζεται διαφορετικά τις ενώσεις με παύλα, τις συσπάσεις και τους ειδικούς χαρακτήρες σε διαφορετικές εκδόσεις. Αυτό το εργαλείο μετρά το «won't» ως μία λέξη (ένα τμήμα isWordLike), ενώ το Word μπορεί να το μετρήσει ως δύο. Για τα περισσότερα πεζά κείμενα, οι μετρήσεις συμφωνούν εντός 1–2%· για κείμενο με παύλες, μπορεί να αποκλίνουν περισσότερο. Οι μετρήσεις χαρακτήρων συμφωνούν πάντα όταν το πηγαίο κείμενο είναι η ίδια συμβολοσειρά UTF-8.

Υποστηρίζει μη-λατινικές γραφές (Κινεζικά, Αραβικά, Κυριλλικά);

Ναι. Το API Intl.Segmenter έχει σχεδιαστεί με επίγνωση Unicode. Τα Αραβικά και Εβραϊκά (γραφές δεξιά-προς-αριστερά) μετρούν σωστά· τα Κυριλλικά και Ελληνικά μετρούν ως κανονικοί διαχωρισμοί ορίων λέξεων λατινικού τύπου· τα Κινεζικά και Ιαπωνικά αναφέρουν ένα τμήμα που μοιάζει με λέξη ανά χαρακτήρα επειδή αυτά τα συστήματα γραφής δεν χρησιμοποιούν κενά μεταξύ λέξεων. Η μέτρηση χαρακτήρων (χρησιμοποιώντας [...text].length) μετρά πάντα κωδικά σημεία Unicode ανεξάρτητα από τη γραφή, οπότε emoji, χαρακτήρες CJK και τονισμένοι λατινικοί χαρακτήρες μετρούν όλοι ως 1.

Μεταφορτώνεται το κείμενό μου;

Όχι. Κάθε υπολογισμός γίνεται μέσα στην καρτέλα του προγράμματος περιήγησής σας χρησιμοποιώντας εγγενή JavaScript API. Τίποτα δεν αποστέλλεται στους διακομιστές της Ultim8Soft ή σε οποιαδήποτε υπηρεσία τρίτου. Μπορείτε να το επαληθεύσετε ανοίγοντας τα DevTools του προγράμματος περιήγησης, μεταβαίνοντας στην καρτέλα Δικτύου, εκκαθαρίζοντας το αρχείο καταγραφής, πληκτρολογώντας στην είσοδο και επιβεβαιώνοντας ότι δεν εμφανίζονται μηδενικά αιτήματα δικτύου για το βήμα μέτρησης.

Αυτός ο μετρητής λέξεων τρέχει εξ ολοκλήρου στο πρόγραμμα περιήγησής σας. Χωρίς μεταφόρτωση, χωρίς λογαριασμό, χωρίς βιβλιοθήκη προμηθευτή, χωρίς αναλυτικά στο μετρημένο κείμενο. Επικολλήστε οποιοδήποτε κείμενο σε οποιαδήποτε γραφή, δείτε τα επτά πλακίδια μετρήσεων να ενημερώνονται καθώς πληκτρολογείτε και αντιγράψτε ό,τι χρειάζεστε. Ολόκληρο το εργαλείο είναι περίπου 12 KB JavaScript που φορτώνεται μία φορά και λειτουργεί εκτός σύνδεσης μετά την πρώτη επίσκεψη.