Bagaimana perkataan dikira?
Alat ini mengira perkataan menggunakan API Intl.Segmenter terbina dalam pelayar anda (Chrome 87+, Firefox 125+, Safari 14.1+) apabila tersedia, yang menangani setiap skrip — Latin, Cina, Arab, Devanagari, Jepun, Korea, Cyrillic — dengan sempadan perkataan yang tepat secara linguistik yang diperoleh dari Unicode CLDR. Apabila Intl.Segmenter tidak tersedia, ia menggunakan ungkapan nalar sedar Unicode (/\p{L}+/gu) yang memadankan mana-mana jujukan huruf Unicode. Kebanyakan alat pesaing membahagi pada ruang putih ASCII dan mengira dengan silap apa-apa di luar abjad Latin; alat ini tidak.
Bagaimana pengiraan berfungsi
Enam langkah berlaku dalam pelayar anda pada setiap ketukan kekunci. Tiada satupun yang menyentuh rangkaian. Keseluruhan saluran paip berjalan dalam kurang daripada milisaat untuk input panjang perenggan biasa dan mengendalikan manuskrip 100,000 perkataan tanpa terlepas bingkai.
- Teks anda dibaca dari kawasan teks dan disimpan dalam ingatan pelayar — tiada apa yang meninggalkan peranti anda.
- Kiraan aksara menggunakan operator spread JavaScript (
[...text].length) untuk mengira titik kod Unicode, jadi emoji seperti 🙂 dikira sebagai 1 aksara tanpa mengira pengekodan UTF-16 dalaman mereka. - Kiraan perkataan bergantung pada
Intl.Segmenterdengangranularity: 'word', menapis kepada segmen di manaisWordLikeadalah benar. Teks Cina dan Jepun yang perkataannya tidak dipisahkan ruang mengira satu segmen setiap aksara. - Kiraan ayat menggunakan
Intl.Segmenterdengangranularity: 'sentence', yang menangani singkatan, elipsis, dan kes tepi tanda baca lebih baik daripada pemisahan titik mudah. - Kiraan perenggan membahagi pada satu atau lebih baris kosong (
\n\s*\n) dan menapis segmen kosong. - Masa membaca dan bertutur membahagikan kiraan perkataan dengan kadar WPM yang dikonfigurasi (lalai: 200 membaca, 130 bertutur) dan memformat hasilnya sebagai minit dan saat.
Mengapa mengira perkataan?
- Had esei dan penyerahan. Arahan universiti mengehadkan pernyataan peribadi pada 650 perkataan (Common App), 500 perkataan (kebanyakan pernyataan peribadi UCAS UK), atau 4,000 aksara dengan ruang. Mengetahui kiraan anda sebelum menyerahkan bermakna tiada potongan saat akhir di bawah tekanan.
- Perancangan SEO dan kandungan. Pasukan kualiti carian menggunakan kiraan perkataan sebagai proksi kasar untuk kedalaman topikal, dan halaman panjang antara 1,500 dan 2,500 perkataan secara konsisten mengatasi siaran nipis untuk pertanyaan kompetitif. Menjejaki kiraan anda semasa anda membuat draf mengekalkan draf dalam julat itu tanpa padding.
- Saiz media sosial. X mengehadkan siaran pada 280 aksara, artikel LinkedIn pada 110,000, kapsyen Instagram pada 2,200, dan penerangan meta kira-kira 160. Jubin aksara menunjukkan angka tepat sebelum anda menampal ke dalam editor platform dan mendapatinya dipotong.
- Anggaran transkripsi dan persembahan. Masa membaca pada 200 WPM sepadan dengan bacaan senyap purata; masa bertutur pada 130 WPM sepadan dengan penyampaian perbualan. Gunakan kedua-duanya untuk menentukan saiz segmen podcast, merancang ceramah kilat 5 minit, atau menganggar runtime narasian sebelum sesi rakaman.
Aplikasi biasa
Pengiraan perkataan dan aksara muncul dalam kerja penulisan, kandungan, dan pembangunan, dan enjin sedar Unicode alat ini paling penting untuk pasukan yang menghantar kandungan dalam lebih daripada satu bahasa:
- Penulisan akademik: jejaki kemajuan ke arah sasaran bab tesis atau sahkan bahawa abstrak kekal dalam had aksara jurnal sebelum penyerahan.
- Salinan pemasaran dan UX: ukur baris subjek, tajuk utama wira, atau label butang CTA terhadap bajet aksara yang ditetapkan pereka bentuk anda dalam Figma.
- Penulisan ucapan dan podcasting: tukar skrip kepada jangka masa yang dijangka supaya anda tahu sama ada ucapan utama berjalan terlalu lama sebelum hari latihan.
Bagaimana contoh kiraan perkataan kelihatan?
Ambil sampel tiga perenggan ini. The quick brown fox jumps over the lazy dog. The sentence above is a pangram — it contains every letter of the English alphabet, which is why typographers and font designers use it to preview a typeface. Pangrams date back at least to the 19th century, when telegraph operators used short letter-complete sentences to test transmission accuracy. Today they show up in font specimens, keyboard tests, and the default placeholder text of every design app from Figma to InDesign. Tampalkan ke dalam input dan jubin metrik melaporkan: 71 perkataan, 410 aksara dengan ruang, 340 aksara tanpa ruang, 4 ayat, 3 perenggan, masa membaca kira-kira 21 saat pada 200 WPM, dan masa bertutur kira-kira 33 saat pada 130 WPM. Panel perkataan-paling-kerap melangkau kata henti seperti the dan a dan menampilkan perkataan kandungan yang mendominasi — di sini, pangram, letter, dan sentence. Tukar kepada teks Cina, Arab, atau Hindi dan setiap jubin mengira semula terhadap peraturan pembahagian skrip sendiri.
Bagaimana perkataan dikira?
Dalam pelayar yang menyokong Intl.Segmenter (Chrome 87+, Firefox 125+, Safari 14.1+) alat menggunakan new Intl.Segmenter(locale, { granularity: 'word' }) dan mengira segmen di mana isWordLike adalah benar. Ini menangani Cina, Jepun, Arab, Devanagari, dan setiap skrip Unicode lain dengan betul. Dalam pelayar lama, regex sandaran /\p{L}+/gu memadankan mana-mana jujukan huruf Unicode, yang berfungsi dengan baik untuk bahasa skrip Latin tetapi menganggap keseluruhan perkataan Cina atau Jepun sebagai satu segmen tanpa mengira ketiadaan ruang.
Mengapa kiraan berbeza dari MS Word?
Algoritma kiraan perkataan Microsoft Word adalah proprietari dan menangani sebatian bertiret, kontraksi, dan aksara khas secara berbeza merentasi versi. Alat ini mengira "won't" sebagai satu perkataan (satu segmen isWordLike), manakala Word mungkin mengiranya sebagai dua. Untuk kebanyakan prosa, kiraan bersetuju dalam 1–2%; untuk teks bertiret, ia boleh berbeza lebih. Kiraan aksara sentiasa bersetuju apabila teks sumber adalah rentetan UTF-8 yang sama.
Adakah ini menyokong skrip bukan Latin (Cina, Arab, Cyrillic)?
Ya. API Intl.Segmenter sedar Unicode mengikut reka bentuk. Arab dan Ibrani (skrip kanan-ke-kiri) dikira dengan betul; Cyrillic dan Greek dikira sebagai pemisahan sempadan perkataan gaya Latin biasa; Cina dan Jepun melaporkan satu segmen seperti-perkataan per aksara kerana sistem penulisan tersebut tidak menggunakan ruang antara perkataan. Kiraan aksara (menggunakan [...text].length) sentiasa mengira titik kod Unicode tanpa mengira skrip, jadi emoji, aksara CJK, dan aksara Latin beraksent semuanya dikira sebagai 1.
Adakah teks saya dimuat naik?
Tidak. Setiap pengiraan berjalan dalam tab pelayar anda menggunakan API JavaScript asli. Tiada apa yang dihantar ke pelayan Ultim8Soft atau mana-mana perkhidmatan pihak ketiga. Anda boleh mengesahkan ini dengan membuka DevTools pelayar, beralih ke tab Rangkaian, mengosongkan log, menaip ke dalam input, dan mengesahkan bahawa sifar permintaan rangkaian muncul untuk langkah pengiraan.
Pembilang perkataan ini berjalan sepenuhnya dalam pelayar anda. Tiada muat naik, tiada akaun, tiada pustaka vendor, tiada analitik pada teks yang dikira. Tampal mana-mana teks dalam mana-mana skrip, tonton tujuh jubin metrik dikemas kini semasa anda menaip, dan salin yang anda perlukan. Keseluruhan alat ialah kira-kira 12 KB JavaScript yang dimuatkan sekali dan berfungsi luar talian selepas lawatan pertama.