§

Joylashtiring yoki yozing

§

Metrics

Belgilar 0
Belgilar (boʻsh joylarsiz) 0
Soʻzlar 0
Jumlalar 0
Paragraflar 0
Oʻqish vaqti
Soʻzlash vaqti
§

Options

§

Eng koʻp uchraydigan soʻzlar

# Soʻz Son Tezlik

Koʻpgina onlayn soʻz sanagichlar veb ingliz-birinchi boʻlganida yozilgan va hali ham ASCII boʻsh joyida matnni ajratadi. Bu xitoy (soʻzlar orasida boʻsh joy yoʻq), arab (oʻng-chap, birlashtiriladigan harflar) yoki Devanagari (undoshga biriktirilgan unli belgilar) joylashtirgan zahoti buziladi. Bu vosita standart tomonidan qamrab olingan har bir yozuv uchun Unicode CLDR soʻz-segmentatsiya qoidalarini olib yuradigan brauzerning mahalliy Intl.Segmenter API-dan foydalanadi.

Soʻzlar qanday saniladi?

Bu vosita mavjud boʻlganda brauzeringizning oʻrnatilgan Intl.Segmenter API-dan (Chrome 87+, Firefox 125+, Safari 14.1+) foydalanib soʻzlarni sanaydi — bu Unicode CLDR-dan olingan lingvistik jihatdan aniq soʻz chegaralari bilan har bir yozuvni — Lotin, Xitoy, Arab, Devanagari, Yapon, Koreys, Kirill — boshqaradi. Intl.Segmenter mavjud boʻlmaganda har qanday Unicode harflar ketma-ketligiga mos keladigan Unicode-xabardor regex (/\p{L}+/gu) ga qaytadi. Raqib vositalarning koʻpchiligi ASCII boʻsh joyida ajratadi va Lotin alifbosidan tashqaridagi har qanday narsani jimgina notoʻgʻri sanaydi; bu vosita bunday qilmaydi.

Hisoblash qanday ishlaydi

Har bir tugmachani bosganda brauzeringizda oltita qadam sodir boʻladi. Ularning hech biri tarmoqqa tegmaydi. Butun quvur odatiy paragraf uzunligidagi kiritish uchun bir millisekunddan kamroq vaqtda ishlaydi.

  1. Matningiz textarea-dan oʻqiladi va brauzer xotirasida saqlanadi — hech narsa qurilmangizdan chiqmaydi.
  2. Belgilar soni JavaScript tarqatish operatoridan ([...text].length) foydalanib Unicode kod nuqtalarini sanaydi, shuning uchun 🙂 kabi emoji ichki UTF-16 kodlashidan qatʼiy nazar 1 belgi sifatida hisoblanadi.
  3. Soʻzlar soni isWordLike true boʻlgan segmentlarni filtrlash bilan granularity: 'word' boʻlgan Intl.Segmenter-ga tayanadi. Soʻzlar boʻsh joy bilan ajratilmagan xitoy va yapon matnlari har bir belgi uchun bitta segment sanaydi.
  4. Jumlalar soni granularity: 'sentence' boʻlgan Intl.Segmenter-dan foydalanadi, bu qisqartmalar, ellips va tinish belgilari chekka holatlarini oddiy nuqtali boʻlinishdan yaxshiroq boshqaradi.
  5. Paragraflar soni bir yoki bir nechta boʻsh satrda (\n\s*\n) ajratiladi va boʻsh segmentlarni filtrlaydi.
  6. Oʻqish va soʻzlash vaqtlari soʻzlar sonini sozlangan SPD tezligiga (standart: oʻqish 200, soʻzlash 130) boʻladi va natijani daqiqa hamda soniyada formatlaydi.

Nima uchun soʻzlarni sanash kerak?

  • Esse va topshiriq chegaralari. Universitetlar shaxsiy bayonotlarni 650 soʻz (Common App), 500 soʻz (koʻpgina Buyuk Britaniya UCAS shaxsiy bayonotlari) yoki boʻsh joylar bilan 4 000 belgida cheklaydi. Topshirishdan oldin sonni bilish oxirgi daqiqadagi kesishlarga yoʻl qoʻymaydi.
  • SEO va kontent rejalashtirish. Qidiruv sifati jamoalari mavzuiy chuqurlikning taxminiy belgisi sifatida soʻzlar sonidan foydalanadi va 1 500 dan 2 500 gacha soʻzlar boʻlgan uzoq matnli sahifalar raqobatbardosh soʻrovlar uchun yupqa postlardan doimo yuqorida turadi.
  • Ijtimoiy tarmoq oʻlchamlarini aniqlash. X postlarni 280 belgida, LinkedIn maqolalarini 110 000 belgida, Instagram sarlavhalarini 2 200 belgida va meta tavsiflarni taxminan 160 belgida cheklaydi. Belgilar katakchasi platforma muharririga joylashtirish va u qisqarganini aniqlashdan oldin aniq raqamni koʻrsatadi.
  • Transkripsiya va taqdimot taxminlari. 200 SPD tezligida oʻqish vaqti oʻrtacha jim oʻqishga mos keladi; 130 SPD tezligida soʻzlash vaqti suhbatdosh yetkazib berishga mos keladi. Podcast segmentini oʻlchamlash, 5 daqiqalik chaqmoq ma’ruzasini rejalashtirish yoki yozib olish seansidan oldin diktor ish vaqtini taxmin qilish uchun ikkalasini ham ishlating.

Keng tarqalgan qoʻllanishlar

Soʻz va belgilarni sanash yozish, kontent va ishlab chiqish ishlarida paydo boʻladi va vositaning Unicode-xabardor mexanizmi bir nechta tilda kontent yuboradigan jamoalar uchun eng muhim ahamiyatga ega:

  • Akademik yozish: dissertatsiya bobidagi maqsadga yoʻnalgan progress kuzatish yoki topshirishdan oldin annotatsiya jurnalning belgilar chegarasida qolganligini tekshirish.
  • Marketing va UX nusxa: mavzu qatori, qahramon sarlavhasi yoki CTA tugmasi yorligʻini dizayneringiz Figma-da oʻrnatgan belgilar byudjetiga nisbatan oʻlchamlash.
  • Nutq yozish va podcast: asosiy notiq mashq kuni oldin uzoq yoki qisqa ishlashini bilish uchun skriptni kutilgan davomiylikka aylantirish.

Soʻzlar soni misoli qanday koʻrinadi?

Ushbu uch paragrafli namunani oling. The quick brown fox jumps over the lazy dog. Yuqoridagi jumla pangram — u ingliz alifbosining har bir harfini oʻz ichiga oladi, shuning uchun tipograflar va shrift dizaynerlari uni shrift oldindan koʻrish uchun ishlatadilar. Pangramlar kamida 19-asrga qadar borib yetadi, telegraf operatorlari uzatish aniqligini sinash uchun qisqa toʻliq-harf jumlalardan foydalangan. Bugun ular shrift namunalarida, klaviatura testlarida va Figma-dan InDesign-gacha har bir dizayn ilovasining standart toʻldiruvchi matnida paydo boʻladi. Buni kiritishga joylashtiring va metrik kataglar hisobot beradi: 71 soʻz, boʻsh joylar bilan 410 belgi, boʻsh joylarsiz 340 belgi, 4 jumla, 3 paragraf, 200 SPD tezligida taxminan 21 soniya oʻqish vaqti va 130 SPD tezligida taxminan 33 soniya soʻzlash vaqti. Eng koʻp ishlatiladigan soʻzlar paneli the va a kabi toʻxtatuvchi soʻzlarni oʻtkazib yuboradi va ustunlik qiladigan kontent soʻzlarni — bu yerda pangram, letter va sentence — chiqaradi.

Soʻzlar qanday saniladi?

Intl.Segmenter-ni (Chrome 87+, Firefox 125+, Safari 14.1+) qoʻllab-quvvatlaydigan brauzerlarda vosita new Intl.Segmenter(locale, { granularity: 'word' })-dan foydalanadi va isWordLike true boʻlgan segmentlarni sanaydi. Bu xitoy, yapon, arab, Devanagari va boshqa har qanday Unicode yozuvini toʻgʻri boshqaradi. Eski brauzerlarda zaxira regex /\p{L}+/gu har qanday Unicode harflar ketma-ketligiga mos keladi.

Nima uchun son MS Word-dan boshqacha?

Microsoft Word-ning soʻz sanoq algoritmi mulkiy va tire birikmalar, qisqartmalar va maxsus belgilarni versiyalar boʻyicha boshqacha boshqaradi. Bu vosita "won’t"-ni bitta soʻz sifatida sanaydi, Word esa ikki deb hisoblashi mumkin. Koʻpgina nasrlar uchun sonlar 1–2% ichida kelishadi; tire birikmalar boʻlgan matn uchun ular koʻproq farq qilishi mumkin.

Bu Lotin boʻlmagan yozuvlarni (Xitoy, Arab, Kirill) qoʻllab-quvvatlaydimi?

Ha. Intl.Segmenter API dizayn boʻyicha Unicode-xabardor. Arab va Ibroniy (oʻng-chapdan yozuv) toʻgʻri sanaydi; Kirill va Grek oddiy Lotin uslubidagi soʻz-chegarali boʻlinishlar sifatida sanaydi; Xitoy va Yapon har bir belgi uchun bitta soʻz-kabi segment hisobotini beradi. Belgilar soni ([...text].length yordamida) har doim yozuvdan qatʼiy nazar Unicode kod nuqtalarini sanaydi.

Matnim yuklanadimi?

Yoʻq. Har bir hisoblash mahalliy JavaScript API-lardan foydalanib brauzer yorligʻingiz ichida ishlaydi. Hech narsa Ultim8Soft serverlari yoki uchinchi tomon xizmatlariga yuborilmaydi. Buni brauzer DevTools-ni ochib, Tarmoq yorligʻiga oʻtib, jurnalni tozalab, kiritishga yozib va hisoblash bosqichi uchun nol tarmoq soʻrovlari paydo boʻlishini tasdiqlash orqali tekshirishingiz mumkin.

Bu soʻz sanagich toʻliq brauzeringizda ishlaydi. Yuklash yoʻq, hisob yoʻq, vendor kutubxonasi yoʻq, sanab chiqilgan matn boʻyicha analitika yoʻq. Har qanday yozuvdagi har qanday matnni joylashtiring, yozayotganingizda yetti metrik katagni yangilanishini kuzating va kerakli narsani nusxalang.