كيف تُعدّ الكلمات؟
تعدّ هذه الأداة الكلمات باستخدام واجهة Intl.Segmenter المدمجة في المتصفح (Chrome 87+، Firefox 125+، Safari 14.1+) حين تكون متاحة، والتي تتعامل مع كل نظام كتابي — اللاتيني والصيني والعربي والديوناغارية والياباني والكوري والسيريلي — بحدود كلمات دقيقة لغوياً مستمدة من Unicode CLDR. حين لا تتوفر Intl.Segmenter، تقع على تعبير نمطي واعٍ بـ Unicode (/\p{L}+/gu) يُطابق أي تتابع من أحرف Unicode. معظم الأدوات المنافسة تقسّم على المسافات ASCII وتُخطئ بصمت في عدّ أي نص خارج الأبجدية اللاتينية؛ هذه الأداة لا تفعل ذلك.
كيف يعمل العدّ؟
ست خطوات تحدث في متصفحك عند كل ضغطة مفتاح. لا شيء منها يلمس الشبكة. خط الأنابيب كاملاً يُشغَّل في أقل من ميلي ثانية للمدخلات النموذجية بطول فقرة ويتعامل مع مخطوطة من 100,000 كلمة دون فقدان إطار.
- يُقرأ نصك من حقل النص ويُحفظ في ذاكرة المتصفح — لا شيء يغادر جهازك.
- عدد الأحرف يستخدم عامل الانتشار في JavaScript (
[...text].length) لعدّ نقاط كود Unicode، فالرموز التعبيرية كـ 🙂 تُعدّ حرفاً واحداً بغض النظر عن ترميزها الداخلي بـ UTF-16. - عدد الكلمات يعتمد على
Intl.Segmenterبـgranularity: 'word'، مُصفِّياً المقاطع التيisWordLikeفيها صحيح. النصوص الصينية والجابانية حيث الكلمات غير مفصولة بمسافات تعدّ مقطعاً واحداً لكل حرف. - عدد الجمل يستخدم
Intl.Segmenterبـgranularity: 'sentence'الذي يتعامل مع الاختصارات والنقاط الثلاث وحالات الترقيم الحدية بشكل أفضل من تقسيم بسيط على النقطة. - عدد الفقرات يقسّم على سطر فارغ واحد أو أكثر (
\n\s*\n) ويُصفّي المقاطع الفارغة. - وقتا القراءة والإلقاء يقسمان عدد الكلمات على معدل الكلمات في الدقيقة المضبوط (الافتراضي: 200 للقراءة، 130 للإلقاء) ويُنسِّقان النتيجة بالدقائق والثواني.
لماذا نعدّ الكلمات؟
- حدود المقالات والتقديمات. الجامعات تحدد البيانات الشخصية بـ 650 كلمة (Common App)، و500 كلمة (معظم تقديمات UCAS البريطانية)، أو 4,000 حرف مع المسافات. معرفة عدّك قبل التقديم يعني لا قطع في اللحظة الأخيرة تحت الضغط.
- تحسين محركات البحث وتخطيط المحتوى. تستخدم فرق جودة البحث عدد الكلمات كمؤشر تقريبي للعمق الموضوعي، والصفحات الطويلة بين 1,500 و2,500 كلمة تتفوق باستمرار على المنشورات الخفيفة في الاستعلامات التنافسية. تتبع عدّك أثناء الكتابة يُبقي المسودات في تلك النطاق دون حشو.
- تحديد حجم وسائل التواصل الاجتماعي. X يحدد المنشورات بـ 280 حرفاً، ومقالات LinkedIn بـ 110,000، وتعليقات Instagram بـ 2,200، والأوصاف التعريفية بنحو 160. خانة الأحرف تُظهر لك الرقم الدقيق قبل اللصق في محرر المنصة واكتشاف الاقتطاع.
- تقديرات النسخ والعروض التقديمية. وقت القراءة بـ 200 كلمة في الدقيقة يُطابق متوسط القراءة الصامتة؛ ووقت الإلقاء بـ 130 كلمة في الدقيقة يُطابق التوصيل التحادثي. استخدمهما لتحديد حجم مقطع بودكاست أو التخطيط لمحاضرة خمس دقائق أو تقدير مدة التعليق الصوتي قبل جلسة التسجيل.
التطبيقات الشائعة
يظهر عدّ الكلمات والأحرف في الكتابة والمحتوى وعمل التطوير، ومحرك الأداة الواعي بـ Unicode يهم أكثر للفرق التي تشحن محتوىً بأكثر من لغة:
- الكتابة الأكاديمية: تتبع التقدم نحو هدف فصل من الأطروحة أو التحقق من بقاء الملخص داخل حد الأحرف لدى المجلة قبل التقديم.
- نسخ التسويق وتجربة المستخدم: قس سطر الموضوع أو العنوان الرئيسي أو تسمية زر الدعوة للعمل مقابل ميزانية الأحرف التي حددها مصممك في Figma.
- كتابة الخطب والبودكاست: حوّل سكريبتاً إلى مدة متوقعة كي تعرف ما إذا كانت الكلمة الرئيسية تمتد قبل يوم التدريب.
كيف يبدو مثال على عدّ الكلمات؟
خذ هذه العينة المؤلفة من ثلاث فقرات. الثعلب البني السريع يقفز فوق الكلب الكسول. الجملة أعلاه هي جملة شاملة لجميع الأحرف — تحتوي على كل حرف من حروف الأبجدية الإنجليزية، ولهذا يستخدمها الطباعون ومصممو الخطوط لمعاينة الخط. ترجع هذه الجمل إلى القرن التاسع عشر على الأقل، حين استخدمها مشغّلو التلغراف لاختبار دقة الإرسال. اليوم تظهر في عينات الخطوط واختبارات لوحة المفاتيح والنص التعريفي الافتراضي لكل تطبيق تصميم من Figma إلى InDesign. الصق ذلك في المدخل وستُبلِّغ خانات المقاييس: 71 كلمة، 410 حرفاً مع المسافات، 340 حرفاً بدون مسافات، 4 جمل، 3 فقرات، وقت قراءة نحو 21 ثانية بـ 200 كلمة في الدقيقة، ووقت إلقاء نحو 33 ثانية بـ 130 كلمة في الدقيقة. تتجاوز لوحة الكلمات الأكثر شيوعاً الكلمات الوظيفية كـ the وa وتُبرز الكلمات الدلالية المهيمنة. بدّل إلى نص صيني أو عربي أو هندي وكل خانة تُعيد الحساب وفق قواعد تقسيم النظام الكتابي الخاص به.
كيف تُعدّ الكلمات؟
في المتصفحات التي تدعم Intl.Segmenter (Chrome 87+، Firefox 125+، Safari 14.1+) تستخدم الأداة new Intl.Segmenter(locale, { granularity: 'word' }) وتعدّ المقاطع التي isWordLike فيها صحيح. هذا يتعامل مع الصينية والجابانية والعربية والديوناغارية وكل نظام كتابي Unicode بشكل صحيح. في المتصفحات القديمة، يُطابق التعبير النمطي الاحتياطي /\p{L}+/gu أي تتابع من أحرف Unicode، وهو يعمل جيداً للغات ذات الأبجدية اللاتينية لكنه يعامل الكلمة الصينية أو الجابانية كاملاً كمقطع واحد بغض النظر عن غياب المسافات.
لماذا يختلف العدد عن MS Word؟
خوارزمية عدّ الكلمات في Microsoft Word خاصة وتتعامل مع المركبات الواصلة والاختصارات والأحرف الخاصة بشكل مختلف عبر الإصدارات. هذه الأداة تعدّ "won't" كلمةً واحدة (مقطع isWordLike واحد)، بينما قد يعدّها Word كلمتين. لمعظم النصوص النثرية تتوافق الأعداد في نطاق 1-2%؛ للنص ذي الواصلات قد تتباعد أكثر. أعداد الأحرف تتوافق دائماً حين يكون النص المصدر ذات سلسلة UTF-8.
هل يدعم النصوص غير اللاتينية (الصينية والعربية والسيريلية)؟
نعم. واجهة Intl.Segmenter واعية بـ Unicode بتصميمها. العربية والعبرية (نصوص من اليمين لليسار) تُعدّ بشكل صحيح؛ السيريلية واليونانية تُعدّ كتقسيمات حدود كلمات عادية بالأسلوب اللاتيني؛ الصينية والجابانية تُبلِّغ بمقطع يشبه الكلمة لكل حرف لأن تلك الأنظمة الكتابية لا تستخدم مسافات بين الكلمات. عدد الأحرف (باستخدام [...text].length) يعدّ دائماً نقاط كود Unicode بغض النظر عن النظام الكتابي.
هل يُرفع نصي؟
لا. كل حساب يجري داخل تبويب متصفحك باستخدام واجهات JavaScript الأصلية. لا شيء يُرسل إلى خوادم Ultim8Soft أو أي خدمة تابعة. يمكنك التحقق بفتح أدوات المطور في المتصفح والتبديل إلى تبويب الشبكة ومسح السجل والكتابة في المدخل والتأكد من أن صفر طلبات شبكة تظهر لخطوة العدّ.
عدّاد الكلمات هذا يعمل بالكامل في متصفحك. لا رفع، لا حساب، لا مكتبة تابعة، لا قياس للنص المعدود. الصق أي نص بأي نظام كتابي، راقب خانات المقاييس السبع تتحدث أثناء الكتابة، وانسخ ما تحتاجه. الأداة كاملاً نحو 12 ك.ب من JavaScript تُحمَّل مرة واحدة وتعمل دون اتصال بعد الزيارة الأولى.