単語はどのようにカウントされますか?
このツールは、利用可能であればブラウザー内蔵の Intl.Segmenter API(Chrome 87+、Firefox 125+、Safari 14.1+)を使用して単語をカウントします。これにより、Unicode CLDR から派生した言語的に正確な単語境界を持つすべての文字体系——ラテン、中国語、アラビア語、デーヴァナーガリー、日本語、韓国語、キリル文字——を処理します。Intl.Segmenter が利用できない場合は、Unicode 対応の正規表現(/\p{L}+/gu)にフォールバックし、Unicode 文字の連続を照合します。競合するほとんどのツールは ASCII の空白で分割し、ラテンアルファベット以外のものを誤カウントしますが、このツールはそうしません。
カウントの仕組み
キーストロークごとに 6 つのステップがブラウザーで実行されます。いずれもネットワークには触れません。パイプライン全体は典型的な段落長の入力に対して 1 ミリ秒未満で実行され、10 万語の原稿もフレームを落とさずに処理します。
- テキストがテキストエリアから読み取られ、ブラウザーメモリに保持されます——デバイスから外に出ません。
- 文字数は JavaScript のスプレッド演算子(
[...text].length)を使用して Unicode コードポイントを数えるため、🙂 のような絵文字は内部的な UTF-16 エンコーディングに関わらず 1 文字としてカウントされます。 - 単語数は
granularity: 'word'を指定したIntl.Segmenterを使用し、isWordLikeが true のセグメントにフィルタリングします。スペースで単語が区切られない中国語・日本語テキストは 1 文字あたり 1 セグメントとしてカウントされます。 - 文数は
granularity: 'sentence'を指定したIntl.Segmenterを使用します。これにより、単純なピリオド分割よりも略語、省略記号、句読点のエッジケースを適切に処理します。 - 段落数は 1 つ以上の空行(
\n\s*\n)で分割し、空のセグメントを除外します。 - 読み時間と話す時間は、単語数を設定された WPM レート(デフォルト:読み 200、話す 130)で割り、結果を分・秒でフォーマットします。
なぜ単語を数えるのですか?
- 論文・提出物の文字数制限。大学の志望理由書は 650 語(Common App)、500 語(多くの UK UCAS 志望理由書)、または 4,000 文字(スペースあり)で上限が設けられています。提出前にカウントを把握しておくことで、締め切り直前の焦った削除作業を防げます。
- SEO とコンテンツ計画。検索品質チームは単語数をトピックの深さの大まかな指標として使用しており、1,500〜2,500 語のロングフォームページは競合クエリで薄い投稿より一貫して上位に表示されます。下書き中にカウントを追跡することで、水増しなしにその範囲に収められます。
- ソーシャルメディアのサイズ確認。X は投稿を 280 文字、LinkedIn 記事を 110,000 文字、Instagram のキャプションを 2,200 文字、メタディスクリプションをおよそ 160 文字に制限しています。文字数タイルは、プラットフォームエディターに貼り付けて切り詰められたことを発見する前に正確な数字を示します。
- 文字起こしとプレゼンテーションの見積もり。1分200語での読み時間は平均的なサイレント読みに対応し、1分130語での話す時間は会話ペースに対応します。ポッドキャストのセグメントのサイズ調整、5分ライトニングトークの計画、または収録セッション前のナレーション時間の見積もりに両方を活用してください。
主な用途
単語・文字数カウントは、ライティング・コンテンツ・開発作業全般に現れます。このツールの Unicode 対応エンジンは、複数言語でコンテンツを配信するチームに特に重要です:
- 学術ライティング:論文章の目標語数に向けた進捗を追跡するか、提出前に抄録がジャーナルの文字数制限内に収まっているかを確認します。
- マーケティング・UX コピー:件名、ヒーローヘッドライン、CTA ボタンラベルをデザイナーが Figma で設定した文字数予算に対して測定します。
- スピーチライティングとポッドキャスト:スクリプトを予想所要時間に変換し、リハーサル当日より前にキーノートが長すぎるかどうかを把握します。
単語数カウントの例はどのようなものですか?
この 3 段落のサンプルをご覧ください。The quick brown fox jumps over the lazy dog. The sentence above is a pangram — it contains every letter of the English alphabet, which is why typographers and font designers use it to preview a typeface. Pangrams date back at least to the 19th century, when telegraph operators used short letter-complete sentences to test transmission accuracy. Today they show up in font specimens, keyboard tests, and the default placeholder text of every design app from Figma to InDesign. これを入力に貼り付けると、メトリクスタイルは報告します:単語数 71、スペースあり文字数 410、スペースなし文字数 340、文数 4、段落数 3、200 WPM での読み時間約 21 秒、130 WPM での話す時間約 33 秒。最頻出単語パネルは the や a などのストップワードをスキップし、主要なコンテンツ語——ここでは pangram、letter、sentence ——を表示します。中国語、アラビア語、ヒンディー語テキストに切り替えると、すべてのタイルがその文字体系独自のセグメンテーションルールに基づいて再計算されます。
単語はどのようにカウントされますか?
Intl.Segmenter(Chrome 87+、Firefox 125+、Safari 14.1+)をサポートするブラウザーでは、ツールは new Intl.Segmenter(locale, { granularity: 'word' }) を使用し、isWordLike が true のセグメントをカウントします。これにより、中国語、日本語、アラビア語、デーヴァナーガリー、およびその他すべての Unicode 文字体系を正確に処理します。古いブラウザーでは、フォールバックの正規表現 /\p{L}+/gu が Unicode 文字の連続を照合します。これはラテン文字言語に対しては良好に機能しますが、スペースのない中国語・日本語のテキスト全体を関わらず 1 セグメントとして扱います。
なぜ MS Word とカウントが異なるのですか?
Microsoft Word の単語カウントアルゴリズムは独自仕様であり、バージョン間でハイフン複合語、短縮形、特殊文字の処理が異なります。このツールは「won't」を 1 語(1 つの isWordLike セグメント)としてカウントしますが、Word は 2 語とカウントする場合があります。ほとんどの文章では 1〜2% 以内で一致し、ハイフン付きテキストではさらに乖離することがあります。ソーステキストが同じ UTF-8 文字列であれば、文字数は常に一致します。
ラテン文字以外の文字体系(中国語、アラビア語、キリル文字)に対応していますか?
はい。Intl.Segmenter API は設計上 Unicode 対応です。アラビア語とヘブライ語(右から左の文字体系)は正確にカウントされ;キリル文字とギリシャ文字は通常のラテン式の単語境界分割でカウントされ;中国語と日本語は 1 文字あたり 1 つの単語ライクセグメントとして報告されます。これらの書記体系では単語間にスペースがないためです。文字数([...text].length を使用)は常に文字体系に関わらず Unicode コードポイントをカウントするため、絵文字、CJK 文字、アクセント付きラテン文字はすべて 1 としてカウントされます。
テキストはアップロードされますか?
いいえ。すべての計算はネイティブ JavaScript API を使用してブラウザータブ内で実行されます。Ultim8Soft のサーバーやサードパーティサービスには何も送信されません。ブラウザーの開発者ツールを開き、ネットワークタブに切り替え、ログをクリアし、入力欄に入力し、カウントステップでネットワークリクエストがゼロであることを確認することで検証できます。
このワードカウンターは完全にブラウザーで動作します。アップロードなし、アカウント不要、ベンダーライブラリ不要、カウントされるテキストへの分析なし。任意の文字体系の任意のテキストを貼り付け、入力しながら 7 つのメトリクスタイルが更新されるのを見て、必要なものをコピーしてください。ツール全体は約 12 KB の JavaScript で、一度読み込まれれば初回訪問後はオフラインで動作します。