Question 1

単語はどのようにカウントされますか？

Accepted Answer

このツールは、利用可能であればブラウザー内蔵の Intl.Segmenter API（Chrome 87+、Firefox 125+、Safari 14.1+）を使用して単語をカウントします。これにより、Unicode CLDR から派生した言語的に正確な単語境界を持つすべての文字体系——ラテン、中国語、アラビア語、デーヴァナーガリー、日本語、韓国語、キリル文字——を処理します。Intl.Segmenter が利用できない場合は、Unicode 対応の正規表現（/\p{L}+/gu）にフォールバックし、Unicode 文字の連続を照合します。競合するほとんどのツールは ASCII の空白で分割し、ラテンアルファベット以外のものを誤カウントしますが、このツールはそうしません。

Question 2

単語数カウントの例はどのようなものですか？

Accepted Answer

この 3 段落のサンプルをご覧ください。The quick brown fox jumps over the lazy dog. The sentence above is a pangram — it contains every letter of the English alphabet, which is why typographers and font designers use it to preview a typeface. Pangrams date back at least to the 19th century, when telegraph operators used short letter-complete sentences to test transmission accuracy. Today they show up in font specimens, keyboard tests, and the default placeholder text of every design app from Figma to InDesign. これを入力に貼り付けると、メトリクスタイルは報告します：単語数 71、スペースあり文字数 410、スペースなし文字数 340、文数 4、段落数 3、200 WPM での読み時間約 21 秒、130 WPM での話す時間約 33 秒。最頻出単語パネルは the や a などのストップワードをスキップし、主要なコンテンツ語——ここでは pangram、letter、sentence ——を表示します。中国語、アラビア語、ヒンディー語テキストに切り替えると、すべてのタイルがその文字体系独自のセグメンテーションルールに基づいて再計算されます。

Question 3

単語はどのようにカウントされますか？

Accepted Answer

Intl.Segmenter（Chrome 87+、Firefox 125+、Safari 14.1+）をサポートするブラウザーでは、ツールは new Intl.Segmenter(locale, { granularity: 'word' }) を使用し、isWordLike が true のセグメントをカウントします。これにより、中国語、日本語、アラビア語、デーヴァナーガリー、およびその他すべての Unicode 文字体系を正確に処理します。古いブラウザーでは、フォールバックの正規表現 /\p{L}+/gu が Unicode 文字の連続を照合します。これはラテン文字言語に対しては良好に機能しますが、スペースのない中国語・日本語のテキスト全体を関わらず 1 セグメントとして扱います。

Question 4

なぜ MS Word とカウントが異なるのですか？

Accepted Answer

Microsoft Word の単語カウントアルゴリズムは独自仕様であり、バージョン間でハイフン複合語、短縮形、特殊文字の処理が異なります。このツールは「won't」を 1 語（1 つの isWordLike セグメント）としてカウントしますが、Word は 2 語とカウントする場合があります。ほとんどの文章では 1〜2% 以内で一致し、ハイフン付きテキストではさらに乖離することがあります。ソーステキストが同じ UTF-8 文字列であれば、文字数は常に一致します。

Question 5

ラテン文字以外の文字体系（中国語、アラビア語、キリル文字）に対応していますか？

Accepted Answer

はい。Intl.Segmenter API は設計上 Unicode 対応です。アラビア語とヘブライ語（右から左の文字体系）は正確にカウントされ；キリル文字とギリシャ文字は通常のラテン式の単語境界分割でカウントされ；中国語と日本語は 1 文字あたり 1 つの単語ライクセグメントとして報告されます。これらの書記体系では単語間にスペースがないためです。文字数（[...text].length を使用）は常に文字体系に関わらず Unicode コードポイントをカウントするため、絵文字、CJK 文字、アクセント付きラテン文字はすべて 1 としてカウントされます。

Question 6

テキストはアップロードされますか？

Accepted Answer

いいえ。すべての計算はネイティブ JavaScript API を使用してブラウザータブ内で実行されます。Ultim8Soft のサーバーやサードパーティサービスには何も送信されません。ブラウザーの開発者ツールを開き、ネットワークタブに切り替え、ログをクリアし、入力欄に入力し、カウントステップでネットワークリクエストがゼロであることを確認することで検証できます。

単語数・文字数・読み時間を計測 _

単語はどのようにカウントされますか？

カウントの仕組み

なぜ単語を数えるのですか？

主な用途

単語数カウントの例はどのようなものですか？

単語はどのようにカウントされますか？

なぜ MS Word とカウントが異なるのですか？

ラテン文字以外の文字体系（中国語、アラビア語、キリル文字）に対応していますか？

テキストはアップロードされますか？

単語数・文字数・読み時間を計測 _

// 関連ツール

単語はどのようにカウントされますか？

カウントの仕組み

なぜ単語を数えるのですか？

主な用途

単語数カウントの例はどのようなものですか？

単語はどのようにカウントされますか？

なぜ MS Word とカウントが異なるのですか？

ラテン文字以外の文字体系（中国語、アラビア語、キリル文字）に対応していますか？

テキストはアップロードされますか？