Question 1

단어는 어떻게 계산되나요?

Accepted Answer

이 도구는 사용 가능한 경우 브라우저의 내장 Intl.Segmenter API(Chrome 87+, Firefox 125+, Safari 14.1+)를 사용하여 단어를 계산합니다. 이 API는 유니코드 CLDR에서 파생된 언어적으로 정확한 단어 경계를 가진 라틴어, 중국어, 아랍어, 데바나가리, 일본어, 한국어, 키릴 문자 등 모든 문자 체계를 처리합니다. Intl.Segmenter를 사용할 수 없는 경우 유니코드 문자의 모든 연속에 매칭되는 유니코드 인식 정규 표현식(/\p{L}+/gu)으로 폴백합니다. 대부분의 경쟁 도구는 ASCII 공백을 기준으로 분리하여 라틴 알파벳 외의 텍스트를 조용히 잘못 계산합니다; 이 도구는 그렇지 않습니다.

Question 2

단어 수 예시는 어떻게 생겼나요?

Accepted Answer

이 세 단락 샘플을 예로 들어보겠습니다. The quick brown fox jumps over the lazy dog. 위의 문장은 팬그램으로 — 영어 알파벳의 모든 글자를 포함하고 있어 타이포그래퍼와 폰트 디자이너가 서체 미리보기에 사용합니다. 팬그램은 전보 교환원이 전송 정확도를 테스트하기 위해 짧은 알파벳 완성 문장을 사용하던 19세기까지 거슬러 올라갑니다. 오늘날 폰트 샘플, 키보드 테스트, Figma에서 InDesign까지 모든 디자인 앱의 기본 플레이스홀더 텍스트에 등장합니다. 입력창에 붙여넣으면 지표 타일이 보고합니다: 71단어, 공백 포함 410문자, 공백 제외 340문자, 4문장, 3단락, 200 WPM 기준 약 21초 읽기 시간, 130 WPM 기준 약 33초 말하기 시간. 가장 많이 사용된 단어 패널은 the와 a 같은 불용어를 건너뛰고 지배적인 내용어를 표시합니다. 한국어, 아랍어, 힌디어 텍스트로 전환하면 모든 타일이 해당 문자 체계의 자체 분할 규칙에 맞게 다시 계산됩니다.

Question 3

단어는 어떻게 계산되나요?

Accepted Answer

Intl.Segmenter를 지원하는 브라우저(Chrome 87+, Firefox 125+, Safari 14.1+)에서 이 도구는 new Intl.Segmenter(locale, { granularity: 'word' })를 사용하여 isWordLike가 true인 세그먼트를 계산합니다. 이는 중국어, 일본어, 아랍어, 데바나가리 및 다른 모든 유니코드 문자 체계를 올바르게 처리합니다. 구형 브라우저에서는 유니코드 문자의 모든 연속에 매칭되는 폴백 정규식 /\p{L}+/gu를 사용하며, 이는 라틴 문자 언어에서 잘 작동하지만 공백 부재에 관계없이 중국어나 일본어 단어 전체를 하나의 세그먼트로 처리합니다.

Question 4

MS Word와 수치가 왜 다른가요?

Accepted Answer

Microsoft Word의 단어 수 알고리즘은 독점적이며 버전에 따라 하이픈 복합어, 축약어, 특수 문자를 다르게 처리합니다. 이 도구는 "won’t"를 하나의 단어(하나의 isWordLike 세그먼트)로 계산하는 반면 Word는 두 개로 계산할 수 있습니다. 대부분의 산문에서 수치는 1~2% 이내로 일치합니다; 하이픈이 많은 텍스트에서는 더 차이가 날 수 있습니다. 소스 텍스트가 동일한 UTF-8 문자열일 때 문자 수는 항상 일치합니다.

Question 5

비라틴 문자(중국어, 아랍어, 키릴 문자)를 지원하나요?

Accepted Answer

네. Intl.Segmenter API는 설계상 유니코드를 인식합니다. 아랍어와 히브리어(오른쪽에서 왼쪽 문자 체계)는 올바르게 계산됩니다; 키릴 문자와 그리스어는 일반 라틴 스타일 단어 경계 분리로 계산됩니다; 중국어와 일본어는 해당 문자 체계가 단어 사이에 공백을 사용하지 않기 때문에 글자당 하나의 단어 같은 세그먼트로 보고합니다. 문자 수([...text].length 사용)는 문자 체계에 관계없이 항상 유니코드 코드 포인트를 계산하므로 이모지, CJK 문자, 강세가 있는 라틴 문자 모두 1로 계산됩니다.

Question 6

텍스트가 업로드되나요?

Accepted Answer

아니요. 모든 계산은 네이티브 JavaScript API를 사용하여 브라우저 탭 내에서 실행됩니다. Ultim8Soft의 서버나 서드파티 서비스로 아무것도 전송되지 않습니다. 브라우저 개발자 도구를 열고, 네트워크 탭으로 전환하고, 로그를 지우고, 입력창에 입력하여 계산 단계에서 네트워크 요청이 전혀 나타나지 않는 것을 확인하면 검증할 수 있습니다.

단어, 문자, 읽기 시간 계산 _

단어는 어떻게 계산되나요?

계산 방법

단어를 계산하는 이유

주요 활용 사례

단어 수 예시는 어떻게 생겼나요?

단어는 어떻게 계산되나요?

MS Word와 수치가 왜 다른가요?

비라틴 문자(중국어, 아랍어, 키릴 문자)를 지원하나요?

텍스트가 업로드되나요?

단어, 문자, 읽기 시간 계산 _

// 관련 도구

단어는 어떻게 계산되나요?

계산 방법

단어를 계산하는 이유

주요 활용 사례

단어 수 예시는 어떻게 생겼나요?

단어는 어떻게 계산되나요?

MS Word와 수치가 왜 다른가요?

비라틴 문자(중국어, 아랍어, 키릴 문자)를 지원하나요?

텍스트가 업로드되나요?