본문으로 건너뛰기

Python에서 파일의 단어 수를 세는 방법

파이썬에서 파일 내 단어 수를 세는 방법.

파이썬을 사용하여 파일 내 단어 수를 세는 방법에 대한 단계별 튜토리얼을 제공합니다:

1단계: 파일 열기 먼저, 단어를 세고자 하는 파일을 열어야 합니다. 파이썬에서는 open() 함수를 사용하여 이 작업을 수행할 수 있습니다. 파일 경로와 파일을 열고자 하는 모드(읽기 등)를 지정합니다.

file_path = '파일_경로.txt'
file = open(file_path, 'r')

2단계: 파일 내용 읽기 다음으로, 파일의 내용을 읽어야 합니다. 이 작업은 파일 객체의 read() 메서드를 사용하여 수행할 수 있습니다. 이 메서드는 파일 전체를 읽고 그 내용을 문자열로 반환합니다.

file_contents = file.read()

3단계: 파일 닫기 파일 내용을 읽은 후에는 close() 메서드를 사용하여 파일을 닫는 것이 좋은 습관입니다. 이를 통해 파일에 사용된 시스템 리소스를 해제할 수 있습니다.

file.close()

4단계: 단어 수 세기 이제 파일 내용을 문자열로 갖고 있으므로, 단어 수를 세어볼 수 있습니다. 단어 수를 세는 데 여러 가지 접근 방법이 있습니다. 다음은 몇 가지 예시입니다:

예시 1: split() 메서드 사용 split() 메서드를 사용하여 문자열을 단어의 리스트로 분할할 수 있습니다. 이 메서드는 기본적으로 공백 문자마다 문자열을 분할하여 단어를 구분합니다. 그런 다음, len() 함수를 사용하여 리스트 내의 단어 수를 얻을 수 있습니다.

words = file_contents.split()
word_count = len(words)

예시 2: 정규 표현식 사용 더 복잡한 단어 경계를 고려해야 한다면, 정규 표현식을 사용할 수 있습니다. 파이썬의 re 모듈은 강력한 정규 표현식 기능을 제공합니다. 다음 예시는 단어 경계를 공백이 아닌 문자로 고려하여 단어를 세는 방법을 보여줍니다.

import re

words = re.findall(r'\b\w+\b', file_contents)
word_count = len(words)

5단계: 단어 수 출력 또는 사용 마지막으로, 단어 수를 출력하거나 필요에 따라 추가 처리에 사용할 수 있습니다.

print("파일 내 단어 수:", word_count)

이것으로 파이썬을 사용하여 파일 내 단어 수를 세는 방법을 알게 되었습니다. '파일_경로.txt'를 실제 파일 경로로 대체해 주세요.