Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- bigquery
- openAI
- 태블로
- Adobe
- GPT
- SQL
- 북리뷰
- tableau
- 서평
- Python
- 생성AI
- 챗GPT
- AWS
- diary
- 빅쿼리
- 데일리
- Q
- daily
- review
- AZURE
- ChatGPT
- 구글애널리틱스
- 파이썬
- 데이터시각화
- r
- 책리뷰
- 필사
- Ga
- datastudio
- 데이터분석
Archives
- Today
- Total
가볍게 배우고 깊게 즐기고 오래 남기기
[Python | Error 해결] 'cp949' codec can't decode byte 0xec in position 51: illegal multibyte sequence - 구글링 해서 찾았는데도 같은 에러 만날 때 한 큐 해결방법 (chardet) 본문
Programming & Tip/Python
[Python | Error 해결] 'cp949' codec can't decode byte 0xec in position 51: illegal multibyte sequence - 구글링 해서 찾았는데도 같은 에러 만날 때 한 큐 해결방법 (chardet)
Awesomist 2024. 1. 5. 15:13728x90
pandas read_csv를 써서 한글을 사용하더라도 UTF-8을 쓰던 CP949를 쓰던
구글링 stackoverflow를 사용해도 가틍ㄴ decode 에러가 뜰때가 있다.
이럴 땐 chardet으로 파일 상관없이 인코딩 패스하는 방법이 있다.
AS-IS
df = pd.read_csv("path/to/file.csv", encoding='cp949')
df = pd.read_csv("path/to/file.csv", encoding='cp949')
ERROR : 'cp949'codec can't decode byte 0xec in position 51: illegal multibyte sequence
TO-BE
import chardet
with open(FILEPATH, 'rb') as f:
result = chardet.detect(f.read()) # 파일 인코딩 확인
df = pd.read_csv(FILEPATH, encoding=result['encoding']) # 감지된 인코딩으로 파일을 읽음
반응형
'Programming & Tip > Python' 카테고리의 다른 글
[Pyton || Tip] nbformat 라이브러리를 활용한 노트북파일(ipynb) py변환 (0) | 2024.05.20 |
---|---|
Python Tip || ["ABC", "DEF"] 리스트형태의 str -> list로 바꿀때 (1) | 2024.04.12 |
Python || Python import json dump 한글 깨짐 해결 방법 (json 파일 쓰기 한글 유니코드 변환 해결 방법) (0) | 2023.09.15 |
Python || Slack API 내용을 일일 로그, 월별로그 남기는 코드 공유 (내 작업본의 일부 Sample) (0) | 2023.08.31 |
Python || chatGPT API 등 외부 API를 활용해 텍스트 출력할 때 줄바꿈하는 간단한 prettier 함수 (0) | 2023.08.03 |
Comments