한글이 깨어져 있을 때 복구법
간혹 파일을 열어보면 한글이 아래와 같이 깨어져 있는 경우를 볼 수가 있습니다.
ìë
íì¸ì
이렇게 보이는 이유는 텍스트 인코딩이 잘 못된 채로 파일이 저장되어서 그렇습니다.
사실 원래 인코딩이 무엇인지 모르기 때문에, 조금 반복테스트가 필요할 수도 있지만 아래 사이트를 이용하면 복원 가능할 수도 있습니다. (물론 실제로 파일이 손상되었거나 인코딩을 못 찾으면 하면 복원이 안됩니다)
https://string-functions.com/encodedecode.aspx
Encoding / decoding tool. Analyze character encoding problems and errors.
View String Manipulation Tools What Is A Code Page? Code page is another name for character encoding. It consists of a table of values that describes the character set for a particular language. What Is character encoding? Character encoding is the process
string-functions.com
보통 서양권에서 파일을 저장하면 인코딩인 iso-8859-1인 경우가 많습니다.
그래서 깨어진 텍스트를 붙여 넣고,
encode with를 iso-8859-1
decode with를 utf-8 또는 euc-kr 또는 utf-16 중에 하나로 해봅니다.
저는 utf-8로 디코딩을 하니까 제대로 보이네요
(아래쪽 "안녕하세요" 라고 나온게 제대로 디코딩 된 것입니다)
혹시 파일의 한글이 깨어져 있다면 이런 식으로 한번 시도해 보시는 것도 좋을 것 같습니다.
감사합니다.