DOMDocument를 이용하여 UTF-8로 인코딩된 html 파일을,
loadHTML, saveHTML 등의 method를 이용해서 가지고 놀던 중,
saveHTML로 뽑아낸 문자열에서 한글이 전부 entity로 변해 있는 것을 발견.
이걸 비교나 콘솔출력 등에 이용하려면 다시 제대로 된 문자열로 변환시켜야 함.
(브라우저는 알아서 변환시켜서 출력해 줌)
PHP의 html_entity_decode() 를 사용하면 다시 문자열로 돌아옴.
...
...
어쩌구 저쩌구 변환과정
...
...
// 콘솔상에 찍으면 결과는 모듈
echo $html."\n";
// 아래의 문장은 콘솔 상에 '모듈'이란 한글이 제대로 출력 됨.
// 3번째 인자로 인코딩을 제대로 넘겨주는 것이 중요.
echo html_entity_decode($html, ENT_NOQUOTES, 'UTF-8');
...
어쩌구 저쩌구 변환과정
...
...
// 콘솔상에 찍으면 결과는 모듈
echo $html."\n";
// 아래의 문장은 콘솔 상에 '모듈'이란 한글이 제대로 출력 됨.
// 3번째 인자로 인코딩을 제대로 넘겨주는 것이 중요.
echo html_entity_decode($html, ENT_NOQUOTES, 'UTF-8');
'PHP' 카테고리의 다른 글
[PHP] 여러 문자열 치환 (0) | 2009.11.18 |
---|---|
[PHP] DOMDocument 이용 중 ChildNode 모조리 날리기 (0) | 2009.11.17 |
[DokuWiki] 파일업로드 확장자 (3) | 2009.10.21 |
ImageMagick 설치시 에러날 때 (0) | 2009.10.16 |
[PHP] Smarty 변수 세팅 사용 (0) | 2009.09.10 |