DOMDocument를 이용하여 UTF-8로 인코딩된 html 파일을,
loadHTML, saveHTML 등의 method를 이용해서 가지고 놀던 중,
saveHTML로 뽑아낸 문자열에서 한글이 전부 entity로 변해 있는 것을 발견.
이걸 비교나 콘솔출력 등에 이용하려면 다시 제대로 된 문자열로 변환시켜야 함.
(브라우저는 알아서 변환시켜서 출력해 줌)

PHP의 html_entity_decode() 를 사용하면 다시 문자열로 돌아옴.

...
...
어쩌구 저쩌구 변환과정
...
...
// 콘솔상에 찍으면 결과는 모듈
echo $html."\n";

// 아래의 문장은 콘솔 상에 '모듈'이란 한글이 제대로 출력 됨.
// 3번째 인자로 인코딩을 제대로 넘겨주는 것이 중요.

echo html_entity_decode($html, ENT_NOQUOTES, 'UTF-8');




Posted by bloodguy
,