NSXMLParser를 이용한 파싱에서 한글과 영어가 섞인 항목에서 한영 분리 현상이 발생하고 있다.

Event-Driven 파싱을 할때 NSXMLParser의 겔리게이트 중

-(void) parser:(NSXMLParser *)parser foundCharacters:(NSString *)string 메소드를 이용한다.

XML  문서가 아래와 같이 


영문 + 한글 형식이면

<tag>abc가나다</abc>


abc | 가나다 가 분리된다.


이상현상으로는

영문 + 한글 + 영문 형식이면

<tag>abc가나다def</abc>

의 경우에는

abc | 가나다def 로 분리된다.



한글 + 영문 + a 으로 시작하는 경우에는?

<tag>가나다abc라마바def</abc>


가나다abc라마바def 가 하나의 토큰으로 인식된다.

반응형

+ Recent posts