루비와 유니코드

일본에서 만든 언어인데 왜 이렇게 유니코드 처리가 빈약한지 모르겠다. 최근 RoR 로 작업하는 일이 있었는데 몇번이나 이놈의 유니코드 처리에 당했다. 레퍼런스를 찾아보면 다음과 같은 아주 고무적인 이야기가 나온다.

Please note that right now Rails basically knows nothing about Unicode and pretends everything is just bytes. It means that validates_length_of for multibyte characters will trigger errors at the wrong places, various kinds of Unicode whitespaces are not going to get trimmed and sometimes Rails will cut right into your characters. Absolute most of Rails internals makes no notion that multibyte text even exists, Rails just delegates all to the Ruby string handling code (which in current Ruby is all single-byte).

This is being looked at, but in the meantime you use UTF8 encoded strings at your own risk and you can expect (and wil get) bugs and problems :-)

버그가 반드시 발생할꺼래요. 너무 고무적인 도움말이군요 :-)

by 슈레인 | 2007/06/19 13:14 | 트랙백(1) | 덧글(8)

트랙백 주소 : http://shurain.egloos.com/tb/3520337
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Tracked from Psychedelic .. at 2007/06/19 15:28

제목 : 루비와 유니코드 #2
공식 문서 루비에서 유니코드에 대한 개략적인 이야기 실질적인 해답 아직 이 답이 완전한지는 모르겠지만 당장 사용하는데에 지장이 있는것 같지는 않다. 개인적으로 slice 를 새로 구현하여 사용하고 있다....more

Commented by bassist. at 2007/06/19 16:18
가르쳐 주는 게 어디야. 루비같은 hot-issued language는 그나마 나은 편이라고 생각함...
Commented by 슈레인 at 2007/06/19 18:09
bassist. // 다른 언어들은 잘 몰라서 뭐라고 하긴 뭐하지만... 사람들이 열광하는 것과는 대조적으로 불편한점이 아직 많이 있어요.
Commented by rein at 2007/06/22 12:22
Python은 유니코드 풀 지원(이라기보단 내부 인터프리터가 UTF-8 기반)

len( u('악플러등장') ) == 5 라서 매우 좋음(???)
Commented by 슈레인 at 2007/06/22 14:00
rein // 저도 그래서 루비가 파이썬을 따라가려면 아직 멀었다고 느끼고 있어요 :)
Commented by 내공쌓기그건내사정 at 2007/09/28 03:02
난 프로그래밍몰라.. 블로그도 몰라 루비레일스 로 2달만에 웹서비스 단독 시작 ㅡㅡ 계획!!
Commented by 슈레인 at 2007/09/28 14:09
내공쌓기그건내사정 // 어려운 길을 가시네요
Commented by 루비 1.9 at 2009/11/19 22:00
요새 루비를 배우고 있는데 1.9 이상 버전에서 유니코드를 잘 지원합니다.
이 글이 몇 년전 글인고..ㅠ
Commented by 슈레인 at 2009/11/23 14:49
2년이 넘은 글이네요 ㅋㅋ 당시에 조금 고생했던 기억이 있습니다.

:         :

:

비공개 덧글

◀ 이전 페이지          다음 페이지 ▶