관리 메뉴

컴사랑의 이런 저런 이야기

최근에 받은 질문들.... 본문

일기/끄적거림

최근에 받은 질문들....

컴사랑 comlover 2010. 11. 12. 17:32
갑자기.. 주변 사람들이 무슨 바람이 불었는지, 꽤나 전공적인 것을 물어본다...   헉.. ㅡㅡ;

며칠 전에 받은 질문
"B+-tree로 varchar 효과적으로 indexing하려면 어떻게 해야해?"

헉.. ㅡㅡ; 이럴수가.. 나름 tree 계열은 꽤 잘 안다고 생각하고 살았는데 (물론 배운지가 오래되어서 기억은 잘 안난다.)
보통 학교에서 배울 때는, indexing key로 문자열은 잘 안 쓰는데 ㅡㅡ;

음. 어떻게 해야 할까?
문자열을 바로 key로 저장하면 왠지 뭔가... 좀 곤란할 것 같은데...
문자열을 hash 한 값을 key로 저장하면 되지 않을까? 라고 까지 밖에는 답을 못해줬다.
(아~ 그리고 tree는 재귀로 짜면 편해 라는 것과 ㅡㅡ; )

(물론 질문자는 "그럼 중복이 생기면?" 이라고 예상했던 질문을 충분히 날려주셨다~ )


그런데, 오늘 또 다른 사람에게 다른 질문을 받는다.
"wildcard가 포함된 substring을 쉽게 찾을 수 있는 알고리즘이 뭐에요?"
아흑, 갑자기 왜 사람들이 이렇게 string 에 관심을 가지는 거야 ㅡㅡ;
살짝 돌이켜 생각해본다. 부분문자열을 찾기에는 suffix tree가 좋은 것 같다. 아. 그런데 이게 wildcard도 처리가 되던가? 기억이 안난다. ㅡㅡ; 그리고 그렇다고 하더라도,  대부분 suffix tree를 알리가 없다. 이걸 내가 설명할 수도 없고, 구현부 설명도 쉽지 않다 (이미 다 잊었고 이게 쉬운 내용이 아니였던 것 같다)

흑 ㅠㅠ 조금 더 고민한다가 regular express을 처리해주는 솔루션을 찾는게 더 낫지 않을까라고 밖에 말을 못해줬다.  

갑자기 왜 이런 꽤나 난이도 있는 질문들이 오는거야~~~~
하지만 그와 동시에, 나의 아는 것이 너무 없다라는 생각도 들었다.

@ 혹시 답 아시는 분 있으시면 댓글로좀.. ^^



'일기 > 끄적거림' 카테고리의 다른 글

오랫만에 쓰는 글...  (0) 2011.10.20
블로그 다시 됩니다  (0) 2011.06.09
최근에 받은 질문들....  (0) 2010.11.12
요즘 읽고 있는 책은...  (4) 2010.10.10
행복하다~  (0) 2010.09.29
이맘때면 항상 잊는 것  (2) 2010.08.16
0 Comments
댓글쓰기 폼