Apr 09 2007
블로그 전문 검색엔진 '나루' 에 대한 생각
이번 주말에 ‘나루’ 시연회가 있었고, RSS 리더에 많은 포스트가 잡혀서 대강의 내용을 파악할 수 있었습니다.
- 블로그 검색 ‘나루’가 생각하는 것들(서명덕 기자 님)
- 생각 검색을 꿈꾸는… naaroo 검색 시연회 후기…(RadioKids 님)
- 블로그 검색 나루 시연회..(미친병아리 님)
검색엔진 파트도 진로의 하나로 고려중이기에 한번 훓어보고 간결한 생각을 남겨봅니다.
나루에 대한 소개나 자세한 내용은 위의 링크를 참조하세요.
현재 검색엔진의 근간이 되는 알고리즘은 ‘페이지 랭킹’ 알고리즘 입니다.
‘페이지 랭킹’ 알고리즘은 해당 글을 링크한 글의 수를 랭킹 계산에 반영합니다. 중요한 글일 수록 다른 글에서 인용되거나 링크되었을 것이라는 의미입니다.
하지만 페이지 랭킹 알고리즘은 블로그에는 특화되어 있지 않습니다. 블로그는 지식 전달로 사용되는 경우도 있지만 이른바 신변잡기나 감성 등의 자료들이 많아 기존의 정보 글 들과는 성격이 약간 다르다고 할 수 있기 때문입니다.
‘나루’는 여기에 블로그의 특성을 추가로 부여하여 블로그에 특화된 검색을 수행합니다.
‘관심’이라는 속성을 추가로 부여하고, 이를 알고리즘에 적극적으로 활용하도록 시스템이 구성되어 있습니다.
이 ‘관심’은 올블로그의 ‘추천’ 이나 트랙백 등의 유저의 피드백에 좌우되도록 하여 검색 결과가 그 때의 트렌드나 유저의 공감대, 해당 블로그의 전문성에 따라 달라질 수 있도록 되어 있습니다.
(시연회에서는 트렌드에 대한 검색 결과의 변동에 대해 ‘애플’을 예로 들어 애플컴퓨터에 대한 정보가 트렌드 상 더 주목을 받고 있을 때는 검색 결과가 애플컴퓨터 관련으로, 과일 정보가 트렌드 상 더 주목을 받고 있을 때는 검색 결과가 과일 관련으로 랭크가 매겨진다는 예를 들었습니다.)
‘관심’을 일반 사이트에 적용하지 않는 것은 일반 사이트를 대상으로 ‘관심’ 수집을 받기가 쉽지 않고, 단순 정보만 보여주거나 판매 사이트, 기업 사이트같은 경우 ‘관심’에 크게 좌우되지 않기 때문이라고 보여집니다.
그리고 일반 검색 시에 트렌드에 따라 검색 결과가 다르게 되면 위에서 보여 준 ‘애플’ 검색의 부작용 사례도 나올 수 있겠죠.(과일 정보가 트렌드 상 더 주목을 받을 때 ‘애플컴퓨터’ 관련 정보를 찾고 싶어도 찾을 수 없다는 등의…)
또한 현재의 검색엔진에서 블로그 검색의 결과가 유독 좋지 않다는 것을 말해 주는 것이기도 합니다.
아무튼 ‘나루’ 서비스는 4월 중에 오픈될 모양인데, 만약 예상보다 좋은 검색 결과를 만든다면 ‘검색엔진의 소셜 알고리즘’이라는 타이틀로 큰 센세이션을 불러 일으킬 것 같습니다. (개인적으로 기대가 되네요.)
하지만 사람 일이라는 게 알 수가 없기에, 실제로 어떤 변화를 가져올 지는 정식 서비스가 된 이후에 지켜봐야 될 것 같습니다.
ps. 리퍼러를 몇 개 방문했는데, 포스트의 미흡함을 지적하셔서 해당 부분에 대해 첨언합니다.
1) 페이지 랭크에 대해 ‘구글의 알고리즘’ 으로 표현함으로써 피상적으로 표현했다는 지적을 해 주셨습니다.
보통 검색엔진은 특정 알고리즘에 의존하지 않습니다. 근간이 되는 큰 알고리즘은 있겠지만, 최적의 검색 결과를 보장하기 위해서 더 많은 속성을 활용합니다. 메타 태그도 활용하고, 제목에 대한 가중치, tf/idf, 분류 클러스터링, 이외에도 수많은 속성들이 각자의 가중치값을 가지고 계산되어 글의 점수를 산출하고 점수에 따라 랭킹이 매겨집니다.
사실 당연한 부분이라 간략히 적은 것인데 오해의 소지가 있을 수 있겠네요. 해당 부분을 수정하였습니다.
2) ‘나루’ 에 대한 판단이 없다는 지적을 해 주셨습니다.
저는 개인적으로 ‘나루’가 기대됩니다. 새로운 속성에 대한 시도라고 보기 때문입니다.
수많은 속성과 페이지 랭크로 대표되는 구글, 수작업에 의한 최적화로 대표되는 네이버에 비해 유저의 피드백이 점수에 중요하게 반영될 여지가 큰 ‘나루’는 확실히 새로운 시도이고, 알고리즘 효율성은 제쳐두고서라도 그 자체로도 의의가 있다고 생각합니다.
다만, 유저가 개입되기 때문에 생길 수 있는 ‘어뷰징’을 차단하는 것이 최대 난관이 될 것입니다.
지적해 주셔서 감사합니다 ^^ 다만, 해당 부분을 트랙백이나 덧글로 알려 주셨다면 하는 아쉬움이 남네요.
이외에도 많은 의견 주시기 바랍니다.
