검색(Information retrieval) 관점에서 잡담
- Posted at 2006/06/08 22:04
- Filed under 과거블로그글/기타
By 주현성님
Web 2.0을 현재 웹문서 검색기술 관점에서 본다면 전혀 지원이 되고 있지 않은 것 같습니다. 동적으로 생성되는 문서에 대해서 웹 검색은 무시할 수 밖에 없으니까요. (web 2.0이 아니더라도 php, javascritp만 해도 그렇습니다.) URL 주소 외에 session, cookie, user가 어떤 context로 javascript의 어떤 event를 발생시켰는 지에 따라 contents가 전혀 달라지니까요. 물론 장점이 더 많은 것 같습니다. Data를 모으는 곳이 그.. 특정 업체들(구글, Amazon 등..)로 몰리게 되면 Data가 well-organize되어 있을 테니, 그 자료들에게 index를 달고하는 일이 쉽겠죠. 지금까지 검색 엔진을 만들 때 첫번째 문제가 되었던 자료 수집이 더 이상 문제가 되지 않는 것이네요. 물론 data를 몽땅 가지고 있는 업체가 그걸 내놔야 하는 어려움이 있습니다. data로 먹고 사는 데, 구글 API처럼 1,000개 씩을 줄 수 있지만 통째로 내놓으면 밑천이 없겠죠. 그들(구글, amazon, 도서관 site 등.)이 지원하는 검색엔진을 이용한 API를 사용할 수 밖에 없습니다. 구글의 웹 검색이 점점 무력화되는 반면, 구글이 개별 사이트에 검색 엔진을 더 많이 팔아먹어서 이익을 볼 수 있지 않을 까요? (하지만 이제 구글이 엄청 컸으니 검색 엔진을 파는 게 아니라, 데이터를 사들이는 군요.) 어제 잠시 꿈꾸었던 open-data movement가 일어나면 데이터가 공개되어 있고 well-orgarnize되어 있으니 index도 맘대로 달 수 있겠네요. :)
Web 2.0을 현재 웹문서 검색기술 관점에서 본다면 전혀 지원이 되고 있지 않은 것 같습니다. 동적으로 생성되는 문서에 대해서 웹 검색은 무시할 수 밖에 없으니까요. (web 2.0이 아니더라도 php, javascritp만 해도 그렇습니다.) URL 주소 외에 session, cookie, user가 어떤 context로 javascript의 어떤 event를 발생시켰는 지에 따라 contents가 전혀 달라지니까요. 물론 장점이 더 많은 것 같습니다. Data를 모으는 곳이 그.. 특정 업체들(구글, Amazon 등..)로 몰리게 되면 Data가 well-organize되어 있을 테니, 그 자료들에게 index를 달고하는 일이 쉽겠죠. 지금까지 검색 엔진을 만들 때 첫번째 문제가 되었던 자료 수집이 더 이상 문제가 되지 않는 것이네요. 물론 data를 몽땅 가지고 있는 업체가 그걸 내놔야 하는 어려움이 있습니다. data로 먹고 사는 데, 구글 API처럼 1,000개 씩을 줄 수 있지만 통째로 내놓으면 밑천이 없겠죠. 그들(구글, amazon, 도서관 site 등.)이 지원하는 검색엔진을 이용한 API를 사용할 수 밖에 없습니다. 구글의 웹 검색이 점점 무력화되는 반면, 구글이 개별 사이트에 검색 엔진을 더 많이 팔아먹어서 이익을 볼 수 있지 않을 까요? (하지만 이제 구글이 엄청 컸으니 검색 엔진을 파는 게 아니라, 데이터를 사들이는 군요.) 어제 잠시 꿈꾸었던 open-data movement가 일어나면 데이터가 공개되어 있고 well-orgarnize되어 있으니 index도 맘대로 달 수 있겠네요. :)
Posted by 한재선
- Response
- No Trackback , No Comment
Trackback URL : 이 글에는 트랙백을 보낼 수 없습니다

