강좌 첫화면으로 최근 글 보기(Post)
갈래별로 보기 categories




  [04.03] 검색영역의 확대. 개인검색부터 모든 지식검색까지



웹2.0 시대의 기회. 시맨틱웹

04.03.검색영역의 확대. 개인검색부터 모든 지식검색까지


개인이 보유한 자료를 검색하고 공유되는 시대가 될 것이다.

다음 세대 검색엔진이 주력할 또 하나의 분야는 개인검색 분야다. 개인의 PC에 저장되는 정보가 많아지면서 일차적으로 개인의 PC에 있는 자료를 검색하는 데스크탑검색 분야가 필요해진다. 데스크탑검색 경쟁은 구글이 내놓은 구글데스크탑으로 본격적으로 시작되었고 이어서 야후, MSN 등이 경쟁적으로 참여했다. 데스크탑검색은 웹검색의 확장인 동시에 웹검색의 시작점이 될 수 있다. 사실 가장 많은 정보는 결국 웹에 있는 것이 아니라 웹에 자료를 올리는 개인이 가지고 있는 것이기 때문이다.

구글은 구글데스크탑검색을 좀더 효과적으로 강화하기 위해 구글미니(Google Mini)와 같은 상품을 내놓기도 했다. 구글미니는 기업 내 정보나 기업의 홈페이지 정보를 검색해주는 일을 한다. 한 마디로 구글의 검색기술이 포함된 컴퓨터다. 사용자는 전원선과 랜선만 연결하면 되는 아주 편리한 제품이다. 구글은 점차 검색의 범위를 개인과 개별 기관으로 확장하고 있는 것이다.

이미 사용자는 이당키(edonkey), 프루나를 비롯한 P2P 프로그램을 통해 자신의 컴퓨터를 검색할 수 있도록 하고 있다. 결국 보안 문제만 해결된다면 사람들은 자신의 PC정보를 인터넷을 통해 공유하려 할 것이다. 그 출발점이 바로 데스크탑검색이고, 이 시장을 노리고 구글이 뛰어든 것이다. 결국 다음 시대의 검색은 누가 사용자의 PC정보를 더 많이 확보하느냐가 될 것이다.


이미 개인검색의 전 단계로 개인화 서비스가 강화되고 있다.

이미 개인정보 검색의 전 단계로 개인화 기술이 점차 강화되고 있다. 현재 구글이나 MS의 개인화 서비스는 사용자 개인이 자신에게 필요한 내용을 편집해 사용하고 있다. 하지만 사용자 정보를 조금만 더 제공한다면 전혀 다른 검색결과를 얻을 수 있다. 즉 '심청'이라는 낱말을 검색하는 경우 지금은 누구에게 똑 같은 결과를 보여주지만 검색한 사람이 초등학생이라면 '왕후 심청'이라는 만화영화를, 대학생이나 국문과 교수라면 '완판본 심청전'을 결과로 보여줄 수 있다. 또 평소 개인 취향이나 검색 정보를 기록했다가 검색엔진에게 제공할 수 있다면 '소니'라는 낱말로 검색했다고 하더라고 게임광에게는 PS2나 PSP를, 노트북 사용자에게는 소니 바이오 노트북을, 부모에게는 소니 캠코더를, 증권업계 종사자에게는 소니의 주가나 기업 정보를 제공할 것이다. 또한 지난 번에 내가 검색했던 낱말이나 요즘 내가 자주 검색했던 낱말들을 나열해주는 기술도 적용될 것이다. 대개 개인 사용자는 자기 환경과 직업에 따라 검색했던 낱말을 반복 검색하기 마련이다. 사용자가 몇 가지 정보만 추가로 제공해도 이처럼 검새결과는 훨씬 발전하는데 이를 자동으로 처리하는 것이 시맨틱웹 시대의 검색엔진이 할 일이다.

지금까지의 검색기술을 평가할 때는 검색낱말과 관련된 정보를 몇 개나 발견했느냐 하는 응답률(recall)과 검색 결과에서 관련 있는 정보가 어느 정도냐 하는 정확도(precision)로 평가했지만 앞으로는 사용자 별 정확도가 어느 정도인가로 평가하는 시대가 될 것임을 알 수 있다.

이것이 바로 개인화 시대의 검색엔진이 나갈 길이며, 여기에는 내 단말기의 프로그램이 검색엔진에게 평소의 내 취미나 검색 패턴을 제공하는 것으로 이루어질 것이다. 물론 주민등록번호나 이름 등을 제공할 필요는 없다. 단지 내 검색에 도움이 될 정보만 검색엔진에게 제공하면 되는 것이다.


웹서비스도 시맨틱웹과 연결되고 있다.

개인화 서비스와 연결해 생각해볼 수 있는 서비스로 웹서비스가 있다. 요즘 화제가 되고 있는 웹서비스 역시 시맨틱웹에 연결되고 있다. 웹서비스는 MS, IBM, SUN 등에서 최근 가장 관심을 가지고 있는 분야 중 하나로 웹 기반의 분산 컴퓨팅 기술이다. 웹서비스는 인터넷에서 네티즌이 사용하고자 하는 서비스나 프로그램의 URI(Universal Resource Identifier)로 찾아주는 서비스다. 이때 설명을 XML로 만든다. 예를 들어 사용자 인증 서비스가 대표적인 웹서비스에 해당한다. MS의 프로그램은 사용자 인증을 해당 프로그램 별로 받지 않고 패스포트 서비스를 불러 인증을 받는다. 웹서비스와 관련된 표준으로 SOAP(Simple Object Access Protocol), WSDL(Web Service Description Language), UDDI(Universal Description, Discovery, and Integration Protocol) 등이 현재 연구 개발 중이다.


컴퓨터를 벗어나 유비쿼터스 단말기로 확장되며, 개인 소유 정보 검색이 먼저다.

개인검색시대에서 우리가 또 한 가지 주목할 것은 유비쿼터스 시대가 되면서 검색의 범위가 PC나 서버와 같은 컴퓨터를 벗어난다는 사실이다. 이제 사용자는 PC에만 정보를 저장하고 다니는 것이 아니라 MP3재생기, PMP, USB드라이브, 휴대용게임기, 휴대전화, 디지털카메라, 디지털액자, 홈시어터 등의 수 많은 기기에 정보를 담고 있다. CD와 DVD에 따로 저장되는 것까지 포함하면 특정 파일이 어느 곳에 있는지 찾기가 쉽지 않다. 저장장치의 발달로 이제는 한 개인이 보유하고 있는 정보가 과거 어지간한 포탈사이트의 정보보다 많아지면서 무엇보다 자기 소유의 저장장치에 있는 자료 검색부터 제대로 이루어져야 하는 시대가 온 것이다. 현재 특정 CD에 있는 파일을 찾아서 자동으로 배출해주는 'CD관리기'가 꽤 비싼 가격에 팔리고 있는 현상이 이런 욕구를 반영하고 있다.

따라서 유비쿼터스시대의 검색엔진은 정보의 공유를 바탕으로 자동화된 검색엔진이 될 것이다. 사용자가 검색한 낱말은 먼저 해당 개인의 기기를 대상으로 검색해줄 것이다. 이 경우 웹은 유비쿼터스 단말기들을 연결하는 연결점으로 사용되는 것이다. 만약 개인의 기기에서 해당 정보를 찾았다면 현재 사용자가 확인 가능한 단말기로 정보를 표시해줄 것이다. 예를 들어서 현재 사용자가 검색을 시작한 단말기가 PDA고 해당 파일을 노트북컴퓨터나 디지털카메라에서 찾았다면 해당 파일을 무선으로 전송해 PDA 화면에 표시해줄 것이다. 한 개인을 둘러싼 여러 단말기가 하나의 작은 네트워크를 구성하는 것이다.

만약 개인의 기기에서 해당 정보를 찾지 못한다면 웹을 매개로 하여 웹사이트는 물론이고 P2P와 숨은자료, 개인검색을 이용하여 전세계의 개인 사용자가 공유한 기기까지 확장해 검색해줄 것이다. 이렇게 검색한 자료는 검증을 거쳐 원하는 사용자의 기기로 전송이 되고 관리될 것이다.

다음 세대 검색엔진의 범위는 웹에서 개인의 모든 단말기로 확장될 것이며, 검색 결과는 모든 통신 가능한 기기의 자료 위치로 나타날 것이다. 물론 이렇게 표시된 자료의 전송과 관리는 무선을 통해 자동으로 처리될 것이다.


구글의 도서관 디지털 작업이 이루어진다면 검색 범위의 구조가 완결된다.

개인 자료에 이어 확장되는 검색영역으로 책을 들 수 있다. 이미 구글은 미국 주요 대학의 도서관에 있는 수 천 만 권의 책을 디지털화해 검색엔진으로 검색할 수 있도록 하겠다고 밝혔다. Internet Archives의 카일(Brewster Kahle)이 미국 국회 도서관의 책을 디지털로 만드는 프로젝트를 말하면서 2천 6백만 권의 책을 디지탈로 변환하는데 드는 비용을 2억 6천만불이라고 말한 적이 있다. 이 비용을 구글이 대고 검색할 수 있도록 하겠다는 것이다. 이 일을 진행하는데 있어서 문제는 비용이 아니라 책의 저작권 문제를 비롯한 반대세력의 방해가 될 것이다. 하지만 만약 구글의 의도대로 이 일이 진행된다면 도서관에 가지 않고도 책을 검색할 수 있게 된다. 웹문서와 도서관 책을 검색할 수 있다면 공공검색 분야의 주요 분야는 일차적으로 완성된다. 남은 것은 개인 PC의 자료인데, 이는 이미 구글데스크탑을 통해 시도되고 있다. 모든게 원하는대로 이루어진다면 개인 자료, 도서관 자료, 웹 자료를 망라한 검색 범위의 구조가 탄탄하게 짜여지는 셈이다. 구글 안에서 모든 지식의 검색이 가능해지는 셈이다.
웹2.0 시대의 기회. 시맨틱웹





첫줄로(go top, go first line) 문화원첫화면으로(go dal site home) 강좌차림으로(go Chair) 사이트맵으로(go sitemap)




total chairpost