강좌 첫화면으로 최근 글 보기(Post)
갈래별로 보기 categories




  [06.01] 꼬리표는 자료 평가와 재활용을 돕는다



6.꼬리표(TAG)와 자료 재활용

6.1.꼬리표는 자료 평가와 재활용을 돕는다.


좋은 정보를 선별하기 위해 꼬리표(TAG) 기술이 필요하다.

꼬리표(TAG) 기술은 어떤 글이나 자료에 추가정보를 적은 꼬리표를 다는 기술로 씨낱말(keyword) 정리 기술이라 할 수 있다. 과거의 꼬리표 기술과 달라진 점은 시맨틱웹 기술을 적용하여 '의미있는 꼬리표(semantic tags)'로 재탄생했다는 점이다.

예를 들어 '지메일 이야기'이라는 제목을 가진 A 문서에 꼬리표로 '구글, 성공, 야후, 지메일, 웹메일, 검색엔진, Ajax, 웹표준'이라는 낱말을 꼬리표로 덧붙인다. 그런 뒤에 꼬리표 검색기능에서 '지메일'로 검색하면 '구글의 성공비결'이라는 A 문서를 찾을 수 있다.

기존 검색방식은 검색 낱말이 문서 안에 없을 경우 검색해주지 않는 문제점이 있으나 꼬리표를 달아두면 본문 내용과 상관 없이 구글 관련 문서로 A를 검색해준다. 기존 방식의 또 다른 문제는 검색결과가 너무 많다는 사실이다. 구글로 검색한 결과 1천 개의 문서가 나왔다고 하자. 1천 개 문서 중에서 995개는 단지 구글이라는 낱말이 나열된 것에 불과하고 구글에 관한 심층적인 글은 단 5개일 수 있다. 이 중 구글과 관련된 문서가 몇 개인지 알 수도 없고, 5개라는 사실을 안다고 해도 일일이 읽으면서 어느 문서인지 찾을 수도 없다. 하지만 5개의 문서에만 '구글'이라는 낱말을 꼬리표로 달아두었다면 꼬리표찾기로 정확하게 구글 관련 주요 문서 5개를 쉽게 찾을 수 있다.


꼬리표 기술은 자료의 가치를 평가하는 기술이다.

기존의 검색기술은 낱말의 형태만 보고 찾는 기계적인 검색기술로 낱말의 가치는 평가하지 못한다. 꼬리표는 이러한 기계적인 검색방법을 보완하는 기술로 문서나 낱말에 다른 가치를 부여해 가치 있는 문서 검색을 돕는 기술이다. 1천 개 문서에서 구글과 관련된 가치 있는 문서 5개에만 가치를 부여하기 때문에 좀더 가치 있는 글의 검색이 쉬워진다. 검색이 쉬워지면 활용도 쉬워진다.

그렇다면 글에 대한 가치는 누가 어떻게 부여하는 것이 가장 좋을까? 일반적으로 검색엔진 사용자나 방문객은 자신에게 가치 있는 것과 대중적 가치가 높은 글을 원한다. 대중적 가치가 높은 글은 PV(Page View, 페이지뷰)나 링크 수, 추천 수 등을 통해 자동 평가할 수 있다. 그러나 '지메일 이야기처럼 정말 괜찮은 구글 관련 글이 아닌 '구글이 포르노?'라는 싱거운 이야기의 PV가 높을 수 있다. 또 '검색엔진 비교'라는 글은 국내 검색엔진 비교 글이고 구글은 잠깐 나열되는 낱말에 불과하지만 글 내용이 좋다고 추천 수와 링크 수가 가장 높을 수 있다. 결국 PV와 링크수와 같은 방식은 글의 가치 판단에 유용하지 않은 요소인 것이다.

현실적으로 '가' 사이트에서 가장 가치 있는 구글 관련 글을 정확하게 판단할 수 있는 사람과 방법은 '가' 사이트 운영자(글 작성자) '갑'이 추천하는 글이다. '갑'이 구글 관련 글로 추천하는 5편의 글은 '갑'은 물론 다른 사람에게도 가장 가치 있는 글일 가능성이 높다. 방문객 '을'은 '갑'의 글 b를 읽으면서 '구글'이라는 낱말이 나왔을 때 갑이 추천하는 구글 관련 글을 읽기를 원할 것이고, 갑도 자신이 쓴 5편의 구글 관련 글부터 사람들이 읽기를 원할 것이다. 이런 경우 5편의 글에 '구글' 꼬리표를 붙여두면 되는 것이다.


꼬리표는 가치문서 검색 외에도 다중연결과 낱말 설명 등의 장점이 있다.

꼬리표 만드는 법은 간단하다. '구글'과 관련된 간단한 설명과 주요 문서의 링크를 담아놓은 문서를 먼저 하나 만든 뒤에 '구글' 낱말에 이 문서를 연결시키면 된다. 을이 갑의 문서를 읽다가 구글 낱말의 링크를 선택하는 순간 꼬리표로 만든 문서가 나타나는데, 이 안에는 구글에 대한 설명과 링크를 담고 있다. 즉 꼬리표 문서는 구글에 대한 사전인 동시에 링크모음 역할을 한다. 방문객 을은 구글 설명도 바로 볼 수 있고, 구글 관련 문서가 무엇이 있는지 쉽게 알 수 있다. 꼬리표는 이전의 앵커태그(a 태그)가 하나의 낱말에 하나의 링크만 걸었던 단점도 보완하여 다중연결 기능을 구현한다.

꼬리표는 자료 재활용 면에서도 매우 유리하다. 이전에는 구글 관련 설명이나 구글 관련 문서의 링크를 수 많은 문서의 본문 안에 삽입시켰는데, 링크 주소가 바뀌거나 설명이 바뀔 경우 많은 문서의 본문을 다시 수정해야 하는 어려움이 있다. 그러나 꼬리표를 이용하면 관련 글이 많아지거나 수정되더라도 수 많은 본문 자체를 수정하지 않고 꼬리표에 등록된 내용만 편집해 설명을 고치고, 링크를 수정하면 된다.

꼬리표 기능

* 글을 읽다가 'FreeBGM'이 궁금해 딸깍하면 관련 설명과 링크목록이 나타나는 것이 꼬리표 기능이다.


꼬리표는 진실 규명과 신뢰 향상에 도움을 준다.

꼬리표는 문서의 이해와 진실 증명에 도움을 준다. '사과색 주전자'의 '사과'에 꼬리표를 달고 '사과는 빨간색이다.'라는 설명을 달아두었다면 사과색을 초록색으로 오해하지 않을 것이다. 그러나 설명이 없다면 오해가 발생한다. '내 친구 영심이는 착하다.'라는 말을 본 을은 '갑이 영심이라는 여자랑 사귀고 있구나.'라고 생각하고 엉뚱한 소문을 낼 것이다. 정보 왜곡을 막기 위해서는 '영심이'에 대해 설명을 다는 것인데 수 백 개의 문서에 등장하는 영심이에 대해 '영심이는 우리 집에 사는 애완견이다.'라고 일일이 설명을 다는 일은 어려운 일이다. 설명을 단다 해도 오해는 발생한다. '영심이는 애완견으로 흰색이다.'라는 옛날 글을 본 '병'은 영심이를 흰색 애완견으로 받아들일 것이고, '털갈이 후 영심이는 검정색이 되었다.'라는 글을 본 '정'은 검정색 개로 이해할 것이다. 이런 문제를 막기 위해 수 많은 문서 안의 영심이 설명을 모두 수정하는 것은 매우 힘든 일이다.

그러나 꼬리표 기능을 사용한다면 '영심이'를 꼬리표말로 등록하고 '영심이는 함께 사는 애완견으로 흰색이었다가 털갈이를 한 2005년부터는 검정색이 되었다'라고 설명을 다는 것으로 충분하다. 이제 각기 다른 문서로 접근한 방문자라 하더라도 꼬리표로 '영심이' 설명을 본 사람들은 누구나 영심이에 대해 제대로 이해할 것이다.

이처럼 꼬리표 기능의 유무에 따라서 글 쓸 때의 수고나 수정 때의 비용, 읽는 사람의 정보 이해력은 천양지차로 벌어진다. 꼬리표는 쉽게 구현할 수 있는 평범한 기술이지만 이 기술에 의해 정보의 왜곡은 크게 줄어들고 자료 재활용이 쉬워진다. 이런 이유로 새롭게 개발되는 블로그 프로그램을 비롯하여 알맹이관리시스템(CMS), 각종 회원제 사이트 등에서 꼬리표를 지원해야 하는 것이다.

물론 꼬리표 기능을 수작업으로 구현할 수도 있지만 이는 효율성이 크게 떨어진다. 글을 쓸 때 자동으로 삽입하게 만들고 읽을 때도 자동으로 구현이 되도록 프로그램에서 지원해주는 것이 좋다. 또한 현재는 꼬리표 설명에 사용하는 링크가 같은 가치로 표시되는데, 링크 자료의 가치를 단계로 나누어 평가하고, 단계에 따라 링크 문장의 크기가 변하는 기능이 지원되면 더욱 좋다.


* 연결: 시맨틱웹 - 웹2.0의 시대의 기회 (차례)





첫줄로(go top, go first line) 문화원첫화면으로(go dal site home) 강좌차림으로(go Chair) 사이트맵으로(go sitemap)




total chairpost