CS 전공/학회와 정보2009. 9. 25. 12:26
Google Scholar는 논문 검색할 때 가장 많이 이용하는 서비스 중 하나이다.
이 때 논문의 중요도를 부여하는 방법은 정확히 공개하고 있지 않다. 다만, 아래와 같이 기술하고 있을 뿐이다.

"Google Scholar aims to sort articles the way researchers do, weighing the full text of each article, the author, the publication in which the article appears, and how often the piece has been cited in other scholarly literature. The most relevant results will always appear on the first page."

Google에서는 이 Ranking system에 대해 정확히 설명한 적이 없지만, 누군가가 데이터 셋들을 이용하여 어떤 식으로 동작하는지를 분석하고 이를 논문으로 포장하였다. (관심있는 분은  참고하시길 바란다.)
역공학한 친구들의 말을 빌리면, 논문의 인용횟수가 가장 큰 순위부여 요인이고, 논문 제목에서 검색 단어의 존재 유무, 학회명과 저자 명에 큰 가중치를 부여하며, 전문에서 TF는 큰 영향을 받지 않는다 한다.
Matthew effect의 보정을 위해 상대적으로 최근의 논문에 가중치를 좀더 준다.
또한 유의어는 처리하지 못하므로, 여러 유의어들을 가지고 검색해야 한다
예를 들어 Multi-core 관계된 논문을 검색하고 싶다면, Multicore, CMP(Chip-level Multi Processor) 등과  같은 여러 유의어로 검색해야 한다.

 논문 작성에 있어서는 최근에 자신의 아이디어와 유사한 아이디어가 이미 나왔는지 훑어보아야 할 필요가 있으므로, 논문들을 이 랭킹 시스템이 부여한 순위 대신에, 연도별로 sort해 볼 필요가 있다. 
알아보니 Google에서는 이미 내부적으로 연도별 sorting을 지원을 하면서도 해당 옵션을 인터페이스에서 선택할 수 있게 제공하고 있지는 않다. (아마도, workload 가 증가할 까봐 그러는 듯 싶기도 하다.)

여하튼 다음과 같이 하면 연도별 논문 리스트 정렬이 되고, 숨겨져 있던 인터페이스 또한 이용이 가능하다.

1. 질의어 입력 후
2. URL의 맨 끝에  &scoring=r 을 추가해서 다시 접속한다.

그러면, 연도별 정렬과 함께, 언제부터의 논문을 검색할지를 결정할 수 있다.


*** 수정 내용 ***
최근의 Google Scholar는 결과 페이지 상단의 "recent articles"
한국판에서는 "최신 논문/자료"를 클릭하면 &scoring=r 붙여 질의한다는...
즉, 연도별 정렬을 인터페이스로 제공한다네요.



Posted by Bart

댓글을 달아 주세요

  1. webtk

    오 그런 방법이 있었군요. 매뉴얼을 안보고 썼었는데~
    흐흐 감솨합니당.

    2009.09.23 13:43 [ ADDR : EDIT/ DEL : REPLY ]
  2. 한참전에 쓴글을 찾아서 공개로 해놓았더니, 이미 옛날 얘기라더라... 지금은 인터페이스를 제공한다는... 쿨럭.
    위 수정 내용 참조.

    2009.09.23 13:59 신고 [ ADDR : EDIT/ DEL : REPLY ]