1. SIGMOD 2010 CFP의 연구 주제란에 XML이 없다.
1998년부터 지금까지 줄기차게 사람들이 파왔던 이 분야도
이제 연구할 거리가 거의 없어졌나 보다. 나도 빨리 다른 분야로 갈아타야겠다.
2. ecoSystem, energy efficient software
MB 정부의 녹색성장은 어떤지 몰라도 이분야는 요새 많이들 언급되는 것 같다.
특히 energy efficiency는 embedded device에서 뿐만 아니라 server 쪽에서도 요새 언급되고 있는 모양이다.
3. Distributed &Parallel Computing
요새 다시 엄청난 관심을 받고 있다. MapReduce와 같은 a large-scale data processing on distributed environments는 예전에도 grid computing, distributed computing. distributed & parallel database이란 이름으로 많이들 해왔던 것이다. 그런데 이것이 Google의 mapReduce 와 cloud computing이라는 키워드 때문에 다시금 각광을 받는가 보다. 사실 학계 입장에서는 MapReduce 개념은 30년 전에 이미 논의되었던 단순한 개념에 불과한데, 이리 관심을 받는 것이 편치 않는 듯하다. 아마 그 개념의 단순함에 의해서 사람들이 접근이 용이하고, Google이라는 회사가 이를 구현해서 이용한다는 것 때문에 사람들이 그리들 관심을 가지고 있는지도 모른다. 어쨌든, DeWitt이나 Stonebraker 같은 DB계의 거목들은 MapReduce의 이용이 30년전으로 회귀하는 것이라고까지 말하지만, 산업계의 흐름은 이쪽으로 넘어가려고 하는 듯 하다. 하지만, 또다시 여기에 필요한 여러가지 기능들을 추가하다보면 결국엔 또다시 disributed DBMS와 비슷한 모습을 취하지 않을까 싶다. 또한 보안 문제 등 아직까지 여러가지로 걸리는 것들이 많다.
이 분야 연구는 개인이 하기엔 규모면에서 좀 버거운 점이 있다. 일단 노드 컴퓨터 수가 어느정도 되어야 실험을 해보던가 할텐데, 소규모의 프로젝트 그룹이나 개인이 하기에는 일단 보유할 PC수부터 제약이 있다. 아마, 몇몇 연구단쳬에서 테스트베드를 구축하고 그걸 가지고 코드를 실험해야 할 것이다. 아 얼핏 인터넷 뒤져보니 이미 그런게 몇개 있기는 한 듯 하다. 두번째로는 산업체에서 주로 많이들 달라붙다 보니, 많은 인력들이 붙어서 단기간에 논문을 뽑아내는데, 그 속도를 개인이 따라가기에 쉬울까라는 고민이 좀 있다.
4. Database Management System and Algorithm Designs for emerging harwdware architectures:
Multi-core processors, larger on-chip caches, large inexpensive RAM, and flash memory
하드웨어 상황이 변하다 보니, 기존의 알고리즘들을 변화된 하드웨어 환경에 맞추어 효율적으로 동작할 수 있도록 알고리즘을 새로 만들던가 또는 수정을 하던가 해야 할 일들이 필요하게 되었다. 대표적인 것이 멀티코어 프로세서 출현에 따른 parallelism의 재고려, flash memory 가격 경쟁력의 향상에 따른 HDD의 flash memory의 대체, cache capacity의 증가와 memory의 access latency와 CPU clock과의 차이에 따른 stall 문제를 해결하기 위한 cache-aware/oblivious 알고리즘들, 보다 큰 메모리에서 데이터를 효과적으로 처리하기 위한 in-memory data structure와 algorithm등등. 이런 부분들은 Computer Architecture, H/W 쪽 지식을 많이 요구한다.
5. Emerging Computing Environments
Social network, semantic web, scientific data, sensor network 등은 기존의 관계형 데이터 모델과 상이한 여러 특징들을 가지고 있으므로 이들에 대한 연구도 많이 진행되는 듯 싶다. 일단 이들과 관련하여 graph model에 대한 DB 지원, 또는 graph db 등이 요새 좀 다루어지는 것 같고, scientific data 는 처리해야 할 data volume 때문에 분야 3.과 같은 테두리에서 연구도 많이 진행되는 것 같다.
6. Web Data Processing & Retrieval
가장 성공적인 데이터, 서비스 전달 도구인 만큼 웹 관련한 내용은 웬만한 CFP에는 항상 있다.
7. 기본기들은 언제나 CFP에서 살아있다.
indexing, query processing, transaction, privacy, security, data mining 등 기본적으로 필요한 세부 기술들은 언제나 CFP에 오르내리고 있다.
1998년부터 지금까지 줄기차게 사람들이 파왔던 이 분야도
이제 연구할 거리가 거의 없어졌나 보다. 나도 빨리 다른 분야로 갈아타야겠다.
2. ecoSystem, energy efficient software
MB 정부의 녹색성장은 어떤지 몰라도 이분야는 요새 많이들 언급되는 것 같다.
특히 energy efficiency는 embedded device에서 뿐만 아니라 server 쪽에서도 요새 언급되고 있는 모양이다.
3. Distributed &Parallel Computing
요새 다시 엄청난 관심을 받고 있다. MapReduce와 같은 a large-scale data processing on distributed environments는 예전에도 grid computing, distributed computing. distributed & parallel database이란 이름으로 많이들 해왔던 것이다. 그런데 이것이 Google의 mapReduce 와 cloud computing이라는 키워드 때문에 다시금 각광을 받는가 보다. 사실 학계 입장에서는 MapReduce 개념은 30년 전에 이미 논의되었던 단순한 개념에 불과한데, 이리 관심을 받는 것이 편치 않는 듯하다. 아마 그 개념의 단순함에 의해서 사람들이 접근이 용이하고, Google이라는 회사가 이를 구현해서 이용한다는 것 때문에 사람들이 그리들 관심을 가지고 있는지도 모른다. 어쨌든, DeWitt이나 Stonebraker 같은 DB계의 거목들은 MapReduce의 이용이 30년전으로 회귀하는 것이라고까지 말하지만, 산업계의 흐름은 이쪽으로 넘어가려고 하는 듯 하다. 하지만, 또다시 여기에 필요한 여러가지 기능들을 추가하다보면 결국엔 또다시 disributed DBMS와 비슷한 모습을 취하지 않을까 싶다. 또한 보안 문제 등 아직까지 여러가지로 걸리는 것들이 많다.
이 분야 연구는 개인이 하기엔 규모면에서 좀 버거운 점이 있다. 일단 노드 컴퓨터 수가 어느정도 되어야 실험을 해보던가 할텐데, 소규모의 프로젝트 그룹이나 개인이 하기에는 일단 보유할 PC수부터 제약이 있다. 아마, 몇몇 연구단쳬에서 테스트베드를 구축하고 그걸 가지고 코드를 실험해야 할 것이다. 아 얼핏 인터넷 뒤져보니 이미 그런게 몇개 있기는 한 듯 하다. 두번째로는 산업체에서 주로 많이들 달라붙다 보니, 많은 인력들이 붙어서 단기간에 논문을 뽑아내는데, 그 속도를 개인이 따라가기에 쉬울까라는 고민이 좀 있다.
4. Database Management System and Algorithm Designs for emerging harwdware architectures:
Multi-core processors, larger on-chip caches, large inexpensive RAM, and flash memory
하드웨어 상황이 변하다 보니, 기존의 알고리즘들을 변화된 하드웨어 환경에 맞추어 효율적으로 동작할 수 있도록 알고리즘을 새로 만들던가 또는 수정을 하던가 해야 할 일들이 필요하게 되었다. 대표적인 것이 멀티코어 프로세서 출현에 따른 parallelism의 재고려, flash memory 가격 경쟁력의 향상에 따른 HDD의 flash memory의 대체, cache capacity의 증가와 memory의 access latency와 CPU clock과의 차이에 따른 stall 문제를 해결하기 위한 cache-aware/oblivious 알고리즘들, 보다 큰 메모리에서 데이터를 효과적으로 처리하기 위한 in-memory data structure와 algorithm등등. 이런 부분들은 Computer Architecture, H/W 쪽 지식을 많이 요구한다.
5. Emerging Computing Environments
Social network, semantic web, scientific data, sensor network 등은 기존의 관계형 데이터 모델과 상이한 여러 특징들을 가지고 있으므로 이들에 대한 연구도 많이 진행되는 듯 싶다. 일단 이들과 관련하여 graph model에 대한 DB 지원, 또는 graph db 등이 요새 좀 다루어지는 것 같고, scientific data 는 처리해야 할 data volume 때문에 분야 3.과 같은 테두리에서 연구도 많이 진행되는 것 같다.
6. Web Data Processing & Retrieval
가장 성공적인 데이터, 서비스 전달 도구인 만큼 웹 관련한 내용은 웬만한 CFP에는 항상 있다.
7. 기본기들은 언제나 CFP에서 살아있다.
indexing, query processing, transaction, privacy, security, data mining 등 기본적으로 필요한 세부 기술들은 언제나 CFP에 오르내리고 있다.
'CS 전공 > 리뷰' 카테고리의 다른 글
DBMS on New Hardware (9) | 2009.11.22 |
---|---|
Memory Hierarchy, Memory Wall and Memory Mountain (10) | 2009.09.28 |
Claremont Report (0) | 2008.09.10 |
ASU의 Yi Chen 교수의 대학원 강의:Data on the Web (0) | 2008.03.25 |
Queyring Large XML data repositories (0) | 2007.11.28 |