20070302 PlatformDay

Web2hub wiki

Jump to: navigation, 찾기

목차

발표자료

세션1. Anatomy of Google Service Platform 한재선
세션2. Hadoop Project 윤진석 김형준

후기


메일링리스트

플랫폼 관련 메일링 리스트를 만들려고 합니다. PlatformDay에 참석하신 분들을 기반으로 하여 플랫폼 관련 논의를 하고 향후 플랫폼 관련 행사를 알려 드릴 채널이 될 것입니다. 관심있으신 분들은 제게(jshan0000@gmail.com) 메일을 보내 주시기 바랍니다. (이름, 이메일, 블로그, 소속, 관심분야 (이름과 이메일은 필수)) 죄송하지만 참석하신 분들도 다시 보내 주시기 바랍니다. 어떤 분이 실수로 참가자 명단을 가져간 것 같습니다. --;;;



PlatformDay에 여러분을 초대합니다.

PlatformDay는 Global Internet Service Platform(GISP)에 대해 구글 플랫폼을 케이스스터디로 발표하는 공개세미나 행사입니다. 웹 2.0의 등장과 함께 서비스를 안정적이고 확장성 있게 운영해 줄 수 있는 서버 플랫폼에 대한 중요성이 증가하고 있습니다. 가장 대표적인 사례로 구글의 강력한 서버 플랫폼은 검색엔진을 비롯한 다양한 구글 서비스 성공의 원동력으로 인정받고 있습니다. 본 행사에서는 구글의 플랫폼 관련 논문들을 소개함으로써 구글 플랫폼에 대한 이해를 돕고 그 기능들을 오픈소스로 구현한 Hadoop에 대해 소개할 것입니다. 또한 학계, 기업체, 연구소 등 다양한 기관의 시스템 소프트웨어 엔지니어들이 모여 국내 플랫폼 기술의 발전에 대해 심도있게 토론해 볼 수 있는 자리가 되었으면 합니다.


[긴급공고] 기대치 못한 성원으로 인해 좌석 70석이 부족한 사태가 벌어졌습니다. 애시당초 70명 안될거라고 예상하였고 또 넘더라도 굳이 듣고 싶다는 분들을 막고 싶지 않아 선착순으로 한정하지 않았습니다. 이것은 지금도 변함이 없구요. 좌석이 모자랄 경우 좌우 통로에 앉아서 들으시는 불편을 감수하셔야 될 수도 있습니다. 이점 고려해 주시고 양해해 주시기 바랍니다. 세미나실이 2시까지 수업이 있을 예정이라 너무 일찍 오시더라도 소용없을거니 느긋하게 와 주세요. ^^



일시 및 장소

  • 일시: 2007년 3월 2일(금) 오후 2:00 ~ 6:00
  • 장소: 대전 한국과학기술원 전산학과(E3-1) 4층 4443호 오상수영상강의실
    • 타지역서 오시는 분은 여기를 참조하세요.
    • 교내 모든 주차공간은 무료입니다.
  • 주최: 본 행사는 NexR, KAIST ANLab, Google SIG에서 호스팅하고 있습니다.


대상

카이스트 구성원(학부생 및 대학원생, 연구원, 교수 등)과 그 외 타대학이나 기업에 계신 분들도 매우(^^) 환영합니다. 발표와 토론은 시스템 소프트웨어에 대한 기본적인 이해를 하고 있다는 가정하에 진행될 예정입니다. 강의실의 좌석은 70개 정도 입니다. 인원파악을 위해 참가하실 분은 참가신청을 해 주시기 바랍니다.

발표요약

Global Internet Service Platform(GISP)는 다양한 인터넷 서비스(검색엔진, 커뮤니티, 지도, UCC 등)를 글로벌 환경에서 안정적이고 확장성있게 운영해 줄 수 있는 기반 컴퓨팅 환경을 말한다. 사용자 중심으로 웹이 진화하면서 데이터의 양이 폭발적으로 증가하였고 이를 효율적으로 저장해 줄 시스템에 대한 요구가 높아지고 있다. 또한 그 속에서 데이터 분석을 통하여 새로운 가치를 끌어내기 위해 데이터를 고속으로 처리할 수 있는 분산 처리 시스템이 필요하다. GISP는 이런 다양한 시스템 기능을 제공해 주는 것으로 구글의 플랫폼이 서비스 성공의 원동력으로 인정받으면서 그 중요성이 재조명 받고 있다.
구글은 저가의 상용 PC 서버로 세계 최대 규모의 클러스터를 구축하고 있다. (NYT 2006년 추정 45만대) 구글 플랫폼은 저가 하드웨어의 필연적인 취약점(불안정성, 부족한 성능 등)을 지능적인 시스템 소프트웨어 설계를 통하여 극복한 것이다. 이를 통해 대용량과 고성능을 달성하면서도 저비용으로 데이터 센터를 구현할 수 있었다. 본 행사에서는 구글의 플랫폼 관련 논문들(GFS, BigTable, MapReduce, Chubby 등)을 소개하고 이들이 어떻게 유기적으로 상호운영될 것인지 분석한다. 또한 구글의 검색엔진을 비롯하여 다양한 서비스들이 플랫폼 기술을 어떻게 이용하여 구현될 수 있는지 나름대로 분석함으로써 구글 플랫폼에 대한 이해를 높인다. 마지막으로 구글 플랫폼 기술을 오픈소스로 구현한 Hadoop 프로젝트를 소개하면서 오픈소스 플랫폼 개발에 대한 가능성에 대해 논의해 본다.

일정

2:00 ~ 4:00 (한재선, NexR, KAIST Google SIG)


4:00 ~ 4:20

  • Coffee Break


4:20 ~ 5:20 (윤진석, NHN)

  • Hadoop Project Introduction
    • Hadoop Project Assumptions and Goals
  • HDFS & MapReduce Architecture
    • Name-node and Data-node
    • Data Replication
    • Robustness
    • Scalable Computing with MapReduce
  • Data Organization
  • Evaluation of Hadoop
  • Live Demo


5:20 ~ 6:00 (한재선, NexR, KAIST Google SIG)

  • Discussion



발표자료샘플

발표에 대한 대략적인 내용과 수준을 미리 파악하실 수 있도록 첫 발표자(한재선)가 다른 곳에서 했던 발표자료를 샘플로 올립니다. 이 자료에서 GISP에 대한 소개와 검색엔진에 대한 내용이 추가되고 기술적인 디테일이 약간 줄어들 예정입니다.
발표자료샘플

Nutch 서브프로젝트로 시작된 Hadoop File System에 대한 소개와 분석을 발표하며(윤진석),
플랫폼의 Strength and Weakness, 그리고 개선점에 대해 알아봅니다.


참가신청

(마지막에 블로그나 홈페이지 주소 부탁드립니다.)

  1. 한재선, (주)넥스알 & KAIST Google SIG, Web2Hub
  2. 전종홍, ETRI 선임연구원, HOLLBLOG
  3. 김유성, 한국과학기술원, (SALab)
  4. 노우경, 플레이포럼, (blog)
  5. 이왕우, 드림위즈, (dreamwiz)
  6. 전희원, 고려대학교, (블로그)
  7. 김한기, KISTI 연구원, (yesKISTI)
  8. 김동국, 한국과학기술원, (SSLab)
  9. 심규동, 한국과학기술원, (SSLab)
  10. 박근태, 한국과학기술원, (SSLab)
  11. 송용, 한국과학기술원, (SSLab)
  12. 김형준, NHN, (Jaso.co.kr)
  13. 김우현, NHN, (UbiComp Study)
  14. 윤진석, NHN, (Udanax.org)
  15. 강태호, NHN, (tkang.blogspot.com)
  16. 유동민, Hostway, (miniway.blogspot.com)
  17. 임지희, 울산대학교, (KLPLab)
  18. 배영준, 울산대학교, (KLPLab)
  19. 김동명, 울산대학교, (KLPLab)
  20. 심강섭, 울산대학교, (KLPLab)
  21. 유정헌, 동부정보기술, (Technical Assistance Team)
  22. 유명원, 네오엠텔
  23. 정우석, 야후코리아, (blog)
  24. 박수혁, 오픈마루, (blog of psyOblade)
  25. 윤도상, 야후코리아, (blog)
  26. 오민석, 다음커뮤니케이션
  27. 백창열, NHN
  28. 정민철, 정보와미래, (정보와미래)
  29. 이신재, 다음커뮤니케이션
  30. 권태현, SK커뮤니케이션즈
  31. 정준영, 엠파스
  32. 이상호, 엠파스
  33. 김형식, 충남대학교
  34. 김대성, 유니와이드
  35. 원범재, 유니와이드
  36. 권영길, 그루터, (lucene blog)
  37. 정권희, 유니와이드
  38. 홍성호, 유니와이드
  39. 구본일, (주)케이비아이
  40. 구본걸, (주)케이비아이
  41. 노지호, SOFTonNET, (SOFTonNET)
  42. 김영필, SOFTonNET, (SOFTonNET)
  43. 홍태희, 생명공학연구원 (blog)
  44. 이상윤, 모바일단말상용화센터 (MTCC)
  45. 배준현, 모바일단말상용화센터 (MTCC)
  46. 김연태, SK커뮤니케이션즈
  47. 홍석후, SK커뮤니케이션즈
  48. 서민갑, SK커뮤니케이션즈
  49. 김지홍, 생명공학연구원
  50. 박경욱, LG전자
  51. 이승익, 다음커뮤니케이션
  52. 손춘호, KT기술연구소 (Blog)
  53. 문상권, 한국과학기술원, (SSLab)
  54. 이훈순, 한국전자통신연구원
  55. 최기한, SK커뮤니케이션즈
  56. 정충국, SK커뮤니케이션즈
  57. 조유형, SK커뮤니케이션즈
  58. 윤준선, SK커뮤니케이션즈
  59. 전준수, 프리랜서
  60. 윤병안, SK커뮤니케이션즈
  61. 김인욱, SK커뮤니케이션즈, (Blog)
  62. 심탁길, NHN
  63. 안용열, 한국과학기술원 (homepage)
  64. 이순호, SK텔레콤
  65. 강태기, 오픈베이스
  66. 이승훈, 오픈베이스
  67. 김영선, SK커뮤니케이션즈
  68. 최성자, SK커뮤니케이션즈
  69. 조민정, SK커뮤니케이션즈
  70. 김경옥, 한국전자통신연구원
  71. 장윤섭, 한국전자통신연구원
  72. 황용호, SK커뮤니케이션즈
  73. 김대욱, SK커뮤니케이션즈
  74. 홍영구, CJ인터넷
  75. 원재성, SK커뮤니케이션즈
  76. 우윤정, SK커뮤니케이션즈
  77. 설경학, SK Communications
  78. 신원석, SK커뮤니케이션즈
  79. 김도우, SK커뮤니케이션즈
  80. 서애선, SK커뮤니케이션즈
  81. 임우택, CJ인터넷
  82. 임유빈, SK커뮤니케이션즈
  83. 김병섭, 한국전자통신연구원
  84. 하한영, SK커뮤니케이션즈
  85. 오수철, 한국전자통신연구원
  86. 김학영, 한국전자통신연구원
  87. 이용주, 한국전자통신연구원
  88. 박춘서, 한국전자통신연구원
  89. 송성호, 한양대학교
  90. 인연진, SOFTonNET, (SOFTonNET)
  91. 김준, 한국전자통신연구원
  92. 김영균, 한국전자통신연구원
  93. 이상민, 한국전자통신연구원
  94. 김홍연, 한국전자통신연구원
  95. 김영철, 한국전자통신연구원
  96. 차명훈, 한국전자통신연구원
  97. 민영수, 한국전자통신연구원
  98. 김선욱, 한국전자통신연구원
  99. 권원옥, 한국전자통신연구원
  100. Genie Lee, SK커뮤니케이션즈
  101. 성기준, NHN Corp., 분산컴퓨팅TF
  102. 이명철, 한국전자통신연구원
  103. 전태연, NHN
  104. 최지훈, 오픈베이스
  105. 황인석, 한국과학기술원 (blog)
  106. 안세원, 한국과학기술원 소프트웨어전문가과정(blog)
  107. 조문옥, SK텔레콤Service기술연구원 (blog)
  108. 추은미, 하나로텔레콤