當企鵝龍遇上小飛象DRBL-Hadoop當企鵝龍遇上小飛象DRBL-Hadoop Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang

Slides:



Advertisements
Similar presentations
EBI European Bioinformatics Institute. EBI The European Bioinformatics Institute (EBI) part of EMBL is a centre for research and services in bioinformatics.
Advertisements

資管同學的一些建議 高雄大學資管系 蕭漢威. 資管的生活 打 BBS 玩連線遊戲 上網看電影 聽 MP3 做網頁 唸書、考試 … 畢業時你具備了什麼能力 ?? 是不是還該多學些什麼 ??
目的 「升學調查系統」,幫助某一學校調查並記錄 其歷屆畢業生報考研究所的情況、未來提供給 學弟妹作參考,以及學校推廣之相關工作。 功能需求 紀錄並追蹤歷屆畢業生升學的狀態 協助畢業生做升學輔導 未來提供學弟妹作查詢、參考 計算上榜率、前十大學校上榜率.
無名哇哇哇 ?. 封包 header & 內文 Form 位置 找到發送 POST 的封包 找到密碼位置.
數位學習經驗分享 「 E 化教學教室與虛擬攝影棚」推廣經驗分享暨觀摩 高高屏活動 義守大學應用數學系郎正廉.
SIP Mobiity TA: 洪敏書
在 Ad-hoc 網路中實現點對 點發送訊息與廣播訊息. 檔案下載  範例程式可在下列網址取得  DEMO 程式可在下列網址取得
 Prentice Hall Chapter 71 科技與工作流程設計.  Prentice Hall Chapter 72 學習目標 了解科技如何影響生產力 討論電腦輔設計 認識彈性製造系統 定義組織再造的三項要素 資訊科技如何支援決策.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
國立聯合大學 資訊管理學系 陳士杰老師 MySQL5 視覺化資料庫管理工具 - MySQL Adminstrator.
1.1 電腦的特性 電腦能夠快速處理資料:電腦可在一秒內處理數百萬個 基本運算,這是人腦所不能做到的。原本人腦一天的工 作量,交給電腦可能僅需幾分鐘的時間就處理完畢。 電腦能夠快速處理資料:電腦可在一秒內處理數百萬個 基本運算,這是人腦所不能做到的。原本人腦一天的工 作量,交給電腦可能僅需幾分鐘的時間就處理完畢。
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
1 實驗一 網路線的製作 一對一 (Straight-Through) 與 扭接 (Crossover) 的網路線製作.
第四章 第二節 網路位址轉換器 NAT Network Address Translation. 動機 解決 IP addresses 不夠的問題 IPv6 – 現有的網路設備需要重新設計 – 代價昂貴 Virtual IP Gateway(VIP Gateway) – 架構於目前的 IPv4 上.
各種線上電子資源的特異功能 STICnet 的 SDI 專題訂閱服務 2003/4/28 修改. 無論校內外皆可使用。連線至
1 網路同步學習 如何使用中山大學管理學院知識管理平台 愷中 製作. 2 如何登入中山大學網路學習平台 1. 首先, 請輸入 2. 點選申請帳號, 依照螢幕所示, 輸入個人資訊.
長訊科技 EVRCOM Voice Mail System 使用者操作說明及流程. 自動總機 -- 來電語音轉接服務流程 ( 範例流程 )
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
最新計算機概論 第 5 章 系統程式. 5-1 系統程式的類型 作業系統 (OS) : 介於電腦硬體與 應用軟體之間的 程式,除了提供 執行應用軟體的 環境,還負責分 配系統資源。
8-1 Chapter 8 技術與流程 組織的技術 製造業的核心技術 服務業的核心技術 非核心技術與組織管理 工作流程的相依性.
台灣客家知識治理之研究 -- 以 行政院客委會為例 發表人: 彭安麗 南華大學公共行政與政策研究所助理教授 發表人: 彭安麗 南華大學公共行政與政策研究所助理教授
第二章 供給與需求 中興大學會計學系 授課老師:簡立賢.
Ubiquitous News(Unews) 的設計與實作 指導教授:黃毅然 教授 學生:葉雅琳 系別:資訊工程學系.
1 MySQL 資料庫的使用 網頁資料庫的基礎 網頁資料庫的基礎 下載與安裝 MySQL 下載與安裝 MySQL 啟動 MySQL 伺服器 啟動 MySQL 伺服器 Web 介面的 MySQL 管理程式 Web 介面的 MySQL 管理程式 MySQL 建立資料庫 MySQL 建立資料庫 在 MySQL.
各種線上電子資源的特異功能 SpringerLINK 的 Alert, Serials Update, News 2003/4/28 修改.
1 透過 IT 電子商務和知識管 理應用之探討 指導老師:李富民 教授 報告者:許志傑 學號: 職 1A 報告日期 :97/01/14.
校友資料庫系統 說明會 公共事務室 廖建翔 2015年6月21日 2015年6月21日 2015年6月21日.
第二屆數位華岡 e-Campus 網頁設計競賽 Inaugural Digital Hwa-Kang e-Campus Web Award, 2006 服務導向的網站規劃 Service-Oriented Web Site Design 楊美華 組長
North Point Government Primary PM School 北角官立下午小學 應用 ‘ 基本能力學生評估 ’ 及 ‘ 網上學與教支援系統 ’ 經驗分享.
實驗六 WLAN 的設定 WLAN card 的設定. Reference Wireless Local Area Network by Dr.Morris Chang.
1 Advanced Topics. 2 Processor 基本運作方式 Instruction fetch Decode Execution Write Back.
校外使用圖書館購置之資料庫 龍華大學圖書館. 讀者遠端認證 (RPA) 設定說明  透過圖書館架設完成的 RPA (Remote Patron Authentication) 讀者遠端認證代理主 機系統,讀者於校外或院外 可直接連線使 用本館所提供的資料庫。  若非使用本館電子資料,請勿設定此代理.
教材名稱:網際網路安全之技術及其應用 (編號: 41 ) 計畫主持人:胡毓忠 副教授 聯絡電話: 教材網址: 執行單位: 政治大學資訊科學系.
手機模擬機車事故黑盒子 指導教授 : 姚修慎 教授 李易璋 鍾明哲 黃靖宇.
6-2 認識元件庫與內建元件庫 Flash 的元件庫分兩種, 一種是每個動畫專 屬的元件庫 (Library) ;另一種則是內建元 件庫 (Common Libraries), 兩者皆可透過 『視窗』功能表來開啟, 以下即為您說明。
法律系 系所科助之血淚辛酸史 劉蕙綺. 系上推行困難處 ( 學期初 ) 傳統習慣:法律系以教科書為主 很多老師沒有電子檔案 專、兼任老師使用平台的意願 因老師多為資深老師,因此在使用電腦部 份可能比較需要幫助 通常學生知道訊息的來源是藉由 BBS 或者 是系上的系板,使用意願會降低.
McGraw-Hill© The McGraw-Hill Companies, Inc., 2004 第 6 單元 作業系統和使用者介面 McGraw-Hill Education.
「防止青少年吸煙」 回顧與前瞻. 流程:  計劃簡介  服務特色  報告研究事項  回顧工作內容  展望未來.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
2010 MCML introduction 製作日期: 2010/9/10 製作人 : 胡名霞.
校園網頁整合平台介紹 電算中心綜合業務組. 大綱 設計理念 功能介紹 實做 FAQ 特殊案例 Q&A.
儀器設備中心 報告人:陳淑慧主任 化學系教授兼任 97 年 6 月 19 日. 中心架構 儀器設備中心任務 對全校師生提供在專業諮詢、教學與研究 等活動上所需之高技能服務 架設和經營成功大學共用設備網站,提供 所有全校共用儀器設備的資料瀏覽和直接 用戶導引連結與預約系統 儀器設備中心任務.
國立中央大學. 資訊管理系 范錚強 Inception 公司治理模擬.
廣電新聞播報品質電腦化 評估系統之研發 國立政治大學 資訊科學系 指導教授:廖文宏 學生:蘇以暄.
網路介紹及其運用 講師陳炯勳. 5-2 IP 協定 ( 一 ) IP 協定運作 (1) – 網路成員:主機 (Host) 與路由器 (Router) – 路由表 – 電報傳輸運作.
概念性產品企劃書 呂學儒 李政翰.
1 威斯康辛「學生教育成就保證」計劃 ( SAGE ) ( Ehrenberg, Brewer, Gamoran & Willms, 2001 ) 年間試行 對象是幼稚園到小三 (K-3) 30% 學生來自貧困家庭 每班人數 人.
1 © 2011 台灣培生教育出版 (Pearson Education Taiwan). 2 學習目標 1. 當面對可預測的變異性時,同步管理並改善供應鏈 中的供給。 2. 當面對可預測的變異性時,同步管理並改善供應鏈 中的需求。 3. 當面對可預測的變異性時,使用總體規劃將利潤最 大化。
論文研討 2 學分 授課教師:吳俊概. 第一節 論文發表的目的 第二節 論文發表的歷程 第三節 投稿過程 第四節 退稿處理 學術期刊論文的製作與發表.
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.
Outlook 教學與研習 (1) - 設定及收發郵件 - 設定郵件規則 陽明大學資訊與通信中心 陳坤元 2006/03/27.
Knowledge Management System -for Agenda 顏亦笛 陳靖宜 指噵教授 : 劉寶均教授 指噵公司 : 安捷達.
指導教授 : 林啟芳 教授 組員 : 邱秉良 林育賢. 何謂 GPS  GPS 即全球定位系統,是一個中距離圓 型軌道衛星導航系統。它可以為地球表面 絕大部分地區( 98% )提供準確的定位、 測速和高精度的時間標準。
Essentials of Management Information Systems, 6e Chapter 1 Managing the Digital Firm 1.1 © 2005 by Prentice Hall 管理數位化公司 Chapter 1.
1 寬頻分碼多重進接無線通訊上 鏈傳收系統之設計與製作 Transceiver System Design and Implementation for WCDMA Uplink Communication 國科會計畫 (1999/8 – 2002/7) 簡介 2004/1.
閱選訂購 Approval Plan. 什麼是閱選訂購 ? 由圖書館與其所選定代理商簽 訂合約,代理商根據圖書館所 制定的選書興趣檔 (profile) 選 擇適合的圖書送至圖書館,由 圖書專員審核挑選過後才予以 購買,不合則主動退書。
著作權所有 © 旗標出版股份有限公司 第 14 章 製作信封、標籤. 本章提要 製作單一信封 製作單一郵寄標籤.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
人力資源管理 報告者:萬通人力資源顧問股份有限公司 侯 佑 霖 日期: 96 年 11 月 22 日.
台灣地區電子錢包 之現況分析 資管進修4B 指導老師:吳有龍 B 蔡恒德.
中壢家商網路現況與經驗分享 報告人:葉建麟 日 期: 時間歷 程備 註 43 年奉准試辦一年招考新生三班 44 年正式成立考核通過 47 年成立高級部 49 年改為完全家事職業學校 57 年奉令改制為省立中壢高級家事職業學校 59 年 奉令改制為省立中壢高級家事商業職業 學校 初級部結束.
Cluster, Grid and Cloud Computing Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang
Internet Technology Laboratory Department of Computer and Communication Kun Shan University  官方網站:
節能轉接插座 認知科學研究所陳啟彰. 設計緣起 不使用的電器如未將插頭拔除, 仍會有少量的電力損耗,這類的 電力損耗稱之為待機損耗 (stand- by loss) 。 不使用的電器如未將插頭拔除, 仍會有少量的電力損耗,這類的 電力損耗稱之為待機損耗 (stand- by loss) 。 家庭用電中,待機損耗約佔總耗.
1 用企鵝龍打造多人雲端實驗叢集 Building Multiuser Hadoop Testbed with DRBL 用企鵝龍打造多人雲端實驗叢集 Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang
Introduction to Diskless Remote Boot Linux Introduction to Diskless Remote Boot Linux Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang.
Diskless Remote Boot Linux
Presentation transcript:

當企鵝龍遇上小飛象DRBL-Hadoop當企鵝龍遇上小飛象DRBL-Hadoop Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang

Source: content/uploads/2007/08/programmer.jpghttp:// content/uploads/2007/08/programmer.jpg Source: Programmer v.s. System Admin.

AgendaAgenda What is Cluster Computing ? How to deploy PC cluster ? What is DRBL and Clonezilla ? Can DRBL help to deploy Hadoop ? Live Demo of DRBL Live and Clonezilla Live PART 3 : PART 1 : PART 2 :

PC Cluster 101 Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 1 :

At First, We have “ ” PC Cluster It'd better be 2 n It'd better be 2 n ManageSchedulerManageScheduler

GiE Switch WANWAN Then, We connect 5 PCs with Gigabit Ethernet Switch Then, We connect 5 PCs with Gigabit Ethernet Switch 10/100/1000MBps10/100/1000MBps Add 1 NIC for WAN Add 1 NIC for WAN

LAN Switch WANWAN 4 Compute Nodes will communicate via LAN Switch. Only Manage Node have Internet Access for Security! Compute Nodes Manage Node

Linux Kernel Kernel Module GNU Libc Boot Loader MPICHMPICH BashBash PerlPerl MessagingMessaging YPYPNISNIS Account Mgnt. SSHDSSHD GCCGCC Compute Nodes BasicSystemSetupforClusterBasicSystemSetupforCluster

Linux Kernel Kernel Module GNU Libc Boot Loader MPICHMPICHOpenPBSOpenPBS BashBash PerlPerl MessagingMessaging YPYPNISNIS Account Mgnt. SSHDSSHD GCCGCC Job Mgnt. NFSNFS File Sharing ExtraExtra On Manage Node, We need to install Scheduler and Network File System for sharing Files with Compute Node On Manage Node, We need to install Scheduler and Network File System for sharing Files with Compute Node

Research topics about PC Cluster Ref: Cluster Computing in the Classroom: Topics, Guidelines, and Experiences SystemArchitectureSystemArchitecture ParallelComputingParallelComputing ParallelAlgorithmsAndApplicationsParallelAlgorithmsAndApplications ProcessArchitectureProcessArchitecture NetworkArchitectureNetworkArchitecture StorageArchitectureStorageArchitecture System-levelMiddlewareSystem-levelMiddleware Share Memory Programming Programming Distributed Memory Programming Programming Application-level Middleware Programming Application-level

Challenges of Cluster Computing Hardware  Ethernet Speed / PC Density  Power / Cooling / Heat  Network and Storage Architecture Software  Job Scheduler ( Cluster level )  Account Management  File Sharing / Package Management Limitation  Shared Memory  Global Memory Management

Common Method to deploy Cluster 1. Setup one Templatemachine Templatemachine 2. Cloning tomultiplemachine tomultiplemachine 3. Configure Settings↓ 4. Install JobScheduler↓ 5. Running Benchmark 3. Configure Settings↓ 4. Install JobScheduler↓ 5. Running Benchmark

Challenges of Common Method Upgrade Software ? Add New User Account ? Configuration Syncronization How to share user data ?

How to deploy Nodes ????

Advanced Methods to deploy Cluster SSI ( Single System Image )  Multiple PCs as Single Computing Resources  Image-based homogeneous ex. SystemImager, OSCAR, Kadeploy  Package-based heterogeneous easy update and modify packages ex. FAI, DRBL Other deploy tools  Rocks : RPM only  cfengine : configuration engine

Comparison of Cluster Deploy Tools Distribution Support Diskless/ Sysmless Type Node configuration tools Cluster management tools Database installation System Imager ALLYesImageYesNo OSCAR RPM- based YesImageYes No KadeployALLNoImageYes DRBLALLYesPackageYes No FAI Debian- Based YesPackageYesNo

Hadoop Deployment Tool Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 2-1 :

Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog

Source: Deploying hadoop with smartfrog

工商服務時間工商服務時間企鵝龍與再生龍企鵝龍與再生龍 Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 2-2 :

D iskless R emote B oot in L inux 網路是便宜的,人的時間才是昂貴的。 企鵝龍簡單來說就是.....  用網路線取代硬碟排線  所有學生的電腦都透過網路連接到一台伺服器主機 ++ = Server Diskless PC source: Diskfull PC 何謂企鵝龍 DRBL ??

何謂再生龍 Clonezilla ?? Clone ( 複製 ) + zilla = Clonezilla ( 再生龍 ) 裸機備分還原工具 Norton Ghost 的自由軟體版替代方案 Disk to Disk Image to N Disks DisktoImageDisktoImage

需分別處理設定 ( 每班約 40 台 ) 如:電腦中毒、環境設定 系統操作問題、開關機、 備份還原等 教師 1 人維護管理多組設備 教學同時分派或收集作業 需要「化繁為簡」的解決方案! 一般國內小學的電腦教室 人力、時間成本高 設備維護成本高 降低資訊教育管理成本降低資訊教育管理成本

知識和軟體都需要讓孩子「帶著走」! 在校學習,也需回家複習 學校每台 ( 平均 ) 2 萬 學生家用 ( 平均 ) 4 萬 教育知識,也需教育尊重 尊重智財權觀念 商業軟體授權高成本 知識與法治的學習 平衡商業軟體與知識教育平衡商業軟體與知識教育

以個人叢集電腦 (PC Cluster) 經驗發展 DRBL&Clonezilla 多元化資訊教學的新選擇! 企鵝龍 DRBL 再生龍 Clonezilla 適用完整系統備份、裸機還原或災 難復原 是自由!不是免費 … 分送、修改、存取、使用軟體的自由。免費是附加價值。 適合將整個電腦教室轉換成純自由 軟體環境 (Diskless Remote Boot in Linux ) 國網中心自由軟體開發國網中心自由軟體開發

電腦教室管理的新利器! ■ 以每班 40 台電腦為估算單位 企鵝龍 DRBL 與再生龍 Clonezilla

節省龐大軟體授權費 降低台灣盜版率 提升台灣形象 降低管理維護成本 帶動自由軟體使用 節樽軟體授權成本 ( 估計 ) NT. 98,595,000 元 以某商業獨家軟體每機 3000 元授權費計, 每班 35 台電腦 (3000*35*939) 教育單位採用 DRBL 高速計算研究 資料儲存備援 擴至全國各單位

企鵝龍的開機原理企鵝龍的開機原理 Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 1-3 :

1st, We install Base System of GNU/Linux on Management Node. You can choose: Redhat, Fedora, CentOS, Mandriva, Ubuntu, Debian,... 1st, We install Base System of GNU/Linux on Management Node. You can choose: Redhat, Fedora, CentOS, Mandriva, Ubuntu, Debian,... Linux Kernel Kernel Module GNU Libc Boot Loader

2nd, We install DRBL package and configure it as DRBL Server. There are lots of service needed: SSHD, DHCPD, TFTPD, NFS Server, NIS Server, YP Server... 2nd, We install DRBL package and configure it as DRBL Server. There are lots of service needed: SSHD, DHCPD, TFTPD, NFS Server, NIS Server, YP Server... DHCPDDHCPDTFTPDTFTPDNFSNFS BashBashPerlPerl Network Booting YPYPNISNIS Account Mgnt. DRBL Server based on existing Open Source and keep Hacking! DRBL Server based on existing Open Source and keep Hacking! SSHDSSHD Linux Kernel Kernel Module GNU Libc Boot Loader

pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe Config. Files Ex. hostname Config. Files Ex. hostname After running “drblsrv -i” & “drblpush -i”, there will be pxelinux, vmlinux-pex, initrd-pxe in TFTPROOT, and different configuration files for each Compute Node in NFSROOT After running “drblsrv -i” & “drblpush -i”, there will be pxelinux, vmlinux-pex, initrd-pxe in TFTPROOT, and different configuration files for each Compute Node in NFSROOT Linux Kernel Kernel Module GNU Libc Boot Loader DHCPDDHCPDTFTPDTFTPDNFSNFSYPYPNISNISSSHDSSHD

BIOS PXE 3nd, We enable PXE function in BIOS configuration. 3nd, We enable PXE function in BIOS configuration. pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader DHCPDDHCPDTFTPDTFTPDNFSNFSYPYPNISNISSSHDSSHD

BIOS PXE While Booting, PXE will query IP address from DHCPD. While Booting, PXE will query IP address from DHCPD. pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader TFTPDTFTPDNFSNFSYPYPNISNISSSHDSSHDDHCPDDHCPD

IP 1 IP 2 IP 3 IP 4 While Booting, PXE will query IP address from DHCPD. While Booting, PXE will query IP address from DHCPD. pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader TFTPDTFTPDNFSNFSYPYPNISNISSSHDSSHDDHCPDDHCPD

IP 1 IP 2 IP 3 IP 4 After PXE get its IP address, it will download booting files from TFTPD. Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader NFSNFSYPYPNISNISSSHDSSHDDHCPDDHCPD pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe TFTPDTFTPD

IP 1 IP 2 IP 3 IP 4 Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader NFSNFSYPYPNISNISSSHDSSHDDHCPDDHCPD pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe TFTPDTFTPD pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd

Config. Files Ex. hostname Config. Files Ex. hostname Linux Kernel Kernel Module GNU Libc Boot Loader YPYPNISNISSSHDSSHDDHCPDDHCPD initrdinitrdinitrdinitrdinitrdinitrd IP 1 IP 2 IP 3 IP 4 pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe TFTPDTFTPD After downloading booting files, scripts in initrd-pxe will config NFSROOT for each Compute Node. NFSNFS

Linux Kernel Kernel Module GNU Libc Boot Loader YPYPNISNISSSHDSSHDDHCPDDHCPD initrdinitrdinitrdinitrdinitrdinitrd IP 1 IP 2 IP 3 IP 4 pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz pxelinuxpxelinux vmlinuzvmlinuz initrdinitrd pxelinuxpxelinux vmlinuz-pxevmlinuz-pxe initrd-pxeinitrd-pxe TFTPDTFTPD Config. Files Ex. hostname Config. Files Ex. hostname NFSNFS Config. 1 Config. 2 Config. 3 Config. 4

DRBL Server YPYPNISNISDHCPDDHCPDTFTPDTFTPD NFSNFS BashBashPerlPerl SSHDSSHD BashBash PerlPerl SSHDSSHD BashBash PerlPerl SSHDSSHD BashBash PerlPerl SSHDSSHD BashBash PerlPerl SSHDSSHD Applications and Services will also deployed to each Compute Node via NFS.... Applications and Services will also deployed to each Compute Node via NFS....

DRBL Server DHCPDDHCPDTFTPDTFTPD With the help of NIS and YP, You can login each Compute Node with the Same ID / PASSWORD stored in DRBL Server! With the help of NIS and YP, You can login each Compute Node with the Same ID / PASSWORD stored in DRBL Server! NFSNFSSSHDSSHD YPYPNISNIS SSHDSSHDSSHDSSHDSSHDSSHDSSHDSSHD SSH Client

Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 2 -1: 當企鵝龍遇上小飛象當企鵝龍遇上小飛象

使用 DRBL 佈署 Hadoop 仍在開發中,待整理套件 drbl-hadoop – 掛載本機硬碟給 HDFS 用 svn co hadoop-register – 註冊網站與 ssh applet svn co

關於 hadoop.nchc.org.tw DRBL Server - 1 台 (hadoop) ,加大 /home 與 /tftpboot 空間。 DRBL Client - 19 台 (hadoop101~hadoop119) 使用 Cloudera 的 Debian 套件 使用 drbl-hadoop 的設定跟 init.d script 來協助部署 使用 hadoop-register 來提供使用者註冊與 ssh applet 介面

Lesson Learn Cloudera 套件的好處:使用 init.d script 來啟動關閉  name node, data node, job tracker, task tracker 建立大量帳號:  可透過 DRBL 內建指令完成 /opt/drbl/sbin/drbl-useradd 使用者預設 HDFS 家目錄  跑迴圈切換使用者,下 hadoop fs -mkdir tmp 設定使用者 HDFS 權限  跑迴圈切換使用者,下 hadoop dfs -chown $(id) /usr/$(id) HDFS 會使用 /var/lib/hadoop/cache/hadoop/dfs MapReduce 會使用 /var/lib/hadoop/cache/hadoop/mapred

Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang PART 2 -2: Live Demo

WANWAN DRBL-Live

1. Boot Server with DRBL-Live CD 2. Download DRBL-Hadoop Script Follow the steps 1. Boot Server with DRBL-Live CD 2. Download DRBL-Hadoop Script Follow the steps Demo with DRBL-Live CD

Questions?Questions? Jazz Wang Yao-Tsung Wang Jazz Wang Yao-Tsung Wang