Pentaho Data Integration

Slides:



Advertisements
Similar presentations
DIR-636L Support 10/100/1000Mbps 1WAN and 4LAN N 300Mbps Wireless Easy wizard setup Support mydlink cloud service mydlink apps (iOS/android) Support.
Advertisements

1 OBJECTIVES To generate a web-based system enables to assemble model configurations. to submit these configurations on different.
Presenters: Alan Chan, Sam Tse Date:2012/06/20. DIR-605L Support 10/100Mbps 1WAN and 4LAN n 300Mbps Wireless Fixed 5dbi antennal x2 Easy wizard.
2010/12/12
FCU, Department of ECE, IC Design Research Lab. TEL: # 4945 Pre-SIm , Post-Sim.
6-1 指標簡介 6-2 指標與陣列 6-3 動態配置記憶體 6-4 本章綜合練習
王謙志. SIP Introduction Call Flow Point to Point Flow Transfer Flow Conference Flow Exception How to use JPcap Future Work Reference.
TA:洪敏書 Qualnet單機版安裝教學 TA:洪敏書
Mobile IP Lab TA: 洪敏書
無名哇哇哇 ?. 封包 header & 內文 Form 位置 找到發送 POST 的封包 找到密碼位置.
在 Ad-hoc 網路中實現點對 點發送訊息與廣播訊息. 檔案下載  範例程式可在下列網址取得  DEMO 程式可在下列網址取得
1 第一章 Word 的基本觀念 內容概要: Word 的特色 啟動與離開 Word 的方法 滑鼠游標與外型的介紹 基本操作 Word 視窗法則 使用 Word 遭遇問題時, 應如何利用軟體特 性而獲得輔助解說.
Android Class vs. Jar 建國科技大學 資管系 饒瑞佶 2013/4 V1. 從 MyAndroidProject 專案改起 將 BMI_method.java 改寫成 class 方式 步驟 1 :在原 package 內新增一個 class.
1 Web of Science 利用指引 單元二 瀏覽與處理查詢結果. 2 瀏覽檢索結果 查出的結果,預設以時間排列, 使用者可改變結果的排列方式: 還可以依被引用次數、相關度、 第一作者、刊名、出版年等排序 回到前先查的結果畫面 點選想看資料的完整書目 本館訂購範圍的期刊 全文,便可直接連結.
1 Web of Science 利用指引 逢甲大學圖書館 參考服務組 單元五 存檔或輸出.
國立聯合大學 資訊管理學系 陳士杰老師 MySQL5 視覺化資料庫管理工具 - MySQL Adminstrator.
程式註解說明. 2 程式註解格式 塊狀註解 對檔案、 class 、 method 、資料結構、一段程式 …. 等程式區塊 做說明。 第一行的開頭必需為 “/*” 且沒有其他文字,最後一行的開頭 必需以 “*/” 做為結束,在中間每一行的開頭都必需是一個 “*” 。 單行註解 佔據一整行的說明。 以.
CNS B4 檢查階段 Present :張永昌 Chang Yung-Chang. Outline  B4.1 簡介  B4.2 例行檢查  B4.3 自我督導程序  B4.4 從事件中學習  B4.5 資訊安全管理系統內部稽核  B4.6 管理階層審查  B4.7 趨勢分析.
IR 組員 : 資工 4A 王俊傑 資工 4B 陳國富 資工 4B 夏希璿.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳 研究設計.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
第 5 章 深入 Response 物件 製作. 網頁的轉向與強制輸出 - 讓網頁轉彎的 Redirect 敘述 運用 Response 物件的 Redirect 方法,將瀏覽器顯 示的網頁,導向至其他網頁,語法如下: Response.Redirect 網頁路徑與名稱 此網頁路徑與名稱  若是導向到同一台.
Install and Uninstall.
文件製作 陳彥良. Phase 1 Identifying problems Identifying opportunities Identifying objectives.
1 MySQL 資料庫的使用 網頁資料庫的基礎 網頁資料庫的基礎 下載與安裝 MySQL 下載與安裝 MySQL 啟動 MySQL 伺服器 啟動 MySQL 伺服器 Web 介面的 MySQL 管理程式 Web 介面的 MySQL 管理程式 MySQL 建立資料庫 MySQL 建立資料庫 在 MySQL.
電腦優化 黃柏漢 羅元富 黃得瑋.
第三章 自動再裝載運用篇 使用時機:裝載計劃完成時,尚有剩餘空 間的情形,維持已固定計劃而繼續做裝載 最佳化。以支持次日裝載計劃而提前調整 作業模式。 裝載物品設定和裝載容器設定如前兩章介 紹,於此不再重複此動作,直接從裝載計 劃設定開始,直接從系統內定的物品和容 器選取所需.
校友資料庫系統 說明會 公共事務室 廖建翔 2015年6月21日 2015年6月21日 2015年6月21日.
Unit C: Analysing data characteristics 主要參考資料來源 : KPMG ACL 課程講義資料 PriceWaterHouseCooper ACL 課程講義資料 ACL Training Materials.
1-6 動畫的文件屬性 舞台是動畫實際播放的畫面, 所以舞台的大 小與長寬比例對將來動畫的呈現有很大的 影響。 Flash 預設的舞台尺寸是 550 Pixels × 400 Pixels, 背景為白色, 如果要更改舞台大小與 背景色, 請執行『修改 / 文件』命令, 開啟文 件屬性 (Document.
從此處輸入帳號密碼登入到管理頁面. 點選進到檔案管理 點選「上傳檔案」上傳資料 點選瀏覽選擇電腦裡的檔案 可選擇公開或不公開 為平台上的資料夾 此處為檔案分類,可顯示在展示頁面上,若要參加 MY EG 競賽,做品一律上傳到 “ 98 MY EG Contest ” 點選此處確定上傳檔案.
Chapter 17 Windows API 程式入門 VC++ 與 WindowsVC++ 與 Windows 建構遊戲設計的舞台 建構遊戲設計的舞台.
6-2 認識元件庫與內建元件庫 Flash 的元件庫分兩種, 一種是每個動畫專 屬的元件庫 (Library) ;另一種則是內建元 件庫 (Common Libraries), 兩者皆可透過 『視窗』功能表來開啟, 以下即為您說明。
個人資訊安全守則 授課:方順展(網站).
法律系 系所科助之血淚辛酸史 劉蕙綺. 系上推行困難處 ( 學期初 ) 傳統習慣:法律系以教科書為主 很多老師沒有電子檔案 專、兼任老師使用平台的意願 因老師多為資深老師,因此在使用電腦部 份可能比較需要幫助 通常學生知道訊息的來源是藉由 BBS 或者 是系上的系板,使用意願會降低.
Management Abstracts Retrieval System; MARS 檢索操作.
國立聯合大學 資訊管理學系 陳士杰老師 MySQL 資料庫執行環境管理. 國立聯合大學 資訊管理學系 資料庫系統課程 ( 陳士杰 ) ▊ Outlines MySQL 資料庫系統的環境簡介 my.ini 簡介與製作 設定管理者的密碼.
安全性管理員 Java 學習手冊 p.p SecurityManager 觀念  Java Application 的系統資源存取權限的設 定  可以由 SecurityManager 完全控制 如 : 檔案系統, Thread, 執行外部 process, 網路存取 一旦 Security.
2010 MCML introduction 製作日期: 2010/9/10 製作人 : 胡名霞.
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Linguistics phonetic symbols. 先下載 IPA 字型檔案,執行安裝。 由於這個程式的字型目錄設定錯誤, 所以等重新開機時就會發現字型消失。 所以必須根據以下步驟來讓 Windows 加入 IPA 字型。
Network Analyzer For Ethereal. 基本設備 Hardware pc network card can connect INTERNET Software OS Winpcap Ethereal.
網路介紹及其運用 講師陳炯勳. 5-2 IP 協定 ( 一 ) IP 協定運作 (1) – 網路成員:主機 (Host) 與路由器 (Router) – 路由表 – 電報傳輸運作.
概念性產品企劃書 呂學儒 李政翰.
無線通訊網路 Mac 層 TDM 通訊模式的操作與效能研究 專題生 : 林書弘、蔡逸祥、毛建翔、王政 華 指導教授 : 黃依賢.
組合語言與系統程式 軟體使用教學. 軟體下載及安裝 下載 到課程網頁下載 tw/~jiun/ 安裝 解壓縮後將 System Software 資料夾放在 D 槽 (C 槽版本放在 C 之下 )
UPnP Architecture Reporter: shi-han wang DCN LAB.
Biological Science Database 個人化服務設定步驟. Biological Science Database 僅提供專題選 粹服務 專題選粹 (Alerts) :查詢後,提供儲存檢 索策略的功能,日後每週將符合條件的 更新資料,採 方式通知。每筆設定 最多每週可收到.
中央大學宿舍網路管理方式.
09610CS_ 校園授權軟體下載與安裝 講師 : 張智宏. 登入校務資訊系統 校園軟體下載.
Android 遊戲設計模組 1 Android 開發環境建構 郭育政 東吳大學資訊管理系 涂昆源 萬能科技大學資訊工程系 余執彰 萬能科技大學資訊工程系 周建興 淡江大學電機工程系 林旭陽 東吳大學資訊管理系 教育部網路通訊人才培育先導型計畫 ─ 課程發展計畫.
著作權所有 © 旗標出版股份有限公司 第 14 章 製作信封、標籤. 本章提要 製作單一信封 製作單一郵寄標籤.
遠端北風資料庫 公佈時間: 2006/4/26 繳交截止時間: 2006/5/10. 作業目的 實作遠端資料庫瀏覽程式.
The information contained herein is the exclusive property of CCL/ITRI and shall not be distributed, reproduced, or disclosed in whole or in part without.
安裝 Android 開發環境 建國科技大學 資管系 饒瑞佶 2013/2 V1. 需要 JDK ( Java Runtime 1.5 above) Eclipse IDE Android SDK ADT.
ASP.NET 應用程式開發與設計 : version control: Git/SVN 講 師: Taoyu Wu ( 吳燾佑 ) 日 期: 2015/3/20 1.
OOAD1 UML Tools: A Brief Introduction 鄧姚文
Subversion Tutorial Presenter: Ya-Lin Huang. Introduction 版本控制系統是什麼? 管理對資訊所做人為變動 程式設計師的工具之一 為何要使用版本控制系統? 促成有效率的團隊合作 使變動歷程能被追溯 2.
ETL Extract Transform Load. Introduction of ETL ETL is used to migrate data from one database to another, to form data marts and data warehouses and also.
自由軟體實驗室 設置 Hadoop 環境 王耀聰 陳威宇 國家高速網路與計算中心 (NCHC)
XAMPP設定 - Apache.
Trend Micro ServerProtect For Linux. System Requirements Hardware(For 1.3, 1.25, 1.2) –Intel™ Pentium™ II processor (or higher) or AMD™ Athlon™ processor.
Openwebmail. 安裝 openwebmail 必要套件 yum -y install gcc perl-Text-Iconv perl-CGI perl- YAML perl-CPAN perl-suidperl httpd service httpd start chkconfig httpd.
1 IPTABLES and NAT on Fedora Core 6 Speaker : Rex Wu Date :
組員: B 黃聖凱 B 陳禮增.  Advanced Encryption Package( 以下簡稱 AEP) 是由 InterCrypto Ltd 所製作的檔案加密程式。  目前只能在 windows 上運行。  AEP PRO 要價 $49.95 元。
Lab 1 Introduction MMLAB. Environment Install Linux OS in a computer( VirtualBox or Vmware or Native) It’s all up to you for selecting Ubuntu Server or.
1 Topic Report Voreen Reporter: Chia-Kai Chang Advisor: Sheng-Lung Huang Date: 2012/8/9.
生物資訊程式語言應用 Part 4 MySQL.
SQL Server 2012 on Server Core新架構探討並與AlwaysOn完美整合
Presentation transcript:

Pentaho Data Integration 2014 3/26

Outline Introduction Installation Key point Demo

Introduction A single product, but consists of multiple programs that are used in different phases of the ETL development and deployment cycle. Each program serves a particular purpose and is more or less independent of the others. All of the programs depend on a common set of Java archives that make up the actual data integration engine.

Overview of Kettle programs

Spoon The integrated development environment GUI that allows you to design transformations and jobs that can run with the Kettle tools-Pan and Kitchen Transformations and Jobs can describe themselves using an XML file or can be put in a Kettle database repository. It also includes functionality for performance monitoring.

Pan & Kitchen Pan : A command line–driven program for transformation A program to execute transformation designed by Spoon in XML or database repository Transformations are scheduled in batch mode to be run automatically at regular intervals. Kitchen : A command line–driven job runner Execute jobs designed by Spoon in XML or database

Carte Simple web server to execute transformations and jobs remotely Allows to remotely monitor, start and stop the transformations and jobs. Accept an XML that contains transformation to execute and the execution configuration.

安裝KETTLE Download from http://community.pentaho.com/ Set environmental variable $PENTAHO_JAVA_HOME Extract the file and execute “Spoon.bat”

Settiing HDFS 下載對應版本的package http://repository.pentaho.org/artifactory/list/pentaho/pentaho/pentaho-hadoop-shims-cdh3u4-package/ 修改設定檔 C:\Program Files\Pentaho\data-integration\plugins\pentaho-big-data-plugin\plugin.properties

重要Key point Job: 主要的具體任務 Transformation: 任務內的component,細部地控制資料的處理 Hop: 兩任務間的stream

Hops Color Convention

使用說明

sPOON

Pan & Kitchen 將 Kettle 的 Transformation 檔案或 Job 檔案放置到 <Kettle_Home> 的任意子目錄中 若是 Transformation 檔案, 則透過 pan.bat 來執行 若是 Job 檔案, 則透過 kitchen.bat 來執行

Carte

Remote execution with Carte start up a slave server on port 8080 Setting : ./data-integration/pwd Start : ./Carte.bat IP address port Define salve server in Kettle Open Kettle, open a transformation or job Click on the View panel Right click on Slave server and select New. Transformations can only use the slave server if you specify it in the Execute a transformation dialog

參考資料 查hdfs對應版本 http://wiki.pentaho.com/display/BAD/Configuring+Pentaho+for+your+Hadoop+Distro+and+Version Pentaho Community wiki http://wiki.pentaho.com/display/COM/Community+Wiki+Home Pentaho Data Integration (Kettle) Tutorial http://wiki.pentaho.com/display/EAI/Pentaho+Data+Integration+(Kettle)+Tutorial