Cloud Computing project NSYSU Sec. 2 Demo. NSYSU EE IT_LAB2 Parse & Index  Parse:  截出抓取文件內文字字元,並進行過濾、文 字處理。  Index:  將文字字元依順序排列並建立字元與文件關 係之連結。

Slides:



Advertisements
Similar presentations
Digital Library Service – An overview Introduction System Architecture Components and their functionalities Experimental Results.
Advertisements

2010/12/12
1 生物計算期末作業 暨南大學資訊工程系 2003/05/13. 2 compare f1 f2  只比較兩個檔案 f1 與 f2 ,比完後將結果輸出。 compare directory  以兩兩比對的方式,比對一個目錄下所有檔案的相 似程度。  將相似度很高的檔案做成報表輸出,報表中至少要.
1 Indexes and Scales ( 指標及量表 ) Social Research Methods 2117 & 6501 Fall, 2006 November 20, 2006.
計算機概論 ( 上機實習部分 ) 每週上課講義 授課教師 : 吳槐桂 最後更新 : 2004/10/21.
Software Engineering for Digital Home 單元 2 :軟體處理程序與需求分析 2-3 需求工程處理程序 Presenter: Away.
Periodicals Archive Online (PAO) 典藏人文社會學術期刊全文資料庫 Periodicals Index Online (PIO) 典藏人文社會學術期刊索引資料庫.
OCLC NetLibrary 電子書 文崗資訊股份有限公司. 2015/6/2 文崗資訊股份有限公司 2 What is NetLibrary ? 權威性: OCLC 旗下,為全球最知名的電子書資料庫 使用廣泛: 目前全球有超過 14,000 家圖書館採用此服務 新穎性: 每月 2,000 本的速度增加中.
Event Sampling 事件取樣法. 關心重點為「事件」本身明確的焦點 行為 清楚掌握主題 - 當「事件」出現時才開 始記錄 記錄程序 等待目標事件的發生 開始記錄 事件結束,停止記錄.
Using High and Low Level Communication in Agile Method Presenter: 花金地.
1 Web of Science 利用指引 單元二 瀏覽與處理查詢結果. 2 瀏覽檢索結果 查出的結果,預設以時間排列, 使用者可改變結果的排列方式: 還可以依被引用次數、相關度、 第一作者、刊名、出版年等排序 回到前先查的結果畫面 點選想看資料的完整書目 本館訂購範圍的期刊 全文,便可直接連結.
亞歷山大文學資料庫 Alexander Street Literature User Guide 中文檢索 登入網址
如何寫好一篇報告 釐清問題 選擇資料庫 制定檢索策略 實機操作. 報告內容 跨國公司 – 公司簡介(如公司成立時間、目前在幾個國家有據 點等) – 公司計畫 – 公司組織 – 公司領導 – 公司控制 – 總結(主要為結論,但是如果可以對該公司提出建 議,會額外加分) – 參考文獻.
SciFinder Scholar Basic Training A division of the American Chemical Society.
WEBPAT專利資料庫檢索. 2 WEBPAT 全球專利資訊網 n 網址:
1 Web of Science 利用指引 逢甲大學圖書館 參考服務組 系統簡介 查詢模式 查詢結果 輸出結果 查詢技巧 Web of Science 利用指引大綱 個人化服務 - 註冊 - 登入.
Concept Map – whatwhat, why and how?whyhow. What is Concept Mapping ?  Concept mapping is a technique for representing knowledge in graphs. Knowledge.
1  7 月 25 日前將各項支出之發票、收(領)據送會計 室 屬於 98 年 7 月底前之差旅費、人事費及其他各項支出之發 票、收(領)據,請於 7 月 25 日前送會計室(預算組) (各項請款支出之發票或收據日期以 98 年 7 月底前為準)  8 月 5 日前將核准後之憑證單據送會計室 核准後之憑證單據請於.
WWW Surfing Technique 莊東穎 WWW Surfing Technique The Starting point w 自己的書籤 (Bookmark) w 熱門的綜合式網站,如 HiNet, SeedNet w Search Engine( 搜尋引擎 )
1 單元三 查詢結果的引用分析 Web of Science 利用指引 查看出版及被引用情況 在查詢結果的清單中,可以瀏覽近 20 年來查詢主題出版和被引用的情況。
From: BOOKS ONLINE 1 Safari Tech Books Online Safari Business Books Online 電子書資料庫.
ProQuest Digital Dissertations 美加地區博碩士論文 -PQDD 地點 :私立元智大學 主講人:徐韻婷 小姐 日期 : 91 年 12 月 5 日 時間 :下午 2:00~ 下午 3:30.
MyiLibrary 電子書 平台使用說明 鑫士代圖書股份有限公司 Kompass. HELP … MyiLibrary主要功能 登入 工具個人化工具常見問題瀏覽檢索 書架上的書 新書上架 快速檢索 內文檢索 進階檢索 複製 / 貼上 / 列印 線上字典 書籤 檢索歷史 筆記本.
IR 組員 : 資工 4A 王俊傑 資工 4B 陳國富 資工 4B 夏希璿.
Modern Information Retrieval 第三組 陳國富 王俊傑 夏希璿.
計算機概論 - 排序 1 排序 (Sorting) 李明山 編撰 ※手動換頁.
文件製作 陳彥良. Phase 1 Identifying problems Identifying opportunities Identifying objectives.
網路廣告 Web Advertising. 2 商業廣告 不被認知認知 熟悉 / 信任 沒有交易過 零星交易 固定交易.
各種線上電子資源的特異功能 SwetsWise 的 alert, TOC alert 與 Favorites 2003/4/28 修改.
Chapter 2 Getting Started Insertion Sort: 能有效率地排序小數字的演算法 範例 :
1 第 9 章 視窗應用程式的事件處理 9-1 事件的基礎 9-1 事件的基礎 9-2 表單事件 9-2 表單事件 9-3 滑鼠事件 9-3 滑鼠事件 9-4 鍵盤事件 9-4 鍵盤事件 9-5 表單的鍵盤事件 9-5 表單的鍵盤事件 9-6 控制項的事件 9-6 控制項的事件.
數位化論文典藏聯盟數位化論文典藏聯盟 Digital Dissertation Consortium.
Unit C: Analysing data characteristics 主要參考資料來源 : KPMG ACL 課程講義資料 PriceWaterHouseCooper ACL 課程講義資料 ACL Training Materials.
資料結構實習-一 參數傳遞.
6-2 認識元件庫與內建元件庫 Flash 的元件庫分兩種, 一種是每個動畫專 屬的元件庫 (Library) ;另一種則是內建元 件庫 (Common Libraries), 兩者皆可透過 『視窗』功能表來開啟, 以下即為您說明。
ProQuest Science Journals 專業科學期刊全文資料庫. PQ Science Journals 期刊數量 索摘: 727 全文期刊: 599 SCI 全文現刊: 251 焦點主題 -Biology -Environmental science -Multidisciplinary.
Management Abstracts Retrieval System; MARS 檢索操作.
Multi - Language 鄭傑仁 陳彥如. Preface 大三下時,經由系上安排進入一間製作 IP phone 的公司實 習,公司所生產的 IP phone 提供很廣泛的設定 ( 例如 : 韌體 資訊、網路設定、 SIP 設定、語音設定等 ) ,為了方便使用 者設定或查詢這些選項,話機本身都內建了.
元智大學資訊工程學系 系統實驗室 1 以 Metalogy 的詮釋資料為依據 的跨圖書館搜尋引擎之設計 陳英祥陳哲民楊正仁 元智大學資訊工程學系2001/10/24.
1 Web of Science 利用指引 逢甲大學圖書館 參考服務組 單元六 個人化服務.
Analyzing Case Study Evidence
(計畫名稱) 簡 報 教育部顧問室奈米科技人才培育計畫 95年度期末成果報告暨96年度工作規劃會議 報告人: 計畫執行團隊:
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
ProQuest Digital Dissertations 〈 PQDD 〉 美加地區博碩士論文 圖 書 館
1 第七章 植基於可調整式量化表及離散餘 弦轉換之浮水印技術. 2 Outlines 介紹 介紹 灰階浮水印藏入 灰階浮水印藏入 灰階浮水印取回 灰階浮水印取回 實驗結果 實驗結果.
T H O M S O N S C I E N T I F I C ISI Web of Knowledge 新功能與提升 2005 年第 3 季.
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
廣電新聞播報品質電腦化 評估系統之研發 國立政治大學 資訊科學系 指導教授:廖文宏 學生:蘇以暄.
數位家庭教學推動聯盟中心 數位家庭軟體工程 第一年教材編列進度報告 國立台灣海洋大學資訊工程學系 梁德容.
網路介紹及其運用 講師陳炯勳. 5-2 IP 協定 ( 一 ) IP 協定運作 (1) – 網路成員:主機 (Host) 與路由器 (Router) – 路由表 – 電報傳輸運作.
From: BOOKS ONLINE 1 Safari Tech Books Online 資訊科技電子書資料庫 提供您最新、最權威 -- 資訊科技新 知.
論文研討 2 學分 授課教師:吳俊概. 第一節 論文發表的目的 第二節 論文發表的歷程 第三節 投稿過程 第四節 退稿處理 學術期刊論文的製作與發表.
Books24x7 ® 電子書資料庫 長智文化事業有限公司 Presented by 邱稚婷. Overview and Access Instructions Books24x7 provides complete access to: –The full text of 23,000+ leading.
蔡中皓 郭尚豪 紀羽軒 1. Outline Background Motive and purpose Method Conclusion 2.
Cambridge Scientific Abstracts 系列資料庫 圖 書 館
-Artificial Neural Network- Matlab操作介紹 -以類神經網路BPN Model為例
NVivo 7在文件分析應用.
資料結構實習-六.
全國奈米科技人才培育推動計畫辦公室 中北區奈米科技K -12 教育發展中心計畫 簡 報 報告人:楊鏡堂教授 計畫執行單位:國立清華大學動力機械工程學系 計畫種子學校:教育部顧問室 94 年度奈米科技人才培育先導型計畫年度成果報告 中華民國九十四年十月十四日.
第8章 字串與陣列 8-1一維陣列的處理 8-2 字串處理 8-3 多維陣列的處理 8-4 動態陣列與參數傳遞 8-5 陣列排序與搜尋.
閱選訂購 Approval Plan. 什麼是閱選訂購 ? 由圖書館與其所選定代理商簽 訂合約,代理商根據圖書館所 制定的選書興趣檔 (profile) 選 擇適合的圖書送至圖書館,由 圖書專員審核挑選過後才予以 購買,不合則主動退書。
Concept Map – whatwhat, why and how?whyhow. Outline.
Mapping - 1 Mapping From ER Model to Relational DB.
Jian Wang Based on “Meet Hadoop! Open Source Grid Computing” by Devaraj Das Yahoo! Inc. Bangalore & Apache Software Foundation.
Hadoop&HDFS 1. OUTLINE Introduction Architecture Hadoop Distribution File System – Architecture of HDFS NameNode DataNode HDFS Client – Replica Management.
自由軟體實驗室 設置 Hadoop 環境 王耀聰 陳威宇 國家高速網路與計算中心 (NCHC)
自由軟體實驗室 設置 Hadoop 環境 王耀聰 陳威宇 國家高速網路與計算中心 (NCHC)
Hadoop Joshua Nester, Garrison Vaughan, Calvin Sauerbier, Jonathan Pingilley, and Adam Albertson.
Cloud Computing project NSYSU Sec. 1 Demo. NSYSU EE IT_LAB2 Outline  Our system’s architecture  Flow chart of the hadoop’s job(web crawler) working.
INTRODUCTION TO HADOOP. OUTLINE  What is Hadoop  The core of Hadoop  Structure of Hadoop Distributed File System  Structure of MapReduce Framework.
Presentation transcript:

Cloud Computing project NSYSU Sec. 2 Demo

NSYSU EE IT_LAB2 Parse & Index  Parse:  截出抓取文件內文字字元,並進行過濾、文 字處理。  Index:  將文字字元依順序排列並建立字元與文件關 係之連結。

NSYSU EE IT_LAB3 Flowchart Seed urls Run crawl command as a hadoop job Assign job’s fragments to each tasktracker; go fetch web’s data Store context to output dir. on HDFS Url DB Doc. data Fetch log HDFS ( ) Map & reduce Index(s) Parse Documents; Create index file ( ) Map & reduce

NSYSU EE IT_LAB4 Architecture Machine 01 Machine 02Machine 03 master (x.x.x.1) slave2 (x.x.x.3)slave1 (x.x.x.2) Namenode JobTracker Datanode TaskTracker Datanode TaskTracker Datanode TaskTracker administer user Job

NSYSU EE IT_LAB5 Hadoop cluster – 1 node Machine 01 master (x.x.x.1) Namenode JobTracker Datanode TaskTracker

NSYSU EE IT_LAB6 Hadoop cluster – 2 nodes Machine 01 Machine 02 master (x.x.x.1) slave1 (x.x.x.2) Namenode JobTracker Datanode TaskTracker Datanode TaskTracker

NSYSU EE IT_LAB7 Crawler input

NSYSU EE IT_LAB8 Crawler ouput  Output of doc.

NSYSU EE IT_LAB9 Time compare  效果比較 ( 文字分析與索引檔建立 ): 單一主機兩台主機 所需時間 50 分 14 秒 24 分 26 秒 網頁資訊文件分析、索引建立時間比較

NSYSU EE IT_LAB10 Thanks for your attention!!