Cloud Computing project NSYSU Sec. 2 Demo. NSYSU EE IT_LAB2 Parse & Index  Parse:  截出抓取文件內文字字元，並進行過濾、文字處理。  Index:  將文字字元依順序排列並建立字元與文件關係之連結。

Slides:

Advertisements

Similar presentations

Digital Library Service – An overview Introduction System Architecture Components and their functionalities Experimental Results.

Advertisements

1 生物計算期末作業暨南大學資訊工程系 2003/05/13. 2 compare f1 f2  只比較兩個檔案 f1 與 f2 ，比完後將結果輸出。 compare directory  以兩兩比對的方式，比對一個目錄下所有檔案的相似程度。  將相似度很高的檔案做成報表輸出，報表中至少要.

1 Indexes and Scales ( 指標及量表 ) Social Research Methods 2117 & 6501 Fall, 2006 November 20, 2006.

計算機概論 ( 上機實習部分 ) 每週上課講義授課教師 : 吳槐桂最後更新 : 2004/10/21.

Software Engineering for Digital Home 單元 2 ：軟體處理程序與需求分析 2-3 需求工程處理程序 Presenter: Away.

Periodicals Archive Online (PAO) 典藏人文社會學術期刊全文資料庫 Periodicals Index Online (PIO) 典藏人文社會學術期刊索引資料庫.

OCLC NetLibrary 電子書文崗資訊股份有限公司. 2015/6/2 文崗資訊股份有限公司 2 What is NetLibrary ? 權威性： OCLC 旗下，為全球最知名的電子書資料庫使用廣泛：目前全球有超過 14,000 家圖書館採用此服務新穎性：每月 2,000 本的速度增加中.

Event Sampling 事件取樣法. 關心重點為「事件」本身明確的焦點行為清楚掌握主題 - 當「事件」出現時才開始記錄記錄程序等待目標事件的發生開始記錄事件結束，停止記錄.

Using High and Low Level Communication in Agile Method Presenter: 花金地.

1 Web of Science 利用指引單元二瀏覽與處理查詢結果. 2 瀏覽檢索結果查出的結果，預設以時間排列，使用者可改變結果的排列方式：還可以依被引用次數、相關度、第一作者、刊名、出版年等排序回到前先查的結果畫面點選想看資料的完整書目本館訂購範圍的期刊全文，便可直接連結.

亞歷山大文學資料庫 Alexander Street Literature User Guide 中文檢索登入網址

如何寫好一篇報告釐清問題選擇資料庫制定檢索策略實機操作. 報告內容跨國公司 – 公司簡介（如公司成立時間、目前在幾個國家有據點等） – 公司計畫 – 公司組織 – 公司領導 – 公司控制 – 總結（主要為結論，但是如果可以對該公司提出建議，會額外加分） – 參考文獻.

SciFinder Scholar Basic Training A division of the American Chemical Society.

WEBPAT專利資料庫檢索. 2 WEBPAT 全球專利資訊網 n 網址：

1 Web of Science 利用指引逢甲大學圖書館參考服務組系統簡介查詢模式查詢結果輸出結果查詢技巧 Web of Science 利用指引大綱個人化服務 - 註冊 - 登入.

Concept Map – whatwhat, why and how?whyhow. What is Concept Mapping ?  Concept mapping is a technique for representing knowledge in graphs. Knowledge.

1  7 月 25 日前將各項支出之發票、收（領）據送會計室屬於 98 年 7 月底前之差旅費、人事費及其他各項支出之發票、收（領）據，請於 7 月 25 日前送會計室（預算組）（各項請款支出之發票或收據日期以 98 年 7 月底前為準）  8 月 5 日前將核准後之憑證單據送會計室核准後之憑證單據請於.

WWW Surfing Technique 莊東穎 WWW Surfing Technique The Starting point w 自己的書籤 (Bookmark) w 熱門的綜合式網站，如 HiNet, SeedNet w Search Engine( 搜尋引擎 )

1 單元三查詢結果的引用分析 Web of Science 利用指引查看出版及被引用情況在查詢結果的清單中，可以瀏覽近 20 年來查詢主題出版和被引用的情況。

From: BOOKS ONLINE 1 Safari Tech Books Online Safari Business Books Online 電子書資料庫.

ProQuest Digital Dissertations 美加地區博碩士論文 -PQDD 地點：私立元智大學主講人：徐韻婷小姐日期： 91 年 12 月 5 日時間：下午 2:00~ 下午 3:30.

MyiLibrary 電子書平台使用說明鑫士代圖書股份有限公司 Kompass. HELP … MyiLibrary主要功能登入工具個人化工具常見問題瀏覽檢索書架上的書新書上架快速檢索內文檢索進階檢索複製 / 貼上 / 列印線上字典書籤檢索歷史筆記本.

IR 組員 : 資工 4A 王俊傑資工 4B 陳國富資工 4B 夏希璿.

Modern Information Retrieval 第三組陳國富王俊傑夏希璿.

計算機概論 - 排序 1 排序 (Sorting) 李明山編撰 ※手動換頁.

文件製作陳彥良. Phase 1 Identifying problems Identifying opportunities Identifying objectives.

網路廣告 Web Advertising. 2 商業廣告不被認知認知熟悉 / 信任沒有交易過零星交易固定交易.

各種線上電子資源的特異功能 SwetsWise 的 alert, TOC alert 與 Favorites 2003/4/28 修改.

Chapter 2 Getting Started Insertion Sort: 能有效率地排序小數字的演算法範例 :

1 第 9 章視窗應用程式的事件處理 9-1 事件的基礎 9-1 事件的基礎 9-2 表單事件 9-2 表單事件 9-3 滑鼠事件 9-3 滑鼠事件 9-4 鍵盤事件 9-4 鍵盤事件 9-5 表單的鍵盤事件 9-5 表單的鍵盤事件 9-6 控制項的事件 9-6 控制項的事件.

數位化論文典藏聯盟數位化論文典藏聯盟 Digital Dissertation Consortium.

Unit C: Analysing data characteristics 主要參考資料來源 : KPMG ACL 課程講義資料 PriceWaterHouseCooper ACL 課程講義資料 ACL Training Materials.

資料結構實習-一參數傳遞.

6-2 認識元件庫與內建元件庫 Flash 的元件庫分兩種, 一種是每個動畫專屬的元件庫 (Library) ；另一種則是內建元件庫 (Common Libraries), 兩者皆可透過『視窗』功能表來開啟, 以下即為您說明。

ProQuest Science Journals 專業科學期刊全文資料庫. PQ Science Journals 期刊數量索摘： 727 全文期刊： 599 SCI 全文現刊： 251 焦點主題 -Biology -Environmental science -Multidisciplinary.

Management Abstracts Retrieval System; MARS 檢索操作.

Multi - Language 鄭傑仁陳彥如. Preface 大三下時，經由系上安排進入一間製作 IP phone 的公司實習，公司所生產的 IP phone 提供很廣泛的設定 ( 例如 : 韌體資訊、網路設定、 SIP 設定、語音設定等 ) ，為了方便使用者設定或查詢這些選項，話機本身都內建了.

元智大學資訊工程學系系統實驗室 1 以 Metalogy 的詮釋資料為依據的跨圖書館搜尋引擎之設計陳英祥陳哲民楊正仁元智大學資訊工程學系2001/10/24.

1 Web of Science 利用指引逢甲大學圖書館參考服務組單元六個人化服務.

Analyzing Case Study Evidence

(計畫名稱) 簡報教育部顧問室奈米科技人才培育計畫 95年度期末成果報告暨96年度工作規劃會議報告人：計畫執行團隊：

演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.

ProQuest Digital Dissertations 〈 PQDD 〉美加地區博碩士論文圖書館

1 第七章植基於可調整式量化表及離散餘弦轉換之浮水印技術. 2 Outlines 介紹介紹灰階浮水印藏入灰階浮水印藏入灰階浮水印取回灰階浮水印取回實驗結果實驗結果.

T H O M S O N S C I E N T I F I C ISI Web of Knowledge 新功能與提升 2005 年第 3 季.

Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標，以減少測量誤差並可建立問卷的構念效度驗證性因素分析.

廣電新聞播報品質電腦化評估系統之研發國立政治大學資訊科學系指導教授：廖文宏學生：蘇以暄.

數位家庭教學推動聯盟中心數位家庭軟體工程第一年教材編列進度報告國立台灣海洋大學資訊工程學系梁德容.

網路介紹及其運用講師陳炯勳. 5-2 IP 協定 ( 一 ) IP 協定運作 (1) – 網路成員：主機 (Host) 與路由器 (Router) – 路由表 – 電報傳輸運作.

From: BOOKS ONLINE 1 Safari Tech Books Online 資訊科技電子書資料庫提供您最新、最權威 -- 資訊科技新知.

論文研討 2 學分授課教師：吳俊概. 第一節論文發表的目的第二節論文發表的歷程第三節投稿過程第四節退稿處理學術期刊論文的製作與發表.

Books24x7 ® 電子書資料庫長智文化事業有限公司 Presented by 邱稚婷. Overview and Access Instructions Books24x7 provides complete access to: –The full text of 23,000+ leading.

蔡中皓郭尚豪紀羽軒 1. Outline Background Motive and purpose Method Conclusion 2.

Cambridge Scientific Abstracts 系列資料庫圖書館

-Artificial Neural Network- Matlab操作介紹 -以類神經網路BPN Model為例

NVivo 7在文件分析應用.

資料結構實習-六.

全國奈米科技人才培育推動計畫辦公室中北區奈米科技Ｋ -12 教育發展中心計畫簡報報告人：楊鏡堂教授計畫執行單位：國立清華大學動力機械工程學系計畫種子學校：教育部顧問室 94 年度奈米科技人才培育先導型計畫年度成果報告中華民國九十四年十月十四日.

第8章字串與陣列 8-1一維陣列的處理 8-2 字串處理 8-3 多維陣列的處理 8-4 動態陣列與參數傳遞 8-5 陣列排序與搜尋.

閱選訂購 Approval Plan. 什麼是閱選訂購 ? 由圖書館與其所選定代理商簽訂合約，代理商根據圖書館所制定的選書興趣檔 (profile) 選擇適合的圖書送至圖書館，由圖書專員審核挑選過後才予以購買，不合則主動退書。

Concept Map – whatwhat, why and how?whyhow. Outline.

Mapping - 1 Mapping From ER Model to Relational DB.

Jian Wang Based on “Meet Hadoop! Open Source Grid Computing” by Devaraj Das Yahoo! Inc. Bangalore & Apache Software Foundation.

Hadoop&HDFS 1. OUTLINE Introduction Architecture Hadoop Distribution File System – Architecture of HDFS NameNode DataNode HDFS Client – Replica Management.

自由軟體實驗室設置 Hadoop 環境王耀聰陳威宇國家高速網路與計算中心 (NCHC)

自由軟體實驗室設置 Hadoop 環境王耀聰陳威宇國家高速網路與計算中心 (NCHC)

Hadoop Joshua Nester, Garrison Vaughan, Calvin Sauerbier, Jonathan Pingilley, and Adam Albertson.

Cloud Computing project NSYSU Sec. 1 Demo. NSYSU EE IT_LAB2 Outline  Our system’s architecture  Flow chart of the hadoop’s job(web crawler) working.

INTRODUCTION TO HADOOP. OUTLINE  What is Hadoop  The core of Hadoop  Structure of Hadoop Distributed File System  Structure of MapReduce Framework.

Presentation transcript:

Cloud Computing project NSYSU Sec. 2 Demo

NSYSU EE IT_LAB2 Parse & Index  Parse:  截出抓取文件內文字字元，並進行過濾、文字處理。  Index:  將文字字元依順序排列並建立字元與文件關係之連結。

NSYSU EE IT_LAB3 Flowchart Seed urls Run crawl command as a hadoop job Assign job’s fragments to each tasktracker; go fetch web’s data Store context to output dir. on HDFS Url DB Doc. data Fetch log HDFS ( ) Map & reduce Index(s) Parse Documents; Create index file ( ) Map & reduce

NSYSU EE IT_LAB4 Architecture Machine 01 Machine 02Machine 03 master (x.x.x.1) slave2 (x.x.x.3)slave1 (x.x.x.2) Namenode JobTracker Datanode TaskTracker Datanode TaskTracker Datanode TaskTracker administer user Job

NSYSU EE IT_LAB5 Hadoop cluster – 1 node Machine 01 master (x.x.x.1) Namenode JobTracker Datanode TaskTracker

NSYSU EE IT_LAB6 Hadoop cluster – 2 nodes Machine 01 Machine 02 master (x.x.x.1) slave1 (x.x.x.2) Namenode JobTracker Datanode TaskTracker Datanode TaskTracker

NSYSU EE IT_LAB7 Crawler input

NSYSU EE IT_LAB8 Crawler ouput  Output of doc.

NSYSU EE IT_LAB9 Time compare  效果比較 ( 文字分析與索引檔建立 ): 單一主機兩台主機所需時間 50 分 14 秒 24 分 26 秒網頁資訊文件分析、索引建立時間比較

NSYSU EE IT_LAB10 Thanks for your attention!!