انجمن انفورماتيک ايران

Slides:



Advertisements
Similar presentations
Large Scale Computing Systems
Advertisements

Securing Big Data KAIZEN APPROACH, INC.. Big Data Defined Big data is where the data volume, acquisition velocity, or data representation limits the ability.
Jennifer Widom NoSQL Systems Overview (as of November 2011 )
Reporter: Haiping Wang WAMDM Cloud Group
25 Need-to-Know Facts. Fact 1 Every 2 days we create as much information as we did from the beginning of time until 2003 [Source]Source © 2014 Bernard.
Database Processing Chapter "No, Drew, You Don’t Know Anything About Report Writing.” Copyright © 2014 Pearson Education, Inc. Publishing as Prentice.
CS 405G: Introduction to Database Systems 24 NoSQL Reuse some slides of Jennifer Widom Chen Qian University of Kentucky.
STATE UNIVERSITY OF NEW YORK INSTITUTE OF TECHNOLOGY AT UTICA/ROME Cloud Computing for Small Businesses Christopher Urban SUNYIT Department of Computer.
+ Hbase: Hadoop Database B. Ramamurthy. + Motivation-1 HDFS itself is “big” Why do we need “hbase” that is bigger and more complex? Word count, web logs.
Massively Parallel Cloud Data Storage Systems S. Sudarshan IIT Bombay.
1 Yasin N. Silva Arizona State University This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
A national virtual reference service Gillian Hanlon, SLIC JISC Web2.0 Forum, 18 June 2010.
Computer Storage & Representing Numbers CE 311 K - Introduction to Computer Methods Daene C. McKinney.
A Brief Overview by Aditya Dutt March 18 th ’ Aditya Inc.
SQL vs NOSQL Discussion
© Spinnaker Labs, Inc. Google Cluster Computing Faculty Training Workshop Open Source Tools for Teaching.
Cloud Databases Matt Gregg Bob Guidinger. Cloud 101 What do we mean by Cloud Databases? Why do we have them? o Alternative to IT infrastructure investment.
sound-effects-sound-clips-family-feud-download sound-effects-sound-clips-family-feud-download-
Syed Qasim SharePoint Innovations, LLC GIGABYTES 2003: 24B 2004: 48 B 2006: 100B 80% Unstructured 2 002: 12B Cave paintings, Bone tools 40,000.
Distributed Indexing of Web Scale Datasets for the Cloud {ikons, eangelou, Computing Systems Laboratory School of Electrical.
SEMINAR ON Guided by: Prof. D.V.Chaudhari Seminar by: Namrata Sakhare Roll No: 65 B.E.Comp.
Amazon Web Services BY, RAJESH KANDEPU. Introduction  Amazon Web Services is a collection of remote computing services that together make up a cloud.
Binary Code.
Experimenting Lucene Index on HBase in an HPC Environment Xiaoming Gao Vaibhav Nachankar Judy Qiu.
O’Reilly – Hadoop: The Definitive Guide Ch.1 Meet Hadoop May 28 th, 2010 Taewhi Lee.
Apache Cassandra - Distributed Database Management System Presented by Jayesh Kawli.
Changwon Nati Univ. ISIE 2001 CSCI5708 NoSQL looks to become the database of the Internet By Lawrence Latif Wed Dec Nhu Nguyen and Phai Hoang CSCI.
Cloud Computing Clase 8 - NoSQL Miguel Johnny Matias
0 © 2003 Cisco Systems, Inc. All rights reserved. Session Number Presentation_ID The Web of Meaning: The Business Value of the Semantic Web William Ruh.
Review of technologies for developing geospatial applications with a focus on open source (FOSS4G) and their implementation of cloud computing application.
By Vaibhav Nachankar Arvind Dwarakanath.  HBase is an open-source, distributed, column- oriented and sorted-map data storage.  It is a Hadoop Database;
MapReduce and NoSQL CMSC 461 Michael Wilson. Big data  The term big data has become fairly popular as of late  There is a need to store vast quantities.
An Introduction to Predictive Analytics with Big Data and Open Source tools Joe Heary CTO & VP of Technical Operations Zimmerman Associates, Inc. (ZAI)
CPS 216: Advanced Database Systems Shivnath Babu.
NoSQL Systems Motivation. NoSQL: The Name  “SQL” = Traditional relational DBMS  Recognition over past decade or so: Not every data management/analysis.
Grid Technology CERN IT Department CH-1211 Geneva 23 Switzerland t DBCF GT IT Monitoring WG Technology for Storage/Analysis 28 November 2011.
CPS 216: Data-intensive Computing Systems Information about Project 1 Shivnath Babu.
Social Media and Networking: Academic Kristina Lerman USC Information Sciences Institute
Database Processing Chapter "No, Drew, You Don’t Know Anything About Creating Queries.” Copyright © 2015 Pearson Education, Inc. Operational database.
The Wonderful World of Computers Larry Holder The University of Tennessee at Martin.
SCALABILITY AND SECURITY Presentation. 01 Scalability.
An Introduction to Big Data (With a strong focus on Apache) Nick Burch Senior Developer, Alfresco Software VP ConCom, ASF Member.
Just insert..it's NOSQL Assem Ragab. Agenda ● NOSQL in others' sight ● Life evolves! ● New business generation ● RDBMS limitations Vs new Business needs.
Cloud Computing % of us use some form of cloud coumputing.
Raju Subba Open Source Project: Apache Spark. Introduction Big Data Analytics Engine and it is open source Spark provides APIs in Scala, Java, Python.
Big Data, Data Mining, Tools
CS 405G: Introduction to Database Systems
SAS users meeting in Halifax
Computer Science 2 What’s this course all about?
It’s All About the Data Distributed Cloud Computing
Apache hadoop & Mapreduce
CS122B: Projects in Databases and Web Applications Winter 2017
BIG Data 25 Need-to-Know Facts.
Hadoopla: Microsoft and the Hadoop Ecosystem
NOSQL.
Hadoop.
Christian Stark and Odbayar Badamjav
Report from MesosCon North America June 2016, Denver, U.S.
NOSQL databases and Big Data Storage Systems
NoSQL Systems Overview (as of November 2011).
Massively Parallel Cloud Data Storage Systems
The Wonderful World of Computers
NOSQL and CAP Theorem.
It’s Always a Hard Choice
Overview of big data tools
Big Data Young Lee BUS 550.
RealStudio and Cloud Databases
1 مقايسه دانشگاه صنعتی شريف و دانشگاه برکلی در رشته‌های مهندسی و علوم کامپيوتر نيما احمدی پور اناری دانشکده مهندسی کامپيوتر دانشگاه صنعتی شريف جهت ارائه.
All About the Internet.
财务管理案例教学法 研究及示例 ——王遐昌 2006/11/10.
Presentation transcript:

انجمن انفورماتيک ايران نسل جديد مراکز داده سخنران : سيد علی ميرپور پائيز 89

بخش اول : مراکز داده سنتی اهميت مراکز داده حجم اطلاعات تولیدی بشر استاندارد TIA-942 امکانات مراکز داده قدیمی رفتار (نیاز) مشتریان

اهميت مراکز داده اهمیت مراکز داده بر کسی پوشیده نیست مانند سد ، نیروگاه ، سیلو و . . .

حجم اطلاعات توليدی بشر: کاربران Twitter روزی چقدر اطلاعات توليد می کنند ؟ ( کسی تمايل دارد حدس بزند ؟)

حجم اطلاعات توليدی بشر: کاربران Twitter روزی 7 ترابایت اطلاعات تولید می کنند بیش از 2 پتا بایت در سال 000ر10 سی دی در روز 5 میلیون فلاپی دیسک 300 گیگا بایت در مدتی که به صحبت من گوش می کنید

حجم اطلاعات توليدی بشر: 40,000 BCE cave paintings bone tools 3500 writing 0 C.E. O How much information are we talking about? O Last year, EMC asked the University of California at Berkeley to find out . . . And here’s the answer. O From the beginning of history to the end of 1999, mankind created the equivalent of 12 billion gigabytes (12 exabytes) of information. O Thirteen percent of this information was generated in 1999 alone. paper 105 2000 3B 1450 printing 1999 1½B 1870 electricity, telephone transistor 1947 computing 1950 GIGABYTES Late 1960s Internet (DARPA) 1993 The web 1999 Source: UC Berkeley, School of Information Management and Systems.

حجم اطلاعات توليدی بشر: 2003 24B 2002 12B 40,000 BCE cave paintings bone tools GIGABYTES 3500 writing 0 C.E. 2001 6B O But that 12 billion gigabytes is a drop in the ocean compared to what’s coming. O The amount of new information we’re creating is doubling each year. O More than 90 percent of it is “born digital.” O And every bit of it will have to be stored . . . Protected . . . managed . . . And leveraged if it’s to be useful. paper 105 2000 3B 1450 printing 1870 electricity, telephone 93% of new information born digital transistor 1947 GIGABYTES computing 1950 Late 1960s Internet (DARPA) 1993 The web 1999 Source: UC Berkeley, School of Information Management and Systems.

حجم اطلاعات توليدی بشر: Source : IDC.com

استاندارد TIA-942: طراحی الکتریکی ، برق ، ups ، سیم کشی ، باتری ، کف کاذب ، سقف ، لرزش ، آب ، اطفاء حریق ، ورودی فیزیکی ، نور ، در ، تهویه و خنک سازی ، راهرو سرد و گرم ، زون ، رک ، دو گانگی (redundancy) ، مشخصات ساختمان ایمن رویه های کاری ، چارت سازمانی ، حفاظت فیزیکی ، مسائل منطقه ای و بین المللی ، مسائل مخابراتی ، ریسک و . . .

مثال : يو پی اس های روتاری (ديناميک)

امکانات مراکز داده قديمی : امکان ارائه انواع سرور ها با ظرفیت دیسک و پهنای باند های گوناگون امکانات clustering و virtualization برای بالا بردن توان پردازشی امکان نصب انواع نرم افزارهای مورد علاقه شما

رفتار(نياز) مشتريان : نیاز به یک سرور با توان پردازش مشخص یا میزان حافظه مشخص ظرفیت دیسک مشخص پهنای باند مشخص سایر امکانات مثل backup دوره ای یا دیتابیس سرور جداگانه یا firewall و . . .

اشکالات : بلا استفاده ماندن قسمت عمده سرویس خریداری شده (استفاده از 5 الی 10% ظرفیت در مراکز داده خارج از سازمان) (استفاده از 20 الی 40% ظرفیت در مراکز داده داخل سازمان) قابلیت ضعیف در scalable بودن (اندازه پذیری) نیاز به انتقال به سایر سرورها یا مراکز

رفتار(نياز) جديد مشتريان : نیاز به پردازش مشخص بدون توجه به سرور یا میزان حافظه ظرفیت دیسک متغیر پهنای باند متغیر نیاز متفاوت در مقاطع زمانی متفاوت (حتی در یک روز) حجم زیاد بانکهای اطلاعاتی نیاز به دیتای دیگران یا برنامه دیگران

مشکلات مراکز داده قبلی بانکهای اطلاعاتی با افزایش دیتا ، کندتر می شوند سرعت جستجو کاهش می یابد حجم دیتا بسیار زیاد شده نیاز به سرورهای سریعتر و قویتر است . . .

بخش دوم : مراکز داده جديد خواسته مشتری : سرویس به جای سرور (استاندارد TIA-942) خواسته مشتری ، cloud computing ، زمانبندی توانایی مرکزداده دیتابیس sql و حجم دیتا سرورهای قویتر ، مین فریم ، سوپرکامپیوتر پردازش مرکزی یا توزیع شده سرعت گوگل در دیتاهای حجم زیاد

فايل سيستمهای بزرگ Google File System (GFS) Hadoop

چه کسانی از Hadoop استفاده می کنند ؟ Amazon Facebook Google IBM New York Times Yahoo! . . .

ساختار Hadoop

Hadoop و NoSql چگونه کار می کند ؟ جمع آوری دیتا Scribe ذخیره و آنالیز دیتا Hadoop یادگیری سریع از دیتا Pig

ديتابيس های NoSql Google BigTable Dynamo Cassandra MongoDB . . . . (به wikipedia مبحث NoSql مراجعه کنید)

مقايسه سرعت در Query پيچيده

مقايسه سرعت در Query ساده

مقايسه سرعت در اضافه کردن رکورد

بخش سوم : مراکز داده Google Google File System BigTable هر دیتا حداقل در سه نسخه PC های عادی سیستم عامل Linux در کانتینر و نه ساختمانهای ایمن و زیر زمین با سیستمهای خنک کننده ساده یا کم مصرف طراحی و در نقاط مختلف دنیا نصب شده اند.

نمای يک سرور Google

داخل مرکز داده Google

کانتينر های مرکز داده Google

نمای مرکز داده Google از بيرون

خواسته کشورهای صنعتی از کشورهای در حال توسعه سالهای 1960 – توليد مواد اوليه سالهای 1980 – (ساخت قطعات) سالهای 1990 – استفاده از خدمات کارشناسی در توليد تکنولوژی سالهای 1995 – توسعه تکنولوژی ساخت سالهای 2000 - ؟؟؟؟؟

مدل کسب و کار متفاوت است

با تشکر از حوصله شما پاسخ به سوالات با تشکر از حوصله شما پاسخ به سوالات