Février 2014 GPU / Xeon Phi Calcul de fonction de corrélation à 2 points sur un grand nombre de galaxies Image : collaboration SDSS Problème : pour effectuer.

Slides:

Advertisements

Similar presentations

Exercice n°1 a) Pour un faisceau de photons mono-énergétiques traversant un écran D’épaisseur « x » on a : N (x) = N 0 e -  x Avec N (x) = nombre de.

Advertisements

Transmis par Plaçons une carte au centre : Clique ici.

En plein désert de Karakoum (Turkménistan ) près de la petite localité de Darvaza, se trouve un cratère d’une cinquantaine de mètres de diamètre et.

1 Le C.C.F. en Baccalauréat Professionnel T.I.S.E.C. T.I.S.E.C. T.M.S.E.C T.M.S.E.C T.F.C.A T.F.C.A.

Perles d’avocats Voici une sélection de questions réellement posées à des témoins par des avocats durant des procès aux Etats-Unis et, dans certains.

Cours 9 Les protocoles de niveau trame. La trame LAP-B Le protocole LAP-B (Link Access Protocol - channel B) est une trame qui a été normalisée pour transporter.

TICE 2 ième Semestre Fonctions « logiques ». Février 2006TICE 2ième Semestre - Les fonctions logiques2 Petits rappels… Une formule est toujours de la.

2 Mesdames, passez votre commande au Père Noël! 1 3 sortie

Clic. Après chaque vol, les pilotes établissent un formulaire dans lequel ils informent les mécaniciens au sol des problèmes qu‘ils ont rencontrés pendant.

Cadre européen commun de référence pour les langues : Apprendre, Enseigner, Évaluer Quels contenus pour quels usages ? LH.

Colloque AQIFGA Hissons les voiles! Mélanie Bergeron, chargée de projets Jean-Simon Labrecque, directeur de production Marcelle Parr, conseillère.

Activités mathématiques autour du jeu de bridge Séance 1 1.

GASNIER Thomas, RICHARD Elliot, MERIGUET Marjorie / première L.

INSTITUT NATIONAL DE LA STATISTIQUE DU CAMEROUN COMMISSION ECONOMIQUES DES NATIONS UNIES POUR L’AFRIQUE Port Louis juillet 2010.

Michel Pellicioli Les métiers d’accompagnement de la recherche Situation de l’IPHC.

Leçon 8: Corps ronds Géométries et communication graphique Edouard Rivière-Lorphèvre 1.

1 Cours UBO 2007 UE – BASES DE DONNEES OCEANOGRAPHIQUES Le portail NAUTILUS accès en ligne aux données et site WEB du SISMER Michèle FICHAUT.

Amin Mesmoudi & Mohand-Saïd Hacid Traitement parallèle et déclaratif de requêtes sur des masses de données issues d'observations astronomiques.

Une journée de réflexion organisée organisée par l’ENS de Lyon, le site Dgesco-Géoconfluences et l’Institut français de l’Education (IFÉ) 18 mai 2011.

ESPACE NUMERIQUE PERSONNEL (ex-coffre fort numérique) 1 PRESENTATION.

MIGRATION VERS ATRIUM Présentation Etapes Attentes / Objectifs.

TEST QUIZ Grammaire Conjugaisons & Les groupes des verbes À quel groupe appartient le verbe: aimer ? Premier groupe Premier groupeaimer Deuxième groupe.

Les nouvelles initiatives en faveur des milieux d’accueil d’enfants Période Par le Fonds social Milieu d’Accueil d’Enfants.

Réunion d’échange CSTL 2014 Soutien psychosocial Southern Sun O.R. Tambo - Johannesburg, Afrique du Sud novembre 2014.

Pour plus de modèles : Modèles Powerpoint PPT gratuitsModèles Powerpoint PPT gratuits Page 1 Définition d’une tâche complexe.

Titre: L’analyse des facteurs influents la production de coton en Afrique de l’Ouest 1. Les contraintes de la filière 2. La Dimension économétrique de.

Réalisé par : Sébastien Lachance MATHS 3 E SECONDAIRE Les figures SEMBLABLES.

Mathématiques CST MODULE 6 L’optimisation de GRAPHES.

26/09/2007 La participation des enfants de 10 à 18 ans 1 Introduction La participation: un des quatre principes fondamentaux de la CIDE Les enfants sont-ils.

Fonctionnement de notre nouvelle Q-PCR

Le lion De Candice 1. L’identité du lion : Le mâle s’appelle le lion, la femelle la lionne et le petit le lionceau. Le lion pèse 150 kg à 220 kg. Il mesure.

Utilisation du spectrophotomètre. Allumer l’appareil Puis allumer l’ordinateur (commun au spectro et à la Q-PCR) Utilisation du spectrophotomètre Ouvrir.

Présente ….. Accédez ici à votre compte une fois inscrit(e) Nouvel utilisateur? Créez votre compte

M ODÉLISATION UML.  Introduction  Modélisation Objet  Types de relation  Héritage  Association  Contenance  Diagrammes UML  Diagramme d’objets.

LA ROUTE DU MEUBLE. Type d’information Informations Type d’activité commerciale Aménagement intérieur et extérieur : meubles, cuisines, salons, cheminées,

1 Administration et paramétrage de K-d’école Module 8 1.Gestion de l’annuaire 2.Autres outils d’administration de l’annuaire 3.Gestion des services internes.

La tuberculose anale: à propos de 4 cas F. Emouhafid, Y. Lbrahmi,M

Début Illustration dans le plan complexe du repliement spectral lors de l’échantillonnage d’un mouvement régulier de rotation dont on modifie la fréquence.

AMPERES Enseigner de façon dynamique le produit scalaire en 1re S ?

1 TRAAM 2011 Domaine d’application Confort et domotique Domaine d’application Confort et domotique Présenté Par Grégory ANGUENOT.

Association canadienne des optométristes Myopie. La myopie est un problème visuel qui fait que l’œil peut voir clairement les objets proches, mais ne.

IFT359 – Programmation fonctionnelle Thème 10 Extension syntaxique II pattern  motif template  gabarit 1.

Réveillez-vous ? Ce n’est pas encore fini !. Sauvez les masses invariantes sur le bureau 1. Sélectionnez File > Export Invariant Masses.

Guide de l'enseignant SolidWorks, leçon 4 Nom de l'établissement Nom de l'enseignant Date.

Développement Durable et Renforcement des Capacités du Gouvernement Prof. Dr. Árpád Kovács Pr é sident du Bureau d’Audit d’Etat de la Hongrie Pr é sident.

Enseignement d’exploration Littérature et société Jeudi 14 octobre 2010 LPO Coeffin Formation académique Académie de la Guadeloupe.

Les Facteurs qui influencent l’accroissement de la population CGC1D ~ Géographie du Canada.

LA SEMAINE DERNIERE Plan du chapitre : Le nouveau christianisme Saint-simoniens et socialisme Saint-Simon et la sociologie 1.

Décembre 2013 PROJET SOCIAL SOLIDAIRE SENEGAL "DIMBALIMA"

TP2: Statistique & Probabilité. avec f i fréquence absolue (cf. WONNACOTT et WONNACOTT, 4e éd., chapitre 2) Une station balnéaire décide de réaliser une.

Changement de sonorité Utilisation de S.A., etc. Edition de multi-pads.

L’intégration de critères ESG dans la Politique d’Investissement 10 JUIN 2016.

Hospitalisations de plus de 24h des patients VIH+ suivis à Cochin de juin 2009 à juin 2010 Pr Dominique SALMON CERON Dr Valérie PERUT Dr Gwenaëlle VIDAL.

La synthèse des protéines

Introduction. Multi-Tâches Création de CPU virtuelles Economique en matériel Nécessite une couche de logicielMulti-Cœur L’UC fait « plusieurs choses.

L’ART DU BONHEUR Il vient du ciel ! Il fait tourner la tête !

Tombe de William Hodgkinson, mitrailleur anglais et de Lynn Campbell, pilote canadien, abattus au-dessus de Préseau, le 09 octobre 1918 par l’aviateur.

Un module éducatif du district de l’est du Canada et des Caraïbes

Tâche 4 Quelques propositions méthodologiques pour suivre le(s) cycle(s) de vie d’une ressource Séminaire ReVEA, juillet 2015, Loriol Catherine Loisy et.

CopiesEnLigne (CEL) TUTORIEL INTERACTIF

Impliquer les communautés et les familles dans la réponse au VIH/sida : stratégie de pérennisation des activités VIH en Côte d’Ivoire Lucile KONAN Chargée.

Qualité des services de santé Ontario Le conseiller provincial en qualité des soins de santé en Ontario Maillons santé : Extraits du rapport.

Nahela Robert & Lisa Goll. Qu'est ce que Twitter ? Twitter est un réseau social, permettant de suivre les actualités d’une personne, d’une association,

L’objectif est de connaitre l’anatomie de l’abdomen et d’en prendre en charge les pathologies. Traumatisme de l’abdomen.Objectifs  Introduction  Rappels.

Mémoire de Projet de Fin d'Études

Reconnaissance du visage dans une base de données

TP ISN Terminale S Instruction if (Programmation Java)

Densité et masse volumique. Imaginons que nous prenions deux cylindres, de même volume, constitués avec des métaux différents. En les pesant, nous trouvons.

Calcul mental. 5ème Questions 1 à 10 : 20 secondes par calcul.

LES TOLERANCES ET AJUSTEMENTS Suite ENPEI. LES TOLERANCES 1- LES AJUSTEMENTS 2- ALESAGE - TOLERANCES FONDAMENTALES 3- ARBRE - TOLERANCES FONDAMENTALES.

Presentation transcript:

Février 2014 GPU / Xeon Phi Calcul de fonction de corrélation à 2 points sur un grand nombre de galaxies Image : collaboration SDSS Problème : pour effectuer cette mesure sur N galaxies, il faut exécuter N(N-1)/2 calculs  devient très vite prohibitif en terme de puissance CPU nécessaire Problème : pour effectuer cette mesure sur N galaxies, il faut exécuter N(N-1)/2 calculs  devient très vite prohibitif en terme de puissance CPU nécessaire Le calcul est simple à programmer et naturellement parallélisable  bon candidat pour se faire la main sur les GPU et autres accélérateurs graphiques (Xeon Phi par exemple) Sur 1 Milliard de galaxies !  ~ calculs !!! Dominique Boutigny 1

Février 2014 GPU Accès aux machines ccgpu01 et ccgpu02 de la plateforme Dell : R720 - cartes Tesla M2090 – 5 GB de mémoire globale. Connexion Infiniband Catalogue de galaxies simulées pour le Blind Cosmology Challenge de la collaboration DES (Dark Energy Survey) (R. Weshler et al.)  204 fichiers contenant chacun ~7 millions de galaxies Algorithme simple : Calculer un angle (fonction trigo non triviale) pour chaque couple de galaxie sans faire de double comptage et sans calculer l'angle de la galaxie avec elle-même !  2 boucles imbriquées avec décalage des indices  Le résultat est une distribution (histogramme) de l'ensemble des valeurs calculées Relativement simple à porter sur GPU :  On copie les coordonnées (RA/DEC) des galaxies dans la mémoire globale du GPU (2x7 millions de valeurs)  La deuxième boucle est exécutée en parallèle sur le GPU (1024 threads en //), chaque thread exécutant un calcul (on associe un thread donné à une position dans le tableau contenant les coordonnées) Dominique Boutigny 2

Février 2014 GPU Afin d'optimiser le calcul, il faut impérativement éviter d'avoir à copier des données entre la mémoire du serveur et la mémoire du GPU  Il faut gérer l'histogramme au niveau du GPU Mais il y a un piège : L'idée de départ est de créer un tableau pour l'histogramme en mémoire globale mais les threads se "marchent sur les pieds" en écrivant dans la mémoire  perte de valeurs  Il faut créer un histogramme par thread et les recombiner à la fin. Sur galaxies:  Sans GPU : 16h 46' 25''  GPU : 387 '' Gain : ×156 Sur 7.1 millions de galaxies:  GPU : ~20h  ~ milliards d'appels à une fonction trigonométrique non triviale ! Dominique Boutigny 3

Février 2014 GPU Prochaines étapes sur la plateforme actuelle :  Gérer la lecture de plusieurs fichiers (204)  Utiliser les 2 GPU disponibles sur une machine  Utiliser 2 GPU sur 2 machines Avec un autre matériel:  Passer à N GPU  Écrire et tester le même algorithme sur des Xeon Phi Prochaines étapes sur la plateforme actuelle :  Gérer la lecture de plusieurs fichiers (204)  Utiliser les 2 GPU disponibles sur une machine  Utiliser 2 GPU sur 2 machines Avec un autre matériel:  Passer à N GPU  Écrire et tester le même algorithme sur des Xeon Phi Les GPU ne sont pas utilisables partout… loin de là ! Le calcul doit s'y prêter. Mais je suis convaincu qu'il y a des tas d'endroits dans le code LSST où c'est applicable : traitement d'images, simulation, … Les GPU ne sont pas utilisables partout… loin de là ! Le calcul doit s'y prêter. Mais je suis convaincu qu'il y a des tas d'endroits dans le code LSST où c'est applicable : traitement d'images, simulation, … Fait ! Et c'est très simple … Il suffit de lancer le "kernel" alternativement sur les 2 GPU. La synchronisation est gérée par le système. Résultat : Galaxies  1 GPU : 404 s  2 GPU : 204 s Il n'y a donc quasiment pas d'overhead Résultat : Galaxies  1 GPU : 404 s  2 GPU : 204 s Il n'y a donc quasiment pas d'overhead  Contribution de Fabio Hernandez pour mener à bien ce projet  Code dispo dans github  Utilisation de Trello comme outil de suivi / gestion de projet Dominique Boutigny 4

Février 2014 Outil de monitoring mis en place par Fabien Wernli Dominique Boutigny 5