WorldCat Identities

Parello, David (1976-....).

Overview
Works: 4 works in 6 publications in 2 languages and 6 library holdings
Roles: Thesis advisor, Author, Other
Publication Timeline
.
Most widely held works by David Parello
Méthodologie d'optimisation de programmes pour architectures complexes de processeurs by David Parello( Book )

2 editions published in 2004 in French and held by 2 WorldCat member libraries worldwide

L'augmentation de la complexité des processeurs rend de plus en plus difficile l'intégration de modèles précis d'architectures dans les compilateurs. En conséquence, l'efficacité des compilateurs statiques décroît. Actuellement, les compilateurs statiques sont enrichis d'informations dynamiques sur le comportement de l'architecture à la manière des techniques d'optimisation basées sur les profiles d'exécutions ou des techniques de re-compilation dynamique. Malheureusement, seules quelques informations élémentaires sur le comportement de l'architecture sont utilisées. Dans cette thèse, nous montrons de quelle manière les interactions entre les différents composants d'une architecture rendent complexe le comportement des programmes et nous montrons qu'il est possible de capturer cette complexité pour en déduire les transformations à apporter aux programmes. Nous avons étudié une méthode plus systématique pour adresser le problème de la complexité. Nous proposons un processus itératif d'optimisation manuelle basé sur une analyse dynamique détaillée. Nous montrons expérimentalement l'efficacité de ce processus. Cette approche présente potentiellement une stratégie pour guider de futurs environnements d'optimisation itératifs et propose, dans l'immédiat, un processus d'optimisation manuelle systématique pouvant être utilisé par des ingénieurs ou des chercheurs
Améliorer la performance des processeurs par l'extration dynamique du parallélisme d'instructions by Ke Chen( Book )

2 editions published in 2012 in French and held by 2 WorldCat member libraries worldwide

This thesis studies instruction level parallelism found in applications and how to exploit it on an adapted processor. The experiences we have driven with our laboratory made measuring software PerPI, from which results are reported in this text, show that instruction parallelism is high and uniformly distributed along the execution only when usual renaming is extended. Registers and memory should be renamed among a unique name space and constants should be propagated along recurrences. This is the price to pay to parallelise loops and to remove delays introduced by transfer instructions due to the register architectural model. We also suggest that multiple cores in today processors could be devoted to a parallel execution of many partially independent parts of a single application rather than the execution of many totally independent applications, which could be more efficiently run on a set of many totally independent processors
A step toward an ILP processor by Ali El Moussaoui( Book )

1 edition published in 2011 in English and held by 1 WorldCat member library worldwide

Towards reproducible, accurately rounded and efficient BLAS by Chemseddine Chohra( )

1 edition published in 2017 in English and held by 1 WorldCat member library worldwide

Le problème de non-reproductibilté numérique surgit dans les calculs parallèles principalement à cause de la non-associativité de l'addition flottante. Les environnements parallèles changent dynamiquement l'ordre des opérations. Par conséquent, les résultats numériques peuvent changer d'une exécution à une autre. Nous garantissons la reproductibilité en étendant autantque possible l'arrondi correct à des séquences de calculs plus importantes que les opérations arithmétique exigées par le standard IEEE-754. Nous introduisons RARE-BLAS une implémentation des BLAS qui est reproductible et précise en utilisant les transformations sans erreur et les algorithmes de sommation appropriés. Nous présentons dans cette thèsedes solutions pour le premier (asum, dot and nrm2) et le deuxième (gemv and trsv) niveaux des BLAS. Nous développons une implémentation de ces solutions qui utilise les interfaces de programmation parallèles (OpenMP et MPI) et les jeu d'instructions vectorielles. Nous comparons l'efficacité de RARE-BLAS à une bibliothèque optimisé (Intel MKL) et à des solutionsreproductibles existantes
 
Audience Level
0
Audience Level
1
  General Special  
Audience level: 0.90 (from 0.87 for A step tow ... to 0.92 for Méthodolo ...)

Languages