•Procéder par étapes,
•Valider les résultats à chaque étape,
•Étapes :
–-O0 : résultats de
référence,
–-O2 : optimisations
locales/globales fiables,
–-O3 -OPT:IEEE_arithmetic=1:roundoff=0 : optimisations plus
aggressives,
–-O3 -OPT:IEEE_arithmetic=3:roundoff=3 : optimisations très
aggressives.
•Utiliser les outils perfex, speedshop, workshop pour étudier les performances après validation des
résultats.
•Quelques règles :
–respect la norme du langage,
–accès aux données de la même façon qu’elles sont
stockées,
–utilisation de bibliothèques scientifiques
optimisées.