•but :
•Montrer les pertes de performances lorsque les
données sont hors des caches
•principe
:
•Calcul d’un produit matrice-matrice
•démarche
:
•1) compilation : -O2;
•2) étude des performances pour n
tel que les 3 tableaux rentrent dans les caches L1, L2 ou la mémoire;
–cache L1 : 32ko,
cache L2 : 1Mo; 4Mo, 8Mo (dépend de l’architecture => hinv)
–3 tableaux en
double précision : 3x8xnxn octets
•3) étude des
performances en modifiants l’ordre des boucles;
•4) compilation : -O3;
•5) refaire les étapes 2)
et 3).