Accélération de l’exécution du code : l’optimisation complète d’une antenne peut prendre plusieurs semaines.
Identifier les boucles les plus chronophages.
Répartition des calculs d’une boucle sur plusieurs cœurs de l’ordinateur : réduction de 50 % du temps à chaque cœur ajouté
Recherche sur la faisabilité d’une parallélisation globale en MPI : trop de temps de refactoring
Identification des boucles du code les plus chronophages avec l’outil MAQAO
Parallélisation partielle des boucles les plus chronophages avec de l’OpenMP
Vectorisation de certains calculs : remplacement des appels AVX en FMA
Tentative de parallélisation et vectorisation de l’algorithme de Clenshaw
Identification de la mémoire vive comme ressource limitante pour l’accélération de l’exécution du code : conseils pour l’achat d’une configuration technique plus adaptée