possible. The current implementation automates profiling,analyses, and การแปล - possible. The current implementation automates profiling,analyses, and แอฟริกา วิธีการพูด

possible. The current implementatio

possible. The current implementation automates profiling,
analyses, and generation of recommendations for optimization
of MPI communication. It also presents the recommendations
to the user in a way that enhances his/her knowledge
of the efficient use of MPI. The tool works with two MPI implementations,
gathers data from both PMPI and MPI_T, and
requires only a single execution of the program to gather the
measurements necessary to generate recommendations. Accordingly,
we restrict this review of related research to those
tools that carry the MPI-performance optimization process
through the analysis phase.
The tool most similar in capabilities to MPI Advisor is
Periscope in conjunction with the Periscope’s MPI Tools Interface
[6]. Using the patches in MPI_T in the MPICH implementation
of MPI, a plugin for Periscope was introduced to
gather information on point-to-point calls and collective operations.
From the data gathered and analyses performed,
the plugin indicates the best eager threshold values for interand
intra-node MPI communication in the given application.
The Periscope Tuning Framework [12] provides guidance on
manually applying optimizations. Its implementation depends
on Periscope tool plugins [13] that recommend a variety
of optimizations such as compiler flags, MPI runtime
environment configuration (buffer sizes, collective protocol,
number of tasks, process affinity, etc.), and application- and
library-specific parameters. In addition, the framework generates
a communication matrix that defines a host file with
a recommended topology for the target system. Unlike MPI
Advisor, Periscope does not provide optimization for collective
algorithms or for tasks-to-cores mapping. More importantly,
unlike MPI Advisor, Periscope requires multiple
executions of an application to collect performance data –
this makes it expensive to apply to production-scale codes.
And, it appears that on most systems, execution of Periscope
requires system-level access privilege.
ATune [15] is an automatic performance-tuning tool that
applies machine-learning techniques to specifically identify
a select number of optimal MPI settings for an application.
ATune was trained on the NAS benchmarks. Like MPI Advisor,
it requires only one run of the target application. From
experimental evaluations using its Open MPI implementation,
ATune’s most significant improvements resulted from
selecting appropriate affinity assignments for MPI tasks with
respect to cores on compute nodes. The breadth of applicability
of training with the NAS benchmarks is an open
question and ATune is restricted to Open MPI. In more recent
work, Pellegrini, et al. [16] apply autotuning to find
runtime parameters suitable for optimizing the performance
of an application. The approach consists of finding parameters
that improve the performance of a set of kernels on the
target cluster. The kernels selected apply methods common
in many HPC applications (e.g., stencil operations, Fourier
transforms, matrix operations, etc.). The kernels are initially
executed with varying runtime parameters on the target
architecture. Then analysis of variance (ANOVA) is used
to determine the set of parameters with the most significant
impact on performance. To ensure that the achieved performance
is close to the maximum that can be obtained with a
subset of the runtime parameters, each of the selected computational
kernels was tested with 1,000 distinct parameter
combinations. Autotuning requires many executions of the
code, which makes its application to production-scale codes
very expensive.
OPTO [2] is an optimization tool that works specifically
with Open MPI to optimize the MPI runtime environment.
It supports optimization of Infiniband parameters among
other Open MPI-specific parameters. OPTO operates by
running benchmarks to characterize the execution environment
and generating a configuration file that should be used
on subsequent executions in the given environment.
Intel provides a performance-tuning utility named VTune
[17], which can be used to optimize the library parameters
of the Intel implementation of MPI either at the cluster or
application level. Cray provides CrayPat, which includes
a comprehensive set of performance reports and automatic
MPI rank order analysis11
There are several tools that provide profiles of MPI communication
operations and present visual displays and data
analyses to the user. These tools are mostly oriented towards
helping users identify hotspots and load imbalance
caused by the use of MPI. Recommendations to alleviate
these hotspots include modification to the application source
code. The most widely used of these tools include Vampir
[14], TAU [19], Open|SpeedShop [18], and Scalasca [5].
Scalasca also has been applied to several MPI performanceoptimization
issues by its developers. The most recent of
these deals with detecting wait states [5]; a complete list is
on the Scalasca website12. Note that, unlike MPI Advisor,
most of
moontlik te maak. Die huidige implementering automatiseert profilering,
ontleed, en Generation van aanbevelings vir die optimalisering
van MPI Kommunikasie. Bied ook die aanbevelings
aan die gebruiker op 'n manier dat sy / haar kennis verhoog
van die doeltreffende gebruik van MPI. Twee Tool werk met die MPI implementering,
versamel data van beide PMPI en MPI_T, en
vereis slegs 'n enkele uitvoering van die program om die versamel
nodige afmetings aan Aanbevelings op te wek. Gevolglik
het ons beperk Dié resensie is aan dié van verwante navorsing
verbetering van die prestasie gereedskap wat die MPI-proses Dra
Deur die analise fase.
Die adviseur Tool Die meeste MPI is soortgelyk in vermoëns om
die Periscope Periscope in samewerking met MPI se gereedskap Interface
[6]. Die gebruik van die kolle in MPI_T in die MPICH implementering
van MPI, 'n prop vir Periscope is ingestel om
inligting oor Punt-tot-punt oproepe en Collective Bedryf samel.
Van die data versamel en ontleed uitgevoer,
die prop dui die beste Gretig drempelwaardes vir Interand.
intra-node MPI Kommunikasie in die aansoek wat.
die Periscope Tuning raamwerk [12] gee leiding oor
hand toe te pas optimalisaties. Die implementering daarvan hang
op Periscope Tool plugins [13] beveel aan dat 'n verskeidenheid
van samesteller optimalisaties soos vlae, MPI Runtime
Environment Konfigurasie (buffer groottes, Collective protokol,
aantal take, Proses affiniteit, ens), en aansoek- en
Biblioteek-spesifiek. parameters. Daarbenewens het die raamwerk genereer
'n gasheer Kommunikasie Matrix dat 'n lêer definieer met
'n aanbevole topologie vir die teikenstelsel. In teenstelling met MPI
adviseur, het Periscope nie voorsiening vir kollektiewe Optimization
algoritmes of vir Take-tot-kerne kartering. Nog belangriker,
in teenstelling met MPI adviseur, Periscope vereis verskeie
teregstellings van 'n aansoek om te versamel -
Maak dit duur is om dit toe te pas om Produksie-skaal kodes.
En, blyk dit dat op die meeste stelsels, uitvoering van Periscope
vereis System-vlak Toegang voorreg.
ATune [15] is 'n outomatiese Performance-Tuning hulpmiddel wat
spesifiek van toepassing is masjien-leertegnieke te identifiseer
'n uitgesoekte optimale aantal MPI instellings vir 'n aansoek.
ATune is opgelei in die NAS maatstawwe. Soos MPI adviseur,
dit verg net een lopie van die teiken Aansoek. Van
eksperimentele evaluering met behulp van sy oop MPI implementering,
ATune se meeste beduidende verbeterings gevolg van
die keuse van geskikte affiniteit vir MPI Take opdragte met
betrekking tot kern op Reken knope. Die breedte van toepaslikheid
van opleiding met die NAS maatstawwe is 'n oop
vraag en ATune is beperk tot Open MPI. In meer onlangse
werk, Pellegrini, et al. [16] Autotuning van toepassing op soek
Geskik Runtime Parameters vir die optimalisering van die prestasie
van 'n aansoek. Dit vind van die benadering bestaan ​​uit Parameters
wat die prestasie van 'n stel van pitte op die verbetering van
Target cluster. Die pitte selekteerde metodes algemeen
in baie HPC Aansoeke (bv Bedryf stensil, Fourier
transforms, matriksbewerkings, ens). Die pitte word aanvanklik
uitgevoer met wisselende Runtime Parameters op die teiken
argitektuur. Variansieanalise dan (ANOVA) gebruik word
om die parameters van SET beduidende met die meeste Bepaal
Impak op Performance. Om te verseker dat die bereik Performance
is baie naby aan die maksimum wat verkry kan word met 'n
subset van die Runtime Parameters, elk van die geselekteerde Computational
pitte is getoets met 1000 Duidelike parameter
kombinasies. Autotuning verg baie teregstellings van die
kode, wat die toepassing daarvan op produksie skaal kodes Maak
baie duur.
OPTO [2] is 'n optimalisering hulpmiddel wat spesifiek werk
met Open MPI om die MPI Runtime Environment optimaliseer.
Dit word ondersteun deur Optimalisering van Infiniband Parameters onder
Oop. MPI-spesifieke parameters. OPTO bedryf deur
loop maatstawwe om die uitvoering Omgewing kenmerk
en die skep van 'n konfigurasielêer wat gebruik moet word
op die volgende teregstellings in die bepaalde omgewing.
Intel bied 'n Prestasie-Tuning Nut Vernoem VTune
[17], wat gebruik kan word om te optimaliseer die Biblioteek Parameters
van. implementering van die Intel MPI Cluster of óf by die
Aansoek vlak. Cray bied CrayPat, wat insluit
'n stel omvattende prestasie verslae en outomatiese
Bestel Analysis11 MPI rang
Daar is verskeie profiele van MPI Kommunikasie Tools wat verskaf
Bedryf en huidige uitstallings visuele data en
ontleding van die gebruiker. Dit is meestal gerig op Tools
Helpende gebruikers te identifiseer brandpunte en load wanbalans
wat veroorsaak word deur die gebruik van MPI. Aanbevelings te verlig
hierdie brandpunte sluit Aansoek verandering aan die bron
-kode. Die meeste van die algemeen gebruik hierdie gereedskap sluit vampir
[14], TLU [19], Open |. Speedshop [18], en Scalasca [5]
Scalasca het ook 'n paar MPI Toegepaste Performanceoptimization is
kwessies deur die ontwikkelaars. Die meeste van die onlangse
handel oor die opsporing van wag hierdie state [5]; 'n Volledige lys is
op die Scalasca Website12. Let daarop dat, in teenstelling met MPI adviseur,
Die meeste van.
