TotalView for HPC

大規模HPCアプリケーションの不具合をすばやく特定し、メモリを最適化し、動的に可視化

TotalViewはマルチコアで動作する大規模HPCアプリケーション内で何が起こっているのか、その理解を妨げる障壁を取り払います。TotalViewはそもそもマルチコアおよび並列コンピューティングのために構築されており、プロセス、スレッド実行に対するこれまでにない制御力と、プログラムの状態に対する可視性を提供します。

多くのプロセスおよびスレッド を単一のウィンドウで同時デバッグできるため、単一のスレッドまたは任意のプロセス/スレッドグループ内の実行、ステップ実行、行ごとの一時停止などのプログラム実行を完全に制御できます。 また、リバースデバッグを使って障害から巻き戻し実行することで、アプリケーションを繰り返し再起動する必要がないため根本原因をより早く特定したり、スレッド、OpenMP、MPI、GPU、コプロセッサを活用する並列プログラムに発生する困難な問題を再現し、トラブルシューティングできます。

実行中のプログラムの状態を様々な形で表示できるため、メモリリーク、デッドロック、競合状態 (レースコンディション) は過去のものとなります。科学技術計算の専門家も、マルチコアや並列アプリケーションの開発問題に慣れていない方も、TotalViewは、エラーをすばやく検出し修正するための見識を提供し、プロトタイプを早期に検証し、計算を正確に確認し、コードを適切にチェックできます。

TotalView は、Linux (Cray や Blue Gene を含む)、UNIX、Mac OS X、 Xeon Phi コプロセッサ の上で走るC、C++ および Fortran アプリケーションに対して動作し、OpenMP、MPI、および OpenACC / CUDAをサポートします。

 
「私たちは、TotalView を使用してすべての並列デバッグ問題を解決しています。スケーラビリティと複数プログラミング言語のサポート、そしてしっかりと作り込まれたデバッガ機能により、TotalViewは、私たちにとって不可欠なツールです。」
David Gunter氏、
ロスアラモス国立研究所
Parallel Tools Team

ローグウェーブが提供する Capability