Детально розглянуто основні принципи роботи зі спільною та розподіленою пам’яттю в технології NVidia CUDA. Описано шаблони взаємодії потоків і проблеми глобальної синхронізації. Проведено порівняльний аналіз основних технологій, що використовуються в підході GPGPU — Nvidia CUDA, OpenCL, Direct Compute.
Проведено порівняльний аналіз новітніх архітектур відеоадаптерів Tesla, Fermi та Kepler і інструментальних засобів створення застосувань NVidia CUDA. Визначено основні методи роботи з глобальною пам’яттю. Розглянуто методи формування потоків для цих програмно-апаратних платформ.