WikiDer > AMD FireStream

AMD FireStream

AMD FireStream был AMD торговая марка для их Radeonтаргетинг на линейку продуктов потоковая обработка и / или ГПГПУ в суперкомпьютеры. Первоначально разработан ATI Technologies вокруг Radeon X1900 XTX в 2006 году линейка продуктов ранее называлась как ATI FireSTREAM и Процессор AMD Stream.^[1] AMD FireStream также можно использовать как плавающая точка сопроцессор для разгрузки вычислений ЦП, что является частью Торренца инициатива. Линия FireStream была прекращена с 2012 года, когда рабочие нагрузки GPGPU были полностью объединены в AMD FirePro линия.

Обзор

Линия FireStream - это серия дополнений карты расширения выпускался с 2006 по 2010 год, основан на стандартных графических процессорах Radeon, но предназначен для использования в качестве универсального сопроцессор, а не рендеринг и вывод 3D-графики. Словно FireGL / FirePro линии, им было предоставлено больше памяти и пропускной способности памяти, но карты FireStream не обязательно имеют порты вывода видео. Все поддерживают 32-битные одинарная точность плавающая точка, и все, кроме первого выпуска, поддерживают 64-разрядную двойная точность. Линия была объединена с новыми API, чтобы обеспечить более высокую производительность, чем существующие. OpenGL и Direct3D API шейдеров могут предоставить, начиная с Близко к металлу, с последующим OpenCL и SDK для потоковых вычислений и в конечном итоге интегрирован в SDK приложения.

Для высокопараллельных математических задач с плавающей запятой карты могут ускорить большие вычисления более чем в 10 раз; Folding @ Home, один из первых и наиболее заметных пользователей GPGPU, получил производительность процессора в 20-40 раз выше.^[2] Каждый пиксельный и вершинный шейдер или унифицированный шейдер в более поздних моделях может выполнять произвольные вычисления с плавающей запятой.

История

После выпуска Radeon R520 и GeForce G70 Ядра графического процессора с программируемые шейдеры, большая пропускная способность с плавающей запятой привлекла внимание академических и коммерческих групп, экспериментирующих с ее использованием для неграфической работы. Интерес привела ATI (и Nvidia) для создания продуктов GPGPU - способных вычислять математические формулы общего назначения массово параллельным способом - для обработки тяжелых вычислений, традиционно выполняемых на Процессоры и специализированная математика с плавающей запятой сопроцессоры. Предполагалось, что блоки GPGPU будут иметь немедленный прирост производительности в 10 или более раз по сравнению с современными расчетами, рассчитанными только на несколько сокетов.

Когда разработка высокопроизводительного X1900 XFX почти закончилась, ATI основала на нем свой первый потоковый процессор, объявив его будущим ATI FireSTREAM вместе с новым Близко к металлу API на выставке SIGGRAPH 2006.^[3] Само ядро практически не изменилось, за исключением удвоения встроенной памяти и пропускной способности, как у FireGL V7350; поддержка новых драйверов и программного обеспечения составила основную разницу. Складной @ дома начал использовать X1900 для общих вычислений, используя предварительный выпуск версии 6.5 драйвера ATI Catalyst, и сообщил о 20-40-кратном улучшении графического процессора по сравнению с процессором.^[2] Первый продукт был выпущен в конце 2006 г. и получил название Процессор AMD Stream после слияния с AMD.^[4]

Бренд стал AMD FireStream со вторым поколением потоковых процессоров в 2007 году на базе чипа RV650 с новыми унифицированными шейдерами и поддержкой двойной точности.^[5] Асинхронный DMA также улучшена производительность за счет увеличения пула памяти без помощи ЦП. Была выпущена одна модель, 9170, по начальной цене 1999 долларов. В планы входила разработка потокового процессора на Модуль MXM к 2008 году для портативных компьютеров,^[6] но так и не был выпущен.

Третье поколение быстро последовало в 2008 году с резким улучшением производительности ядра RV770; 9250 имел почти вдвое большую производительность, чем 9170, и стал первым одночиповым терафлоп процессор, несмотря на то, что цена упала до $ 1000.^[7] Вскоре после этого был выпущен более быстрый собрат, 9270, за 1999 долларов.

В 2010 году вышло последнее поколение FireStreams - карты 9350 и 9370, основанные на чипе Cypress, представленном в HD 5800. Это поколение снова удвоило производительность по сравнению с предыдущим: до 2 терафлопс у 9350 и 2,6 терафлопс у 9370. ,^[8] и был первым построен с нуля для OpenCL. Это поколение также было единственным с полностью пассивным охлаждением, а активное охлаждение было недоступно.

Поколения Северных и Южных островов были пропущены, и в 2012 году AMD объявила, что новые серии FirePro W (рабочая станция) и S (сервер) на основе новых Графическое ядро Next Архитектура займет место карт FireStream.^[9]

Модели

FireStream 9170 включает Direct3D 10.1, OpenGL 3.3 и APP Stream
FireStream 92x0 включает Direct3D 10.1, OpenGL 3.3 и OpenCL 1.0
FireStream 93x0 включает Direct3D 11, OpenGL 4.3 и OpenCL 1.2 с последними обновлениями драйверов

Модель (Кодовое название)	Запуск	Архитектура (Fab)	Автобус интерфейс	Потоковые процессоры	Тактовая частота		объем памяти				Вычислительная мощность^[а] (GFLOPS)		TDP (Вт)
Модель (Кодовое название)	Запуск	Архитектура (Fab)	Автобус интерфейс	Потоковые процессоры	Ядро (МГц)	Память (МГц)	Размер (МБ)	Тип	Ширина автобуса (кусочек)	Пропускная способность (ГБ/ с)	Одинокий	Двойной	TDP (Вт)
Потоковый процессор (R580)	2006	R500 80 нм		240	600		1024	GDDR3	256	83.2	375^[10]	Нет данных	165
FireStream 9170 (RV670)^[11]^[12]	8 ноября 2007 г.	TeraScale 1 55 нм	PCIe 2.0 x16	320	800	800	2048	GDDR3	256	51.2	512	102.4	105
FireStream 9250 (RV770)^[13]^[14]	16 июня 2008 г.	TeraScale 1 55 нм	PCIe 2.0 x16	800	625	993	1024	GDDR3	256	63.6	1000	200	150
FireStream 9270 (RV770)^[15]^[16]	13 ноября 2008 г.	TeraScale 1 55 нм	PCIe 2.0 x16	800	750	850	2048	GDDR5	256	108.8	1200	240	160
FireStream 9350 (Cypress XT)^[17]	23 июня 2010 г.	TeraScale 2 40 нм	PCIe 2.1 x16	1440	700	1000	2048	GDDR5	256	128	2016	403.2	150
FireStream 9370 (Cypress XT)^[18]	23 июня 2010 г.	TeraScale 2 40 нм	PCIe 2.1 x16	1600	825	1150	4096	GDDR5	256	147.2	2640	528	225

^ Точность вычисляется исходя из базовой (или ускоренной) тактовой частоты ядра на основе FMA операция.

Программного обеспечения

AMD FireStream был запущен с поддержкой широкого спектра программных платформ. Одна из поддерживающих фирм была PeakStream (приобретено Google в июне 2007 г.), который первым представил открытый бета версия программного обеспечения для поддержки CTM и AMD FireStream, а также x86 и Клетка (Cell Broadband Engine) процессоры. После запуска программного обеспечения PeakStream было заявлено, что FireStream в типичных приложениях в 20 раз быстрее, чем обычные процессоры.^{[нужна цитата]}. RapidMind также предоставила программное обеспечение для обработки потокового видео, которое работает с ATI и NVIDIA, а также с процессорами Cell.^[19]

Комплект для разработки программного обеспечения

После отказа от своих недолговечных Близко к металлу API, AMD сосредоточила внимание на OpenCL. AMD впервые выпустила свои Stream Computing SDK (v1.0), в декабре 2007 г. под AMD EULA, чтобы работать на Windows XP.^[19] SDK включает "Brook +", оптимизированную для оборудования AMD версию Ручей язык, разработанный Стэнфордским университетом, который сам является вариантом ANSI C (Язык C), с открытым исходным кодом и оптимизирован для потоковых вычислений. В Математическая библиотека AMD Core (ACML) и Библиотека производительности AMD (APL) с оптимизацией для AMD FireStream и видеотеки COBRA (далее переименованной в «Accelerated Video Transcoding» или AVT) для перекодирование видео ускорение также будет включено. Другая важная часть SDK, Compute Abstraction Layer (CAL), представляет собой уровень разработки программного обеспечения, предназначенный для низкоуровневого доступа через аппаратный интерфейс CTM к архитектуре графического процессора для программного обеспечения настройки производительности, написанного на различных высокоуровневых языках. языки программирования.

В августе 2011 года AMD выпустила версию 2.5 пакета разработки программного обеспечения ATI APP,^[19] который включает поддержку OpenCL 1.1, а параллельные вычисления язык, разработанный Хронос Групп. Концепция чего-либо вычислить шейдерыофициально называется DirectCompute, в MicrosoftAPI следующего поколения называется DirectX 11 уже включен в графические драйверы с поддержкой DirectX 11.

AMD APP SDK

Контрольные точки

Согласно продемонстрированной AMD системе^[20] с двумя двухъядерными AMD Opteron процессоров и двух ядер графического процессора Radeon R600, работающих на Microsoft Windows XP Professional, 1 терафлоп (TFLOP) может быть достигнуто с помощью универсального вычисления умножения-сложения (MADD). Для сравнения, процессор Intel Core 2 Quad Q9650 с тактовой частотой 3,0 ГГц в то время мог достигать 48 GFLOPS.^[21]

В ходе демонстрации антивирусного сканирования Kaspersky SafeStream, оптимизированного для потоковых процессоров AMD, в 2007 году он смог сканировать в 21 раз быстрее с ускорением на основе R670, чем с поиском, работающим полностью на Opteron.^[22]

Ограничения

Рекурсивные функции не поддерживаются в Brook +, потому что все вызовы функций встроенный во время компиляции. Используя CAL, функции (рекурсивные или иные) поддерживаются до 32 уровней.^[23]
Поддерживается только билинейная фильтрация текстур; mipmapped текстуры и Анизотропная фильтрация не поддерживаются.
Функции не могут иметь переменное количество аргументов. Та же проблема возникает для рекурсивных функций.
Преобразование чисел с плавающей запятой в целые на графических процессорах выполняется иначе, чем на процессорах x86; это не полностью IEEE-754 совместимый.
Выполнение «глобальной синхронизации» на GPU не очень эффективно, что вынуждает GPU разделять ядро и делаем синхронизацию на CPU. Учитывая переменное количество мультипроцессоров и другие факторы, возможно, не существует идеального решения этой проблемы.
Пропускная способность шины и задержка между процессором и графическим процессором могут стать горлышко бутылки.

Смотрите также

Обработка потока
Гетерогенная системная архитектура
NVIDIA Tesla аналогичное решение от Nvidia
Intel Xeon Phi аналогичное решение от Intel
Открытый язык вычислений (OpenCL) - отраслевой стандарт
Унифицированная архитектура вычислительных устройств (CUDA) - проприетарное решение только для Nvidia
Список графических процессоров AMD

внешняя ссылка

[FLOPS-10] Точность вычисляется исходя из базовой (или ускоренной) тактовой частоты ядра на основе FMA операция.

[1] Пресс-релиз AMD

[fath-2] а ^б Гасиор, Джефф (16 октября 2006 г.). «Более пристальный взгляд на Folding @ home на GPU». Технический отчет. Получено 2016-05-26.

[3] Презентация ATI SIGGRAPH 2006 (PDF) (Отчет). ATI Technologies.

[4] Валич, Тео (16 ноября 2006 г.). «Представлена плата ATI FireSTREAM AMD Stream». Спрашивающий. Получено 2016-05-26.

[amd9170-5] «AMD представляет процессор первого потока с технологией двойной точности с плавающей запятой». AMD. 8 ноября 2007 г. Архивировано с оригинал на 2017-06-19. Получено 2016-05-26.

[AMD_WWHPC_07-6] Презентация AMD WW HPC 2007 (PDF) (Отчет). п. 37.

[amd9250-7] «Процессор AMD Stream первым преодолеет барьер в 1 терафлоп». AMD. 16 июня 2008 г. Архивировано с оригинал на 2017-06-19. Получено 2016-05-26.

[amd9350-8] «Новейшие графические ускорители AMD FireStream ™ обеспечивают почти двукратную максимальную производительность с одинарной и двойной точностью и производительность на ватт по сравнению с последним поколением». AMD. 23 июня 2010 г. Архивировано с оригинал на 2017-06-19. Получено 2016-05-26.

[9] Смит, Райан (14 августа 2012 г.). «Обзор AMD Firepro W9000 W8000, часть 1». Anandtech.com. Получено 28 июн 2016.

[11] «Beyond3D - ATI R580: Radeon X1900 XTX и Crossfire». www.beyond3d.com.

[12] «AMD представляет процессор первого потока с технологией с плавающей запятой двойной точности». AMD. 8 ноября 2007 г.. Получено 2016-05-26.

[13] «Характеристики AMD FireStream 9170». TechPowerUp.

[FireStream_9250-14] AMD FireStream 9250 - Страница продукта В архиве 13 мая 2010 г. Wayback Machine

[15] «Характеристики AMD FireStream 9250». TechPowerUp.

[FireStream_9270-16] AMD FireStream 9270 - Страница продукта В архиве 16 февраля 2010 г. Wayback Machine

[17] «Характеристики AMD FireStream 9270». TechPowerUp.

[18] «Характеристики AMD FireStream 9350». TechPowerUp.

[19] «Характеристики AMD FireStream 9370». TechPowerUp.

[ATIStreamSDK-20] а ^б ^c Страница загрузки AMD APP SDK В архиве 2012-09-03 в Wayback Machine и Лицензионное соглашение SDK для потоковых вычислений В архиве 6 марта 2009 г. Wayback Machine, получено 29 декабря 2007 г.

[21] Отчет HardOCP В архиве 2016-03-04 в Wayback Machine, получено 17 июля 2007 г.

[22] Метрики соответствия экспорта микропроцессоров Intel

[23] Валич, Тео (12 сентября 2007 г.). «GPGPU резко ускоряет работу антивирусного ПО». Спрашивающий. Получено 2016-05-26.

[24] Справочное руководство AMD по промежуточному языку, август 2008 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[а]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

Navigation