Шокирующие характеристики NVIDIA GT300 (Fermi)
Были раскрыты потрясающие подробности о структуре и возможностях нового ядра.
Согласно Brightsideofnews, GT300 будет жестоким вычислительным монстром, которого мы никогда раньше не видели. Архитектура получила кодовое имя Ферми не случайно: Энрико Ферми был итальянским физиком, который имел неоспоримые заслуги в изобретении ядерного реактора. Хотя GT300, к счастью, не будет ядерным, он может поместиться в реактор.
Технические характеристики графического процессора:
- 3,0 миллиарда транзисторов
- Производство 40 нм TSMC
- 384-битный интерфейс памяти
- 512 шейдерных ядер [переименовано в ядра CUDA]
- 32 основных шейдера CUDA на блок
- Кэш L1 1 МБ [общий кеш 16 КБ]
- 768 КБ унифицированного кэша второго уровня
- До 6 ГБ памяти GDDR5
- IEEE 754 с половинной скоростью и двойной точностью
Как видите, если приведенная выше информация верна, GT300 будет содержать 3 миллиарда транзисторов, что более чем вдвое превышает 200 миллиарда в GT1,4. Это, конечно, приведет к огромному размеру ядра, в котором будут размещены 16 потоковых мультипроцессоров (это новое имя для блоков оттенков), и эти блоки будут содержать 32 ядра CUDA на кусок, в общей сложности 512 ядер CUDA, или классический называется потоковым процессором. Новая архитектура, как и последний новаторский G80, будет иметь 6 64-битных шин памяти, поэтому ее шина памяти будет иметь ширину 384 бита. Этот интерфейс работает в паре с памятью GDDR5 на 1,5, 3 или даже 6 ГБ. Даже эти цифры привлекают внимание, но если мы представим на мгновение тактовую частоту GDDR5 4 ГГц или выше в сочетании с 384-битным интерфейсом, мы увидим довольно грубую полосу пропускания.
GPGPU мертв, cGPU жив!
В свете вышесказанного, GT300 идет по новому пути, пути, по которому GPU еще не пошли, нацеливаясь на другое направление функциональности. Архитектура Fermi выполняет 512 операций Fused Multiply-Add-Add [FMA] за такт в режиме простой точности, ровно половину от этого значения в режиме двойной точности, или 256. Еще одно любопытство - знание стандартов IEEE. Раньше NVIDIA поддерживала только арифметику с плавающей запятой IEEE 754-1985, но GT300 уже знаком с последней версией стандарта IEEE 754-2008, поэтому он поддерживает все важные отраслевые стандарты, предположительно без каких-либо уловок.
Обеспечивает ли графический процессор встроенную поддержку C ++?
Архитектура Fermi обеспечивает встроенную поддержку C [CUDA], C ++, DirectCompute, DirectX 11, Fortran, OpenCL, OpenGL 3.1 и OpenGL 3.2. Впервые в истории графический процессор способен выполнять код C ++ без серьезных ошибок и снижения производительности, плюс, если мы добавим Fortrant или C, станет ясно, что NVIDIA проделала хорошую работу.
Это все, что можно сказать вкратце, мы надеемся, что NVIDIA представит свои последние работы в ближайшие несколько недель. Нет сомнений в том, что архитектура GT300 и Fermi - это не только новая видеокарта GeForce, но и ответ на Intel Larrabee, решение, которое, как ожидается, будет чрезвычайно эффективным, а также обеспечит полную поддержку ключевых отраслевых стандартов и, что наиболее важно, это также будет доступный и доступный продукт для среднего домашнего пользователя.
Что касается возможных вариантов: для пользователей с высоким спросом GT300, конечно же, будет доступен на GeForces, а для профессиональных и промышленных компаний будут присутствовать модели Quado и Tesla, которые будут расти с мощностью.
Объем памяти на картах будет варьироваться в зависимости от целевой аудитории, серия GeForce 380 может включать 1,5 ГБ, модели Quadro и Tesla могут включать 3 или даже 6 ГБ GDDR5.
Новости обрабатывают неофициальную информацию, поэтому относиться к ней как к факту не стоит. В любом случае Ферми вписывается в текущую философию NVIDIA, поэтому приведенные выше данные и описания могут даже быть правдой.