Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Сбор компьютера своими руками для начинающих.


Информационный Канал Subscribe.Ru


Сбор компьютера своими руками.

Часть 9.

(Выбор видеокарты.)

(Статья №2.)


Содержание.


Введение.
Для начала рассмотрим работу AGP порта( это предворяя многочисленные вопросы по этой теме).Стандарт на AGP был разработан фирмой Intel с для того, чтобы не меняя сложившийся стандарт на шину PCI, ускорить ввод/вывод данных в видеокарту и, кроме этого, увеличить производительность компьютера при обработке трехмерных изображений без установки дорогостоящих двухпроцессорных видеокарт с большими объемами как видеопамяти, так и памяти под текстуры, z-буфер и т.п.. Этот стандарт был поддержан большим количеством фирм, входящих в AGP Implementors Forum, организацию, созданную на добровольной основе для внедрения этого стандарта. Стартовая версия стандарта - AGP 1.0.
Принципы работы AGP.
Существуют несколько модификаций шины AGP - AGPx2, AGPx4 и AGPx8. Отличаются они пропускной способностью (266 Мб/с для AGPх1, 533 Мб/с для AGPx2 и так далее), а также требованиями к изготовлению видеокарт. Материнские платы могут поддерживать один или несколько режимов работы видеокарты, соответственно, при покупке акселератора необходимо обратит внимание на совместимость режимов. SBA (Side-Band Addressing) - адресация по побочной шине. Тут ситуация следующая: для того чтобы работать с данными, любому устройству (будь то PCI- или AGP-девайс) приходится передавать адреса памяти, с которыми, собственно, идет работа. Так, для PCI максимальная скорость передачи данных достигается при передаче 4 пакетов данных и одного пакета адресов. При разработке шины AGP этот недостаток был учтен и были разработаны дополнительные, "побочные", линии, позволяющие передавать адреса параллельно с данными. Шина SBA - 8-ми разрядная, соответственно как раз за 4 пакета данных (и, соответственно, 4 цикла), по побочной шине полностью передается 32-разрядный адрес. Получается что за те 5 тактов, за которые шина PCI может передать 4 пакета данных, шина AGP способна передать все 5 пакетов. Но не все производители видеокарт используют режим SBA, используя тот факт, что шина AGP позволяет работать и в "старом" PCI-режиме, когда побочные линии не задействуются. Практически, использование этого режима не всегда дает ощутимый прирост производительности. В зависимости от реализации этой функции в чипсете видеокарты, а также в чипсете материнской платы, прирост скорости может варьироваться от 1 до 10, а иногда и 15%. Также следует знать, что для увеличения стабильности системы при разгоне (особенно если разгон идет по шине), лучше отключать этот режим. Включить его довольно. Включается SBA либо очень просто (по умолчанию включен), или очень сложно (нужно достать BIOS видеокарты с поддержкой SBA, а потом ковыряться в реестре). DiME (Direct in Memory Execution) - прямое выполнение в памяти. Оно же - AGP-текстурирование, оно же - размещение текстур в оперативной памяти компьютера. В некоторых условиях при нехватке локальной видеопамяти видеокарта может работать с текстурами, расположенными в оперативной памяти. Но какие бы преимущества не давала шина AGP (а ресь идет о скорости передачи данных и о "прямой" работе с памятью без участия центрального процессор), ОЗУ скорее всего никогда не станет также быстра, как и оперативка видеокарт. Посему толку от использования DiME, честно говоря, очень мало. VGart - драйвер шины AGP для чипсета материнской платы. Наборы логики от Intel, Ali, SIS, VIA имеют свои собственные методы реализации таких функций, как, например, SBA или DiME. Соответственно для их поддержки, да и просто для корректной работы шины AGP необходим соответствующий драйвер. Обычно драйвера видеокарт содержат VGart для некоторых чипсетов, но более стабильная работа все равно достигается при использовании драйвера от производителя чипсета материнской платы. FastWrites - быстрые записи. Ну очень быстрые! Как вы помните, видеокарта, функционирующая в режиме AGPx2 или AGPx4, способна работать с системной памятью на очень большой скорости. Фактически, скорость AGPx4 (1.06 Гб/с) - это предел возможностей памяти стандарта PC133. Но тут есть одно "но". Процессору-то все это дело нужно сначала записать в память. И только после этого ускоритель может с этими данными работать. Криво как-то, согласны? И фиг бы с ними - с текстурами - современные ускорители оборудованы таким количеством памяти, что хватит за глаза почти любой игре. Главное здесь - геометрические данные. Например, GeForce4 способен так быстро обрабатывать геометрию, что процессоры не успевают ее подавать. Что же делать? А вот что - исключить слабое звено, то есть системную память, которая мало того что нагружена всякими программами, так еще и тормоз жуткий. В общем, FastWrites - это режим работы видеокарты и чипсета материнской платы, когда данные от процессора идут не в оперативную память, а потом в ускоритель, а напрямую - от процессора в видеокарту. Получается, что видеокарта получает данные на полной скорости, будь то AGPx2 или AGPx4.
AGPx8
В ноябре 2000 года Intel выпустила предварительную версию (draft) следующего варианта AGP шины - 8X. Основная идея - увеличение полосы пропускания до 8х4=32 байт за один такт системной шины. Это означает, что скорость передачи данных на шине возрастет до 2-х Гигабайт в секунду. Кроме этого, в проект нового варианта шины заложены несколько принципиальных изменений, расширяющих возможности интерфейса AGP. Можно перечислить некоторые из них:
  • Понижение уровня напряжений сигналов на шине
  • Циклы калибровки
  • Динамическая инверсия шины
  • Поддержка изохронного режима передачи данных
  • Поддержка нескольких AGP 8X портов (ранее был возможен только один порт)
  • Новые регистры конфигурации для 8Х шины
Что дальше?
На самом деле с уменьшением стоимости синхронной памяти SDRAM (и ее разновидности - синхронной графической памяти SGRAM), а также еще более быстрой DDR DRAM перспективы AGP не так радужны, как в свое время казалось. Основная цель, которую преследовала Intel - создание дешевого эквивалента профессиональным видеокартам с большими объемами локальной памяти теряет смысл при низкой стоимости памяти. Значение полосы пропускания в платах стандарта AGP 2.0 (1 GB/s), в 2 раза меньше реальной сегодняшней полосы пропускания для локальной SGRAM памяти, достигающей 2 GB/s. Поэтому увеличение тактовой частоты и разрядности шины PCI может свести на нет все преимущества AGP. Другое дело, что AGP стал фактически единственным интерфейсом для видеокарт и только этот факт делает практически невозможным обратный переход к PCI, поэтому AGP развиваться будет и впредь, но как бы параллельно с развитием PCI.

В трехмерной графике все объекты создаются как совокупность множества (счет идет на миллионы) треугольников, а треугольники затем образуют полигоны (но полигон, вообще говоря, любая плоская фигура с количеством углов >=3). Работа начинается с определения полигонов для каждого из объектов изображения. Далее выполняется анализ перемещения каждого из объектов относительно наблюдателя, включая и вращение относитетельно собственной оси. Кроме этого, определяется, как подсветка отражается на каждом объекте. Весь этот анализ исходит из отрисовки 30 кадров/с, хотя для терпимого качества достаточно иметь 10-15 кадров/с. Так как весь объект состоит из треугольников, все операции выполняются с координатами вершин треугольников и при перемещении объекта координаты вершин пересчитываются. При освещенииобъекта определяется уровень освещенности каждой вершины треугольника, а уровень освещенности каждой точки внутри треугольника вычисляется как средневзвешенное значение относительно вершин. Весь процесс создания трехмерной картинки состоит из двух частей: Сначала создается геометрия объекта из множества треугольников, а затем выполняется отображение объекта на экране или, как принято в 3D описаниях, рендеринг (от слова render - изображать). Большинство современных видеокарт с 3D ускорителями не занимаются обсчетом вершин (т.е. первой частью), а выполняют только рендеринг. Это объясняется тем, что первая часть работы требует чрезвычайно интенсивных вычислений и она, как правило, возлагается на центральный процессор. Именно поэтому результаты тестирования видеокарт существенно зависят от производительности процессора. Собственно рендеринг состоит из четырех основных задач: растеризации, z-буферизации, затенения и нанесения текстур. "Правильная" 3D видеокарта аппаратно выполняет все эти операции. Качество растеризации завистит от возможностей видеокарты - лучшие карты не выполняют цветовую обработку пикселей всего треугольника, если часть его выходит за границу видимости объекта. Обрабатываются только видимые пиксели. В не очень хороших картах весь треугольник, попадающий на край объекта, может быть обработан или весь не обработан. Поэтому в хороших картах край изображения выглядит намного ровнее. Этот механизм называют также anti-aliasing. При z-буферизации определяется, какие треугольники частично или полностью видимы относительно других треугольников. Этот механизм называется z-буферизацией, так требуется сохранять третью координату для каждой вершины треугольника и анализировать ее. После этого процесса становится известно, что следует рисовать на переднем плане, а что на заднем. Затенение формирует цвет каждого треугольника в зависимости от освещения или тени, падающей на объект. Самым популярным методом сейчас является затенением по Гуро - программа, в зависимости от света (тени) в каждой вершине треугольника, вычисляет среднее значение для всего треугольника. Нанесение текстур приводит к формированию деталей на полигоне - например, ворса на ткани, колец на срезе дерева, цементной "шубы" на стене и т.п. Текстура является образом поверхности объекта. Обычно создается несколько текстур с различным разрешением. Для частей объекта, ближайших к наблюдателю, выбираются текстуры с более высоким разрешением, для удаленных - с более низким. Этот способ также называется mip mapping. Ну, на сегодня теории достаточно. Это , конечно, не все, что можно рассказать по данному вопросу, но на первое время хватит.

Рассмотрим всю серию акселераторов GeForce FX.
  • GeForce FX5800 (NV30). Именно то ядро, с которого все и началось. Самая старшая модель в линейке, до последнего времени топовый чип NVidia. Единственная на сегодняшний день игровая видеокарта, оснащенная памятью DDR II.
  • GeForce FX5600 (NV31). Продукт среднего уровня, обладающий сниженными тактовыми частотами и уменьшенным числом текстурных блоков на конвейер.
  • GeForce FX5200 (NV34). Самая младшая модель, "DirectX 9 для бедных". Да-да, это все та же серия МХ, но в новом обличье: по сравнению с FX5800 частоты снижены, количество конвейеров уменьшено наполовину.
Каждая из вышеописанных модификаций имеет вариант Ultra с более высокими по сравнению с базовой моделью частотами ядра и памяти. Как видно из перечисленного, на сегодняшний день серия GeForce FX включает в себя шесть (!) различных вариантов чипсета NV30, покрывающих практически все сегменты рынка. Во времена GF4Ti модельный ряд верхнего уровня состоял только из трех продуктов, а подобным разнообразием могла похвастаться только бюджетная серия МХ (которая, к слову, имела отдаленное касательство к ядру NV25). Сейчас же NVidia заявляет, что все варианты GeForce FX построены на основе одного -- старшего -- чипа. Так ли это -- мы поговорим чуть ниже, а пока более подробно остановимся на особенностях архитектуры NV30. Для начала -- это изменение технологического процесса с 0,15 мкм на 0,13 мкм плюс использование медных проводников. Это позволило увеличить число транзисторов на кристалле до рекордной величины -- 125 млн. Но, раз транзисторов стало больше, значит, и функциональность чипа повысилась? Разумеется. Итак... По требованиям DX9 акселератор, поддерживающий этот API, должен иметь два геометрических и два растровых процессора. Новый продукт NVidia "несет на борту" 3 и 4 процессора соответственно. Причем растровые процессоры имеют по три ALU каждый: два -- для целочисленных операций и одно -- для операций с плавающей точкой. Далее, как мы уже упоминали, поддержка памяти DDR II с шириной шины 128 бит. Контроллер памяти также был доработан. Кстати, схема его не изменилась -- это по-прежнему четырехканальный коммутируемый контроллер. Улучшенный механизм анизотропной фильтрации, существенно снижающий потери производительности при его активации. Качество при этом страдает весьма незначительно. Кроме этого, появился новый режим анизотропии -- 8Х. Алгоритмы сглаживания также подверглись изменениям: добавлено два новых режима -- 8Х и 6хS. Значительно повышена эффективность технологий экономии полосы пропускания видеопамяти. Теперь кадровый буфер полностью подвергается сжатию -- компрессируется как информация о цвете (исключительно при использовании MSAA) с коэффициентом до 4:1, так и Z-буфер (информация о глубине). Это позволило значительно снизить падение производительности при включении режима FSAA. Реализованы механизмы Early HSR, Early Z Cull -- т. е. сжатия и раннего отсечения невидимых поверхностей. Увеличена точность как целочисленных, так и форматов с плавающей точкой до 10/16 и 16/31 бита на каждый компонент соответственно. Введена поддержка 128-битного цвета. Ну и наконец, реализована гибко перепрограммируемая логика работы чипа с помощью языка Cg. Именно это, по мнению разработчика, упростит написание сложных шейдерных процедур и позволит реализовать ранее недоступные эффекты. Это то, что касается NV30 в целом. А теперь хотелось бы немного поговорить об основных отличиях разных семейств друг от друга. В принципе, можно утверждать, что NV30 и NV31 практически идентичны за исключением частот и поддержки DDR II. Ну и, разумеется, уменьшение у NV31 либо числа конвейеров, либо числа текстурных блоков в зависимости от режима работы. Как мы говорили выше, новое ядро является перепрограммируемым и в разных ситуациях может динамически перераспределять количество конвейеров и TMU. К примеру, 4 2, 8 1 в случае с NV30 или 4 1, 2 2 в случае с NV31. А теперь перейдем к NV34. Разработчик утверждает, что в его основе лежит NV30. Так-то оно так, но не совсем. Вернее, ядро-то в основе лежит, но как? Для начала сравним число транзисторов у NV30 и NV34 -- 125 млн. и 47 млн. соответственно. Разница почти в три раза! Не наводит ли это на размышления? Ну хорошо, можно списать это на уменьшение числа конвейеров и текстурников. Но ограничивается ли этим дело? Попробуем подумать. Итак, единственная формула для NV34 -- это 2 2. Два конвейера, два TMU. Ни о каком гибком изменении их числа речь не идет. Соответственно, и никакой оптимизации под задачу. Это раз. Кто может поручиться, что два конвейера и два TMU, грубо говоря, занимают 78 млн. транзисторов? Никто. Следовательно, нет гарантий, что в чипе не убраны еще какие-либо функциональные блоки, учитывая и заявление NVidia о том, что задачи распараллеливания вычислений шейдеров лучше выполняются на NV30 и NV31. Это два. Отсутствие в NV34 возможности сжатия без потерь цветовой информации в кадровом буфере и Z-буфере. Отсюда -- снижение быстродействия при использовании механизмов сглаживания. Это три. Ну и наконец, старый 0,15-микронный техпроцесс. В какой-то мере он, безусловно, просто не дал разместить на кристалле все необходимые блоки. Вернее, сколько могли, столько их и разместили. Но это еще не все: техпроцессом ограничивается не только возможная функциональность чипа, но и его тепловыделение, максимальные рабочие частоты (а значит, и способность к разгону). Это четыре. В общем... Да никто и не ожидал от карты нижнего класса каких-то заоблачных характеристик. Но все это наводит на невеселые размышления. Учитывая то, что один "удачный МХ" (GF4 MX) мы уже видели...

Продукт не провальный, это ясно. Но ожидания и обещания явно не соответствуют тому, что мы получили в итоге. "Короля скорости" мы так и не увидели -- продукты ATI по-прежнему быстрее. И чем "тяжелее" графический режим, тем больше видна разница. Это, кстати, при том, что тот же Radeon 9800 Pro вышел гораздо с меньшей помпой, чем NV30. К тому же модельный ряд GeForce FX достаточно узок -- опять же у ATI в арсенале гораздо больше продуктов, перекрывающих весь спектр рынка, а не заявленные шесть моделей, из которых в лучшем случае на рынке будут присутствовать четыре. Да и потом, линейка ускорителей, состоящая из продуктов класса "дешево, но никому не нужно", "довольно дорого и ничуть не лучше, чем у конкурента" и "достаточно быстро, но космически дорого" вызывает недоумение... Судите сами: нам был обещан DX9 для бедных? Ну, в принципе, мы его получили. Только куда его, простите, девать с такой "выдающейся" производительностью? Какой толк в поддержке новейшей версии этого API в GeForce FX5200, если использующие его приложения все равно превратятся в слайд-шоу? Да и старые игры для него -- тоже задача не из простых. Только если уж играть совсем в "неприличных" на сегодняшний день разрешениях... Что касается FX5600, то тут ситуация тоже достаточно странная -- интерес представляет только версия "Ultra" этого чипсета. Но цена на него пока выше разумной. Производительность зачастую ниже, чем у Ti4600, и практически всегда меньше, чем у Radeon 9600 Pro. И опять возникает вопрос: ну и кому нужен DX9 на такой скорости? Что там осталось -- FX5800? Да, достаточно быстрое ядро. Не чемпион, но вполне достойный противник. Но вот цена, шум, конструктив, нагрев... Нет уж, простите. Столько времени делать такого "флагмана"? Теперь насчет обещанного "кинематографического качества". Сменится еще, как минимум, два поколения ускорителей, прежде чем это самое "качество" придет (возможно) на экраны мониторов. К тому времени FX будет храниться разве что в музеях коллекционеров и на полках неудачливых пользователей, в спешке приобретших его в надежде на "кино" уже сегодня. Да и сам разработчик, похоже, не верит в долгую жизнь этого своего детища. Уж слишком быстро анонсирован FX5900. Причем именно в таком виде, который должен был изначально иметь NV30. В итоге получаем странную, запоздалую линейку чипов, место которой под солнцем уже занято продуктами ATI. Линейку, которую в очередной раз ждали, ждали и дождались... Плюс к этому не делающий чести NVidia скандал с FutureMark, попытки любыми способами "спасти лицо" своего нового ядра. Хорош же должен быть ускоритель, чтобы продвигать его на рынок такими методами! Может, NVidia стоило раньше посмотреть, что же за наработки она купила вместе с 3dfx? Может, надо было раньше их использовать? Меньше создавать шумихи вокруг своих продуктов, а больше заниматься их разработкой? Тогда, глядишь, и не пришлось бы снимать с производства еще не вышедший чипсет... В общем, не сильно веселая картина получается. Если так будет продолжаться и дальше, кто знает, куда заведет эта дорожка некогда ведущего игрока рынка 3D? Видимо, эта компания начинает потихоньку забывать уроки истории. Забывать, как сама стала когда-то на этом рынке лидером. И какую опасность могут представлять даже для ведущих игроков пусть небольшие, но агрессивные компании, которые предпочитают сначала делать, а потом уж говорить о сделанном.

В следующем выпуске мы поговорим о видеокартах от ATI. Все ваши пожелания, замечания, гневные и другие реплики присылайте по адресу flash@aport.ru.


http://subscribe.ru/
E-mail: ask@subscribe.ru
Отписаться
Убрать рекламу

В избранное