middle end что это

Тонкие вопросы середины (Middle-End)

Вот уже, совсем скоро, и придет весна. А весна, как известно, время распускаться новым цветам — Next Generation топовых ускорителей ATI и NVIDIA. Но эта статья не о том :-).

Сегодня мы предпримем попытку окинуть взглядом придирчивой препарации синтетическими тестами скромный, и в тоже время решающий сегмент mainstream — тех самых середнячков, искусство балансировки которых во многом определяет реальное, экономическое лидерство компаний-производителей на рынке. Если в нижнем секторе главную роль играет цена, в верхнем — производительность и возможности, то здесь, в mainstream, ее, несомненно, играют оба критерия. Тем самым, предъявляются наиболее строгие требования к балансу подсистем ускорителя, его себестоимости и, что самое главное, к востребованности всех заложенных в него технологий.

Не претендуя на истину в последней инстанции, мы постараемся нащупать узкие места и ошибки балансировки самых популярных середнячков, снабженных уже «устаканившимися» драйверами. Тем самым, мы попытаемся предсказать основные направления и результаты «работы над ошибками», приобрести которые у нас (возможно) появится шанс в середине 2004 года. Никто не сомневается в компетентности разработчиков таких компаний как ATI и NVIDIA — а, следовательно, в том, что ими уже давно и хорошо изучены слабые места их текущих продуктов. Но известны ли они нам? Орешек знаний тверд. Давайте его расколем. Что мы тестировали

Для тестирования подсистем чипов использовался уже хорошо знакомый нашим читателям пакет D3D RightMark (Beta 3, известная также как версия 1.0.4.9). Вы можете ознакомиться с этим набором тестов, посетив сайт 3d.rightmark.org, где, в том числе доступны для скачивания исходные тексты и дистрибутив этого пакета.

Мы протестировали следующие ускорители (в скобках указана частота ядра / памяти):

На двух платформах — Pentium 4 3.2 ГГц и AMD64:

Забегая вперед, отметим, что разница между платформами проявилась лишь в одном из тестов, что и ожидалось — обе конфигурации способны загрузить вышеописанные ускорители «по самое не хочу». Однако для очистки совести (и в поисках возможных аномалий поведения драйверов или взаимодействия ускорителей с платформами) мы внимательно сравнили результаты обоих тестовых стендов. А затем, с чистой совестью исключили из большинства графиков совпадающие зачастую до 3 или даже 4 знака результаты AMD64. Геометрическая производительность

Для начала FFP — т.е. эмуляция T&L:

На горизонтальной оси — миллионы треугольников в секунду. На вертикальной — различные задачи, по мере роста их сложности — от простого константного освещения (фактически пиковая пропускная способность ускорителя по треугольникам) до сложной системы из трех источников света, каждый из которых снабжен двумя компонентами — диффузной и спекулярной (бликовой) составляющими.

Как и ожидалось, все решает частота ядра. За исключением ситуации, когда это ядро другое (NV31/NV36). Геометрическая производительность хороший аргумент в пользу покупки карты из семейства 5700, а не 5600. Теперь посмотрим, как изменится картина при переходе к вершинным шейдерами 1.1:

Читайте также:  какой крепости самогон лучше фильтровать

Ситуация стала более ровной, но, NVIDIA по-прежнему лидер геометрических задач. А теперь перейдем к шейдерам 2.0:

Выводы: наличие циклов или условных переходов в вершинных шейдерах — не сильная сторона NVIDIA: было бы неплохо исправить этот факт в следующем поколении ускорителей. В традиционных задачах (а вершинные шейдеры 2.0 пока не получили сколь бы заметного распространения) NVIDIA лидирует в вопросах геометрической обработки. Кроме того, отметим небольшую аномалию, связанную с драйверами или взаимодействием ускорителя с платформой у связки NVIDIA+AMD64. Сама по себе, в абсолютных значениях, геометрическая производительность mainstream ускорителей значительно превышает требования современных приложений — разве только GeForce FX 5600 может вызывать опасения в этой области. Основные баталии сейчас и в будущем, как и в области High End, будут происходить в вопросах скорости закраски и пиксельных шейдеров. Скорость закраски и фильтрации текстур

Для начала исследуем пиковые возможности закраски, реализуемые при минимальных (2х2) текстурах, в различных режимах работы пиксельных конвейеров (FFP/PS1.1/PS1.4/PS2.0) при различном числе текстур, накладываемых на пиксель. Для сравнения тотальной эффективности будем приводить не число закрашенных пикселей, а число пикселей, помноженное на число текстур (т.е. число выбранных текселей). Это позволит нам понять, для какого числа текстур на пиксель в среднем лучше всего сбалансированы чипы. Для начала FFP и пиксельные шейдеры 1.1:

Теперь посмотрим на производительность закраски в режиме шейдеров 1.4 и 2.0:

Итак, в вопросах закраски шейдеры 2.0 — не сильное место NVIDIA. Ее пиксельные конвейеры более капризны и могут, как порадовать заметным преимуществом, так и огорчить более чем двукратным падением. «Вы просто не умеете их готовить». Вот почему NVIDIA проводит столько работы с разработчиками приложений — если научить их оптимально использовать продукты NVIDIA, можно добиться заметного преимущества, если не научить — можно серьезно проиграть. ATI не столь чувствительна к вопросам оптимизации и версий шейдеров — результаты на ее ускорителях более предсказуемы. Надеемся, что в будущих поколения NVIDIA сумеет создать менее зависимую от внешнего произвола архитектуру, причем, не скопировав подход ATI (твердая серединка), а именно избавившись от своих слабых мест, при этом, не уменьшив преимущества сильных. ATI же в свою очередь можно пожелать просто нарастить мышцы — увеличить число конвейеров и эффективность работы с памятью.

Теперь посмотрим на более реальную задачу — скорость выборки и фильтрации различными методами текстуры ходового размера 128х128:

Теперь две текстуры одновременно:

В этой конфигурации ATI и NVIDIA идут нос к носу. Самое ходовое сочетание числа и размера текстур отработано лучше всего. Становится ясно, что вне зависимости от торжества современных технологий, эти чипы нацелены и сбалансированы в расчете на приложения сегодняшнего (и даже вчерашнего) дня, наиболее ходовые среди простых покупателей — основной клиентуры mainstream.

Читайте также:  boot failure guard count что это в биосе

И, напоследок — 4 текстуры:

А здесь ATI уже слегка опережает NVIDIA. В чем дело? Сказывается та самая нелюбовь ее пиксельных конвейеров к режиму FFP с 4 текстурами на пиксель. Впрочем, нет повода для паники — в реальных приложениях этот режим встречается реже PS1.1.

Теперь посмотрим на эффективность кэширования текстур — зависимость скорости выборки текстур от их размера (билинейная фильтрация, 1,2 и 4 текстуры):

Теперь тоже самое, но с трилинейной фильтрацией для одной и двух текстур:

А сейчас посмотрим на зависимость от формата текстур:

Выводы: Сложный пиксельный конвейер NVIDIA можно назвать капризным. Он требует бережного отношения со стороны программистов. В случае успеха наградой будет заметное преимущество, в случае неудачи — неожиданное падение скорости. Надеемся, что в будущем NVIDIA закрепит сильные и устранит слабые стороны своего подхода. В то время как ATI достаточно просто нарастить мышцы на простых задачах выборки и фильтрации текстур. Пиксельные шейдеры 2.0 — вычислительные задачи

Теперь исследуем вычислительную мощь пиксельных шейдеров 2.0:

Для интереса скомпилируем шейдеры с профилем 2.a — возможно небольшое различие результатов компиляции:

На графике практически не заметно, но если приглядеться, становится ясно, что иногда компиляция с профилем 2.a дает для NVIDIA чуть более успешные результаты. Сказываются большие функциональные возможности ее пиксельного конвейера.

Ну, и напоследок посмотрим, спасет ли ситуацию широкое использование заранее просчитанных таблиц данных (LUT) в виде текстур — ведь чипы NVIDIA, как известно, выбирают значения текстур куда как более успешно, нежели выполняют математические операции в шейдерах 2.0:

Разница есть, особенно она заметна в шейдере процедурной текстуры, но вновь мы приходим к выводу, что решающей ее назвать нельзя. В случае самой тщательной оптимизации шейдеров NVIDIA сравняется с продуктами ATI. Но не начнет их превосходить.

Выводы: Основная работа над ошибками в следующем поколении у NVIDIA должна быть проведена в области пиксельных шейдеров 2.0. Если фирме удастся поднять их производительность хотя бы до того уровня, который демонстрируется сейчас для шейдеров 1.1 и 1.4 — можно будет считать эту работу выполненной. У ATI в этой области все отлично. Ее куда больше должна волновать простая выборка текстур. Эффективность HSR

Измерим пиковую эффективность подсистемы HSR, достижимую на данных чипах:

Эффективность NVIDIA выше, особенно в сценах со средней сложностью геометрии (mid). Имея более низкий теоретический предел скорости закраски, NVIDIA отыгрывается на эффективной выборке текстур и HSR. Вот что значит качественный общий баланс подсистем чипа. Но, как и любой баланс, он возможен только в поле некой узкой области параметров (в данном случае — сложности сцены). Если подход ATI более адаптивен, то подход NVIDIA к HSR позволяет добиваться заметного преимущества в одном классе задач и, как минимум, не проигрывать в остальных. Что ж, здесь это оказалось вполне оправдано. Спрайты

Читайте также:  cooling fan что такое

Рассмотрим скорость отрисовки спрайтов (первая диаграмма — без освещения, вторая — с двумя источниками света):

По вертикали отложены миллионы спрайтов в секунду.

Источник

middle end

1 middle end

См. также в других словарях:

Middle Chinese — 中古漢語 Spoken in China Region Medieval China Extinct Evolved into Proto Mandarin and other Chinese dialects apart from Min … Wikipedia

Middle English — Spoken in England, south east Scotland and in Scottish burghs, to some extent in Ireland Extinct developed into Early Modern English, Scots and Yola in Wexford by the 16th century Language family … Wikipedia

Middle school — and Junior High School are levels of schooling between elementary and high schools. Most school systems use one term or the other, not both. The terms are not usually interchangeable. In China, Taiwan, Hong Kong,[citation needed][1], and Vietnam … Wikipedia

Middle Eastern theatre of World War I — Middle Eastern theatre Part of World War I Gallipoli Campaign, April 191 … Wikipedia

Middle Class Rut — Origin Sacramento, California, United States Genres Alternative rock Indie rock Years active 2006–present Labels Bright Antenna Kids (UK) … Wikipedia

Middle East Media Research Institute — Founder(s) Yigal Carmon Type 501(c)(3) non profit Founded 1998 Location Washington, D … Wikipedia

Middle Cyclone — Studio album by Neko Case Released March 3, 2009 (CD, Digital) … Wikipedia

End time — End time, End times, or End of days are the eschatological writings in the three Abrahamic religions and in doomsday scenarios in various other non Abrahamic religions. In Abrahamic religions, End times are often depicted as a time of tribulation … Wikipedia

Middle-earth calendar — refers to one of the systems of keeping time in the fictional Middle earth devised by J. R. R. Tolkien and described in The Lord of the Rings. Because Middle earth was intended to be our world in the distant past, the basic structure of the… … Wikipedia

Middle East Institute — in Washington, D.C. The Middle East Institute (MEI) is a non partisan think tank and cultural center in Washington, DC. Founded in 1946, MEI is the oldest institution in Washington dedicated exclusively to the study of the Middle East. Its… … Wikipedia

Middle High German — diutsch, tiutsch Spoken in southern Germany (south of the Benrath line), parts of Austria and Switzerland Era developed into Early New High German from the 14th century … Wikipedia

Источник

Сказочный портал