Третий Пень Туалатин с кэшем второго уровня 512 Кб - процессор серверный, своего рода Ксеон для бедных. Такой сервачок старого образца на двух Пеньках вполне пригоден в качестве графической станции под не слишком сложные задачи, идеален в качестве сервера по раздаче интернета в интернет-клубе или в не очень большом учреждении. Кроме того, это отличная бенчерская машинка для любителей участвовать в разнообразных битвах ветеранов. Серверные системы на Туалатинах достойны отдельной темы!
[url=http://www.ixbt.com/cpu/tualatin-smp.shtml]Скамья для двух Туалатинов: "серверный" процессор и его платформа[/url]
Казалось бы, Intel уже давно выпустила SMP-варианты Pentium 4 для двухпроцессорных конфигураций. Но, в то время как материнские платы под них доступны, сами P4 Xeon по-прежнему остаются дефицитом. Поэтому реально старшим из процессоров Intel для дуальных систем остается старый добрый Pentium III, хотя теперь уже в новом варианте -- "серверный Tualatin".
Пожалуй, немного найдется в мире крупных IT-компаний, которые бы за последние два-три года так часто и сильно удивляли компьютерную общественность. В числе первых вполне можно было бы назвать Intel, которая удивляла часто, но не всегда приятно, порой вызывая у пользователей некоторое недоумение. В мире давным-давно продаются двухпроцессорные системы на Intel Xeon "Foster" -- чипах с ядром, родственным ядру Pentium 4, и частотами до 1,7 GHz и выше. Платы под них (чипсет i860, разъем Socket 603) доступны также давно, чуть ли не со времен прошлогоднего "Комтека". Вот-вот должен выйти новый 0,13-микронный вариант Xeon "Prestonia" -- с частотами от 2 и 2,2 GHz, L2-кэшем объемом 512 KB и поддержкой технологии Hyper Threading. Вроде бы все прекрасно, и теоретически выбор платформы для дуальных систем достаточно широк:
Intel Xeon "Prestonia" (ожидается) -- частота до 2,2 GHz, объем L2-кэша 512 KB;
Intel Xeon "Foster" -- частота до 1,7 GHz, объем L2-кэша 256 KB;
Intel Pentium III Xeon "Tanner" -- частота до 900 MHz, объем L2-кэша 1--2 MB;
Intel Pentium III "Coppermine" -- частота до 1 GHz, объем L2-кэша 256 KB;
Intel Pentium III "Tualatin" -- частота до 1,4 GHz, объем L2-кэша 512 KB;
AMD Athlon MP "Palomino" -- до 1900+ (1,6 GHz), объем L2-кэша 256 KB.
Но что же мы имеем в результате? Intel Xeon достаточно недешев, и хотя спрос на него есть, но процессоры практически недоступны и попадают сюда (и в Украину, и в Россию) в основном по "серым" каналам. Pentium III Xeon также не назовешь дешевым, к тому же при самом большом объеме кэша второго уровня у него и самая низкая частота. Athlon MP радует высокой производительностью и доступной ценой, но назвать эту платформу массовой пока еще достаточно сложно. Вот и остается тем, кто привык, что "сервер -- это Intel плюс Intel" (в смысле процессор + чипсет, а иногда еще и "плюс" материнская плата и корпус/шасси), ориентироваться на семейство Pentium III (либо же на P-III Xeon, единственными преимуществами которого по сравнению с обычным P-III являются большой 2-мегабайтовый кэш и возможность работы в 4- и 8-процессорных конфигурациях).
Как известно, проверенная временем и хорошо знакомая многим линейка Pentium III "Coppermine" достигла предела 1 GHz, после чего рост частоты прекратился. Продолжением ее стали новые варианты P-III с ядром Tualatin, на котором мы остановимся более подробно.
Tualatin -- как много в этом звуке...
В "народном сознании" имя Tualatin оказалось прочно связанным с названием нового ядра Pentium III, изготовленного по технологии 0,13 мкм. На самом же деле Tualatin -- изначальное название глобального проекта Intel по переводу производства процессоров на 0,13-микронную технологию. Сами CPU с новым ядром стали по сути первыми продуктами, появившимися в рамках этого проекта, и под кодовым названием Tualatin был выпущен не один, а целых четыре семейства процессоров (см. таблицу). В результате линейка Pentium III "распалась" на два класса -- настольных и серверных процессоров. У первых объем L2-кэша так и остался равным 256 KB, у вторых -- удвоился до 512 KB; также у настольной версии нового P-III (так называемого Desktop Tualatin) отсутствовала поддержка SMP. Срок жизни этого процессора оказался недолгим: практически он поставлялся только крупным производителям ПК, а с массового рынка был изъят с целью освободить дорогу флагманскому продукту Intel в лице Pentium 4. Вместе с этим линейка Celeron начиная с частоты 1,2 GHz была переведена на ядро Tualatin, получив тем самым удвоение L2-кэша (со 128 до 256 KB) и 0,13-микронную технологию производства, но оставшись на частоте шины 100 MHz. Отдельным семейством выступают процессоры для мобильных систем Pentium III-M с ядром Tualatin, поддерживающие технологию SpeedStep и оснащенные на удивление большим для таких систем 512-килобайтовым L2-кэшем. Ну и последним (по списку, но не по значимости) является герой нашего повествования -- Pentium III-S, который Intel называет исключительно серверным процессором. Преимущества нового 0,13-микронного ядра Pentium III вполне очевидны:
низкое энергопотребление;
малая рассеиваемая мощность;
возможность интеграции в ядре вдвое большего объема L2-кэша практически без увеличения площади кристалла (и, соответственно, себестоимости производства);
возможность дальнейшего роста тактовых частот (тогда как P-III Coppermine "уперся" в значения частот чуть выше 1 GHz).
Однако при этом есть один минус: процессоры с ядром Tualatin потребовали новой модификации VRM (Voltage Regulator Module) -- блока, отвечающего за питание процессора. Чипы семейства Coppermine работали с версией VRM 8.4, для Tualatin же была выпущена новая версия VRM 8.5, реализующая концепцию так называемой нагрузочной прямой (Load Line).
Потребность в модификации схем питания возникла именно при переходе на 0,13-микронный технологический процесс. При уменьшении расстояний между полупроводниковыми элементами на таких тактовых частотах становятся весьма заметными токи утечки и шумовые наводки. Растет точечная отводимая мощность, что приводит к изменению параметров проводников и изолятора и в результате -- к снижению надежности процессора. Резко повышается неравномерность нагрева кристалла при работе, что является причиной учащения сбоев. Кроме того, снижается процент выхода годных процессоров, что, естественно, сказывается на итоговой цене чипов (вспомните баснословно дорогие первые образцы Pentium Pro).
Для борьбы со всеми этими нежелательными явлениями и была разработана концепция нагрузочной прямой. Применявшийся ранее "идеальный VRM" при работе процессора поддерживает постоянное напряжение питания ядра в заданном диапазоне, несмотря на изменяющееся потребление тока (для P-III -- от 0 до 30 A).
VRM, построенный по принципу нагрузочной прямой, изменяет напряжение питания процессора в зависимости от потребляемого тока.
Отметим, что 0,18-микронные процессоры Pentium III Coppermine "терпят" оба типа питания -- и "идеальный VRM", и нагрузочную прямую. Но самым принципиальным моментом является то, что у "десктопного" и "серверного" вариантов P-III Tualatin, различающихся объемом L2-кэша, характеры нагрузочных прямых разные. А это означает, что такие процессоры нельзя устанавливать в платы, предназначенные для P-III Tualatin другого типа. То есть не допускается установка "серверных" процессоров в платы для настольных систем и наоборот (хотя второй вариант ввиду отсутствия на рынке Desktop Tualatin не особо актуален). Вряд ли процессор сгорит при установке в "неправильную" плату, но работа на "чужом" VRM снижает как кратковременную, так и долговременную надежность процессора. В результате этого он наверняка не отработает тех семи лет, на которые был рассчитан.
Новшества Tualatin не заканчиваются на использовании другой версии VRM. Кроме этого, были значительно изменены упаковка процессора (в новом конструктиве FC-PGA2 ядро покрыто теплорассеивающей пластиной) и его дизайн. В качестве примера приведем такой факт: если для Coppermine при перегреве процессора (сигнал THERMTRIP#) достаточно было просто убрать тактирование, то для Tualatin этого мало -- необходимо еще убрать и питающее напряжение процессора.
Реализация поддержки всех новшеств Tualatin, конечно же, потребовала модификации материнских плат и чипсетов, в результате чего были выпущены i815 B-Step, VIA Apollo Pro133T/266T, SiS 633T/635T, а также обновленные чипсеты от ServerWorks ServerSet III LE3/HE-SL. Соответственно, появилась целая волна новых материнских плат -- как для настольных систем, так и для рабочих станций и серверов. О настольных платах с поддержкой Tualatin мы уже писали не раз, и теперь хотелось бы рассмотреть несколько двухпроцессорных моделей.
Характеристики процессоров с ядром TualatinПроцессор Celeron Pentium III Desktop Pentium III Server Pentium III-M
Тактовые частоты, MHz 1200, 1300 1133, 1200 1133, 1266, 1400 700--1200
Частота FSB, MHz 100 133 133 133/100
Объем L2-кэша, KB 256 256 512 512
Наличие Data Prefetch Logic - + + +
Поддержка SMP - - + -
Форм-фактор FC-PGA2 FC-PGA2 FC-PGA2 BGA2/uBGA2
Технология SpeedStep - - - +
Напряжение питания, В 1,475--1,5 1,475 1,45 1,4/1,15*
* В режимах Maximum Performance/Battery Optimized технологии SpeedStep.
Чипсеты и двухпроцессорные платы под Tualatin
На сегодняшний день существует четыре основных чипсета, поддерживающих P-III Tualatin в двухпроцессорных конфигурациях: VIA Apollo Pro133T/266T и ServerWorks ServerSet III LE3/HE-SL. Все они являются модифицированными версиями соответствующих предыдущих чипсетов, работающих с более ранними процессорами под Socket 370. Краткое сравнение возможностей чипсетов приведено в таблице, мы коснемся лишь наиболее значительных отличий. Apollo Pro133T работает с обычной памятью PC133 SDRAM, тогда как Apollo Pro266T поддерживает оба типа памяти -- как PC133, так и PC2100 DDR SDRAM (к тому же может работать с бoльшим ее объемом -- до 4 GB). По нашим сведениям, из известных производителей плат только Tyan выпускает двухпроцессорные модели на VIA Apollo Pro133T -- Tiger 200T (S2505T) и Tiger 230T (S2507T). А одна из немногих известных дуальных плат на базе Apollo Pro266T -- Supermicro P3TDDE -- оснащена только слотами под PC133-память (хотя есть еще и Supermicro P3TDDR и Iwill DVD266u-RN, рассчитанные на DDR SDRAM).
Решение, в общем-то, правильное: давно известно, в том числе из наших тестов, что для систем с Pentium III использование DDR-памяти мало что дает в смысле повышения производительности. Из особенностей Apollo Pro266T стоит отметить связь северного и южного мостов по скоростной шине V-Link (266 MBps) вместо PCI, а также возможность работы с чипом-компаньоном VPX-64 (VT8101), реализующим поддержку PCI 64-бит/66 MHz.
Двухпроцессорные чипсеты с поддержкой TualatinЧипсет VIA Apollo Pro133T VIA Apollo Pro266T ServerWorks ServerSet III LE3 ServerWorks ServerSet III HE-SL
Поддерживаемые частоты FSB, MHz 133/100/66 133/100/66 133/100
Память
поддерживаемые частоты, MHz 133/100/66 133/100/66 SDR, 266/200 DDR 133/100
максимальный объем, GB 1,5 4 4 12
поддерживаемые типы PC133 SDRAM, VCM SDRAM PC133 SDRAM, VCM SDRAM, PC2100 DDR SDRAM PC133 Registered SDRAM с ECC
асинхронный режим + -
количество каналов 1 1 2
Поддержка AGP AGP 4X - AGP 2X
Количество шин PCI 1 x 32-бит/33 MHz 1 x 32-бит/33 MHz*** 1 x 64-бит/66 MHz, 1 x 32-бит/33 MHz 2 x 64-бит/66 MHz, 1 x 32-бит/33 MHz
Связь северного и южного мостов PCI (133 MBps) V-Link (266 MBps) PCI (133 MBps) Н/д
Интерфейс UDMA UDMA 100/66/33* UDMA 100/66/33 UDMA 66/33
Количество портов USB 4 6 4 4
Встроенный мониторинг + + - -
Встроенный IOAPIC + + + +
Северный мост VT82C694T VT8653 CNB30LE (NB6635) CNB20HE-SL
Южный мост VT82C596B** VT8233/VT8233C OSB4/OSB5 (IB6566)
* Зависит от конкретного южного моста.
** Официальная информация VIA. На практике обычно используется VT82C686B.
*** Поддержка PCI 64-бит/66 MHz реализуется чипом-компаньоном VPX-64.
В то время как два чипсета VIA являются, скорее, "подросшими" версиями массовых настольных продуктов, которые обзавелись функциями двухпроцессорности, чипсеты ServerWorks были изначально ориентированы на high-end. В них наличествует PCI 64-бит/66 MHz, есть поддержка нескольких независимых шин PCI, обеспечивается работа с большими объемами памяти, реализованы многие "хитрые" функции для оптимизации работы систем (например, двухканальный контроллер памяти на ServerSet III HE-SL). В младшем чипсете ServerSet III LE3 не поддерживается AGP (хотя о том, как плохо она работала в HE-SL, мы уже говорили много раз). Отметим, что у самой ServerWorks второй чипсет вообще исчез из списка продуктов на Web-сайте (http://www.serverworks.com), поэтому не совсем понятно, как же правильно называется "обновленный" HE-SL с поддержкой Tualatin. Однако новые платы на ServerSet III HE-SL выпускаются и работают, как бы странно ни относилась ServerWorks к снабжению пользователей информацией о себе.
Как и всегда, мы решили кратко описать участников обзора. Правда, описания эти будут существенно отличаться от тех, которые читатели могли видеть в предыдущих наших материалах, посвященных "десктопным" платам. Разница состоит в том, что характеристика "удобство дизайна и разводки", вполне применимая к десктопному продукту (и весьма подробно нами освещавшаяся), в данном случае просто теряет всякий смысл. Серверы и мощные рабочие станции (тем более в Украине) -- изделия штучные, а даже если и выпускаются серийно, то, как правило, конкретная партия содержит не более одного-двух десятков компьютеров. Корпуса (да и прочее "железо") чаще всего используются либо рекомендованные производителями плат, либо максимально на них похожие, а то и вообще разрабатываются под конкретный заказ. Таким образом, понятие удобства сборки просто исчезает: если, к примеру, разъем питания ATX находится посередине платы, то значит, так оно и надо, и в "родном" корпусе именно это расположение и предусмотрено. Поэтому единственное, что нам остается сделать в данном случае, -- это просто "пробежаться" по наполнению плат и высказать свои мысли по поводу возможного их позиционирования. Отметим, что все участвующие платы основаны на чипсетах ServerWorks; как оказалось, двухпроцессорные модели под P-III Tualatin на наборах логики от VIA -- достаточно редкие гости в наших краях.
Intel Server Board SCB2 "Coosbay"
Плата, все же больше подходящая для сервера, чем для рабочей станции (казалось бы, вышенаписанное напрямую следует из ее названия, но мы будем пытаться "переосмыслить" официальное позиционирование, исходя из реалий рынка, в том числе и отечественного). О "серверности" свидетельствует и отсутствие слота AGP (несмотря на то что как раз чипсет ServerWorks ServerSet III HE-SL, на базе которого сделана плата, эту шину поддерживает), и большое количество встроенных компонентов: двухканальный Ultra 160 SCSI-контроллер, два сетевых адаптера, видеокарта. К слову, о видеокарте: ее можно было бы "посадить" на AGP, даже отказавшись от установки на плату самого слота. Но ATI Rage XL на Intel SCB2 работает на PCI 32-бит/33 MHz. Из особенностей именно этой платы стоит отметить нестандартный 24-контактный разъем ATX-питания (впрочем, стандартный для серверных шасси Intel) и два разъема, похожие на PCI 64-бит/66 MHz, но на самом деле таковыми не являющиеся. Эти разъемы предназначены для установки одно- или трехслотовых PCI Riser (знакомым сборщикам как "елочка"), в которые уже устанавливаются PCI-карты расширения, что позволяет строить компактные 1U/2U-системы. Из прочих особенностей Intel SCB2 назовем возможность работы с PCI-контроллером Zero Channel RAID от самой Intel или от Adaptec.
Двухканальный контроллер SCSI Intel использовала весьма "оригинально" -- только один из двух разъемов предназначен для подключения устройств, находящихся внутри системного блока, второй же вынесен на заднюю панель платы. Кроме того, подчеркнуто "игнорируется" IDE -- несмотря на то что в чипсете реализован полноценный двухканальный IDE-контроллер, на плате присутствует только один разъем (к которому, соответственно, можно подключить только два устройства). Видимо, Intel вообще с удовольствием убрала бы IDE с серверной платы, но возможность хотя бы временно подключить IDE-винчестер или ATAPI CD-ROM из соображений совместимости пришлось отставить. Впрочем, справедливости ради заметим, что выпускается еще один вариант SCB2, в котором двухканальный SCSI-контроллер заменен на UATA/100 IDE RAID (чип Promise PDC20267).
Supermicro P3TDE6-G
А вот этот продукт явно ориентирован именно на рынок рабочих станций, причем в том числе на самые "тяжелые" их варианты. Свидетельствует об этом прежде всего наличие слота AGP, мало того -- еще и в стандарте AGP Pro, т. е. поддерживающего мощные видеокарты с повышенным энергопотреблением (к примеру, что-то типа 3Dlabs Wildcat 4210 или Wildcat II 5110). Также косвенно подтверждается это позиционирование и остальной комплектацией -- в частности, присутствует двухканальный Ultra 160 SCSI-контроллер на базе чипа Adaptec AIC-7899W, одинаково "полезный" как серверу, так и мощной рабочей станции. А вот интегрированный сетевой контроллер -- один (вспомним предыдущую плату от Intel -- там их было целых два). В общем-то, логично -- зачем рабочей станции два сетевых контроллера? В число особенностей P3TDE6-G входит наличие слотов PCI 64-бит/33 MHz (именно 64 бита, но 33 MHz). Оба канала SCSI предназначены для "внутреннего использования", причем дополнительно к двум 68-контактным разъемам имеется и один 50-контактный. Также реализованы оба канала IDE (мы невольно продолжаем сравнивать Supermicro P3TDE6-G с описанной выше Intel SCB2). Из прочих отличий хотелось бы отметить присутствие на плате двух разъемов для подключения ATX БП, возможность установки дублирующей микросхемы флэш-памяти и идущую в комплекте с платой AGP-видеокарту (правда, ничего особенного собой не представляющую -- все тот же ATI Rage XL с 8 MB видеопамяти).
Supermicro P3TDL3/P3TDLE/P3TDLR
Две "близняшки" на основе чипсета ServerWorks ServerSet III LE3 отличаются друг от друга только наличием (P3TDL3) или отсутствием (P3TDLE) одноканального Ultra 160 SCSI-контроллера на чипе Adaptec AIC-7892. Даже по внешнему виду и довольно "скромному" размеру становится понятно, что мощный сервер на такой плате не соберешь. Однако и для "стоечных" 1U-решений P3TDL3/P3TDLE тоже мало подходят, так как разъемы DIMM у них сделаны стандартным образом, а не наклонены на 25°, как у некоторых плат, рассмотренных ниже (это является одним из самых простых признаков ориентации платы на системы формата 1U). Таким образом, применение данные платы, с нашей точки зрения, могут найти в небольших серверах или рабочих станциях (при условии, что устраивает PCI-видеокарта, т. е. производительность графической подсистемы некритична). Однако у обеих плат есть одна воистину уникальная особенность -- слот ISA. Дело в том, что сравнительная простота разработки устройств для нее в период "нашествия x86" (особенно в странах бывшего СССР) породила массу "самодельных" плат, производимых некоторыми компаниями для своих внутриведомственных целей (всевозможные шифраторы/дешифраторы, специализированные модемы и пр.). Устройства эти (для самих компаний) остаются весьма актуальными даже по сей день, а вот устанавливать их уже почти некуда. С этой точки зрения Supermicro P3TDL3/P3TDLE попадают в категорию "вне конкуренции", так как альтернативы им сегодня практически нет.
Описать Supermicro P3TDLR можно всего двумя словами: это немного урезанная по слотам P3TDL3 с "косыми" (наклоненными под углом 25°) разъемами DIMM и добавленным еще одним сетевым контроллером. Соответственно, позиционирование данного продукта абсолютно прозрачно: создание 1U/2U-модулей для стоечных серверов. Прочие различия между P3TDL3 и P3TDLR хорошо видны как на фото, так и в сводной таблице, поэтому детально мы их описывать не будем.
Tyan Thunder HEsl-T
Хотя по названию Thunder HEsl-T является как бы "старшей сестрой" хорошо известной платы Thunder HEsl, но по сути своей это совсем другая плата. Сразу бросаются в глаза убранный напрочь слот AGP Pro (вечно не работавший на ServerSet III HE-SL), появление двух дополнительных слотов DIMM (теперь их шесть) и достаточно сильно измененный дизайн. Проще всего сравнивать эту плату с Intel Server Board SCB2 -- уж слишком у них много общих черт. Одинаковый чипсет, одинаковое количество разъемов DIMM, даже отсутствие AGP, несмотря на ее поддержку чипсетом. Соответственно, позиционирование Tyan Thunder HEsl-T вполне прозрачно -- это, несомненно, плата для "серьезного" сервера. А вот подходы у Intel и Tyan разнятся. Скорее всего, это объясняется тем, что в случае с Thunder HEsl-T мысли о создании на ее основе rackmount-модуля в голову уже не приходят -- это классическая серверная материнская плата, предназначенная для установки в большой серверный корпус. Плата у Tyan получилась более консервативная, чем у Intel, -- никаких PCI Riser, обычные слоты PCI, оба канала Ultra 160 SCSI-контроллера AIC-7899W выведены внутрь на два 68-контактных разъема (50-контактный отсутствует). Отношение к IDE тоже гораздо "лояльнее" -- присутствуют положенные по спецификации чипсета два разъема. Однако если отбросить некоторые особенности, то продукты эти можно считать практически равноценными. Мы бы сказали так: в ряде случаев сервер можно собрать как на одной, так и на другой плате, и по функциональности они будут примерно одинаковы, а иногда за счет своих особенностей одна из плат становится предпочтительнее. Например, внешний разъем SCSI в определенных случаях является преимуществом (можно подключить к нему, к примеру, ленточный накопитель), а в некоторых -- недостатком (нельзя "разнести" два массива SCSI-винчестеров на разные каналы без установки дополнительного контроллера).
Tyan Thunder LE-T
Естественно, никто ни у кого дизайн и идеи не заимствовал, но так уж вышло, что описания плат мы традиционно располагаем в алфавитном порядке (как по моделям, так и по производителям), поэтому о Thunder LE-T проще всего рассказывать, взяв за основу описание Supermicro P3TDLR. Обе платы сделаны на базе одного чипсета (ServerSet III LE3), обе предназначены для создания стоечных серверов ("косые" DIMM), да и по оснащению они довольно схожи. Впрочем, отличия все же есть: у продукта Supermicro по сравнению с платой Tyan присутствуют два добавочных слота PCI 32-бит/33 MHz, зато на Thunder LE-T установлен двухканальный SCSI-контроллер (против одноканального у P3TDLR). Есть еще одно различие -- интегрированный PCI-видеоадаптер (знакомый ATI Rage XL) на Tyan Thunder LE-T снабжен четырьмя мегабайтами памяти, а не восемью, как на плате Supermicro. Впрочем, для стоечного сервера это различие фундаментальным никак не назовешь -- скорее всего, и 2 MB было бы вполне достаточно. Таким образом, решение о приобретении того или иного продукта обусловливается исключительно потребностью в соответствующей оснастке: кому-то пригодятся дополнительные слоты PCI, кому-то -- второй канал SCSI-контроллера.
Двухпроцессорные платы с поддержкой P-III Tualatin
Модель Intel Server Board SCB2 Supermicro P3TDE6-G Supermicro P3TDL3 Supermicro P3TDLE Supermicro P3TDLR Tyan Thunder HEsl-T Tyan Thunder LE-T
Чипсет ServerSet III HE-SL ServerSet III HE-SL ServerSet III LE3 ServerSet III LE3 ServerSet III LE3 ServerSet III HE-SL ServerSet III LE3
Разъемы DIMM 6 4 4*** 6 4***
Слоты PCI
64-бит/66/33 MHz до 6** 2 2 2 2 4 2
64-бит/33 MHz - 4 - - - - -
32-бит/33 MHz до 3** - 4 4 2 2 -
Слот AGP Pro - + - - - - -
Слот ISA - - - + - - -
Сетевой чип Intel 82550PM Intel 82559 2 x Intel 82559 2 x Intel 82559
SCSI-контроллер, разъемы Adaptec AIC-7899W, 2 x 68-pin Adaptec AIC-7899W, 2 x 68-pin, 1 x 50-pin Adaptec AIC-7892, 1 x 68-pin - Adaptec AIC-7892, 1 x 68-pin Adaptec AIC-7899W, 2 x 68-pin
Интегрированное PCI-видео ATI Rage XL, 8 MB - - - ATI Rage XL, 8 MB ATI Rage XL, 4 MB
Размер Flash, MB* 8 4 4
Формат, размеры, мм Ext.ATX, 305 x 330 Ext.ATX, 305 x 330 Full ATX, 305 x 267 Ext.ATX, 305 x 330 ATX, 305 x 244
Гарантия, мес. 36 36 36 36 36 36 36
Ориентировочная цена, $ 640 650 530 380 650 605 520
* Все платы оснащены AMI BIOS.
** Зависит от типа и количества установленных карт PCI Riser.
*** Разъемы DIMM наклонены под углом 25°.
Тестирование
Слово "серверный" в названии статьи не случайно было взято в кавычки. Да, казалось бы, Intel позиционирует P-III Tualatin исключительно для рынка серверов. А теперь, внимание, вопрос: на чем нам строить мощную рабочую станцию, если производительности двух P-III Coppermine 1 GHz уже недостаточно? На P4 Xeon? С радостью бы, только где же его взять-то, долгожданного?! На P-III Xeon? А какой смысл -- частоты только 700 и 900 MHz, поддержка только FSB 100 MHz, а от большого кэша польза есть далеко не во всех workstation-приложениях. На Athlon MP? В принципе, pourqois pas, но далеко не все еще решаются на такую альтернативу. Поэтому что нам мешает построить, например, станцию видеомонтажа на платформе из ServerSet III HE-SL и двух P-III Tualatin 1,26 или 1,4 GHz (скажем, с PCI-видеокартой класса Matrox G450, что многие и делают)? Или даже недорогую графическую или CAD-станцию на тех же двух "туалатинах" и материнской плате на VIA Apollo Pro133T/266T? По-видимому, ничто особо не мешает. По крайней мере, при установке в "правильные" платы (а кто же после прочтения этого материала будет устанавливать в неправильные?) гарантию на процессоры мы не потеряем. Исходя из вышесказанного, мы соответствующим образом построили методику оценки производительности P-III Tualatin в дуальных системах. Использовавшиеся в качестве тестов приложения скорее относятся к "настольным" или "рабоче-станционным", чем к серверным. Однако отметим, что среди них есть и достаточно тяжелые, весьма активно нагружающие ALU/FPU обоих процессоров и подсистему памяти. Вообще наша методика оценки производительности претерпела серьезные изменения: обновление ОС, апгрейд приложений и расширение их набора в сторону "утяжеления" выполняемых задач. За подробным описанием новой методики мы отсылаем читателей на страничку Тестовой лаборатории на ITC Online, здесь же отметим лишь основные моменты:
переход на Windows XP Professional;
обновление приложений: 3DS Max 4.2 (SP1), LightWave 7b, Photoshop 6.0.1 (с P4 Update);
ввод новых тестов -- например, рендеринг в A|W Maya.
И перед тем как перейти непосредственно к тестам, огласим цель нашего тестирования. Здесь не будет сравнения платформ Intel и AMD, не будет и "тараканьих бегов" плат на одном чипсете. Мы хотим лишь оценить то, насколько процессоры P-III Tualatin частот 1,13 и 1,26 GHz более производительны в дуальных системах по сравнению со старшим из Coppermine -- P-III 1 GHz. А результаты позволят оценить привлекательность новой волны плат и то, стоит ли выделки вся эта более дорогая овчинка. Также мы проведем небольшое сравнение быстродействия плат на двух представленных чипсетах ServerWorks -- ServerSet III LE3 и ServerSet III HE-SL.
Основой для тестовых платформ служили две материнские платы Tyan, первыми появившиеся в редакции: Thunder LE-T и Thunder HEsl-T. Конфигурации систем включали один или два процессора P-III 1/1,13/1,26 GHz, 1 GB памяти Registered PC133 SDRAM, жесткие диски Cheetah X15 36LP (ST336752LW, Ultra320 SCSI, 15000 об/мин, 8 MB кэш) и встроенные графический и сетевой адаптеры. Для начала мы опишем еще один критерий оценки, который не отражен в диаграммах, но по-своему весьма интересен -- мы назвали его "КПД большого кэша". Выводится он просто: сначала подсчитывается, насколько в каждой задаче Pentium III-S 1,13 GHz быстрее, чем Pentium III 1 GHz. Потом аналогичное соотношение вычисляется для пары P-III-S 1,26 GHz и P-III-S 1,13 GHz, после чего из первого значения просто вычитается второе. P-III-S 1,13 GHz по частоте выигрывает у P-III 1 GHz ровно столько же, сколько P-III-S 1,26 GHz -- у P III-S 1,13 GHz. Но разница состоит в том, что в первом случае происходит увеличение частоты и объема L2-кэша, во втором же -- только увеличение частоты. Соответственно, данный коэффициент позволяет приблизительно оценить то, насколько удвоение L2-кэша влияет на производительность по сравнению с простым увеличением тактовой частоты.
3D Studio MAX
Несмотря на переход на обновленную версию, это приложение никаких сюрпризов не преподнесло: как и всегда, производительность при рендеринге существенно повышается при установке второго процессора, впрочем, и частота также дает стабильный прирост. Более интересно сравнивать графики одно- и двухпроцессорных систем между собой -- четко видно, что прирост каждого следующего по мощности CPU по отношению к скорости предыдущего на системах с одним процессором ощутимо выше. Как нам кажется, в случае с двухпроцессорными системами производительность просто становится настолько высока, что дальнейший рост скорости обусловливается уже не частотой или количеством CPU, а подсистемой памяти и полосой пропускания процессорной шины. А эти параметры в дуальных системах на платформе Socket 370, к сожалению, "апгрейду" уже не поддаются. "КПД большого кэша" в случае 3DS MAX не очень высок -- около 7%.
LightWave
Мы приводим для LightWave две диаграммы, и это неспроста. Как оказалось в процессе отработки новой методики, влияние SMP на производительность может изменяться не только от приложения к приложению, но даже в зависимости от конкретной сцены, рендеринг которой оно осуществляет. Доказательства -- налицо: при рендеринге стандартной тестовой сцены Radiosity_ReflectiveThings, не содержащей полупрозрачных объектов, прирост от использования SMP достигает 45%, т. е. почти двукратный. Однако при смене сцены на другую (Tracer-Radiosity) на той же системе ускорение от второго процессора равняется... всего 18%. Вывод очевиден: даже в рамках одной программы флуктуации производительности SMP-систем могут быть весьма велики. Что же касается результатов LightWave, то они очень похожи на результаты 3DS MAX, с той лишь поправкой, что польза от SMP в целом меньше, а в отдельных случаях -- совсем небольшая.
A|W Maya
Прирост производительности от использования SMP в Alias|Wavefront Maya 4.0.1 столь же велик, как и в 3DS MAX, -- порядка 90%, т. е. практически двукратный. Диаграммы с результатами этих приложений за одним исключением похожи, и даже подмеченная нами в 3DS MAX ситуация, когда скорость рендеринга в SMP-системах с высокочастотными процессорами "упирается" в пропускную способность процессорной шины и памяти, повторяется и здесь. Единственным (но весьма существенным) различием является разница в производительности CPU с объемом L2-кэша 256 KB и 512 KB. "КПД большого кэша" в пакете Maya один из самых высоких в данном тестировании -- 20% в одно- и 23% в двухпроцессорных системах. Наверняка это связано с различиями в реализации алгоритмов рендеринга в этих пакетах.
Adobe Photoshop
Новая методика тестирования в Photoshop 6.0.1, разработанная одним из наших читателей, теперь включает в себя три скрипта, отличающихся друг от друга не только временем исполнения, но и "концептуально". Первый скрипт создает файл среднего размера (порядка 40 MB) и работает с его содержимым, используя как фильтры, так и команды Photoshop. Второй применяет только фильтры к файлу относительно большого размера (80 MB), третий -- опять-таки использует только фильтры, но размер файла составляет 20 MB. Под командами в данном контексте мы подразумеваем операции, не входящие в меню Filters, т. е. изменение размера изображения, вращение, операции с цветом, слоями и т. п. По результатам легко заметить два момента: то, какие операции в Photoshop лучше всего "заточены" под SMP (самый большой прирост наблюдается в первой диаграмме, т. е. в тесте, где кроме фильтров используются еще и команды), и то, насколько этому приложению "помогает" увеличение размера L2-кэша. По "КПД большого кэша", который составляет до 25%, Photoshop занимает первое место в этом тестировании. Кстати, в отличие от SMP, удвоенный L2-кэш лучше всего показал себя именно при работе с фильтрами.
DivX (AVI-->DivX)
От свободно распространяемого мультиплатформенного кодека DivX 4.12 трудно было ожидать SMP-оптимизации -- в мире freeware такое встречается редко. Поэтому рассматривать кодирование AVI-->DivX с точки зрения SMP мы не будем, а просто скажем, что польза от второго процессора практически нулевая. Более интересно то, что под это же определение ("практически нулевая польза") попадает не только увеличение количества CPU... но и увеличение частоты! Результаты P-III-S 1,13 GHz и 1,26 GHz, как легко заметить, почти идентичны. О возможной причине внимательные читатели уже, наверное, догадываются -- скорее всего, узким местом становится не мощность вычислителя, а скорость поступления данных, т. е. работа с ОЗУ. К слову, превосходные результаты, которые почти во всех приложениях класса media-encoding показывает Pentium 4 с егодвухканальной RDRAM (3,2 GBps), косвенно подтверждают наши предположения. А вот большой кэш, как это часто бывает при медленной памяти, показал себя весьма неплохо -- его "КПД" для DivX составляет порядка 20%.
MP3-кодек GOGO (WAV-->MP3)
Буквально в предыдущем абзаце мы писали, что всевозможные "хитрые оптимизации" freeware-сообществом не очень любимы... но тем приятнее выглядят исключения из этого правила! Кодек GOGO-no-coda 2.39c сменил в нашей методике LAME именно по причине того, что он оптимизирован буквально "под все" -- поддерживаются MMX, 3DNow!, SSE и даже многопроцессорные системы! Результаты несколько неоднозначны -- в случае с одним процессором мы наблюдаем высокий "КПД большого кэша" (15%) и довольно малую зависимость производительности от частоты, но при переходе на SMP все происходит с точностью до наоборот. Предположения... перефразируя известное изречение -- "чужой код -- потемки". Однако "открытие" MP3-кодека, умеющего использовать многопроцессорность, стало для нас в любом случае приятным событием.
WinAce
Архивирование с помощью WinAce с 4-мегабайтовым словарем и максимальной степенью сжатия является нашим традиционным "реальным" тестом на производительность подсистемы памяти. Однако в данном случае хорошо заметно, что на платформе Socket 370 эта подсистема просто не в состоянии обеспечить требуемой для данного приложения скорости. То преимущество, которое получили P-III-S 1,13 и 1,26 GHz, связано исключительно с тем, что 512-килобайтовый кэш позволил им немного "сгладить" недостатки "бутылочного горлышка" в лице шины памяти (это подтверждается тем, что их результаты практически одинаковы). Что же касается SMP, то четко видно, что WinAce не поддерживает многопоточность. Впрочем, это вполне естественно -- все-таки архиваторы не относятся к группе приложений, где такой вид оптимизации широко распространен.
ServerSet III: HE-SL vs. LE3
Легко заметить, что сравнение производительности этих чипсетов вошло в диаграммы в весьма усеченном виде -- результаты ServerSet III LE3 присутствуют только на двух. Связано это с тем, что только в DivX и WinAce их скорость различается на хоть сколько-нибудь пригодную для рассмотрения величину -- во всех остальных случаях она практически идентична. Выводы из этого могут быть двоякими и зависят больше от степени оптимизма (или же, наоборот, пессимизма) того, кто, собственно, будет их делать. Мы дадим оба варианта. Оптимист скажет, что производительность LE3 и HE-SL, несмотря на то что последний считается более мощным (и дорогим), одинаковая, а стало быть, "зачем платить больше?". Пессимист же посетует, что двухканальный контроллер памяти HE-SL так и не смог себя показать в подавляющем большинстве приложений.
Выводы
Учитывая достаточное, по нашему мнению, количество фактического материала и комментариев к нему, выводы могут быть довольно лаконичны. Intel продолжила линейку CPU для многопроцессорных систем нижнего и среднего уровня, и показали себя "новички" с самой лучшей стороны. Жизненный цикл у платформ для серверов и рабочих станций гораздо больше, чем у десктопов (как правило, порядка двух лет), и новые Pentium III-S пришлись как нельзя кстати -- они продемонстрировали вполне достойную производительность по сравнению со "старичком" Coppermine, а значит, платформа "будет жить". Перспективы также известны -- в недалеком будущем мы увидим Pentium III-S частотой 1,4 GHz (и наверняка с еще более высокой), и недорогие серверы, включая компактные 1U/2U, явно не останутся без процессоров. Понятно, что будущее рабочих станций за Intel Xeon на ядре Pentium 4. Но те, кто сейчас не хочет платить немалые деньги за "новомодного журавля", получили в руки вполне реальную "синицу", имеющую достойную производительность, сравнительно невысокую цену и все преимущества новой 0,13-микронной технологии: малую потребляемую мощность и слабый нагрев.
К слову, есть у серверных Tualatin и еще один плюс. Они олицетворяют собой классический эволюционный путь развития со всеми его прелестями: предсказуемостью, отлаженностью архитектуры, поддержкой со стороны производителей ПО и, в конце концов, просто-напросто хорошей репутацией устоявшегося, стабильного решения, все "подводные камни" которого либо давно устранены, либо хорошо известны.
Тесты см. по ссылке выше.