Следующий процессор, который должна представить публике корпорация Intel - это Katmai. Этот процессор нацелен на применение в компьютерах ценой порядка $2000, а значит, велика вероятность того, что кристалл окажется в нашей домашней или рабочей машине. На прошедшем недавно Microprocessor Forum стали известны некоторые подробности этой новой архитектуры. Сегодня наш рассказ пойдет о ней.
Процессор
Процессор Pentium II, основанный на ядре Katmai будет запущен в производство в начале 1999 года. Будет выпущено сразу две версии, предназначенные для установки в Slot 1, - с частотами 450 и 500 МГц. При производстве этих процессоров будет использован уже применяемый в настоящее время технологический процесс 0.25 мкм. Как и Deschutes, Katmai будет изначально работать со 100-мегагерцовой системной шиной и содержать L2-кэш объемом 512 Кбайт, функционирующий на половинной частоте ядра. Но, в отличие от своего предшественника, объем кэша первого уровня будет удвоен и достигнет 64 Кбайт, благодаря чему ожидается увеличение производительности кристалла на 5-10%.
В дальнейшем, ко второй половине 1999 года ожидается выпуск версии Katmai с частотой 533 МГц, выполненной по технологии 0.18 мкм и использующей новую системную шину 133 МГц. Эта внешняя частота будет поддерживаться в новом чипсете i440JX "Camino", который ориентирован на применение в системе оперативной памяти RAMBUS, поддержку AGP 4x mode и ATA-66. В старших моделях Katmai объем L2-кэша будет достигать 1 или даже 2 Мбайт.
Также Katmai можно будет использовать в уже имеющихся Slot-1 материнских платах на чипсете i440BX, но после перепрошивки BIOS.
Цена младшей 450-мегагерцовой модели на начальном этапе составит порядка $600.
Для более дешевых систем предусматривается создание своего рода Celeron-процессора на ядре Katmai, но с кэш-памятью второго уровня, также работающей на половинной частоте процессора, объемом 192 или 256 Кбайт. Возможно, L2-кэш в этой модели будет интегрирован в ядро, как у Mendocino. Есть мнение, что в этом кэше будет использована SDRAM, однако, есть серьезные сомнения в возможности ее работы на таких частотах.
В процессоре Katmai, Intel, кроме наращивания частот, увеличения объема кэша и применения нового технологического процесса, коснулся и изменения архитектуры. Основными нововведениями в Katmai, помимо уже применяемых в существующих Pentium II-процессорах динамического исполнения, специфичной шины P6 и технологии MMX, будут являться конкурентная архитектра SIMD-FP с набором команд KNI, новые инструкции MMX и поточная архитектура работы с системной памятью. Рассмотрим все по порядку.
KNI
Ключевым новшеством в архитектуре Katmai является добавление 70 новых команд процессора для работы с трехмерной графикой. Как и в 3DNow!, все эти команды предназначены для работы с числами одинарной точности с плавающей точкой (32-битные вещественные). Этот набор команд, названный KNI (Katmai New Instructions), как и MMX, является SIMD-инструкциями (Single Instruction Multiple Data), что наиболее соответствует потребностям 3D-обработки. Это означает, что одной такой операцией процессор может обработать несколько (пар) данных. Идея SIMD уже была использована AMD в процессоре K6-2, однако то, что предлагает Intel, отличается от технологии конкурента.
KNI оперируют с восемью новыми регистрами процессора, представляя собой еще один модуль, типа арифметического сопроцессора, названный SIMD-FP. Регистры SIMD-FP являются 128-битными и позволяют хранить в себе одновременно 4 числа с плавающей точкой одинарной точности. Таким образом, оперируя с двумя такими регистрами, возможно выполнить операцию одновременно над четырьмя парами аргументов. Эта идея позволяет достичь пиковой производительности одного конвейера SIMD-FP до 2 GFLOP/с при частоте ядра 500 МГц. Пока не ясно, сколько параллельных конвейеров будет содержать Katmai - 1 или 2, то есть в последнем случае пиковая производительность сможет достигнуть 4 GFLOP/с. Следует заметить, что пиковая производительность модуля 3DNow!, имеющего два конвейера и 8 64-битных регистров - 2 GFLOP/c.
Для работы с новыми регистрами, названными XMM0-XMM7, Intel ввел в Katmai дополнительный режим процессора (вспомним введенный 10 лет назад protected mode). Этот режим позволяет использовать SIMD-FP одновременно с MMX или арифметическим сопроцессором, так как они используют разные регистры. Как известно, именно по причине общих регистров, MMX одновременно с FP-сопроцессором работать не могут. Кстати, и модуль 3DNow! работает только отдельно от MMX и сопроцессора.
Однако, для использования нового режима, как и для поддержки KNI вообще, требуется поддержка со стороны операционной системы. Например, при переключении задач, система должна сохранять состояния регистров XMM0-XMM7. Хотя DirectX 6.0 и не поддерживает KNI, в отличие от 3DNow!, существует патч ядра Windows 98 для сохранения регистров SIMD-FP, а Windows NT 5.0 поддерживает KNI по умолчанию.
С 128-битными регистрами SIMD-FP оперируют новые инструкции KNI. Сказать что-то об их реализации сейчас нельзя, однако их набор содержит загрузку, запись, сложение, умножение, логические операции, модуль, квадратный корень и.т.п. То есть их набор похож на набор инструкций 3DNow!, но будет ли он быстрее, зависит от его реализации, а это станет понятно позже. Синтаксис инструкций KNI во многом повторяет на инструкции MMX. Также, учитывая то, что Microsoft уже предлагает библиотеки для их поддержки в своих компиляторах, KNI-инструкции быстро получат широкое распространение в среде разработчиков программного обеспечения.
KNI может использоваться не только в приложениях, связанных с 3D-графикой, но и в других задачах, требующих активных вычислений с плавающей точкой и не требующих большой точности. Например, распознавание речи, моделирование, объемный синтез звука, MPEG-кодирование и декодирование и т.д.
Тем не менее, несмотря на все свои преимущества, KNI вскрывает и многие недостатки архитектуры x86. А именно - аппаратное ограничение в 8 регистров приводит к тому, что некоторые приложения цифровой обработки сигналов не смогут быть оптимизированы под эту архитектуру. К тому же все операции в x86 - бинарные, а уже сейчас есть необходимость в вычислении функций типа скалярного произведения векторов, реализуемых в современных и дорогих графических процессорах. То есть, развитие KNI лежит, скорее всего, за пределами x86-архитектуры.
MMX
В стандартный модуль MMX процессора Katmai также внесено несколько дополнительных инструкций. В основном, они нацелены на облегчение задач распознавания речи и кодирования-декодирования видеосигнала. В их числе - сумма абсолютных значений разностей, вычисление среднего значения с округлением в меньшую сторону, нахождение минимума и максимума. Вот только на быструю поддержку этих команд девелоперами рассчитывать не приходится - MMX и так очень медленно двигается в жизнь, да еще и соответствующий инструментарий, использующий новые команды отсутствует.
Работа с памятью
Процессор Katmai также содержит усовершенствования шины P6 для поточного доступа к памяти.
Новый механизм предсказаний позволяет уменьшать задержки при последовательном доступе к памяти и исключает "забивание" кэша данными, которые используются однократно. Кроме того он определяет в какой из кэшей - в L1, во все или во все кроме L1 должны быть записаны данные для увеличения полосы пропускания. Новый мханизм может позволить обработку до восьми одновременных независимых запросов.
По обещаниям Intel, эти усовершенствования позволят поднять производительность еще на 5-20%, особенно при кодировании и декодировании MPEG-2.
Выводы
Intel подготовил достойный ответ AMD 3DNow!. Единственное, на что может уповать AMD в сложившихся условиях, так это на низкую цену своих процессоров. Очевидно, что проблем у Intel как с внедрением MMX уже не будет. Почва для KNI уже подготовлена. Разработчики программного обеспечения уже получили инструментарий для использования KNI и процессоры для тестирования. К моменту выхода Katmai, его возможности будут использоваться многими приложениями. А у AMD проблемы возникнут несколько позднее, когда придется встраивать KNI в свое ядро.
Выпуская 3DNow!, AMD сделал достойный ответ на интеловский MMX. Будем надеяться, что этот шаг Intel - KNI - окажется таким же сильным.
Процессор Intel Pentium III 500 МГц
Intel Pentium III:
чип, произведенный по технологии 0.25 мкм;
ядро Katmai, представляющее собой Deschutes плюс модуль SSE;
работает в Slot-1-системных платах, но требует обновления BIOS;
L1-кэш - 32Кбайта (16 - на данные, 16 - на инструкции);L2-кэш - 512Кбайт. Расположен вне процессорного ядра, но в
процессорном картридже, иработает на половинной частоте ядра;
процессорный картридж SECC2;
один конвейер SSE, работающий с набором из 70 инструкций, оперирующих четырьмя парами вещественных чисел одинарной точности одновременно;
напряжение 2В;
частоты - 450 и 500 МГц (системная шина - 100 МГц);
SSE поддерживается DirectX 6.1 и выше.
Практическое функционирование процессора Intel Pentium III.
Во-первых, необходимо иметь в виду, что для запуска системы на новом процессоре новая системная плата не требуется. Нужна обновленная версия BIOS, которую, предложили уже практически все производители системных плат. BIOS должен уметь правильно распознавать новое ядро и иметь соответствующий микрокод. Что касается напряжения питания Pentium III, то, вопреки всем ожиданиям, оно пока оказалось старым - 2 Вольта. Однако для поддержки будущих моделей Pentium III все же необходима материнская плата с питанием от 1.8 В - именно такое напряжение вскорости будут требовать эти процессоры. Новый процессор, как и все предыдущие Pentium II, работает на частоте системной шины 100 МГц. Умножение у него зафиксировано, поэтому разгон возможен только повышением частоты FSB.
Процессорный картридж - SECC2.
SECC2 - некое промежуточное звено между стандартным SECC и его полным отсутствием. SECC2-картридж лишился своей передней половинки, той самой, на которую навешивается кулер. В этом есть и еще один плюс. Теперь радиатор, обдуваемый вентилятором, соприкасается не с железной пластиной, прижатой к ядру, а непосредственно с микросхемой. Таким образом, отвод тепла в SECC2 поставлен лучше. Косвенным доказательством этого явился тот факт, что предоставленный нам образец Pentium III оборудован только игольчатым радиатором без вентилятора. При этом он нормально функционировал не только на штатной частоте 500 МГц, но и будучи разогнанным до 560 МГц (5х112 МГц).
Но и это еще не все. Вместо старого покрытия кристалла Plastic Land Grid Array (PLGA) теперь используется новый органический сплав на основе меди - Organic Land Grid Array (OLGA). Таким образом, и само ядро нового процессора обрело другое лицо. Результатом этого явилось его уменьшение, с одной стороны, и улучшение охлаждения за счет лучшей теплопроводности, с другой. Так выглядит теперь Pentium III без корпуса:
Номер
Вторым нововведением, наделавшим, явилось присваивание каждому процессору Pentium III серийного номера - уникального идентификатора. Любой процессор можно было однозначно идентифицировать, а следовательно, легко решить проблемы с аутентификацией пользователей и защитой процессоров от разгона. Благодаря специальному программному обеспечению этот номер также мог бы быть получен удаленно, через интернет.
19 октября 1998 года