Рейтинг@Mail.ru

Тестирование процессора Intel Pentium 4 1.7GHz: Кто быстрее Pentium 4 или Athlon?

31 мая 2001 в 00:00 | Всего прочтений: 17088

Введение

По общему признанию, мы были весьма резки в адрес Pentium 4 в нашем первом обзоре, но на это были свои причины. Несмотря на всю внушительность, его архитектура не давала реального увеличения производительности по сравнению с более дешевым Athlon или даже старшими моделями Pentium III в некоторых случаях. Фактически, запуск Pentium 4 очень напоминает запуск предыдущих процессоров. Вспомните, выпуск процессоров 386, 486, Pentium и Pentium Pro встречался так же с большим скептицизмом, поскольку ни один из них не предлагал существенного увеличения производительности по сравнению со своим предшественником. Однако, в конечном счете, каждая архитектура преобладала над предыдущей.

Практически во всех обзорах Pentium 4 упоминаются два основных условия успеха Pentium 4. Во-первых, прикладной спрос на новую архитектуру; если приложения будут оптимизированы под NetBurst архитектуру, тогда Pentium 4 будет популярен. В настоящее время, большинство приложений оптимизированы под P5 и P6 архитектуру, которая существует уже более 9 лет (по сравнению с 1 годом жизни NetBurst ).

Вторым условием является необходимость достичь очень высокой тактовой частоты. С Гипер конвейерной технологией процессор выполняет меньше операций за такт, поэтому, что бы реально превзойти предшественников тактовая частота должна составить более 1.5GHz.

Несмотря на небольшой возраст Pentium 4 и отсутствие оптимизированных под него приложений, недавно Intel объявила первое существенное поднятие частоты.

Доллары и центы

С увеличением таковой частоты Intel стремится максимально снизить цену на Pentium 4. В течение мая мы должны увидеть снижение цены на Pentium 4 1.7GHz до отметки ниже $400.  В то время как эта цена все еще будет на $100 выше AMD Athlon-C 1.33GHz, она будет конкурентно способна, по сравнению с тем, что было в ноябре 2000 года.

Intel также помогает снижать полную стоимость Pentium 4 системы, поставляя 2 x 64MB PC800 RDRAM RIMM модуля памяти в боксовых версиях процессора. Кроме того, Pentium 4 может комплектоваться большим объемом памяти, так же как и без нее, т.к. цены на память продолжают падать.

Также, глядя на цены системных плат основанных на чипсете i850, мы видим еще одно усилие Intel для продвижения Pentium 4. Если посмотреть наш последний обзор мирового рынка, можно увидеть, что разница между ASUS P4T (i850) и ASUS A7M266 (AMD 760) составляет всего $6. При этом затраты на производство i850 плат вдвое выше, чем AMD 760. Это означает, что Intel, видимо, датирует производителей, что бы заполнить рынок Pentium 4 системами.

Несмотря на такие усилия, имеется несколько препятствий, которые лежат на пути Intel. Одна заключается в требовании Pentium 4 нового питания (ATX12V). Хотя большинство системных плат позволяют работать без 4-pin ATX12V разъема, Intel очень не рекомендует делать это.

Другой проблемой, сдерживающей снижение цен на Pentium 4, является большой размер кристалла. Но такая ситуация сохранится до третьего квартала этого года, когда выйдет 0.13-мкм Pentium 4.

С ценовой точки зрения Pentium 4 пока еще далек от AMD Athlon – однако по сравнению с ноябрем 2000 года ситуация значительно улучшилась. И сегодня нет причин для ухудшения ситуации, все будет только улучшаться.

С появлением третьих производителей Pentium 4 чипсетов, непрерывно уменьшающихся цен на RDRAM, и «наступающим» 0.13-мкм ядром Northwood, Pentium 4 платформа станет лидирующей в самом ближайшем времени.

Теперь посмотрим на 1.7GHz

Pentium 4 1.7GHz не имеет никаких изменений по сравнению с версиями 1.3, 1.4 и 1.5GHz. Ниже мы представили краткий обзор его спецификаций.

Hyper Pipelined Technology –Pentium 4 имеет намного более длинный конвейер, чем Pentium III или Athlon. К сожалению, это означает, что Pentium 4 выполняет меньше инструкций за такт, однако это позволит ему работать на очень высокой тактовой частоте, компенсируя меньшее количество действий за такт. Это приводит к получению большого увеличения производительности по сравнению с предшественниками. Эту особенность можно продемонстрировать на примере Pentium III, который достиг частоты 1GHz на 0.18-мкм ядре, в то время как Pentium 4 достиг 1.7GHz на 0.18-мкм ядре.  И, как Вы увидите ниже, имеется явное различие производительности.

Improved Branch Prediction – Очевидно, что с таким длинным конвейером необходимо иметь улучшенный модуль предсказания перехода (BPU). Отсутствие подвинутого BPU в процессоре Athlon несколько сдерживало его производительность. К счастью, улучшенный BPU появится в наступающем ядре AMD Palomino.

Rapid Execution Engine – Два ALU (Арифметико-логические модули: обрабатывают целочисленные операции) Pentium 4 позволяют передавать вдвое больше данных за такт, и идентичны ALU работающему на 3.4GHz.  Это необходимо для обеспечения высокой производительности целочисленных операций, т.к. они очень восприимчивы к неправильно предсказанному переходу.

12K micro-op trace cache – Это специальный кэш заменяет и улучшает традиционный кэш инструкций первого уровня.  8-way set associative Execution Trace Cache кэширует micro-ops после того, как они были декодированы. Это помогает скрыть уменьшение производительности, вызванные длинным конвейером.

256KB Advanced Transfer Cache – Кэш второго уровня Pentium 4 является одной из интереснейших особенностей. Благодаря 256-bit внутренней шине к L2 кэшу, Pentium 4  1.7GHz, позволяет достичь пропускной способности 54.4GB/s к/от L2 кэш. В сравнении с Pentium III 1.0GHz, который предлагает пропускную способность 16GB/s и Athlon 1.33GHz который предлагает 10GB/s (Athlon имеет 64-bit шину к L2).

Hardware Prefetch –Pentium 4 способен предсказать, то какие данные будут востребованы прежде, чем они фактически потребуются, чтобы получить их из оперативной памяти и кладет их в кэш. В случае если эти данные не потребуются, это станет тратой пространство кэш памяти и уменьшение пропускной способности FSB/memory. 

Учетверенная 100MHz FSB + Двухканальный RDRAM –Pentium 4 работает на учетверенной 100MHz FSB, которая эквивалентна 400MHz FSB, с пропускной способностью 3.2GB/s.  Эта шина работает синхронно с двуканальным контроллером RDRAM

SSE2 –Pentium 4 предлагает дополнительные 144 SSE2 инструкции к обычным 70 SSE командам. Однако, даже под SPEC CPU2000, увеличение производительности, предлагаемое SSE2 оптимизацией, находится на уровне 5%.  Учитывая то, что SPEC CPU2000 является синтетическим тестом, маловероятно, что SSE2 дадут серьезное увеличение производительности в реальных приложениях. Единственное, на что необходимо обратить внимание, это факт, что модуль SSE2способе обрабатывать две 64-bit SIMD-Int и SIMD-FP команды. 

Температура и разгон

Pentium 4 1.7GHz имеет термодиод, считывающий температуру непосредственно с кристалла процессора. При этом температура равна температуре Athlon 1.33GHz.  Однако, как Вы знаете, Athlon не имеет интегрированного термодиода, что не позволяет считать реальную температуру кристалла. Это означает, что рабочая температура Pentium 4 1.7GHz ниже, чем Athlon 1.33GHz.

Во время наших испытание Pentium 4 1.7GHz не имел никаких проблем из-за перегрева.  Вы вообще не должны беспокоиться из-за перегрева процессора, если только не запускаете его без кулера.

К сожалению, мы не смогли провести испытания разгона Pentium 4  1.7GHz, т.к. ожидаем модификаций BIOS от нескольких производителей системных плат для правильного распознавания нового процессора.  Только Intel 850 и MSI 850 платы имеют BIOS распознающие 1.7GHz процессор.

Испытания

Тестовая система Windows 98SE / 2000

Аппаратное обеспечение

Процессоры

Intel Pentium III 1.0GHz

Intel Pentium 4 1.7GHz Intel Pentium 4 1.5GHz Intel Pentium 4 1.0GHz

AMD Athlon "Thunderbird" 1.33GHz AMD Athlon "Thunderbird" 1.0GHz

Системные платы

ASUS CUSL2

Intel D850GB

ASUS A7M266/A7V133/A7V

Память

256MB PC133 Corsair SDRAM (Micron -7E CAS2) 256MB PC2100 Corsair DDR SDRAM 256MB PC800 Samsung RDRAM

Жесткие диски

IBM Deskstar 30GB 75GXP 7200 RPM Ultra ATA/100

CDROM

Phillips 48X

Видеокарта

NVIDIA GeForce2 Ultra 64MB DDR (default clock - 250/230 DDR)

Сеть

Linksys LNE100TX 100Mbit PCI Ethernet Adapter

Программное обеспечение

Операционные системы

Windows 98 SE Windows 2000 Professional

Видео драйверы

NVIDIA Detonator3 v6.50 @ 1024 x 768 x 16 @ 75Hz NVIDIA Detonator3 v6.50 @ 1280 x 1024 x 32 (SPECviewperf) @ 75Hz VIA 4-in-1 4.29V was used for all VIA based boards

Тестовые продукты

Unreal Tournament 4.32 Reverend’s Thunder.dem Quake III Arena v1.27g demo127.dm3 Mercedes-Benz Truck Racing Timedemo Serious Sam Public Test 2 (Coop Party 04)

BAPCo SYSMark 2001 Benchmark Studio Beta 2.0 MusicMatch Jukebox 6.0 (MP3 Encoder Tests)

Cachemem Linpack

       

Cachemem – сравнение латентности

Неоднократно мы говорили, что архитектура Pentium 4 базируется на низкой латентности операций, но сегодня мы попробуем немного ближе исследовать это утверждение. Будем надеяться, что это позволит нам лучше понять производительность Pentium 4.

Cachemem - сравнение латентности
время в циклах
(меньше - лучше)

Data Size

Pentium 4 1.7GHz

Athlon 1.33GHz

4KB

1

1

8KB

2

4

16KB

2

4

32KB

19

4

64KB

19

4

128KB

19

20

256KB

25

20

512KB

281

202

1MB

289

202

2MB

292

229

4MB

292

238

8MB

295

241

16MB

297

244

32MB

297

245

Для лучшего понимания процессов, мы представили график и таблицу. Здесь необходимо обратить внимание, что data кэш L1 Pentium 4 (8KB) может в два раза быстрее обращаться к данным, нежели L1 data кэш (64KB) Athlon. В тоже время мы видим, что как только размер данных становиться больше 8KB, латентность драматично увеличивается с 2 до 19 циклов.  Напротив, большой data кэш Athlon позволяет поддерживать невысокую латентность до 64KB.  При достижении 128KB отметки латентность увеличивается до 20 циклов и находится на этом уровне до отметки 256KB. 

Помните, что Athlon имеет исключающую подсистему кэш памяти второго уровня, означая, что 256KB L2 предназначена только для данных, в то время как кэш Pentium 4 включает дубликат кэша первого уровня.  Хотя только 8KB кэша первого уровня дублируются в кэш второго уровня, это дает задержку на отметке 256KB, чем в процессоре Athlon, но всего на 5 циклов.

На уровне 512KB оба процессора исчерпывают драгоценный кэш, и теперь они полностью зависят от шины памяти. К счастью, Athlon делает переход к DDR SDRAM, которая делает 182 циклов задержки.  Однако Pentium 4 имеет большую RDRAM задержку в 271 цикл.

Если бы 0.13-мкм Pentium 4 (codename: Northwood) имел 512KB L2 кэш, было бы уменьшено влияние высокой латентности RDRAM. Это позволило бы , Pentium 4 сохранить высокий уровень производительности во многих современных приложениях.

Cachemem – сравнение пропускной способности кэш памяти

Хотя L1 кэш Pentium 4 имеет меньшую латентность, чем Athlon, AMD имеет 64KB интегрированной кэш памяти, что отмечается как преимущество AMD.  Как Вы можете видеть, Pentium 4 1.7GHz и Athlon 1.33GHz показывают похожую пропускную способность в режиме чтения из L1 кэш. Однако в режиме записи в кэш L1 Athlon показывает вдвое большую пропускную способность. 

Athlon имеет 64-bit шину к кэш L2, что ограничивает его производительность. В приложениях, зависящих от пропускной способности, Pentium 4 показывает огромно преимущество. В режиме чтения – 68%, в режиме записи более 40%. Меньшая латентность процессоров AMD, скрывает недостаток пропускной способности, т.к. большинство современных приложений чувствительны ко времени ожидания, а не к пропускной способности памяти.

Сравнение пропускной способности памяти

На этой диаграмме мы вновь видим, что Pentium 4 может грамотно использовать возможности RDRAM, в то время как Pentium III не мог воспользоваться преимуществом пропускной способности этого типа памяти. Кроме этого обратите внимание, что обе тестовые системы рекламируют большие значения, чем те, что получены в наших испытаниях.

Двухканальный PC800 RDRAM Pentium 4 обещает пропускную способность до 3.2GB/s, а реально показывает только половину от заявленного.  PC2100 DDR SDRAM на Athlon платформе обещает пропускную способность 2.1GB/s, и обеспечивает около 52% от этого значения.

С другой стороны в этих графиках нет ничего удивительного. Мы всегда говорили, что платформа Pentium 4 имеет большую пропускную способность памяти, чем любое конкурирующее решение.

В завершении нашего изучения пропускной способности памяти, мы используем тест Linpack.  Как Вы можете видеть, первая часть графика определена главным образом производительностью кэш памяти и, следовательно, тактовой частотой (в обоих случаях L2 кэш работает на тактовой частоте процессора).  Но мы не хотим сейчас говорить о частотном сравнении, т.к. тестовые процессоры имеют различную архитектуру. Вместо этого давайте рассмотрим различия в поведении архитектуры обоих процессоров.

Обратите внимание, что, несмотря на преимущество тактовой частоты, Pentium 4 не предлагает усовершенствования пропускной способности над Athlon для первых 128KB.  Это еще раз доказывает, что производить частотное сравнение Pentium 4 и Athlon не правильно.

На графике мы можем видеть небольшой участок, где оба процессора работают с данными в кэш памяти, и Pentium 4 имеет преимущество над Athlon.  Это преимущество объясняется более высокой пропускной способности подсистемы кэш памяти второго уровня. Но что самое интересное, этот небольшой участок показывает, что 64-bit шина кэш второго уровня Athlon не сильно влияет на производительность.

Последняя часть графика полностью отображает пропускную способность оперативной памяти и не сильно зависит от производительности процессора. Здесь же Вы можете видеть преимущество пропускной способности RDRAM над DDR SDRAM.

Теперь, когда мы сравнили латентность и пропускную способность между самыми быстрыми процессорами, давайте перейдем к тестам в реальных приложениях.

Производительность в Content Creation

Тест Internet Content Creation показывает явное преимущество процессора Pentium 4. Объясняется это тем, что практически все действия основаны на Windows Media кодера, который очень чувствителен к пропускной способности. Как Вы видели в наших предыдущих синтетических тестах, Pentium 4 имеет большую пропускную способность. Даже процессор Pentium III несколько опережает Athlon, благодаря большей пропускной способности кэш второго уровня. 

Обратите внимание, что различие между 1GHz и 1.7GHz составляет всего 1 секунду. С одной стороны это совсем не много, с другой, при выполнении сотни операций 1 секунда превращается в часы.

Рэйтинг Internet Content Creation так же демонстрирует предыдущую картину. Если Вы хотите подробнее разобраться с подробностями этого теста, рекомендуем посмотреть страницу http://www.bapco.com/sysmark2001overview.htm.

Производительность в офисных продуктах

Картина производительности резко изменяется, когда мы смотрим на SYSMark 2001 Office Productivity. Лидером здесь оказался Athlon 1.33GHz.  Но, различие времени ответа составляет всего 0.59s в сравнении с 0.99s в Internet Content Creation.  Это демонстрирует, что производительность в этом тесте ни как не масштабируется со скоростью процессора.

Результаты Office Productivity подтверждают наши подозрения, что Pentium 4 не очень хорошо масштабируется в этом тесте. Самое большое различие результатов наблюдается между процессорами Pentium 4 1.3GHz и 1.5GHz, и составляет 11%, в то время как переход к 1.7GHz увеличивает производительность на 4%. 

А увеличение на 33% тактовой частоты Athlon (1.0GHz -> 1.33GHz) приводит к 24% увеличению производительности. Без комментариев.

Полная и Постоянная вычислительная производительность

При измерении полной производительности Pentium 4 занял лидирующее положение из-за своего успеха в тесте Internet Content Creation.  Значение полной производительности Athlon 1.33GHz находится близко к Pentium 4 1.5GHz.

Тест Benchmark Studio позволяет максимально загрузить систему, выполняя одновременно 13 параллельных приложений. Среди запускаемых приложений имеются программы потокового видео, доступа к базам данных и exchange серверам. Как Вы можете видеть, здесь производительность не связана непосредственно с высокой пропускной способностью. Мы видим прямую зависимость от комбинации пропускной способности и латентности. 

Производительность в игровых приложениях

В Quake III Arena 1.7GHz P4 предлагает 20% преимущество над Athlon 1.33GHz, но мы не будем ограничиваться только Quake III Arena.

Так, в UnrealTournament мы видим драматичное изменение картины, где 1.7GHz Pentium 4 на 7% отстает от  Athlon.  Эти 7% не настолько значительны как 22% в Quake III Arena, но это дает нам право считать, что в игровых тестах не имеется явного победителя.

Под Serious Sam, относительно новая игра, Pentium 4 1.7GHz и Athlon 1.33GHz отделяют 2 fps.  Как Вы можете видеть, этот тест прекрасно масштабируется с увеличением частоты.

В нашем заключительном, игровом тесте мы видим, что  Pentium 4 еще раз становится лидером. Фактически, здесь все процессоры Pentium 4 занимают лидирующие места, отмечая архитектурные преимущества. А точнее, пропускную способность шины кэш память/оперативная память и высокую частоту FSB. 

Производительность в FPU/MP3 кодировании

Теперь мы переходим к звуковому испытанию, которое иллюстрирует более мощный FPU Athlon в стандартном x87 FP коде и т.к. MP3 кодирование не активно использует пропускную способность памяти, AMD заняла лучшие места. Здесь интересно отметить, что оптимизированный SSE2 кодер позволит увидеть, что истинная сила SSE2 будет заключена в его 64-bit SIMD-FP инструкциях.

Заключение

Итак, в заключении мы хотим еще раз отметить, что Pentium 4 наконец-то достиг частоты, на которой он может реально воспользоваться всеми преимуществами своей архитектуры и платформы. Но, несмотря на это, многих из Вас продолжает волновать один вопрос: Что же выбрать?

Описанные выше результаты позволят Вам достаточно четко определиться со своим выбором.

Если Вы занимаетесь обработкой изображений и видео, разработкой web приложений, Flash дизайном и т.д. то лучшим выбором можно считать Pentium 4.

Если Вы активно работаете с офисными продуктами: текстовые процессоры, базы данных, таблицы, интернет и электронная почта, то здесь лучше всего использовать Athlon, который помимо более высокой производительности, позволит Вам несколько сэкономить денег.

Самое сложное сделать выбор для игрового компьютера. Здесь мы видели смешанные результаты. В некоторых случаях (Quake III Arena, MBTR) лидером оказывается Pentium 4, в то время как в случае Serious Sam или Unreal Tournament – лидером оказывается Athlon. Здесь мы рекомендуем оценить Ваши потребности более точно, и уже потом остановить свой выбор на том или ином процессоре.

Где купить...

Мы благодарим компанию «FORUM Computers» (www.forum3.ru) за помощь, оказанную во время подготовки статьи. По вопросам приобретения последних моделей процессоров Pentium 4 и Athlon, а также компьютеров, основанных на базе этих процессоров обращайтесь по телефону в Москве: (095) 755-8111 (многоканальный). Полную контактную информацию и цены (в режиме on-line) Вы также сможете найти на сайте компании «FORUM Computers».