Разгоняем Celeron II

10 декабря 2000 в 00:00 | Today_and_all_counter

Несмотря на многочисленные попытки Intel препятствовать разгону своих процессоров, они до сих пор остаются лучшими в этом смысле. До тех пор пока Intel не получит реальные проблемы с пользователями, разогнавших свой процессор, на индивидуальном уровне, она не будет сильно препятствовать процессу разгона.

Появление процессоров построенных по 0.18мкм технологии, способных квалифицированно охватывать частотный диапазон от 500МГц до беспрецедентного 1ГГц, неизбежно приводит к желанию достигнуть максимального предела технологии для Low End моделей. Все 0.18мкм процессоры Intel были получены из Pentium III основанного на ядре Coppermine с 256KB интегрированного на кристалл кэш второго уровня, работающим на полной частоте процессора. Из опыта разгона младших (по частоте) Pentium III Coppermine известно, что 500-600МГц версии беспрепятственно достигают частот 667-800МГц, только за счет поднятия частоты FSB. Но какое к этому всему отношение имеет Celeron II или как его еще называют Celeron FC-PGA?

Этот процессор базируется на варианте coppermine ядра, называемым copermine 128. Его основное отличие это уменьшенный в два раза кэш второго уровня. Несмотря на это и ряд других различий, это ядро так же изготавливается по 0.18мкм технологии, что дает право, надеется, на неплохие возможности разгона. На сегодняшний день выпущены версии 533А, 566 и 600МГц Celeron II, работающих на частоте системной шины 66МГц. При поднятии частоты до 100МГц, теоретически можно достигнуть частот 800-900МГц.Выпуская новый Celeron, Intel специально опустила частотный диапазон, что бы быть верной традициям. Celeron - это Low End процессор, и его частота должна соответствовать его уровню.

Первоначально нам стало известно о выпуске 566 и 600МГц версии, но потом выяснилось о выпуске еще и так называемой переходной версии 533A, предназначенной соединить промежуток между предыдущим и современным поколением процессоров. Для лучшего понимания этого давайте вспомним, как развивалось семейство Celeron. Первые процессоры без кэш памяти были выпущены в версиях 266 и 300МГц. Далее компания выпускает процессор с установленным на модуле процессора 128KB кэш второго уровня. Это поколение процессоров выпускалось в версиях 300 и 333МГц. Так вот 300МГц версия являлась переходной и носила название Celeron 300A.

Точно такая же ситуация сложилась сейчас. Есть процессор 533 и есть 533А. Celeron 533A - очень интересная версия т.к. имеет множитель 8.0, который при работе на 100МГц позволяет получить реальные 800МГц. 600МГц версия (9.0х) позволяет получить частоту 900МГц, что не совсем реально на сегодняшний день.

Процессор

Частота ядра МГц

Частота системной шины МГц

CPUID1

266

266

66

065xh

300

300

66

065xh

300A

300

66

066xh

366

366

66

066xh

400

400

66

066xh

433

433

66

066xh

466

466

66

066xh

500

500

66

066xh

533

533

66

066xh

533A

533

66

068xh

566

566

66

068xh

600

600

66

068xh

Когда мы получили первую информацию о coppermine 128, мы ожидали получить производительность сравнимую со стандартным coppermine ядром, т.к. уменьшение объема кэш памяти не должно привести к значительному уменьшению производительности в каждодневных приложениях. Реально же мы увидели серьезное падение производительности по сравнению с Pentium III, работающим на той же частоте. Причин этому несколько.

Во первых, частота системной шины и шины памяти 66МГц. Это приводит к 4-13% падения производительности по сравнению со 100МГц шинами.

Во вторых, кэш память. Причем здесь имеет влияние не столько объем, сколько схема по которой работает кэш L2. Для того, что бы показать разницу между двумя процессорами Celeron 566 и Pentium III 550E, мы воспользовались программой WCPUID от H.Oda.

Обратите внимание на различия. Celeron показывает значение латентности кэша второго уровня равное 2, а Pentium III показывает значение латентности кэша второго уровня равное нулю.  В то время как это могло бы несколько объяснить падение производительности, мы имеет одно большое несоответствие между этими двумя рисунками. Дело в том, что WCPUID фактически не верно определяет латентность кэша.

Согласно Intel, Coppermine128 и Coppermine ядро имеют одинаковую латентность. Значит, имеется еще что-то влияющее на производительность. С помощью той же программы мы посмотрим на подробную информацию о кэш памяти для обоих процессоров.

Обратите внимание на различия сейчас. Celeron имеет ассоциативный кэш с 4-путями, а Pentium III имеет ассоциативный кэш с 8-путями. Для того, что бы понять разницу необходимо сначала вспомнить основные принципы работы кэша. Кэш второго уровня является пересылочным пунктом, данных между кэш памятью первого уровня и системной памятью (или другими источниками данных). Когда процессор запрашивает данные, он сначала ищет их в кэш памяти первого уровня. Если ему удается отыскать их там, то это называют удачным совпадением, если нет, то он обращается к кэш памяти второго уровня. Если здесь данных нет, то процессор обращается к памяти. А зачем все это надо.

Дело в том, что рабочая частота процессора в несколько раз выше скорости работы системной памяти. Отсутствие кэш памяти работающей на скорости процессора привело бы к большим задержкам и резкому снижению производительности. Кэш по существу отображает строки кэш второго уровня к множественным адресам системной памяти (номер которых определен в специальной зоне кэш L2). Имеется несколько методов отображения.

Прямой отображенный кэш делит системную память на множество разделов равного объема, каждый отображается к одной строке кэш L2. Красота прямого отображения состоит в том, что этот метод имеет высокую скорость и эффективность, т.к. все организовано в равные разделы. Но здесь есть и отрицательные эффекты – уменьшение вероятности совпадения, потому что этот метод не учитывает никакого смещения в сторону часто используемых областей памяти.

Существует еще т.н. полностью ассоциативный метод отображения, который является противоположным предыдущему. Вместо деления на одинаковые разделы, отображение происходит к индивидуальным строкам, что делает действия кэша, как действие с большим количеством динамических объектов, который учитывает строку кэш, которая отображена к любому разделу системной памяти. Такая гибкость позволяет получить высокую степень совпадения, но и не имеется никакой организованной методики отображения, что приводит к снижению скорости.

Собрав все лучшее от обоих методов получаем, т.н. наборный ассоциативный кэш, который используется сегодня во всех процессорах. Эта методика делит кэш на различные разделы, упомянутые как наборы. Каждый набор содержит множество строк кэша. Набор с 4 путями кэш второго уровня содержит 4 строки кэша, с 8 путями – восемь. Красота этого метода состоит в том, что он действует так же быстро, как и прямой метод, только вместо одной строки он содержит х строк. В случае Coppermine Pentium III и Coppermine128 Celeron, набор с 8 путями Coppermine Pentium III позволяет получить большую вероятность совпадения, чем кэш с 4 путями Coppermine128 Celeron. 

256KB L2 кэш на Coppermine Pentium III так же приводят к увеличении вероятности совпадения. Это и объясняет различия в производительности между Pentium III и Celeron.

Системные платы

Для пользователей системных плат на базе чипсета BX, новый Celeron, будет, наверное, лучшим решением, т.к. позволяет получить из Вашей системы максимум возможного без модернизации на 133МГц платформу. Если Ваша системная плата не поддерживает множители 8.0, 8.5, и 9.0x, необходимые для нового Celeron, все равно все будет работать. Максимум, что Вам потребуется сделать это обновить BIOS. Помните, множитель устанавливается внутри процессора, системная плата может только предложить воспользоваться каким либо. Процессор сам диктует, какой множитель будет использовать системная плата. Для нашей BX тестовой системы мы использовали плату ABIT BE6, которая не имеет обновления BIOS, официально поддерживающего новые Celeron.

Несмотря на это, мы не имели ни каких проблем в течении наших испытаний, но это не означает, что в любом другом случае установка может обойтись без проблем. Наш совет, прежде чем приступать к модернизации удостоверьтесь, что для Вашей платы есть обновление BIOS.

Для VIA 133A тестовой платформы мы использовали плату ASUS P3V4X. 

Для подключения FC-PGA Celeron на плату Slot-1, мы воспользовались конвертером Microstar MS-6905Master поддерживающим FC-PGA процессоры.  Если Вы планируете использовать конвертер, или плату Socket 370, удостоверьтесь, что они имеют поддержку FC-PGA.

Кандидаты

В наших испытаниях мы будем работать с двумя процессорами OEM Celeron 600 и OEM Celeron 566. 

На всех процессорах мы использовали стандартные комбинированные кулеры, которые идут в коробочном варианте всех Celeron и FC-PGA Pentium III процессоров. Нельзя сказать, что этот кулер лучший, но его вполне хватает для большинства задач.

Сначала мы попробовали запустить Celeron 600 на частоте системной шины 100МГц, что должно было позволить получить рабочую частоту 900МГц. Результат был не утешителен. Фактически нам удалось получить только 750МГц с частотой FSB 83МГц. При этом напряжение ядра осталось прежним 1.50v. Для увеличения стабильности равной оригинальной 600МГц версии нам пришлось поднять рабочее напряжение до 1.55v. К счастью, наш Celeron 566МГц оказался более разгоняемым, на частоте 100МГц FSB, нам удалось получить 850МГц. При этом рабочее напряжение пришлось поднять до 1.65МГц. Заметим, что стандартное напряжение Pentium III 850 так же равно 1.65v. Увеличивая FSB до 112МГц, нам удалось получить 952МГц, при рабочем напряжении 1.70v. Для увеличения стабильности системы, тестируемой в течение 48 часов, оказалось, необходимо поднять напряжение до 1.75v.

Испытания

Windows 98 SE испытательная система

Аппаратное обеспечение

Процессоры

Intel Celeron 600
Intel Celeron 566
Intel Pentium III 800E
Intel Pentium III 700E
Intel Pentium III 600E

Intel Pentium III 1.0EB
Intel Pentium III 866EB
Intel Pentium III 800EB
Intel Pentium III 733EB
Intel Pentium III 667EB
Intel Pentium III 600EB

AMD Athlon 1000
AMD Athlon 950
AMD Athlon 900
AMD Athlon 850
AMD Athlon 800
AMD Athlon 700
AMD Athlon 600
AMD Athlon 500

Системные платы

ABIT BE6

ASUS P3V4X

ASUS P3V4X

ASUS K7V-RM

Системная память

128MB PC133 Corsair SDRAM

128MB PC133 Corsair SDRAM

128MB PC133 Corsair SDRAM

Жесткий диск

IBM Deskstar DPTA-372050 20.5GB 7200 RPM Ultra ATA 66

CDROM

Phillips 48X

Видео карта

NVIDIA GeForce 256 32MB DDR (default clock - 120/150 DDR)

Программное обеспечение

Операционная система

Windows 98 SE

Видео драйвера

NVIDIA GeForce 256 - Detonator 3.76 @ 1024 x 768 x 16 @ 75Hz
VIA AGP GART Drivers v3.59 was used for all VIA based boards

 

Здесь мы видим посредственную производительность Celeron 566/600 под Content Creation Winstone 2000, достигающих конкурентоспособных уровней при поднятии частоты FSB до 100МГц. В этом случае производительность Celeron 850 достигает уровня Pentium III 800E. Увеличивая частоту шины до 112МГц, позволяющей получить из Celeron 566, Celeron 952 на BX платформе, мы получаем достаточно шуструю систему, способную конкурировать с 1ГГц Athlon.

Здесь мы имеем практически идентичное распределение. Celeron 850МГц несколько быстрее Pentium III 700E, но сильно отстает от Pentium III 800E. На 952МГц мы опять видим очень мощное решение стоимостью $188, сравнимое с 950МГц Athlon, который превосходит copermine ядро более развитой архитектурой, позволяющей оптимально использовать ресурсы процессора. Из этих испытаний становиться ясно, что говорить о работе на 133МГц шине процессора Celeron, не приходится. Отсюда следует, что платформа VIA Apollo Pro 133A не совсем идеальна для наших испытаний, за исключением, тех плат, где имеется возможность оставить частоту FSB 100МГц, а частота шины памяти 133МГц.

Здесь мы наблюдаем влияние графической карты GeForce. Поэтому результаты практически одинаковы.

Заключение

FC-PGA Celeron оказался не плохим процессором в плане разгона. Мы смогли действительно получить неплохой прирост производительности при сохранении практически нормальных условий эксплуатации.