Вплив зміни таймінгів оперативної пам'яті на продуктивність Athlon 64 2800+ на платформі з чіпсетом VIA K8T800

Вплив зміни таймінгів оперативної пам'яті на продуктивність Athlon 64 2800+ на платформі з чіпсетом VIA K8T800

04.06.2019 0 Автор admin

Сьогодні ми з вами проведемо невелике дослідження залежності продуктивності AMD Athlon 64 2800+ від зміни таймінгів оперативної пам'яті на платформі з чіпсетом VIA K8T800. Поставлена ​​задача не представляється складною, але перед проведенням тестування і аналізом його результатів все ж пропоную згадати теорію.

У порівнянні з чіпсетом NVIDIA nForce 3 150, поступово замінним на ринку більш просунутим NVIDIA nForce 3 250, чіпсет VIA K8T800 має перевагу у вигляді фірмової технології під назвою «Hyper8», по суті, представляє собою підтримку режиму шини HyperTransport між процесором і чіпсетом по 16 біт / 800 МГц в обидві сторони. Тоді як у NVIDIA nForce 3 150 обмін між процесором і чіпсетом здійснюється по шині 8 біт / 600МГц в одну сторону і 16 біт / 600МГц в іншу. Інша справа, що впливу на продуктивність, як позитивного, так і негативного, даний факт не робить зовсім, і в завершенні статті я ще раз скажу про це.

У вдосконаленій ж версії чіпсета компанії VIA для процесорів AMD Athlon 64 - VIA K8T800 Pro - швидкість шини HyperTransport збільшена до 1000MHz. Крім того введена можливість фіксації частот PCI / AGP - що є більш корисним нововведенням для оверклокінгу, ніж «прискорена шина».

До основних технічних характеристик чіпсета VIA K8T800 відносяться:

  • підтримка процесорів AMD Athlon 64, Athlon 64 FX, Opteron (будь-яких серій і під будь-які роз'єми);
  • AGP 8x;
  • двунаправленная шина HyperTransport до процесора з частотою 800 МГц при розрядності 16 біт в кожну сторону;
  • шина V-Link 8x (533 МБ / с) для зв'язку з південним мостом;
  • 2 канали на чотири пристрої Parallel ATA (ATA133);
  • підтримка двох пристроїв Serial ATA (SATA150);
  • підтримка ще двох пристроїв Serial ATA при використанні PHY-контролера (інтерфейс SATAlite);
  • V-RAID для створення RAID-масиву з SATA-пристроїв (JBOD, 0, 1, 0 + 1 - останній режим, зрозуміло, тільки при можливості підключення 4 SATA-накопичувачів);
  • 8 портів USB 2.0;
  • 6 пристроїв PCI;
  • MAC-контролер Fast Ethernet (до 100 Мбіт / с);
  • інтерфейс AC'97 для аудіокодеків (до 6 каналів);
  • інтерфейс MC'97 для модемних кодеків;
  • LPC-шина для підключення застарілої периферії.

(З огляду на дискретність чіпсетів VIA, необхідно додати, що функціональність південного моста дана для VT8237).

Отже, спочатку в процесі тестування зміни піддавалися наступні тайминги:

  • Затримка CAS # (TCL);
  • RAS # в CAS # Delay (Trcd);
  • Ряд предразряд (Trp);
  • Час циклу (Tras).

(Саме в такій послідовності тайминги і вказані на діаграмах).

Нагадаю короткий опис значень таймінгів оперативної пам'яті *:

CAS # Latency (tCL) - параметр, керуючий затримкою часу (за періодами синхронизирующих імпульсів) що відбувається досі коли пам'ять починає виконувати команду зчитування після її отримання. Також визначає значення «циклу таймера» для завершення першої частини пакетної передачі. Чим менше час очікування, тим швидше відбувається транзакція. Може приймати значення: 2; 2,5 і 3.

RAS # to CAS # Delay (tRCD) - опція, що дозволяє виставити затримку між сигналами RAS (Row Address Strobe) і CAS (Column Address Strobe). Простіше кажучи - затримка, яка відбувається коли щось записується, оновлюється чи зчитується в пам'яті. Природно, що зменшення даного параметра призводить до поліпшення продуктивності, а збільшення, навпаки, до її зниження. Вибір можна здійснити з значень: 2; 3 і 4.

Читай ще:   Ретро-фантазії: старовинні мобільні телефони в образі смартфонів

Row Precharge (tRP) - час попереднього заряду. Дана опція встановлює кількість циклів необхідних, щоб RAS нагромадив свій заряд перед оновленням SDRAM. Як правило, зменшення часу попереднього заряду покращує продуктивність SDRAM. Можна вибрати зі значень 2; 3; 4.

Cycle Time (Tras) - функція, що дозволяє змінити мінімальну кількість циклів пам'яті необхідних для Tras і Trc. Tras означає SDRAM`s Row Active Time (час активності ряду SDRAM), тобто період часу протягом якого ряд відкритий для перенесення даних. Також існує термін Minimum RAS Pulse Width (мінімальна тривалість імпульсу RAS). Trc, з іншого боку, означає SDRAM`s Row Cycle Time (цикл пам'яті / час циклу ряду SDRAM), тобто період часу протягом якого завершується повний цикл відкриття і поновлення ряду. У більшості BIOS материнських плат, заснованих на чіпсеті VIA K8T800, можливий широкий діапазон вибору між значеннями від 5 до 15.

* Джерело.

Тестування було проведено на наступній конфігурації системного блоку:

  • Материнська плата: Micro-Star K8T Neo-FSR (MS-6702), VIA K8T800;
  • Процесор: AMD Athlon 64 2800+ 1800MHz, 512Kb, 1.5v. (NewCastle);
  • Пам'ять: 1 x 512Mb PC3200 400MHz 2.6v., (Patriot);
  • Відеокарта: ATI Radeon 9800SE 128Mb @ 9800Pro 430 / 730MHz;
  • Жорсткий диск: 164.7Gb SATA150 Hitachi 7200rpm 8Mb;
  • Привід: DVD ± R / RW & CD-RW NEC ND-2510A;
  • Корпус: INWIN-S508 + блок живлення 420W (Thermaltake-W0009) + два корпусних 80-мм кулера Zalman (~ 1700 rpm, 7v.).

Операційна система: Windows XP Home SP1. Системні драйвери VIA Hyperion v.4.53, версія DirectX - 9.0c, Catalyst 4.11. Всі зайві сервіси були відключені. Ніяких додаткових програм також не встановлювалося ( «чистий» Трей). Система налаштована на максимальну швидкодію.

Технологія Cool'n'Quiet під час тестування була відключена в BIOS Setup материнської плати.

Налаштування BIOS материнської плати Micro-Star K8T Neo-FSR (MS-6702) в частині, що стосується оперативної пам'яті і чіпсету, не відрізняються особливим багатством:

Незважаючи на останню доступну версію біоса, вибір параметра «Bank Interleaving» можливий тільки з значень «Auto» і «Disabled».

Як тестів було обрано такі синтетичні бенчмарки, програми та ігри:

  • SiSoft Sandra-2004.10.9.133;
  • Everest v.1.52.215;
  • CrystalMark v.0.9.106.215;
  • PCMark'04 будувати 1.2.0;
  • Super PI;
  • WinRar v.3.4;
  • 7-Zip v.4.09;
  • Lame v.3.96;
  • CINEBENCH 2003;
  • Unreal Tournament 2004 білд 2225;
  • Far Cry v.1.3 побудувати 1337;
  • DOOM 3;
  • 3DMark'03 будувати 3.5.0.

Всі тести виконувалися мінімум по два рази. У разі, якщо якийсь результат «випадав» (тобто значно відрізнявся від попереднього), то тестування проводилося додатково ще як мінімум один раз.

Результати тестів:

SiSoft Sandra-2004.10.9.133

Популярний синтетичний бенчмарк несподівано виявився практично байдужий до зміни таймінгів оперативної пам'яті. Приріст від зміни максимальних таймингов на поєднання 2-2-2-9 приносить тільки менше 1 % продуктивності.

Читай ще:   Вентилятор для суворого розгону обертається зі швидкістю 6000 об / хв

Everest v.1.52.215

Результати Everest-а також не відображають помітного приросту продуктивності. Якщо тільки звернути увагу на операції запис в пам'ять - сумарний приріст склав 6,6 %. Подивимося, як впливає зменшення таймінгів в бенчмарке «Latency» (менше - краще):

Не погано! Особливо помітний приріст при зміні CAS # Latency (tCL) з 2.5 на 2, а також зменшенні параметра RAS # to CAS # Delay (tRCD) з 3 до 2. Різниця між результатами при максимальних таймингах і мінімальних становить 19,2 % і , забігаючи вперед, скажу, що це максимальне % -е значення приросту з усіх проведених бенчмарков.

CrystalMark v.0.9.106.215

PCMark'04 будувати 1.2.0

Обидва останніх синтетичних бенчмарка даної статті не виявили помітного приросту продуктивності від зменшення таймінгів оперативної пам'яті. Подивимося, як поведуть себе реальні програми та ігри.

Super PI

При розрахунку 2Mb в Super PI виграш мінімальних таймінгів над максимальними склав 4 секунди або 3,4 %. Трохи, звичайно, але припущу, що на більш «довгих дистанціях» розрив буде більше.

WinRar v.3.4

Особливо помітний приріст в WinRar можна спостерігати при зменшенні параметра RAS # to CAS # Delay (tRCD), а загальна різниця між результатами на мінімальних і максимальних таймингах становить 18 %!

7-Zip v.4.09

В даному архіваторі різниця видна лише при упаковці файлів. При розпакуванні 7-zip до таймингам оперативної пам'яті байдужий.

Перед проведенням тестів в іграх, необхідно сказати, що для мінімізації впливу продуктивності відеокарти тестування проводилося з роздільною здатністю 640х480 і максимально швидкісних налаштуваннях драйверів Catalyst (AA off, AF off).

Unreal Tournament 2004 білд 2225

Тестування проводилося на BotMatch «Rankin».

За результатом даної гри складно виявити який з таймингов найбільш сильно впливає на продуктивність процесора. Кожен з параметрів при його зменшенні вносить свій невеликий внесок в загальну справу, що в сумі виливається в +7,6 %.

Far Cry v.1.3 побудувати 1337

Як з'ясувалося з тестування GeForce 6600GT виробництва LeadTek, демо-запис від 3DNews на рівні «Research» дуже сильно процесорозалежність, що нам якраз і потрібно. Бенчмарк проганяли по два рази.

В черговий раз можна спостерігати, що максимальний приріст продуктивності відбувається при зменшенні RAS # to CAS # Delay (tRCD) і при цьому в цілому становить 2.3FPS (c 61.2FPS до 63.5FPS). Сумарне збільшення продуктивності при зменшенні таймінгів пам'яті в Far Cry одно 7,2 %.

DOOM 3

Тестування було виконано на стандартному demo1 за два проходи.

За аналогією з Far Cry, RAS # to CAS # Delay (tRCD) в DOOM 3 найбільш «впливова».

І в завершенні приведу результати 3DMark'03 CPU Benchmark.

3DMark'03 будувати 3.5.0

3DMаrk'03 CPU Benchmark підтвердив правоту Far Cry і DOOM 3 по відношенню до параметру RAS # to CAS # Delay (tRCD) - це найбільш значимий і найбільш впливає на продуктивність таймінг оперативної пам'яті для платформи на чіпсеті VIA K8T800.

Читай ще:   Що краще 2: GeForce 6800XT і 6800LE проти 6600GT

Здивовані станом рахунку? Тьху! Вибачте 🙂 Здивовані відсутністю результатів тестування при стисненні аудіо в формат MP3 кодеком Lame і рендеринга в CINEBENCH 2003 присутніми в списку бенчмарків? Я не забув їх привести, а просто не став завантажувати статтю зайвими діаграмами. Справа в тому, що зміна таймінгів ніяк не вплинуло на обидва даних програми (+0,4 % в CINEBENCH 2003 не береться до уваги).

Наведу підсумкові результати приросту продуктивності при зменшенні таймингов з поєднання 3-4-4-11 на 2-2-2-9 в одній зведеній таблиці:

Тест-х Приріст від зміни таймінгів з 3-4-4-11 на 2-2-2-9
Сандра 2004.10.9.133 пам'яті Int Buff +0,9 %
поплавок Буф +0,9 %
Everest v.1.52.215 зчитування +1,7 %
запис +6,6 %
латентність +19,2 %
CrystalMark v.0.9.106.225 оцінка пам'яті +6,0 %
PCMark'04 v.1.2.0 оцінка пам'яті +1,0 %
Super PI, 2Mb час +3,4 %
WinRAR v.3.4 КБ / сек +18,0 %
7-Zip v.4.09 (MIPS) то +4,4 %
Unpak {0,0} 8007e76c79b9ca7d225ff67cb372fe197d0a936cc4deee58aba29471077ea84c
Lame 3,96 320 кбіт / с {0,0} 8007e76c79b9ca7d225ff67cb372fe197d0a936cc4deee58aba29471077ea84c
CINEBENCH 2003 Робить. 1 ЦП +0,4 %
UT2004 640 × 480 +7,6 %
велика різниця +7,2 %
DOOM 3 +7,8 %
3DMark 2003 оцінка CPU +4,8 %
Середній приріст: +5,3 %

У уважних читачів також можуть виникнути питання і про причини відсутності тестів при подальшому зменшенні параметра Cycle Time (Tras) з 9 до мінімально можливих 5. Тести були проведені в усьому можливому діапазоні від 11 до 5, і Ви можете переконатися в цьому самі, ознайомившись з Повну таблиці результатів (10.4Kb). Але так як збільшення продуктивності при зниженні Cycle Time (Tras) нижче 9 не відбувається, то і приводити їх, на мій погляд, немає необхідності.

Аналогічно (тобто ніяк 🙂 ) реагувала система і на зміну DRAM Burst Length - довжину пакета, в якій зазначено кількість блоків даних, які надсилаються в один цикл передачі. В ідеальному випадку одна передача буде заповнювати один рядок пам'яті в кеші L2 сучасних процесорів. Тобто вона повинна дорівнювати 64 байтам або восьми пакетам даних. Обидва допустимих значення - 4 і 8 - протестовані.

Як я вже згадував на початку статті, додатково було вивчено вплив на продуктивність зміни параметрів чіпсета VIA K8T800: LDT to AGP Lokar (Upstream) 8bit або 16bit і LDT to AGP Width (Downstream) 8bit або 16bit. Також проводилися тести і при заниженій з дефолтовая 800MHz до 600MHz частоти шини HyperTransport. Результати тестів присутні в наведеній вище таблиці. Змін - 0,0.

На черзі вивчення приросту продуктивності від двоканального режиму роботи з оперативної пам'яті в системах з Athlon 64. Але це вже буде інша стаття і, природно, на іншій платформі.

Удачі вам!

Ваші зауваження та пропозиції щодо теми статті пропоную обговорити в спеціально створеній гілці конференції.

Сергій ліпив aka Jordan

Виберіть мову

Українськийанглійська німецький Іспанська французький італійський Португальська турецький Арабська шведський угорський болгарський естонський Китайська (спрощена) В'єтнамський румунський тайський Словенська Словацька сербський Малайський Норвезька Латвійська Литовський Корейська японський Індонезійська хінді іврит Фінський грецький нідерландський чеський Данська Хорватська Китайська (традиційна) Філіппінська урду Азейбарджанскій Вірменський білоруський бенгальська грузинський казахський каталонська Mongolski Таджітскій Tamil'skij телугу узбецький