Пляшковий шийка в комп'ютері. Який процесор розкриє відеокарту? Як визначити bottleneck у виробничому процесі

Останнім часом дуже набрали популярності різні it блогери. І при всій до них повазі - підкоряючись наживі на хайпах вони створили дуже багато дивної інформації, які різні користувачі використовують, абсолютно не розуміючи про що мова.

Але справді простої інформації ніде немає - чи написано багато зайвого (для звичайних смертних), складною мовою. Або проскакують якісь крихти, які доводиться збирати за іноземними форумами, ресурсами і т.д.

Тому я вирішив зробити серію блогів про те, як взагалі працюють ігри, що впливає, що таке "розкриття відеокарти" і т.д. І описати це максимально простою та доступною мовою.

П.1. "Як це працює? Простіше, будь ласка!"

Для того, щоб надалі навіть прості речі не здавалися "китайською грамотою" - давайте розберемося, що ж таке "гра" і як пристрій її нам показує.

Гра за своєю суттю – це 3д додаток. І як і будь-який додаток він спочатку збирається з різних "шматочків", як "лего".

Провівши аналогію ми отримуємо:

1) Процесор - головний мозок, будує вершини, розраховує фізику (найчастіше). Якщо провести аналогію - це той, хто читає інструкцію зі збирання

2) відеокарта – обліплює текстурами, вішає ефекти, "робить красиво" – за аналогією це той, хто збирає за надиктованою інструкцією.

3) жорсткий диск- Зберігає безпосередньо файли гри - за аналогією це коробка з конструктором.

4) Оперативна пам'ять і відеопам'ять - зберігає дані частого звернення, відеопам'ять - зберігає текстури. Це шматочки конструктора, які ви витягуєте і кидаєте поряд із собою, щоб не тягнутися в коробку.

Як ми бачимо, кожен компонент нашого пристрою, будь то ПК, консоль або навіть смартфон, виконує певні дії, щоб наша гра запустилася. Це, звичайно, найпримітивніше уявлення, але цього вже достатньо, щоб розуміти як це працює.

П.2. Чи розкриє процесор відеокарту?

Дуже багато розмов було на цю тему. Багато говорили про те, чи взагалі існує таке поняття. З моїх міркувань - так, існує, в якомусь сенсі.

Є таке поняття - "пляшкове шийка". Якщо просто - хтось робить щось повільно, через це стопориться весь процес. Якщо повернутися до наших аналогій - це або інструкцію читають повільно, або малюк-відеокарта не встигає складати "цеглинки", або, навіть, просто детальки поклали занадто далеко і доводиться за ними ходити.

Тепер розберемося як "дружать" процесор та відеокарта і хто кого розкриває?

Ситуація 1. Пляшкова шийка - відеокарта:

В результаті ми отримаємо на екрані 15 кадрів за секунду. При цьому відеокарта працюватиме на повну, процесор працюватиме наполовину. Це найідеальніший варіант, у такому разі кажуть, що "процесор розкриває відеокарту повністю". Процесору під час гри так само треба обробити різні програмисамої системи, простежити, щоб працював скайп\вайбер\тимспик і багато іншого. Тому невеликий "запас" у процесора має залишатися.

Що це нам дає? У випадку ПК - ми можемо знизити налаштування графіки, щоб відеокарта змогла зробити більше "машинок"-кадрів. Так ми отримаємо більше фпс у грі.

Є й зворотний варіант:

Тут ми також отримуємо 15 кадрів. При цьому процесор у нас працює на повну, а відеокарта простоює (відпочиває). У такому разі говорять, що процесор не розкриває відеокарти.

Що це нам дає? За такого розкладу - ми не зможемо "стрибнути вище голови". Побачити більше фпс, ніж видає нам процесор, ми не зможемо. Але, оскільки у нас відеокарта відпочиває - ми можемо змусити її збирати не зі звичайної пластикової цегли, а з металевих з малюнками та стразами. Якщо за ігровими настройками - ми можемо поставити більше дозвіл, кращі ефекти, Більш прогресивне згладжування - аж до того моменту, поки карта не стане працювати на 100%, видаючи все ті ж 15 кадрів.

п2.1 То як зрозуміти, який процесор і відеокарту до нього взяти?

В інтернеті повно тестів "заліза". Коли тестують відеокарту - їй створюють ідеальні умови, щоб вона в будь-якому випадку викладалася на повну. Коли тестують процесори – роблять так само.

що ж нам потрібно, щоб гра у нас йшла у 60 кадрів без проблем? Давайте розглянемо з прикладу Witcher3, т.к. її протестували на все, що тільки можна.

Нам потрібно визначити, який процесор дозволить нам побачити 60 кадрів у грі. При цьому, по-доброму, нам треба брати із запасом, щоб процесору було чим обробляти фонові завдання.

Як бачимо, для цієї гри вистачить навіть Phenom2. І з ним ми побачимо 60 кадрів у цій грі, якщо "пляшковим шийкою" не стане відеокарта. Власне, подивимося, яка карта нам підійде:

Що ми бачимо? Що б пограти на самих максимальних налаштуванняхв 60фпс нам потрібна карта 980 і вище.

А тепер найцікавіше - саме в цій грі, саме на таких налаштуваннях 980-ту карту розкриє старенький феном. Таким чином, ставлячи питання "чи розкриє мій процесор такусь відеокарту" просто подивіться, який фпс показує ваш процесор в іграх, що вас цікавлять. І потім подивіться, який фпс може дати відеокарта.

У другій частині я планую розповісти про жорсткий диск, ssd, оперативну пам'ять та відеопам'ять (їхній вплив на гру.)

P.s. Дякую. що прочитали. Це мій перший запис у блозі, тому буду радий конструктивній критиці. Якщо знайшли якісь неточності, помилки та ін. - пишіть у коментарях, виправлятимуся.

Якщо у сучасної людини запитати, з яких основних частин складається комп'ютер, то, мабуть, вона наведе досить довгий список, у перших рядках якого опиняться системний блок, клавіатура та монітор. Неважко здогадатися, що такий перелік навряд чи підходить для характеристики комп'ютера, що управляє мікрохвильовою піччю, системою запалювання автомобіля чи космічним апаратом. Загалом у ньому не більше спільного з реальністю, ніж у твердженні про те, ніби малиновий піджак. відмінна рисавсіх хребетних.

Будь-який комп'ютер, незалежно від його архітектурних особливостей та призначення, складається з центрального процесораі оперативної пам'яті, які за потреби можуть бути доповнені периферійними пристроями. Останні застосовуються в основному для того, щоб комп'ютер міг обмінюватися інформацією із зовнішнім світом. Але загалом його продуктивність визначається узгодженою роботою саме процесора та пам'яті. І саме тут останнім часом намітилося вузьке місце.

В IBM PC, першому масовому 16-розрядному персональному комп'ютері, що з'явився трохи більше 20 років тому, був використаний процесор Intel 8088 - молодший брат Intel 8086, який відрізняється від нього вдвічі більш вузькою зовнішньою шиною даних. Таке рішення було економічно виправданим, тому що дозволяло використовувати восьмирозрядну периферію, завдяки чому новий комп'ютерне надто сильно відрізнявся за ціною від своїх восьмирозрядних побратимів. Але якщо попередній процесор Intel 8086 здійснював синхронну вибірку та виконання команд, то у нового процесора ці дії виконувались асинхронно – з'явилася черга команд, що заповнювалася тоді, коли не було інтенсивного обміну процесора з областю даних. Це дозволило більш ефективно використовувати пропускну здатність шини даних, і зменшення її ширини вдвічі не призвело до суттєвого падіння продуктивності.

На той час пам'ять практично не затримувала виконання команд: процесор працював на тактовій частоті 4,77 МГц і навіть адресу він обчислював набагато довше, ніж пам'ять видавала необхідні дані. Однак швидкість процесора характеризується тактовою частотою, а швидкість пам'яті - часом доступу, який не схильний до такого запаморочливого прогресу: тактова частота зросла майже в 500 разів, а час доступу скоротився лише приблизно на порядок. Але якщо час доступу, скажімо, 100 нс, то за 10 МГц це відповідає одному такту процесора, за 40 МГц - чотирьох тактів, а за 100 МГц - вже десяти. З іншого боку, вдосконалювалася архітектура процесорів, отже одні й самі команди почали виконуватися набагато менше тактів (див. табл. 1).

Розробники враховували тенденції, що виникають. IBM PC AT вийшов вже з повною 16-розрядною шиною даних, а IBM AT-386 – з повною 32-розрядною. Такою була розрядність комп'ютерів і 486 процесорі. Дальше більше. Ширина зовнішньої шини даних Pentium становила 64 розряди, тобто вдвічі перевищувала розрядність процесора. А для графічних процесорів (часто званих 3D-акселераторами) вона становить уже 128-256 розрядів.

Збільшення ширини шини - єдиний спосіб обійти низьку швидкість роботи пам'яті. Починаючи зі старших моделей 386, у комп'ютерах стали застосовувати кеш-пам'ять - невеликий обсяг. швидкодіючої пам'яті, що є буфером між повільною основною пам'яттю і процесором.

Сучасні модулі пам'яті призначені до роботи у вузькому діапазоні частот, тому часові діаграми їх роботи оптимізуються лише однієї, номінальної, частоти. Отже, при використанні нижчих частот продуктивність пам'яті буде знижуватися пропорційно.

Донедавна частота зовнішньої шини процесора Front Side Bus (FSB) мала збігатися з частотою тактування оперативної пам'яті. Низька частота шини у процесорів Celeron (66 МГц) у своїй обмежувала продуктивність даного класу процесорів. Останні чіпсети дозволяють тактувати пам'ять вищою частотою, що може досить суттєво позначитися загальної продуктивності. Для дослідження цього питання була використана системна плата Gigabyte GA-6VTX на чіпсеті VIA Apollo Pro 133T, що дозволяє незалежно встановлювати як зовнішню частоту процесора, і частоту тактування оперативної пам'яті. На неї по черзі встановлювалися два процесори, що відрізняються частотою зовнішньої шини: Celeron-566 (FSB 66 МГц) та Celeron-1000 (FSB 100 МГц). Набір тестів – традиційний для нашого журналу. Усі тести проводилися в однозадачній ОС (DOS Mode Windows 98 SE). Природно, кеш-пам'ять під час проведення вимірів не відключалася, що також мало чималий вплив (іноді визначальний, але це нижче) на результати.

Під час читання, запису та пересилання 4-Мбайт масиву виявилися цілком певні закономірності (див. табл. 2).

По-перше, збільшення частоти тактування пам'яті зі 100 до 133 МГц при FSB 66 МГц не призвело до зміни результатів. Це справедливо як для послідовного доступу, а й взагалі всім проведених експериментів. У чому тут справа: чи FSB не здатна "перетравити" більш ніж півторакратне збільшення частоти пам'яті, чи реальна частота тактування "заморожується" на 100, коли BIOS Setup показує 133, - сказати важко.

По-друге, швидкість виконання значної частини операцій залежить лише від частоти пам'яті, а чи не від частоти процесора.

По-третє, реально виміряні швидкості доступу до пам'яті часто виявляються значно нижчими від того, що можна було б очікувати, виходячи з найпростіших оцінок.

Як альтернативу послідовному доступу можна застосувати довільний. Усередині 32-Мбайт області випадково обчислювалася адреса, а потім за цією адресою проводилося читання або запис одного байта (рис. 1).

Надзвичайно низька швидкість обміну пояснюється двома факторами. По-перше, для початкового завдання адреси потрібно багато часу (див. врізання ). По-друге, операції читання/запису буферизовані кешем, а обмін із ним здійснюється лише порціями по 32 байти. Іншими словами, щоб рахувати з пам'яті 1 байт, необхідно перенести в кеш 32. На закінчення зазначу, що процедура обчислення випадкової адреси звичайно ж займає деякий час, проте застосований алгоритм дозволяє при зменшенні обсягу даних до об'єму кеша L2 робити вибірку зі швидкістю більше 70 Мбайт/с для застосовуваного процесора 1 ГГц.

Різний характер залежності продуктивності від частоти процесора та пам'яті для різних типівдодатків можна побачити на рис. 2.

Для однаковості за одиницю продуктивності прийнятий процесор із частотою 566 МГц та пам'яттю, що працює на 66 МГц. Кривими позначено такі тестові програми:

Рішення системи диференціальних рівняньу приватних похідних (СДУЧП) на процесорі 566 МГц за обсягом даних 40 Мбайт.
Рішення СДУЧП на процесорі 1000 МГц за тих самих умов.
Знаходження простих чисел методом "решета Ератосфена" (РЕ) на процесорі 566 МГц за обсягом масивів 40 Мбайт.
РЕ на процесорі 1000 МГц при тому обсязі масивів.
Швидке сортування 16-Мбайт масиву на процесорі 566 МГц.
Швидке сортування 16-Мбайт масиву на процесорі 1 ГГц.
Знаходження найкоротшого шляху у графі методом Дейкстри на 566-МГц процесорі. Об'єм масивів 300 Кбайт (більше подвоєного обсягу кеш-пам'яті).
Знаходження найкоротшого шляху у графі на 1-ГГц процесорі за тих самих умов.

З наведених даних видно, що більшість додатків найбільш чутлива до частоти процесора. На рис.2 їм відповідають горизонтальні криві поблизу одиниці частоти 566 МГц і поблизу 1,7-1,8 для 1000 МГц. Найбільш чутливим до частоти пам'яті виявилося "решета Ератосфена", при цьому з 66-МГц пам'яттю продуктивність практично не залежала від частоти процесора. Графіки таких додатків мають вигляд похилих ліній, котрим збільшення частоти удвічі відповідає такому збільшення продуктивності, у своїй залежність від частоти процесора відсутня. Деякий компроміс спостерігається під час вирішення системи диференціальних рівнянь. Продуктивність залежить від частоти пам'яті, але не прямо пропорційно, а набагато слабше, крім того, при частоті пам'яті 66 МГц процесор Celeron 1 ГГц демонструє лише на чверть більш високу продуктивність порівняно з 566 МГц.

Хочеться порівняти на прикладі ще одного завдання, а також дослідити вплив кеш-пам'яті.

У ті далекі часи, коли комп'ютери займали кілька поверхів будівлі та використовувалися виключно для наукових розрахунків, оцінці продуктивності вже приділялося чимало уваги. Щоправда, затримок, пов'язаних із пам'яттю, тоді не було, а найскладнішими вважалися обчислення з плаваючою комою. Ось для таких обчислень і було написано тест Донгарра – рішення системи лінійних рівнянь. Результати деякого узагальнення цього тесту наведено на рис. 3. Тепер виявилося, що самі обчислення з плаваючою комою можна виконати набагато швидше, ніж записати результати цих обчислень на згадку.

Невисока продуктивність при невеликих масивах пояснюється тим, що сучасні суперскалярні процесори з конвеєрною архітектурою добре виконують безперервну послідовність команд, цикли і виклики процедур - дещо гірші, а накладні витрати саме на ці операції зростають зі зменшенням розмірів масивів. До досягнення обсягом даних обсягу кеш-пам'яті продуктивність зростає, причому визначається виключно частотою процесора. При переповненні кешу бачимо різке падіння продуктивності, що досягає десятикратного. При цьому криві в перехідній ділянці спочатку розходяться, а потім знову сходяться, але вже зовсім за іншою ознакою - за частотою пам'яті. Тактова частота процесора втрачає свою роль, першому плані виходить частота пам'яті.

На щастя, значна частина реальних додатків не досягає таких обсягів даних, що одночасно оброблюються, при яких тактова частота процесора вже перестає грати роль. Обробку текстур, необхідну кожному кадрі, перебирає графічний процесор, а там зовсім інші і частоти, і ширина шини. А решта об'ємних даних, будь то відеофільм, архів або багатосторінковий документ, як правило, обробляються невеликими порціями, що вміщуються в кеш-пам'ять. Але з іншого боку, кеш-пам'ять теж треба заповнювати. Та й зниження продуктивності "всього" вдвічі-втричі чи навіть на десятки відсотків замість десятикратного навряд чи може втішити.

З проведених вимірювань випливає і ще один висновок: якщо чіпсет допускає асинхронну роботу процесора і пам'яті, це нівелює різницю в продуктивності через відмінності в FSB, яка є, наприклад, Celeron і Pentium !!!.

Від редакції:хоча отримані висновки з упевненістю можна віднести лише до плат на основі набору мікросхем VIA Apollo 133T, але в цілому цей підхід може бути застосований і для оцінки ефективності переходу на шину 533-МГц в сучасних платах.

Як працює динамічна пам'ять

Центральною частиною мікросхеми динамічної пам'яті є матриця конденсаторів розміром MxN, де M і N зазвичай дорівнюють двом певною мірою. Кожен конденсатор може бути в одному з двох станів: зарядженому або розрядженому, таким чином він зберігає 1 біт інформації.

Адреса в мікросхему пам'яті передається в два етапи: спочатку молодша половина адреси фіксується в регістрі адреси сигналом RAS (строб адреси рядка), а потім старша - сигналом CAS (строб адреси стовпця). При зчитуванні даних із пам'яті після фіксації молодша частина адреси подається на дешифратор рядків, і з нього - на матрицю, у результаті рядок конденсаторів матриці повністю підключається до входу підсилювачів зчитування. У процесі зчитування конденсатори розряджаються, отже, інформація в матриці втрачається. Щоб не допустити цього, щойно лічені рядки даних знову записуються в рядок конденсаторів матриці - відбувається регенерація пам'яті. До того моменту, коли рядок з матриці потрапила в буфер підсилювача зчитування, на дешифратор адреси стовпця вже подано старшу половину адреси і за допомогою цього дешифратора вибирається один-єдиний біт інформації, що зберігається за адресою, зафіксованою в регістрі адреси. Після цього лічені дані можна подати вихід мікросхеми. При записі інформації спочатку рядок також зчитується повністю, потім у ній змінюється потрібний біт і записується на колишнє місце. Збільшення розрядності до 1, 2, 4 або 8 байт досягається паралельною роботою кількох мікросхем пам'яті або кількох матриць в одній мікросхемі.

Як бачимо, для доступу до осередку динамічної пам'яті потрібно зробити багато послідовних операцій, а тому час доступу виявляється досить великим - сьогодні це 35-50 нс, що відповідає 5-7 тактам зовнішньої шини.

Пам'ять, що працює, як описано вище (DRAM - динамічна пам'ятьдовільного доступу), застосовувалась у перших персональних комп'ютерах. В одному корпусі зберігався обсяг інформації до 64 кбіт. Але якщо операції з адресою неминуче займають багато часу, то чи не можна обійти це обмеження? Адже процесору часто потрібні довгі ланцюжки байтів, що зберігаються в пам'яті поспіль, наприклад, при виконанні послідовності команд або при обробці рядків і масивів даних. І рішення було знайдено: після передачі мікросхеми адреси першого елемента кілька наступних зчитували лише за допомогою сигналів шини управління, без передачі нової адреси, що виявилося приблизно вдвічі швидше. Така пам'ять отримала назву FPM RAM (пам'ять зі швидкою сторінковою організацією) і надовго стала єдиним типом оперативної пам'яті, що використовується в персональних комп'ютерах. Для позначення часових характеристик такої пам'яті застосовувалися послідовності цифр: наприклад, "7-3-3-3" означало, що отримання першої порції даних потрібно витратити 7 тактів системної шини, але в наступні - по 3. Проте відрив тактової частоти процесора від частоти системної шини, з одного боку, і прогрес технології, що дозволив скоротити кількість тактів, що витрачається обчислювальним блоком на одну операцію, з іншого, порушили питання подальшого вдосконалення технології роботи оперативної пам'яті.

Наступним етапом була розробка EDO RAM - пам'яті зі збільшеним часом виведення даних, коли стало можливим поєднати отримання чергового блоку даних із передачею "заявки" отримання наступного. Це дозволило на такт зменшити час доступу: "6-2-2-2". Однак EDO RAM дуже скоро була витіснена пам'яттю типу SD RAM (синхронна), за рахунок чергування блоків час доступу виявилося можливим зменшити до "5-1-1-1-1-1-1-1". Одночасно був застосований деякий маркетинговий хід: якщо при позначенні часу доступу до пам'яті типу FPM та EDO RAM прийнято було вказувати час першого звернення, яке становило 60-80 нс, то для SD RAM стали вказувати час другого та наступних, що становило вже 10-12 нс для тих же тактових частоті, отже, близького часу першого звернення. Продуктивність підсистеми пам'яті у своїй зросла на десятки відсотків, тоді як числа, що позначають час доступу до пам'яті, зменшилися у кілька разів.

SDRAM і досі є основним типом пам'яті для процесорів Intel Pentium !!! та Celeron. Поряд з нею можуть використовуватися і нові розробки: DDR RAM (точніше, DDR SDRAM, але ми будемо користуватися зазначеним позначенням), що застосовується в основному з процесорами AMD Athlon і Duron, що працює на тих же частотах (100-133 МГц), але дозволяє передавати дані до двох разів за такт: по передньому та задньому фронту (тому з'явилося таке поняття, як ефективна частота, в даному випадку 200-266 МГц), та орієнтована на застосування в системах з Pentium-4 RDR RAM (Rambus RAM), що працює на частотах 300–533 МГц (ефективна частота 600–1066 МГц).

Якщо для SDRAM (тепер часто званої SDR DRAM) були прийняті позначення PC-100 і PC-133, що означають можливість роботи на 100 і 133 МГц відповідно, то нових типів пам'яті, скажімо PC-2100, цифри позначають не частоту понад 2 ГГц , А лише "пікову" швидкість передачі даних. Слово "пікова" взято в лапки тому, що в яких би ідеальних умовах ми не проводили вимірювання, отримане відношення кількості переданої інформації до витраченого на це часу не тільки не буде вказаним числам, але навіть не буде прагнути до них асимптотично. Справа в тому, що ця швидкість наведена для частини пакета з відрізаною першою порцією даних, тобто, як і для SDRAM, тільки для "другого та наступних". Для DDR RAM час першого звернення такий самий, як і SDRAM, а наступних - удвічі менше. Тому при послідовному доступі виграш у продуктивності становить десятки відсотків, а за довільного - взагалі відсутня.

Теорію обмежень систем було сформульовано у 80-ті роки ХХ ст. та стосувалася управління виробничими підприємствами. Коротко її суть зводиться до того, що в кожній виробничої системидіють обмеження, які стримують ефективність. Якщо усунути ключове обмеження, система запрацює значно ефективніше, ніж намагатися впливати на всю систему відразу. Тому процес удосконалення виробництва слід розпочинати з усунення вузьких місць.

Зараз термін bottleneck може використовуватися для будь-якої галузі — у сфері послуг, розробці. програмного забезпечення, логістика, повсякденне життя.

Що таке bottleneck

Визначення bottleneck звучить як місце у виробничій системі, в якому виникає перевантаження, тому що потік матеріалів надходить занадто швидко, але не може бути так само швидко перероблений. Часто це станція з меншою потужністю ніж попередній вузол. Термін походить з аналогії з вузьким шийкою пляшки, яка уповільнює шлях рідини назовні.

Bottleneck - вузьке місце у виробничому процесі

На виробництві ефект пляшкового шийки викликає простої та виробничі витрати, знижує загальну ефективність та збільшує терміни відвантаження продукції замовникам.

Існує два типи вузьких місць:

Короткострокові вузькі місця- Викликані тимчасовими проблемами. Хороший приклад — лікарняна чи відпустка ключових співробітників. Ніхто в команді не може повноцінно замінити їх і робота зупиняється. На виробництві це може бути поломка одного із групи верстатів, коли його навантаження розподіляється між робочим обладнанням.
Довгострокові вузькі місця- Діють постійно. Наприклад, постійна затримка місячних звітів у компанії через те, що одна людина має обробити величезну кількість інформації, яка надійде до неї лавиною наприкінці місяця.

Як визначити bottleneck у виробничому процесі

Існує кілька способів пошуку bottleneck на виробництві різного рівня складності, із застосуванням спеціальних інструментів та без. Почнемо з більш простих способів, заснованих на спостереженні.

Черги та затори

Процес на виробничій лінії, який збирає перед собою найбільшу чергу з одиниць незавершеного виробництва, зазвичай є пляшковим шийкою. Такий спосіб пошуку bottleneck підходить для штучного конвеєрного виробництва, наприклад, на лінії розливу. Добре видно, де лінії скупчуються пляшки, і який механізм має недостатню потужність, часто ламається або обслуговується недосвідченим оператором. Якщо на лінії кілька місць скупчення, то ситуація складніша, і потрібно використовувати додаткові методи, щоб знайти найкритичніше вузьке місце.

Пропускна здатність

Пропускна спроможність усієї виробничої лінії прямо залежить від виходу обладнання bottleneck. Ця характеристика допоможе знайти головну пляшечку шийки процесу виробництва. Збільшення випуску одиниці устаткування, яка є вузьким місцем, істотно вплине загальний випуск лінії. Перевіривши по черзі все обладнання, можна виявити bottleneck - тобто той крок, збільшення потужності якого найбільше вплине на вихід всього процесу.

Повна потужність

Більшість виробничих ліній відстежують відсоток завантаження кожної одиниці устаткування. Верстати та станції мають фіксовану потужність та в процесі виробництва використовуються на певний відсоток від максимальної потужності. Станція, яка задіює максимум потужності – bottleneck. Таке обладнання стримує процент використання потужності іншого обладнання. Якщо ви збільшите потужність bottleneck, то потужність усієї лінії зросте.

Очікування

Процес виробництва також враховує час простоїв та очікування. Коли на лінії є пляшкова шийка, то обладнання, що йде одразу ним, довго простоює. Bottleneck затримує виробництво і наступний верстат не отримує достатньо матеріалу, щоб працювати безперервно. Коли ви виявите верстат з довгим часом очікування, то шукайте на попередньому кроці пляшку.

Крім спостереження за виробництвом для виявлення вузьких місць використовуються такі інструменти:

Value Stream Mapping – карта створення потоків цінності

Як тільки ви з'ясуйте причину чи причини вузьких місць, потрібно визначити діїдля розширення пляшкового шийки та нарощування виробництва. Можливо, вам знадобиться перемістити співробітників у проблемну зону або найняти додатковий персонал та закупити обладнання.

Пляшкова шийка може виникнути там, де оператори переналаштовують обладнання для виробництва іншого продукту. У такому разі треба подумати, як скоротити простої. Наприклад, змінити графік виробництва, щоб зменшити кількість переналагодження або зменшити їх вплив.

Як зменшити вплив вузьких місць

Bottleneck менеджмент пропонує виробничим компаніям використовувати три підходи, щоб зменшити вплив вузьких місць.

Перший підхід

Збільшення потужності існуючих вузьких місць.

Існує кілька способів збільшити потужність вузьких місць:

Додайте ресурси до обмежуючого процесу. Необов'язково наймати нових працівників. Крос-функціональне навчання персоналу може зменшити вплив вузьких місць із незначними витратами. У такому разі робітники обслуговуватимуть одразу кілька станцій та полегшуватимуть проходження вузьких місць.
Забезпечте безперебійне подання деталей на вузьке місце. Завжди слідкуйте за незавершеним виробництвом перед вузьким місцем, керуйте подачею ресурсів на станцію bottleneck, враховуйте овертайми, протягом яких обладнання також завжди повинно мати деталі для обробки.
Переконайтеся, що вузьке місце працює лише з якісними деталями. Не витрачайте потужність та час роботи вузького місця на опрацювання шлюбу. Розташовуйте точки контролю якості перед станціями bottleneck. Це підвищить пропускну спроможність процесу.
Перевірте графіки виробництва. Якщо у процесі випускається кілька різних продуктів, які вимагають різного часу роботи bottleneck, скоригуйте графік виробництва так, щоб загальний попит на bottleneck зменшився
Збільште час роботи обладнання, що обмежує. Нехай bottleneck працює довше, ніж інше обладнання. Призначте оператора, який обслуговуватиме процес під час обідніх перерв, планових простоїв і, якщо потрібно, понаднормово. Хоча цей метод не зменшить час циклу, він буде підтримувати роботу bottleneck доки інше обладнання простоюватиме.
Скоротіть простої. Уникайте планових та позапланових простоїв. Якщо обладнання bottleneck вийде з ладу під час робочого процесу, негайно відправте ремонтну бригаду, щоб відремонтувати та запустити його. Також постарайтеся скоротити час переналагодження обладнання з одного продукту на інший.
Удосконаліть процес саме у вузькому місці. Використовуйте VSM, щоб усунути дії, що не додають цінності, і скоротити час на додавання цінності, позбавившись втрат. У результаті ви отримаєте коротший час циклу.
Перерозподіліть навантаження на bottleneck. Якщо можливо, розділіть операцію на частини та призначте їх на інші ресурси. У результаті ви отримаєте коротший цикл і збільшену потужність.

Другий підхід

Продаж надлишків виробництва, які випускає обладнання, що не відноситься до пляшкового шийки.

Наприклад, у вас на лінії 20 ін'єкційних пресів, а ви використовуєте лише 12 із них, тому що обладнання bottleneck не може переробити випуск усіх 20 пресів. У цьому випадку ви можете знайти інші компанії, які зацікавлені у субпідряді на операції лиття під тиском. Ви будете у прибутку, тому що отримаєте від субпідрядників більше, ніж ваші змінні витрати.

Третій підхід

Скорочення потужності, що не використовується.

Третій варіант оптимізації виробництва — розпродати обладнання з екстра потужністю та скоротити чи перемістити персонал, який його обслуговує. В цьому випадку потужність всього обладнання буде зрівняна.

Приклади bottleneck поза виробництвом

Транспорт

Класичний приклад — пробки на дорогах, які можуть постійно утворюватися у певних місцях, або тимчасово з'являтися під час ДТП або проведення дорожніх робіт. Інші приклади – шлюз на річці, навантажувач, залізнична платформа.

Комп'ютерні мережі

Повільний WiFi-роутер, підключений до ефективної мережі з високою пропускною здатністює вузьким місцем.

Комунікація

Розробник, який шість годин на день проводить на нарадах, і лише дві години пише код.

Програмне забезпечення

У додатку теж є вузькі місця - це елементи коду, на яких програма "гальмує", змушуючи користувача чекати.

"Залізо" комп'ютера

Вузькі місця в комп'ютері - це обмеження апаратних засобів, при яких потужність системи обмежується одним компонентом. Часто процесор розглядається як обмежуючий компонент відеокарти.

Бюрократія

У повсякденному житті ми часто зустрічаємося з вузькими місцями. Наприклад, коли раптово закінчуються бланки для паспортів або прав водія і вся система зупиняється. Або коли потрібно пройти медогляд, а кабінет флюорографії працює лише три години на день.

Вердикт

Вузькі місця у виробництві, менеджменті та житті – це точки потенційних покращень.

Розширення bottleneck дасть відчутний приріст продуктивності та ефективності.

А не звертати уваги на обмежуючі елементи системи — значить недоотримувати прибуток і працювати гірше за свої можливості.

При складанні ігрового ПК найдорожчою частиною є відеокарта, і хочеться, щоб вона на повну відпрацьовувала свої гроші. Тоді постає питання: який треба вибрати процесор для цієї відеокарти, щоб він не обмежував її в іграх? У цій проблемі вам допоможе наш спеціально підготовлений матеріал.

Вступ

Так виходить, що головним у комп'ютері є процесор і він командує рештою. Саме він і дає розпорядження вашій відеокарті про малювання тих чи інших об'єктів, а також розраховує фізику об'єктів (навіть деякі операції вважає процесор). Якщо відеокарта не працює на повну міць, а процесор вже не може швидше, то виникає ефект «пляшкового шийки» (bottleneck), коли продуктивність системи обмежується найслабшим її компонентом.

Насправді завжди є операції, коли відеокарта взагалі не напружується, а відсотків оре на повну, але ми тут говоримо про ігри, так що будемо міркувати в цій парадигмі.

Як розподіляється навантаження між процесорами та відеокартою?

Слід зазначити, що зі зміною налаштувань у грі змінюється співвідношення завантаженості процесора та відеокарти.

При збільшенні роздільної здатності та налаштувань графіки навантаження на відеокарту зростає швидше, ніж на процесор. Це означає, що якщо на більш малих дозволах процесор не є пляшковим шийкою, то і на більших теж не буде.

Зі зменшенням дозволу та настоянок графіки все навпаки: навантаження на процесор при прорахунку одного кадру майже не змінюється, а відеокарта стає значно легшою. У такій ситуації процесор з більшою ймовірністю стане пляшковим шийкою.

Які ознаки bottleneck?

Для проведення тесту потрібна програма. Вам потрібно дивитись на графік «Завантаження ДП».

Також потрібно знати навантаження на процесор. Це можна зробити в моніторингу системи у диспетчері завдань, там є графік навантаження процесора.

Отже, які ж ознаки того, що процесор не розкриває відеокарту?

Навантаження ДП не близьке до 100%, а навантаження ЦП весь час біля цієї позначки
Графік навантаження ГП сильно скаче (може бути погано оптимізована гра)
При зміні налаштувань графіки FPS не змінюється

Саме за цими ознаками ви можете дізнатися, чи має місце bottleneck у вашому випадку?

Як розібратися з вибором процесора?

Для цього раджу вам дивитися тести процесорів у потрібній вам грі. Є сайти, які спеціально займаються цим ( , ).

Приклад тесту у грі Tom Clancy's The Division:

Зазвичай при тестуванні процесорів у різних іграхвказуються настоянки графіки та дозвіл. Підбираються такі умови, щоб пляшковим шийкою був процесор. У такому разі можна дізнатися на яку кількість кадрів у даній роздільній здатності здатний той чи інший процесор. Таким чином, можна і порівнювати процесори між собою.

Ігри бувають різні (капітан очевидність) і вимоги до процесора вони можуть бути різними. Так, в одній грі все буде добре і процесор буде без проблем справлятися зі сценами, а в іншій відеокарта прохолоджуватиметься в той час, як процесор насилу виконуватиме свої завдання.

Найсильніше на це впливають:

складність фізики у грі
складна геометрія простору (багато великих будівель з безліччю деталей)
штучний інтелект

Наші поради

Радимо вам при виборі орієнтуватися саме на такі тести з потрібними налаштуваннями графіки і потрібним вам FPS (які потягне ваша карта).
Бажано дивитися по найвибагливіших ігор, якщо хочете бути впевнені в тому, що майбутні новинки добре працюватимуть.
Можете також брати процесор із запасом. Зараз ігри добре працюють навіть на чіпах 4-річної давності (), а це означає, що хороший процесорзараз буде ще дуже довго тішити вас в іграх.
Якщо FPS у грі нормальний, а навантаження на відеокарту низьке, навантажте її. Підвищіть налаштування графіки так, щоб відеокарта працювала на повну.
При використанні DirectX 12 навантаження на процесор повинне трохи знизитися, що зменшить вимоги до нього.

FX проти Core i7 Шукаємо вузькі місця із конфігурацією Eyefinity

Ми бачили, як кожні три-чотири роки продуктивність процесорів подвоювалася. І все ж найвибагливіші ігрові движки, які ми тестували, також старі, як процесори Core 2 Duo. Звичайно, вузькі місця з боку CPU повинні були піти в минуле, чи не так? Як виявилось, швидкість GPU зростає ще швидше, ніж продуктивність центрального процесора. Таким чином, суперечка про купівлю швидшого CPU або нарощування графічної потужності продовжується.

Але завжди настає момент, коли сперечатися безглуздо. Для нас він настав, коли ігри почали плавно працювати на самому великому моніторіз рідною роздільною здатністю 2560x1600. І якщо швидший компонент зможе забезпечити в середньому 200, а не 120 кадрів на секунду, різниця все одно не буде помітна.

У відповідь відсутність більш високих дозволів для швидких графічних адаптерів, AMD представила технологію Eyefinity, а Nvidia – Surround. Обидві технології дозволяють грати більш ніж на одному моніторі, і для GPU high-end класу робота на роздільній здатності 5760×1080 стала об'єктивною реальністю. По суті, три дисплеї з роздільною здатністю 1920×1080 обійдуться дешевше і вражають вас більше, ніж один екран на 2560×1600. Звідси виникла причина додатково витратитися більш потужні графічні рішення.

Але чи справді необхідний потужний процесор, щоб грати без "гальм" на роздільній здатності 5760x1080? Питання виявилося цікавим.

Нещодавно AMD представила нову архітектуру, і ми купили боксовий FX-8350. у статті "Огляд та тест AMD FX-8350: чи виправить Piledriver недоліки Bulldozer?"у новому процесорі нам сподобалося багато чого.

З економічної точки зору, у цьому порівнянні Intelдоведеться довести, що він не тільки швидше за чіп AMD в іграх, але і виправдовує високу різницю в ціні.

Обидві материнські плати відносяться до сімейства Asus Sabertooth, проте за модель з роз'ємом LGA 1155 компанія вимагає більш високу ціну, що ще ускладнює становище Intel щодо бюджету. Ми спеціально вибрали ці платформи, щоб порівняння продуктивності було максимально справедливим, при цьому вартість не приймалася.

FX проти Core i7 Конфігурація та тести

Поки що ми чекали появи в тестлабі FX-8350, провели тести боксового Враховуючи, що процесор AMD без проблем сягає 4,4 ГГц, ми розпочали тестування чіпа Intel на такій самій частоті. Згодом з'ясувалося, що ми недооцінили наші зразки, оскільки обидва CPU досягли 4,5 ГГц на вибраному рівні напруги.

Нам не хотілося відкладати публікацію через повторне тестування на більше високих частотахтому було вирішено залишити результати тестів на частоті 4,4 ГГц.

Тестова конфігурація
CPU Intel	Intel Core i7-3770K (Ivy Bridge): 3,5 ГГц, 8 Мбайт загального кешу L3, LGA 1155 розгін до 4,4 ГГц на 1,25 В
Материнська плата Intel	Asus Sabertooth Z77, BIOS 1504 (08/03/2012)
Кулер CPU Intel	Thermalright MUX-120 w/Zalman ZM-STG1 Paste
CPU AMD	AMD FX-8350 (Vishera): 4,0 ГГц, 8 Мбайт загального кешу L3, Socket AM3+ розгін до 4,4 ГГц на 1,35 В
Материнська плата AMD	Asus Sabertooth 990FX, BIOS 1604 (10/24/2012)
Кулер CPU AMD	Sunbeamtech Core-Contact Freezer w/Zalman ZM-STG1 Paste
Мережа	Вбудований контролер Gigabit LAN
Пам'ять	G.Skill F3-17600CL9Q-16GBXLD (16 Гбайт) DDR3-2200 CAS 9-11-9-36 1,65 В
Відеокарта	2 x MSI R7970-2PMD3GD5/OC: GPU, 1010 МГц GDDR5-5500
Накопичувач	Mushkin Chronos Deluxe DX 240 Гбайт, SATA 6 Гбіт/с SSD
живлення	Seasonic X760 SS-760KM: ATX12V v2.3, EPS12V, 80 PLUS Gold
ПЗ та драйвера
Операційна система	Microsoft Windows 8 Professional RTM x64
Графічний драйвер	AMD Catalyst 12.10

Завдяки високій ефективності та швидкій установці, вже кілька років ми використовуємо кулери Thermalright MUX-120 та Sunbeamtech Core Contact Freezer. Однак монтажні скоби, які йдуть у комплекті з цими моделями, не взаємозамінні.

Модулі пам'яті G.Skill F3-17600CL9Q-16GBXLD мають характеристику DDR3-2200 CAS 9 і використовують профілі Intel XMP для напівавтоматичної конфігурації. Sabertooth 990FX використовує значення XMP через Asus DOCP.

Блок живлення Seasonic X760 забезпечує високу ефективність, необхідну оцінки відмінностей платформ.

StarCraft II не підтримує технологію AMD Eyefinity, тому ми вирішили використовувати старіші ігри: Aliens vs. Predator та Metro 2033.

Конфігурація тестів (3D-ігри)
Aliens vs. Predator	з використанням AvP Tool v.1.03, SSAO/тесселяція/тіні вкл. Тестова конфігурація 1: якість текстур High, без AA, 4x AF Тестова конфігурація 2: якість текстур Very High, 4x AA, 16x AF
Battlefield 3	Режим кампанії "Going Hunting" 90-секунд Fraps Тестове налаштування 1: якість Medium (без AA, 4x AF) Тестове налаштування 2: якість Ultra (4x AA, 16x AF)
F1 2012	Версія Steam, вбудований бенчмарк Тестове налаштування 1: якість High, без AA Тестове налаштування 2: якість Ultra, 8x AA
Elder Scrolls V: Skyrim	Оновлення 1.7, Celedon Aethirborn рівень 6, 25-секунд Fraps Тестове налаштування 1: DX11, рівень деталізації High без AA, 8x AF, FXAA вкл. Тестове налаштування 2: DX11, рівень деталізації Ultra, 8x AA, 16x AF, FXAA вкл.
Metro 2033	Повна версія, вбудований бенчмарк, сцена "Frontline" Тестове налаштування 1: DX11, High, AAA, 4x AF, без PhysX, без DoF Тестове налаштування 2: DX11, Very High, 4x AA, 16x AF, без PhysX, DoF вкл.

FX проти Core i7 Результати тестів

Battlefield 3, F1 2012 та Skyrim

Але спершу давайте поглянемо на енергоспоживання та ефективність.

Енергоспоживання не розігнаного FX-8350в порівнянні з чіпом Intel не так і жахливо, хоча фактично воно вище. Однак на графіку ми не бачимо картини загалом. Ми не бачили, щоб чіп працював на частоті 4 ГГц при постійному навантаженні базових налаштуваннях. Натомість, при обробці восьми потоків в Prime95 він зменшив множник і напругу, щоб залишитися в межах заявленого теплового пакета. Тротлінг штучно стримує енергоспоживання CPU. Установка фіксованого множника та напруги помітно підвищує цей показник у процесора Vishera під час розгону.

У той же час, не всі ігри можуть задіяти можливість процесора FX-8350обробляти вісім потоків даних одночасно, отже вони ніколи не зможуть довести чіп до спрацьовування механізму троттлінга.

Як уже зазначалося, під час ігор на нерозігнаному FX-8350тротлінг не активується, оскільки більшість ігор не можуть повністю завантажити процесор. Насправді ігри вигідно використовують технологію Turbo Core, що підвищує частоту процесора до 4,2 ГГц Найгірше чіп AMD показав себе на діаграмі середньої продуктивності, де Intel помітно виходить уперед.

Для діаграми ефективності ми використовуємо середню споживану потужність і середню продуктивність всіх чотирьох змін як середній показник. У цій діаграмі продуктивність на ват процесора AMD FX-8350становить приблизно дві третини від результату Intel.

FX проти Core i7 Чи зможе AMD FX наздогнати Radeon HD 7970?

Коли ми говоримо про непоганий і доступний залізо, любимо використовувати такі фрази як "80% продуктивності за 60% вартості". Ці показники завжди дуже чесні, оскільки у нас вже стало звичкою вимірювати продуктивність, споживану потужність та ефективність. Однак у них враховується вартість лише одного компонента, а компоненти, як правило, поодинці працювати не можуть.

Додавши компоненти, використані в сьогоднішньому огляді, ціна системи на базі Intel зросла до $1900, а платформи AMD до $1724, це без урахування корпусів, периферії та операційної системи. Якщо розглядати готові рішення, то варто додати ще приблизно $80 за корпус, в результаті отримуємо $1984 у Intel і $1804 у AMD. Економія на готовій конфігурації з процесором AMDскладає $180, у відсотковому співвідношенні від загальної вартості системи це небагато. Іншими словами, інші компоненти персонального комп'ютера high-end класу применшують значення вигіднішої ціни процесора.

У результаті у нас залишається два абсолютно упереджені способи порівняння ціни та продуктивності. Ми відкрито зізналися, тому сподіваємось, що нас не засуджуватимуть за представлені результати.

Для AMD вигідніше, якщо ми включимо лише вартість системної плати та CPU та збільшимо вигоду. Вийде така діаграма:

Як третю альтернативу можна розглядати материнську платуі процесор як апгрейд, припускаючи, що корпус, блок живлення, пам'ять та накопичувачі залишилися від минулої системи. Найімовірніше, пара відеокарт Radeon HD 7970у старій конфігурації не використовувалася, тому найрозумніше брати до уваги процесори, системні плати, та графічні адаптери. Таким чином, до списку ми додаємо дві відеокарти із GPU Tahiti за $800.

AMD FX-8350виглядає вигідніше ніж Intel (особливо в іграх на обраних нами налаштуваннях) лише в одному випадку: коли решта системи "безкоштовна". Оскільки інші компоненти не можуть бути безкоштовними, FX-8350теж зможе стати вигідним придбанням для ігор.

Intel та відеокарти AMD

Результати наших тестів вже давно показали, що графічні чіпи ATI більш процесорозалежні, ніж чіпи Nvidia. В результаті, при тестуванні GPU high-end класу ми оснащуємо наші тестові стенди. процесорами Intel, обходячи недоліки платформи, які можуть перешкодити ізоляції графічної продуктивності та несприятливо позначитися на результатах.

Ми сподівалися, що вихід AMD Piledriverзмінить ситуацію, але навіть кількох вражаючих удосконалень виявилося замало, щоб команда розробників CPU порівнялася з ефективністю команди розробників графічних рішень у AMD. Що ж, почекаємо виходу чіпів AMD на базі архітектури Steamroller, яка обіцяє бути на 15% продуктивнішою за Piledriver.

Комп'ютерний портал osblog