Вопросы масштабирования мультиядерных процессоров
На уровне технологического производства, крупные производители чипов считают, что мы будем иметь возможность продолжить процесс с текущими технологиями КМОП вплоть до изготовления приблизительно 6 нм (по состоянию на 2010 год, контактный вывод самых передовые технологий – 32 нм). Однако на этом уровне будут возникать, по крайней мере, две основные проблемы:
-По мере того как размер транзисторов будет измеряться в несколько десятков атомов в лучшем случае, должны быть приняты во внимание квантовые эффекты, и, следовательно, мы будем наблюдать повышенную ненадежность аппаратных средств с компонентами, более часто выходящими из строя, и, что еще более важно, работающими с перерывами.
-На чипе не будет много транзисторов, а значит, и это сэкономит энергию, нельзя будет включать их все одновременно, это явление, называемое «проблемой темного кремния», будет иметь значительное влияние на то, как мы будем строить будущие процессоры.
Ненадежность будущих аппаратных средств, вероятно, приведет к реализации механизмов избыточного исполнения. Несколько ядер будут выполнять одни и те же вычисления, чтобы увеличить вероятность того, что по крайней мере одно преуспеет, в некоторых же случаях схема голосования по результату (проверяя, все ли вычисления дали один и тот же результат) может быть использована, чтобы гарантировать правильность расчета.
Такие механизмы, вероятно, будут невидимыми для программного обеспечения, но повлияют на сложность конструкции логических ядер процессора. К проблеме темного кремния сложнее обратиться. Снижая частоту, на которой работают чипы, мы можем продвинуть предел, но в конце концов это перестанет быть проблемой, независимо от того, какой низкой будет частота.
Альтернативные решения включают в себя принятие мемристоров в качестве строительных блоков (вместо транзисторов) и конструкции чипов, где, в любой момент времени, только некоторое подмножество компонентов является активным в зависимости от типа приложения.
Оптические межсоединения внутри и между микросхемами могут также позволить делать более мелкие чипы, соединенные между собой для построение более объемной, кэш-когерентной логической микросхемы.
Другое затруднение для масштабируемости относится к разработке протоколов когерентности кэша. Синхронизация доступа к той же области памяти от большего числа ядер увеличит сложность конструкции последовательности и приведет к увеличению задержки при доступе к часто изменяемым областям памяти. По нашему мнению, это будет тяжелая борьба, направленная на поддержание слаженности на сотнях, а может и на тысяче ядер, даже если мы сможем это сделать, будет трудно оправдать затраты, связанные с этим.
Пропускная способность памяти является еще одним затруднением для масштабируемости. Нивелирование частоты ядра будет приводить к уменьшению задержки, но увеличение числа ядер будет умножать количество данных, требуемых ядрами, и, таким образом, суммарную пропускную способность памяти, которую будущие чипы будут требовать. Если мы действительно видим продолжение закона Мура, переведенного на все возрастающее число ядер, возможно, следуя той же тенденции удвоения количества ядер каждые два года, подобная тенденция потребуется для пропускной способности памяти, как что-то, с чем отрасль не справилась в прошлом.
На основании этих наблюдаемых или прогнозируемых событий и затруднений, по нашему мнению, следующие тенденции будут доминировать в производстве будущих процессоров:
-Сдвиг в сторону простой, низкой частоты, ядер низкой сложности в сочетании с увеличением количества ядер до уровня нескольких сотен в течение пяти-десяти лет, неоднородность – не в архитектуре набора команд, а в основных возможностей, будет играть роль просто потому что это легко способствует оптимизации,
-Фокус на новые технологии памяти, которые могут предоставить более высокий доступ пропускной способности, такие технологии, как 3D-моделирование, оптические межсоединения и, возможно, мемристоры будут наблюдать ускоренное поглощение основных конструкций процессоров, оптические межсоединения особенно имеют потенциал ослабления части давления, связанного с тем, как чипы структурированы и взаимосвязаны.
-Размер внутрисхемной памяти будет также резко увеличен, и мы увидим, что новые инновации позволят уменьшить размеры, снизить энергопотребление и сложность разработки таких решений, похожих на разработку встроенной технологии динамического ОЗУ, еще раз 3D-штабелирование и мемристоры могут быть среди технологий на рассмотрении.
-Будет изобилие аппаратных ускорителей: они требует мало памяти и отличаются низким энергопотреблением, таким образом, мы будем наблюдать в аппаратной реализации увеличивающийся массив алгоритмов.
-«Агрессивные» механизмы оптимизации мощности – припороговая операция, стробирование энергии, частота и напряжение масштабирования, будут распространены не только в областях традиционно низкой мощности, но и в большинстве областей, где используются процессоры.
Некоторые из этих предположений могут сойти на нет, но, в отсутствии революционно нового метода проектирования процессоров, увеличение числа ядер, гетерогенности и зависимость от агрессивных методов оптимизации мощности, скорее всего, будет доминировать в отрасли чипов в ближайшие пять-десять лет.