Cortex A77 — SD865 не за горами

  A A A

Как обычно ARM как обычно обновили свою флагманскую архитектуру, которая теперь зовется Cortex A77. Сегодня мы разберем два момента, во-первых, посмотрим на заявленную производительность, энергопотребление и просто новые фичи, а во-вторых углубимся чуть глубже в недра микроархитектуры Cortex A77, чтобы разобраться, как там все устроено.

Cortex A77 разработана на основе архитектуры A76, но была доработана так, чтобы улучшить производительность на один поток. Скорее всего это связано с увеличением количества исполняемых инструкций и тут нам обещает прибавку от 20% по сравнению с A76 и, очевидно, что это солидная прибавка, которая делает эту архитектуру пригодной не только для смартфонов, но и ноутбуков работающих под управлением ARM-версии винды. Конечно, все это работает очень схоже с тем, что мы видели в случае с A76. Присутствует поддержка технологии ARM Dynamic в соответствии архитектуре ARM 82 и поддержка исполнения 32 битных инструкций. Были смутные опасения, что поддержку 32-бит выпилят, но нет. Сохранился и многоуровневый кэш, а так как поддерживается технология Dynamic, то и работать могут тут ядра логики big.Little, вместе с ядрами, естественно, Cortex A55, как это и было ранее.

Cortex A77
SPEC 2006 бенчмарк

Интересно что с кэшем ничего не изменилось по сравнению со A76: 512 килобайт кэша L2 и всего 4 мегабайта общего системного кэша. А вот данные с бенчмарка, где мы видим сравнение начиная с Cortex A75 на 10нм и посередине A76 на 7нм, как и A77, кстати. Так вот, A76 давал до 35% преимуществах в производительности в этом однопоточном сценарии, но у него в данном случае заявлено на 200 мегагерц большая частота. А вот A77, несмотря на тот же техпроцесс и частоту работы, предлагает еще 20% сверх того, что было у A76. И все это только за счет улучшения микроархитектуры. То есть, если мы возьмем какой-нибудь Snapdragon 855 и тупо заменим у него ядра A76 на 77, не меняя нормы производства, то получим 20% прибавки производительности. И если мы посмотрим будущее, анализируя, то что было в прошлом, то Qualcomm, который выпускает свои чипы обычно зимой, выпустит что-то типа Snapdragon 865, который будет наверняка основан на ядрах A77, которые в Qualcomm немного тюнингуют и обзовут другим именем типа Kryo.

Несмотря на не утихающие политические разногласия, тот же Huawei должен разработать свои Kirin на ядрах A77, но это не точно. Конечно, есть еще Samsung и MediaTek, но вряд ли новая архитектура появится в этих однокристаллках в скором времени.

Итак, как мы видим, главной целью новой компоновки является увеличение количества используемых инструкций за такт, и при этом сохраняя естественно частотный потенциал, который был уже ядер A76. Также упоминается, что важной целью является достижение энергоэффективности. Это значит, что в идеале чип не должен занимать много места, дабы быть производительным. А значит, он не должен занимать много площади на литографической пластине, то есть о цене в ARM тоже подумали. Но как же достигнуть лучшей производительности на такт, сохраняя частотный потенциал ? Прежде всего надо увеличить длину конвейера, который теперь выполняет 6 инструкций за такт место 4 в A76. В добавок к этом, пропускная способность предсказателя переходов была удвоена, но, что более важно, сам предсказатель был улучшен так, что должен стать более точным. Ну и для кучи был увеличен буфер адресов перехода.

Cortex A77
Параметры Cortex A77

Но есть и революционные улучшения. Во фронтенде вычислительного конвейера был добавлен кэш для макро операций. Чтобы вы понимали, макро операция в понимании ARM это более сложная, чем обычная операция, которая разбивается на одну или более микро операций. В свою очередь и сами макро операции можно склеивать т называется это аппаратной оптимизацией «макро фьюжн».

Кэш для макро операций имеет объем 1,5 КБ на ядро и работает так, как только инструкция выходит с конвеера и попадает в самую первую фазу, фазу расшифровки, то оказывается она в памяти, где и решается ее судьба: будет она декодирована или если она была декодирована ранее, то декодирование происходить уже не будет. Это может съекономить целый такт. Эта система срабатывает в 85 и более процентах случаев при типичных задачах.

Также заявлена динамическая оптипизация кода, которая призвана оптимизировать его таким образом, чтобы выбирались уже исполненные инструкции, дабы по максимуму использовать эту новую фичу.

Смотря на бенчмарки, видим прирост в Geek Bench 4 в 15-20%, увеличена на 15% пропускная способность подсистемы памяти. Но самая большая прибавка ожидается в операциях с числами с плавающей запятой, где прирост может составить от 25 до 35%. Это связано именно с оптимизацией процесса внутри камня. То есть, грубая вычислительная сила здесь не при чем.

Стать и по теме:

Насколько полезна статья?

Нажмите на иконку, чтобы оценить:

Средний рейтинг / 5. Кол-во голосов:

Так как вы считаете статью интересной...

Поделитесь пожалуйста:

Я сожалею, что статья вам не понравилась...

Позвольте мне улучшить статью.

От автора

Techno
Спасибо, что дочитали статью до конца. Можете оставить свой комментарий ниже, регистрация не требуется.

Напишите первый комментарий на "Cortex A77 — SD865 не за горами"

Оставить комментарий

Ваш email нигде не публикуется.


*


Подбор смартфона: