Kirin 990 — следующий процессор

  A A A

Сегодня процессоры Kirin от Huawei уже вплотную подобрались к топовому игру на рынке Qualcomm и максимально сократили разрыв в бенчмарках с процессорами Snapdragon. Сегодня я расскажу вам о перспективном следующем процессоре Kirin 990.

Навигация по подразделам:

Краткое описание процессора

Прошло не так много времени, как HiSilicon, дочерняя компания китайской корпорации Huawei, выпустила SoC (System-on-a-Chip) Kirin 980.

Однако, судя по исходящим, и уже подтвержденным инсайдам, компания не собирается останавливаться на достигнутом и планирует уже в 2019 пустить в массовое производство новую систему на кристалле — Kirin 990.

Одной из главных особенностей данного чипа будет уже встроенная поддержка сетей пятого поколения 5G, ввод в эксплуатацию которых ожидается в 2019 году.

В этой статье мы попробуем разобраться, что же нам обещает новинка, исходя из различных инсайдов и уже опубликованной информации.

Huawei Kirin 990

Особенности разработки и технологического процесса

Kirin 980 был первым чипсетом, созданным по 7-нанометровому процессу, включая в себя первые ядра ARM из Cortex-A76 серии.

Чипы компании Kirin являются результатом ее тесных отношений с гонконгской TSMC в последние годы. Kirin 960 был разработан по 16-нанометровому процессу, Kirin 970 по 10-ти нанометровому, а Kirin 980 был по 7-нанометровому процессу, включая последний анонсированный.

Отчеты из Китая показывают, что гонконгская TSMC создает чипсет базе 7-нанометрового процессора. Инсайдеры из индустрии также подтверждают, что HiSilicon инвестировала порядка 200 миллионов в разработку и создание данной SoC, что равно около 28 млн долларов/ 25 млн евро. Все это, безусловно, показывает стремление китайской корпорации не зависеть от наработок других компаний.

Производство будет вестись по 7-нанометровому процессу с использованием метода экстремальной ультрафиолетовой литографии.

Согласно последней информации, в настоящее время Huawei является вторым по величине клиентом TSMC, и должен первым внедрить процесс производства процессоров с помощью экстремальной ультрафиолетовой литографии. Эта современная технология основана на так называемом EUV (он же XUV) подтипе ультрафиолетового излучения. Оно используется для создания т.н. «нод» («node»), размер которых на текущий момент оценивается экспертами в 13,5 нанометров.

Поскольку Kirin 990 будет иметь схожую архитектуру, включающую в себя такое же число транзисторов и такие же показатели энергопотребления, как у предшественника, мы можем представить, какой будет анонсированная SoC.

Huawei Kirin 990

Описание основных модулей

Итак, как было сказано выше, Kirin 990 во многом будет схож с предыдущей моделью, за исключением таких модулей, как CPU, GPU и NPU. Также не стоит забывать о главном отличии — наличии уже встроенного в SoC 5G модема Balong 5000. Однако об этом чуть позже. Как и Kirin 980, новая модель будет вмещать в себя 6,9 миллиарда транзисторов, что позволяет процессору достойно проявлять себя в сравнении с ближайшими конкурентами, такими как Qualcomm Snapdragon 855.

Kirin 990 использует самый быстрый вид оперативной памяти на данный момент LPDDR4X. Она функционирует на частотах до 2133 МГц и оснащёна при этом двойным нейромодулем.

Двойной NPU ARM ML обеспечивает более высокие показатели производительности, нежели у предшественников при обработке задач искусственного интеллекта, давая при этом расширенную поддержку интеллектуальных приложений.

Kirin 990, как и предшественник, будет использовать разработанную ранее компанией Huawei технологию обработки изображений ISP 4.0, которая имеет на 46% более высокую пиксельную пропускную способность, что дает возможность поддерживать большее количество камер, заметно снижая при этом уровень шумов и повышая качество воспроизведения цветов. Описанные функции дают возможность конечному пользователю делать более чёткие фотографии и плавные видеоролики практически без ограничений.

Ключевой функцией современных смартфонов является фотокамера и удобство работы с ней. Именно поэтому в последних моделях процессоров Kirin особое внимание уделяется качеству фото и функционалу камеры. Для обеспечения действительно высокого качества фотографий, у нового SoC есть специальный процессор обработки изображений (ISP) четвёртого поколения, который способен поддерживать множество камер в одной конфигурации, а также координировать взаимодействие между ними.

Такие функции как полутона, цветопередача теперь регулируются по зонам, помимо этого данный процессор оснащен новой функцией воспроизведения цветов в режиме HDR. Данная функция способна управлять контрастом изображения, подсвечивая объекты в различных частях кадра.

Kirin 990 имеет улучшенную технологию многоканального шумоподавления, заметно снижающую помехи при съёмке в условиях низкого освещения и в режиме ночной съёмки для создания чистых и детализированных снимков. Другая новая функция ISP — отслеживание движения.

Компанией была довольно значительно увеличена точность автофокуса, при этом процент успешных срабатываний системы определения и распознавания лиц поднялся до внушительных 97,4%. Помимо того, Kirin 990 использует абсолютно новую технологическую цепочку обработки видеокадров, которая способна снижать задержку обработки на 33%.

Интеллектуальные функции процессора

Первый процессор из линейки Kirin, включавший в себя технологии искусственного интеллекта — Kirin 970, представленный широкой публике еще в 2017 году, показал пользователям возможности и функционал локального искусственного интеллекта. Выходящий в этом году Kirin 990 обладает ещё более мощным и функциональным инструментарием для обработки т.н. «интеллектуальных» приложений.

С помощью двойного нейромодуля ARM ML и значительно более высокой, нежели у конкурентов, вычислительной мощности, Kirin 990 предоставляет пользователю такие возможности как интеллектуальное распознавание объектов, лиц, сегментацию изображений, перевод в реальном времени и многие другие функции.

При помощи глубинных нейронных сетей данный модуль имеет возможность выполнять в реальном времени широчайший спектр действий, предоставляя конечному пользователю высокий уровень комфорта и доступность/интуитивность при выполнении повседневных задач. Kirin 990 распознает более 4500 изображений в минуту, и это на 120% быстрее, чем, к примеру, Kirin 970.

Высокая частота считывания кадров (до 30 fps), как и способность распознавать позы нескольких людей одновременно в кадре, дает возможность получать чёткие и яркие снимки людей, находящихся в движении, даже довольно интенсивном.

Новый процессор имеет на борту такие платформы искусственного интеллекта ,как Caffe, TensorFlow и TensorFlow Lite. Они имеет достаточно высокую совместимость с системами глубинного обучения, обеспечивая при этом целый набор полноценных инструментов компиляции — здесь и оффлайн компиляция, онлайн компиляция, а также 8-битное квантование.

Все эти особенности заметно снижают инженерную сложность локальной модели развёртывания, как и использования самой большой вычислительной способности среди аналогов за счёт, в том числе, использования преимуществ процессора нейронных вычислений. Кроме того, данный модуль использует гетерогенные вычисления на CPU, GPU, DSP и NPU, что значительно упрощает процесс автоматического планирования алгоритмов глубокого обучения. Благодаря использованию искусственного интеллекта, поддержке различных фреймворков и значительному набору инструментов для компиляции, Kirin 990 дает широкие возможности разработчикам «интеллектуальных» приложений .

Несмотря на прекращение сотрудничества британской компании ARM с Huawei, в состав чипа Kirin 990 войдут модифицированные вычислительные ядра с архитектурой ARM Cortex-A77.

Ядра Cortex-A77 от ARM являются непосредственным преемником чипа Cortex-A76. В сравнении с предыдущим чипом, Cortex-A77 увеличивает количество команд ядра за такт (IPC) на 20% при аналогичном энергопотреблении, кроме того, увеличивает производительность в задачах машинного обучения (ML) на 25% в сравнении с Cortex-A76 и в целых 35 раз по сравнению с Cortex-A55.

Еще переходы с 16 нм на 10 нм и, затем, на 7 нм, позволили повысить тактовую частоту. Прогресс в архитектуре Cortex-A75 и, далее, Cortex-A76, исходя из отчетов ARM, на текущий момент помог достичь 1,8-кратного прироста производительности. Благодаря росту IPC на новом ядре Cortex-A77, появилась возможность повысить производительность еще на 20 % на той же тактовой частоте, что и раньше. Увеличение IPC на 20 % не повлияло, при этом, на энергопотребление A77, которое осталось на практически прежнем уровне. Этому способствовал тот факт, что площадь кристалла A77 выросла на 17 % в сравнении с A76 при том же самом технологическом процессе. Конечно, такие изменения не могли не затронуть стоимость отдельного ядра. Сравнение достижений ARM с лидерами отрасли показывает нам, что, к примеру, AMD в Zen 2 достигла увеличения IPC на 15 %, в отличии от с Zen+, а значение IPC у Intel уже довольно долгий срок остается неизменным.

Окно исполнения с изменением последовательности команд увеличено на 25 % (до 160 единиц). Это дает возможность ядру A77 повысить параллелизм расчетов.

Уже в Cortex A76 был большой буфер адресов перехода, а в Cortex-A77 он увеличился еще на 33 %, до 8 Кбайт. Это дает возможность блоку предсказания ветвлений. Теперь он может эффективнее справляться с возросшим числом параллельных инструкций.

Помимо того, интересным нововведением стал абсолютно новый 1,5-Кбайт кеш, хранящий в себе макрооперации, возвращаемые из модуля декодирования. Архитектура ядра ARM декодирует инструкции из пользовательского приложения в более мелкие макрооперации, и далее разбивает их на микрооперации, которые передаются уже ядру исполнения напрямую. Кеш используется для уменьшения степени влияния пропущенных ветвлений и сбросов, так как теперь хранятся в отдельном блоке и не требуют повторного декодирования. С помощью такого решения общая пропускная способность ядра увеличивается еще больше. При некоторых видах нагрузок новый блок будет весьма полезным и функциональным дополнением к стандартному кешу инструкций.

Среди значимых изменений ядра можно назвать такие новшества, как добавление второго конвейера шифрования AES, улучшенный механизм предварительной выборки данных следующего поколения, что дает возможность повысить эффективность энергопотребления, а кроме того, еще и увеличить пропускную способность подсистемы DRAM.

Cortex-A77 оказался наиболее производителен при целочисленных операциях и вычислениях с плавающей запятой. Эта особенность была выявлена в результате проведения внутренних тестов ARM в SPEC, показавших увеличение производительности на 20 % в целочисленных операциях и на 35 % в вычислениях с плавающей запятой соответственно. Показатели пропускной способности памяти получили прибавку в 20 %.

Подводя итог, можно сказать, что все виды перечисленных выше изменений и оптимизаций в A77 в среднем на 20% увеличиваются производительность в сравнении с моделями предыдущих поколений, что, несомненно, является важным фактором, позволяющим Kirin 990 успешно идти в авангарде современных тенденций.

Одновременно с новым ядром Cortex-A77 корпорация ARM представила графический процессор, созданный для мобильных однокристальных систем нового поколения. Mali-G77 станет первым графическим процессором, перешедшим с архитектуры ARM Bifrost на Valhall.

Huawei P40
Huawei P40

ARM обещает нам весьма значительный прирост производительности Mali-G77 — на целых 40 % по сравнению с последними процессорами этой линейки Mali-G76. Данный рост производительности обусловлен как измененным технологическим процессом, так и новыми особенностями архитектуры. Mali-G77 будет иметь от 7 до 16 ядер (в перспективе предполагается расширение данного диапазона от 1 до 32), при этом каждое из них практически идентичного же размера, что и у G76. На этом основании можно предположить, что высокопроизводительные смартфоны будут нести в себе такое же количество ядер ГП. В играх, согласно данным бенчмарков, ожидается увеличение быстродействия на уровне от 20 до 40 процентов. Точный цифры будут зависеть от каждого конкретного вида графических нагрузок. На основании широко известного в кругах экспертов теста Manhattan GFXBench, показывающего заметное превосходство нового графического модуля над ближайшими конкурентами, можно сделать вывод, что Qualcomm сделает соответствующие выводы и последующие за этим решения в контексте улучшения производительности графики Adreno. В ARM утверждают, что только сама новая архитектура Mali G77 дает улучшение энергоэффективности или производительности модуля в среднем на 30 процентов. 2-е поколение скалярной архитектуры ARM Valhall дает возможность графическому процессору исполнять в параллельных потоках 16 команд за цикл на CU по сравнению с восемью в Bifrost (Mali G76). Также в данном графическом процессоре реализовано аппаратно управляемое динамическое планирование команд и абсолютно новый набор команд при сохранении, при этом, обратной совместимости с Bifrost. Кроме того, была добавлена поддержка формата сжатия ARM AFBC1.3 и другие нововведения(FP16 render targets, layered rendering и vertex shader outputs).

Важное нововведение, которые мы получили в Mali-G77 — это удвоение производительности текстурного модуля, обрабатывающего теперь 4 билинейных текселя за такт по сравнению с двумя ранее, и 2 трилинейных текселя за такт, тем самым обеспечивая еще более быструю фильтрацию FP16 и FP32.

В ARM внесли и несколько иных изменений, благодаря которым Mali-G77 и Valhall должны значительно увеличить производительность в играх и задачах машинного обучения. Очень немаловажно, что несмотря на такой прирост, энергопотребление и площадь чипа удалось сохранить на уровне Bifrost. Все это, в свою очередь делает возможным производство смартфонов с более высокой пиковой производительностью без повышения при этом показателей электропотребления, а также отсутствия надобности в решении проблемы теплоотвода.

Встроенный 5G модем

Отличительной особенностью Kirin 990 стал встроенный 5G модем. Этим модемом выступит Balong 5000, о чем подробнее ниже.

Модем Huawei Balong 5000 обеспечит SoC Kirin 990 поддержку стандартов 2G, 3G, 4G и 5G. В отличии от предшественников, он эффективно снижает задержку сигнала, а также потребление энергии при передаче данных в нескольких режимах одновременно.

Кроме того, данный модем способен работать одновременно с двумя архитектурами 5G — автономной (SA) и не автономной (NSA). Не автономная архитектура 5G строится на базе ныне существующих сетей 4G LTE, в то время как автономная архитектура — на своей собственной инфраструктуре. Эти преимущества дают модему Balong 5000 широкие возможности по применения в самых различных сетях с самого начала его выпуска.

В диапазоне ниже 6 ГГц чип Balong 5000 обеспечивает теоретическую скорость загрузки данных до 4,6 Гбит/с. В спектре миллиметровых волн пропускная способность достигает 6,5 Гбит/с.

По сведениям инсайдеров, знакомых с ходом разработки модуля,в ходе реальных тестов модем показывал пиковую скорость загрузки данных в 3,29 Гбит/с. При этом средняя скорость оказалась немногим ниже — 3,22 Гбит/с. Таким образом, данный модуль позволит конечному пользователя в реальных условиях передавать информацию со скоростью порядка 400 Мбайт/с.

Продукция с ним и дальнейшие перспективы

В качестве заключения стоит отметить, что первым смартфоном на базе данной SoC станет Huawei Mate 30. Его выход запланирован на октябрь текущего года.

В будущем, на основе Kirin 990 планируется выпустить Huawei P40 (ориентировочно весна 2020 года). Кроме того, возможно, на базе данного чипа будут выпущены смартфоны от дочерней компании Honor. При этом, как уверены эксперты, поставок данного чипа другим компания ожидать не следует.

В будущем на смену Kirin 990 должна прийти модель Kirin 1020. Впрочем, подробных данных об этом пока нет.

Стать и по теме:

Насколько полезна статья?

Нажмите на иконку, чтобы оценить:

Средний рейтинг / 5. Кол-во голосов:

Так как вы считаете статью интересной...

Поделитесь пожалуйста:

Я сожалею, что статья вам не понравилась...

Позвольте мне улучшить статью.

От автора

Techno

Автор публикации: Александр Остин.

Профили в соц сетях:

  • https://twitter.com/TexnobloggerC
  • https://www.facebook.com/texnobloggercomm
  • https://vk.com/texnobloggercomm
  • https://www.reddit.com/user/TexnoBlogger

Спасибо, что дочитали статью до конца. Можете оставить свой комментарий ниже, регистрация не требуется.

Напишите первый комментарий на "Kirin 990 — следующий процессор"

Оставить комментарий

Ваш email нигде не публикуется.


*


Подбор смартфона: