English
version
Задать вопрос

Новости

Все теги
Подписаться на новости

Подпишитесь на рассылку, чтобы всегда быть в курсе последних новостей в мире технологий

Вы успешно подписались!

Мы отправили вам на указанный адрес письмо со ссылкой-подтверждением.

Закрыть
2 июня 2020

Графические ядра PowerVR компании Imagination Technologies: обзор

2 июнь 2020 года — Компания Imagination Technologies — это глобальный технологический лидер, продукты компании затрагивают жизнь миллиардов людей по всему миру. Широкий спектр интеллектуальной собственности компании включает ключевые процессорные блоки, необходимые для создания СнК, которые применяются в мобильной, потребительской и встроенной электронике. Уникальные технологии компании в сфере мультимедиа, передачи данных и процессоров обеспечивают клиентам возможность быстро выйти на рынок с полноценными и легко узнаваемыми платформами СнК. В число лицензиатов Imagination Technologies входят многие ведущие мировые производители полупроводниковых приборов, сетевые операторы, производители OEM/ODM.

Imagination Technologies хорошо известна своими уникальными графическими ядрами PowerVR. Семейство графических процессоров PowerVR (GPU) лидирует на рынке по технологическим возможностям, обширности каталога изделий и развитости сопутствующей экосистемы, тем самым устанавливая планку для мобильных и встроенных графических процессоров. Лидерство графической технологии PowerVR основывается на высокой развитости и уникальности ее архитектуры. За счет отсроченного тайлового рендеринга (TBDR) PowerVR обеспечивают наименьшие требования к пропускной способности и наименьшее количество циклов обработки для каждой задачи, и, как следствие, высокую эффективность и наименьшее энергопотребление на кадр, превосходя тем самым другие решения. OEM-производители, использующие микросхемы с PowerVR, переносят эти преимущества в изделия, которые обеспечивают пользователям самые лучшие визуальные впечатления при максимально возможном времени автономной работы.

В России Imagination Technologies представляет компания НАУТЕХ.

Архитектура PowerVR

В настоящее время у Imagination есть две основные архитектуры ГПУ: Rogue и Furian. Первые ГПУ на базе архитектуры Rogue были выпущены в 2012 году в устройствах линейки PowerVR Series 6. Далее архитектура Rogue была доработана, она развивалась на протяжении нескольких лет и послужила основой для всех графических процессоров Imagination вплоть до устройств линеек Series9XE и Series9XM, датированных 2017 годом. Furian — это более новая архитектура ГПУ. На данный момент существует два графических процессора Furian: PowerVR GT8525 и PowerVR GT8540. Оба являются частью линейки PowerVR Series8XT, что немного сбивает с толку, поскольку графические процессоры Series9XE и XM используют более старую архитектуру Rogue, как и Series8XE и Series8XE Plus.

В ГПУ PowerVR обычно используются четырехзначные номера устройств. Первая цифра — это номер серии. Таким образом, все процессоры в линейках Series8XE и XE Plus начинаются с 8. Процессоры в линейке Series9 начинаются с девяти и так далее. Вторая цифра указывает, сколько пикселей обрабатывается за такт. Как правило, указанное число составляет половину фактической пиксельной скорости. Таким образом, «4» означает восемь пикселей за такт, «2» означает четыре пикселя за такт, а «1» означает два пикселя за такт. Третья цифра указывает на вычислительную мощность графического процессора. Некоторые производители ГПУ указывают количество «ядер» в их устройствах. Термин «ядро» может трактоваться очень вольно – то, что один вендор подразумевает под «ядром», отличается от представления другого вендора. Если кратко, то чем выше третья цифра, тем выше производительность. Скорости различаются для каждого поколения, но если смотреть внутри линейки ГПУ Series9, то:

1 = 64 FP16 FLOP (операций с плавающей точкой чисел с половинной точностью)/такт

2 = 128 FP16 FLOPs/такт

4 = 256 FP16 FLOPs/такт

Последняя цифра является признаком функции. Например, GE8322 (обратите внимание на два в конце) поддерживает сжатие буфера кадра PVRIC (алгоритм сжатия и декомпрессии без потерь в PowerVR), тогда как GE8340 (обратите внимание на ноль в конце) не поддерживает его.

В прошлом графические процессоры использовали два разных типа шейдеров: вершинные шейдеры, которые отвечали за выполнение преобразований в списке точек (вершин) из трехмерного мира в двухмерный мир плоского экрана, и пиксельные шейдеры, которые рассчитывали цвет пикселя на основе информации об освещении и текстуре. Эти шейдеры были программируемыми и, как правило, пиксельных шейдеров было больше, чем вершинных шейдеров. Шейдеры со временем стали ядрами, и с появлением унифицированной шейдерной модели (Unified Shader Model), где шейдер может выступать и в качестве вершинного шейдера, и в качестве пиксельного шейдера, термин «ядро» стал еще более популярным.

По мере развития графических процессоров форма этих ядер начала меняться. Ранее одно шейдерное ядро содержало в себе всю необходимую логику, обеспечивающую планирование, исполнение и отправку инструкций, выполняемых в шейдере (потому что они программируемые). Для увеличения пропускной способности разработчики графических процессоров начали увеличивать некоторые части конструкции шейдера, делая их «толще» в середине. Это позволило удвоить или даже учетверить пропускную способность ядра шейдера, но теперь возник вопрос, выбирать ли одно ядро с четырьмя исполнительными устройствами или четыре ядра. В графических процессорах PowerVR блоки, выполняющие математические вычисления, называются арифметическими логическими устройствами (АЛУ). Они выпускаются в 16-битном и 32-битном вариантах и сгруппированы в кластеры. Так, графический процессор PowerVR GX6650 имеет шесть кластеров, в которых 192 32-битных (FP32) ядра АЛУ.

PowerVR Series8XT GT8525

Архитектура Furian была спроектирована для повышения производительности при обеспечении энергоэффективности, она отличается от конкурирующих решений по параметру производительность на 1 мВт в лучшую строну. По сравнению с GPU Series7XT GT7200, GT8525 достигает:

• Увеличение показателя количества кадров в секунду более чем на 50% в бенчмарке Manhattan, фактически являющемся одним из стандартных тестов для мобильных и других приложений, и на 80% — в бенчмарке TRex;

• Увеличение показателя количества кадров в секунду более чем на 50% в бенчмарке Antutu – другом ключевом тесте;

• Удвоение пропускной способности PPC (8 пикселей/такт по сравнению с 4 для GT7200), что обеспечивает более высокое разрешение и дополнительную производительность в приложениях, ранее ограниченных по скорости заполнения;

• Увеличение показателя числа операций с плавающей запятой (GFLOP) более чем на 50%, рост доступности к вычислительным операциям, что упрощает использование всего потенциала ядра для графики и вычислений.

Архитектура Furian, на которой основано ядро GT8525, отличается улучшенной вычислительной плотностью, эффективностью графического процессора и эффективностью системы, что приводит к снижению энергопотребления и повышению удобства использования в приложениях следующего поколения. Она содержит в себе множество тех уникальных функций, которые вывели PowerVR в лидеры в области графических технологий, в том числе отсроченный тайловый рендеринг (Tile Based Deferred Rendering, TBDR) от Imagination, применявшийся во множестве поколений графических процессоров PowerVR, что обеспечивало наивысшую эффективность для приложений со встроенной графикой.

Для повышения вычислительной плотности и эффективности работы Furian также оснащен новым 32-разрядным кластерным АЛУ. Новая архитектура набора команд (ISA) в первичных и вторичных конвейерах АЛУ обеспечивает лучшее использование ресурсов и, следовательно, повышает эффективность системы, а многопоточная оптимизация обеспечивает эффективный и очень гибкий доступ к локальной вычислительной памяти микросхемы. Furian создана для удовлетворения растущих вычисленных требований многочисленных приложений и сегментов рынка за счет своего эффективного использования вычислительных API, включая OpenCL® 2.0, Vulkan® 1.0 и OpenVX 1.1.

Графические процессоры PowerVR серий 9XE и 9XM

Графические процессоры серий 9XE и 9XM представляют собой результат непрерывной эволюции архитектуры PowerVR Rogue, занимающий минимальную площадь на кристалле и имеющий минимальный профиль энергопотребления. Imagination изначально разворачивает несколько СФ ядер в каждом семействе, предлагая множественные точки, уравновешивающие АЛУ и производительность текстуры, связанных с одно- и многокластерными конструкциями. Высокомасштабируемая архитектура позволяет легко и эффективно генерировать новые СФ ядра для удовлетворения конкретных потребностей клиентов и рынка, а увеличение площади на кристалле соответствует аналогичному увеличению уровня производительности.

Графические процессоры PowerVR серий 9XE и 9XM подняли планку графики и вычислений в чувствительных к стоимости устройствах, позволяя поставщикам СнК добиться значительного повышения производительности без малейшего влияния на площадь на кремнии по сравнению с предыдущим поколением графических процессоров. С помощью графических процессоров PowerVR серий 9XE и 9XM поставщики СнК и производители оборудования (OEM) могут минимизировать затраты и энергопотребление, обеспечивая при этом наилучший пользовательский опыт для игровых приложений и графического пользовательского интерфейса в таких устройствах, как смартфоны, автомобильные информационно-развлекательные системы, телевизионные приставки и телевизоры.

Потребители сегодня хотят иметь на своих устройствах захватывающие графические приложения и технологии, но при этом они часто хотят получать эти устройства с наименьшими возможными затратами. Графические процессоры семейства PowerVR обеспечивают непревзойденные графические характеристики даже для устройств в ограниченном ценовом диапазоне, предоставляя разработчикам СнК гибкое решение, обеспечивающее необходимый уровень производительности для продуктов в любой ценовой категории.

Графические процессоры серии 9XE подхватили эстафету по показателю «пиксельная скорость заполнения на квадратный миллиметр площади на кристалле» предыдущей линейки графических процессоров PowerVR серии 8XE. Это позволяет обеспечить наилучший возможный пользовательский опыт в графических интерфейсах, интерфейсах человек-машина и казуальных играх на недорогих устройствах, включая цифровые телевизионные приёмники, телеприставки, потоковые приставки, автомобильные информационно-развлекательные системы, мобильные и планшетные устройства начального уровня. Диапазон этих устройств был расширен за счет нового ядра со скоростью заполнения 8 пикселей за такт (ПЗТ), которое идеально подходит для приложений с графическим интерфейсом, требующих поддержки видео с разрешением 4K и кадровой частотой 60 кадров в секунду (4K60).

Графические процессоры серии 9XM с повышенной вычислительной плотностью (гигафлопс/кв. миллиметр) являются лучшими в отрасли графическими ядрами для вычислений и игровых приложений на таких устройствах, как премиальные игровые приставки, среднеценовые смартфоны и планшеты, автомобильные информационно-развлекательные системы с возможностью масштабирования до разрешения 4K и выше.

9XE и 9XM также выигрывают от улучшений в подсистеме памяти, сокращая пропускную способность на значение до 25% по сравнению с предыдущими поколениями, это обеспечивает полную эксплуатацию вычислительной мощности. Другие новые функции, общие для семейств 9XE и 9XM, включают в себя новый диспетчер оперативной памяти (MMU), позволяющий использовать расширенный диапазон адресов и стандартную поддержку 10-битного кодирования цветового сигнала по методу YUV по всему диапазону, не затрагивая площадь. Эти ядра также обеспечивают широкий выбор гибких конфигураций.

Основные характеристики графических процессоров PowerVR серий 9XE и 9XM:

• Наилучший показатель производительности на квадратный миллиметр площади кристалла;

• Решение 9XE обеспечивают улучшенную производительность в игровых приложения, сохраняя при этом ту же плотность заполнения, что и в предыдущем поколении графического процессора;

• Графические процессоры 9XM используют несколько новых и улучшенных архитектурных элементов для достижения на 70% лучшей плотности производительности, чем конкурирующие продукты*, и до 50% лучшей, чем предыдущее поколение серии 8XEP;

• Экономия полосы пропускания на значения вплоть до 25% по сравнению с графическими процессорами предыдущего поколения за счет архитектурных усовершенствований, включающих параметрическую компрессию и группировку тайлов;

• Улучшения в системе памяти: 36-разрядная адресация для улучшения системной интеграции, улучшенные размеры пакетов для эффективного доступа к памяти и расширенные возможности компрессии;

• Чрезвычайно низкое энергопотребление за счет опробированной компанией Imagination Technologies технологии отсроченного тайлового рендеринга (Tile Based Deferred Rendering — TBDR);

• Поддержка аппаратной виртуализации и технологии мультидоменной безопасности Imagination OmniShield ™, позволяющая клиентам создавать системы, в которых приложения и операционные системы могут надёжно и независимо друг от друга работать на одной платформе;

• Поддержка графических API-интерфейсов Khronos, включая OpenGL ES 3.2 и Vulkan 1.0, и расширенные API-интерфейсов для вычислений и машинного зрения, таких как RenderScript, OpenVX ™ 1.1 и OpenCL® 1.2 EP;

• Опциональная поддержка новейшей технологии PVRIC3, новейшей PowerVR-технологии сжатия изображений без потерь для оптимальной эффективности системной интеграции.

Графические процессоры PowerVR серий 9XE и 9XM также идеально подходят для использования с ускорителем нейронных сетей PowerVR 2NX (NNA). Представленный компанией Imagination Technologies ускоритель нейронных сетей PowerVR серии 2NX (NNA) позволяет разработчикам, создающим СнК для мобильных систем, систем видеонаблюдения, автомобильных и потребительских систем, достичь высокопроизводительных вычислений нейронных сетей при очень низком потреблении энергии на минимальной площади кремния. В таких устройствах как мобильные телефоны, где требуется графический ускоритель, разработчики могут использовать графические процессоры серий 9XE / 9XM для управления классическими алгоритмами обработки изображений и выгружать вычисления нейронной сети на ускоритель PowerVR 2NX. За счет плотности производительности PowerVR NNA и графических процессоров лицензиары могут реализовать эту комбинацию на площади кремния, сравнимой с занимаемой конкурирующими решениями отдельных графических процессоров.

В настоящее время для лицензирования доступны следующие конфигурации СФ-ядра графического процессора серии 9XE:

• 1 ПЗТ с 16 F32 флопс / такт (GE9000)

• 2 ПЗТ с 16 F32 флопс / такт (GE9100)

• 4 ПЗТ с 32 F32 флопс / такт (GE9210)

• 8 ПЗТ с 64 F32 флопс / такт (GE9420).

СФ ядра серии 9XM доступны для лицензирования в конфигурациях:

• 4 ПЗТ с 64 FP32 флопс / такт (GM9220)

• 4 ПЗТ с 128 FP32 флопс / такт (GM9240)

• 8 ПЗТ с 128 FP32 флопс / такт (GM9440)

Компания Imagination Technologies также предоставляет разработчикам бесплатный доступ к кросс-платформенному комплекту разработки ПО (SDK) PowerVR, рассчитанному на поддержку всех аспектов разработки 3D-графики. Также предоставляются инструменты и утилиты, которые облегчают разработку 3D-графики и вычислительных приложений для графических ускорителей. Разработчики могут присоединиться к сообществу PowerVR Insider Community, бесплатно загрузить SDK бесплатно и взаимодействовать через форумы разработчиков http://community.imgtec.com/developers/powervr/.

Для разработчиков доступны комплекты для оптимизации проектирования на физическом уровне (DOK), что позволяет клиентам гибко оптимизировать энергопотребление, производительность и площадь на кристалле. Комплект DOK компании Imagination включают в себя оптимизированные эталонные маршруты проектирования, настроенные библиотеки от партнёров, диагностические данные и документацию.

IMG A-Series — новое поколение графических процессоров Imagination Technologies

В начале этого года компания Imagination Technologies выпустила новое, десятое поколение своей графической архитектуры PowerVR, названное IMG A-Series. Решение IMG A-Series уже лицензировано на различных рынках, и появление первых СнК с физической реализацией ожидается в течение 2020 года.

Представляя собой самые быстродействующие из когда-либо выпущенных IP-блоков графических процессоров, IMG A-Series выводит архитектуру графических ускорителей PowerVR на новый уровень для удовлетворения потребностей разработки целого спектра устройств следующего поколения в задачах обработки графики и вычислений. Линейка IMG A-Series, призванная стать «графическим процессором всего», ориентирована на самые разнообразные рынки, от автомобильной электроники, искусственного интеллекта вещей (AIoT) до цифровых телевизионных устройств (DTV/STB/OTT), сервисов мобильной связи и серверных приложений. Графические ядра IMG A-Series позволяют масштабировать производительность от 1 пикселя на такт (PPC) для устройств начального уровня до 2-х терафлопс для высокопроизводительных устройств и, далее, до многоядерных решений в облачных приложениях.

По сравнению с другими доступными на сегодняшний день IP-блоками графических процессоров IMG A-Series обеспечивает более высокую производительность, более низкое энергопотребление (при одинаковых тактовых частотах и техпроцессах) и меньшую требуемую полосу пропускания (при том же размере кеша, что и у конкурентов), и всё это — при меньшей площади кремния. Архитектура IMG A-Series также выгодно отличается от других гарантированным сжатием графических данных на 50%, в большинстве случаев вообще без потерь (lossless), или же, в исключительных случаях, визуально-без-потерь (visually lossless). Также, в сравнении с предыдущими ядрами PowerVR, по каждому параметру IMG A-Series обеспечивает значительное улучшение при аналогичных тактовой частоте и технологическом процессе, показывая в 2,5 раза более высокую производительность, в 8 раз более быстрое машинное обучение и 60% экономию по потребляемой мощности.

Высокопроизводительные версии СФ-блоков IMG A-Series, самые мощные из когда либо выпущенных мобильных графических процессоров, доступны в пяти конфигурациях:

● IMG AXT-64-2048 для флагманской производительности — 2.0 TFLOPS, 64 Gpixels и 8 TOPS производительности в приложениях ИИ;

● IMG AXT-48-1536 для премиальных приложений мобильной связи — 1,5 TFLOPS, 48 Gpixels и 6 TOPS;

● IMG AXT-32-1024 для высокопроизводительных мобильных и автомобильных приложений — 1 TFLOP, 32 Gpixels и 4 TOPS;

● IMG AXT-16-512 для мобильных устройств и автомобильной электроники верхнего и среднего уровня производительности — 0,5 TFLOPS, 16 Gpixels и 2 TOPS;

● IMG AXM-8-256 для мобильных устройств среднего уровня производительности — 0,25 TFLOPS, 8 Gpixels и 1 TOPS.

В более дешевых сегментах IMG A-Series также отличаются лучшим соотношением занимаемой площади, себестоимости и производительности:

● IMG AX-2-16 для премиум-класса устройств интернета вещей, простых приставок DTV/STB, дисплеев и других приложений, требовательных к пиксельной скорости заполнения — 2 PPC, 16 GFLOPS и 2 Gpixels;

● IMG AX-1-16 для простых мобильных устройств и интернета вещей (кроме того, это самый быстрый графический процессор с поддержкой Vulkan в своем классе) — 1 PPC, 16 GFLOPS и 1 Gpixels.

Графические процессоры IMG A-Series также позиционируются как лучшие мобильные графические процессоры для геймеров. Большинство мобильных графических процессоров из-за ограничений теплового режима испытывают трудности с поддержкой постоянного игрового процесса — они могут работать быстро короткое время, затем замедляются до недопустимого уровня и после этого не восстанавливаются, что приводит пользователя к разочарованию. IMG A-Series обеспечивает устойчивую производительность в течение продолжительного игрового процесса при постоянной частоте кадров, избегая перегрева, сбоев в функционировании и понижения тактовой частоты при росте температуры.

Архитектура IMG A-Series PowerVR имеет преимущества по полосе пропускания и энергопотреблению, поскольку в ней используется технология отложенного мозаичного рендеринга (tile-based deferred rendering), за счет которой прорисовывается только то, что видно на экране. Она сочетается с продвинутой системой прямой гибкой подачи питания, использующей алгоритмы Pro-Active DVFS (Dynamic Voltage and Frequency Scaling, динамическая подстройка напряжения и частоты) и Deadline Scheduling (планирование сроков исполнения), которые обеспечивают быстрое управление питанием и отклик со сверхнизкой задержкой. Если какие-либо элементы графического процессора не используются полностью и не заняты обработкой данных, система их немедленно замедляет или даже переводит в режим ожидания — это обеспечивает энергоэффективность устройства.

IMG A-Series предоставляет наилучший пользовательский опыт в играх за счет стабильной частоты кадров. Для этого нужна высокая энергоэффективность графического процессора, что обеспечивается в PowerVR интеллектуальными встроенными микропрограммами с гибкими алгоритмами DVFS, дающими малую задержку при прямом управлении системой через GPIO. IMG A-Series также гарантируют визуально безупречные пиксели за счет лучшего в отрасли алгоритма сжатия класса «визуально-без-потерь» PVRIC и полностью обновленных алгоритмов анизотропной выборки и регулирования уровня детализации.

IMG A-Series поддерживается лучшими в отрасли средствами проектирования и комплектами разработчика программного обеспечения (SDK), которые предлагают новые функции, такие как аппаратные тепловые карты, помогающие разработчикам оптимизировать свой контент.

Еще одной особенностью IMG A-Series является технология HyperLane компании Imagination Technologies: аппаратные каналы управления, каждый из которых изолирован в памяти, разделены так, что это позволяет одновременно передавать на графический процессор различные задачи и обеспечивать безопасность при многозадачности графического процессора. За счет динамического управления производительностью (Dynamic Performance Control) графический процессор может распределять свою производительность по этим нескольким задачам, выполнять их все и тем самым максимизировать свою загрузку. Приоритетные каналы HyperLanes осуществляют динамическое разделение: например, при обработке графики обеспечивают производительностью одно приложение, в то время как другие задачи выполняются параллельно с использованием оставшихся ресурсов. Технология HyperLane также может изолировать конфиденциальный контент для управления правами. Все графические процессоры серии IMG A поддерживают до восьми каналов HyperLane.

За счет HyperLane также работает новая функция AI Synergy. Она позволяет разработчикам СнК использовать вычислительные возможности IMG A-Series для максимизации рабочих нагрузок приложений ИИ. Благодаря AI Synergy графический процессор осуществляет высокопроизводительные графические вычисления, используя свой свободный ресурс для обеспечения функционирования программируемого ИИ наряду с фиксированным набором функций высокооптимизированного ускорителя нейроных сетей Imagination. AI Synergy реализует программируемый ИИ при самой малой площади на кристалле, а унифицированный программный стек обеспечивает гибкость и высокую производительность.

Основные характеристики графических процессоров IMG A-Series:

● Самый производительный из когда либо существовавших СФ-блок графического процессора;

● 5-кратная плотность производительности по сравнению с лучшими из существующих устройств PowerVR;

● Возможность масштабирования под любые сегменты рынка графических процессоров;

● Одноядерные варианты с производительностью от 1 PPC до 2,0 TFLOPS;

● Наилучшая стоимость реализации для разработчиков и оптимальная цена для потребителей за счет высокой плотности производительности;

● Наличие технологии приоритизации каналов HyperLane с поддержкой технологии многозонной аппаратной виртуализации;

● Пакет опций для автомобильной электроники с долгосрочной поддержкой, сертификацией ISO 26262 и документацией;

● Компрессия графики PVRIC 4.1 (без-потерь или визуально-без-потерь), гарантирующая постоянное снижение на 50% загрузки трактов данных и сокращение занимаемой площади на кристалле;

● Усовершенствованная технология гибкого прямого управления питанием;

● Унифицированный API приложений ИИ для использования в сочетании с ускорителями нейронной сети PowerVR;

● Поддержка новейших стандартов API, включая OpenGL® ES, Vulkan ™, OpenCL ™.

Обзор составлен по материалам сайтов nautech.ru и imgtec.com