Intel поделилась подробностями о гибридной архитектуре Alder Lake и новой графике Arc

Умный суперсемплинг, Рей-трейсинг в видеокартах и 19% рост IPC в процессорах

9577
8

Новые процессоры Alder Lake сочетают полноценные мощные ядра с маленькими энергоэффективными и сегодня Intel поделились подробностями о принципах работы новых гибридных процессоров. Новые гибридные процессоры и многочисленные оптимизации Intel позволят повысить IPC (Instructions Per Clock) за счет нескольких факторов, включая:

  • Кэш подсистемы предсказания ветвлений на 5 тысяч записей для более точного результата;
  • 64-килобайтный кэш инструкций оптимизирован хранить наиболее частые инструкции ближе, не обращаясь к внешней памяти;
  • Первый декодер длины инструкций Intel, который производит предварительную информацию для запроса;
  • Кластеризованный внеочередной (out-of-order) декодер, который позволяет декодировать до 6 инструкций за такт с сохранением уровня энергоэффективности;
  • Расширенный исполнительный модуль с 5 регистрами переназначения и 8 регистрами завершения инструкций, буфером на 256 внеочередных инструкций и 17 исполнительными портами;
  • Надежные функции безопасности, включая аппаратную защиту от кибератак Intel® Control- Flow Enforcement Technology (CET) и защиту от перенаправлений Intel® Virtualization Technology;
  • Реализация расширения системы команд AVX наряду с новыми дополнениями для поддержки целочисленных операций ИИ.

В сравнении с ядром Skylake, в сингл-треде энергоэффективное ядро Alder Lake предоставляет на 40% больше производительности при одинаковом энергопотреблении, или аналогичную производительность при уменьшенном на 40% энергопотреблении. Четыре энергоэффективных ядра без использования технологии Hyper Threading имеют производительность на 80% выше, чем 2 ядра и 4 потока Skylake, потребляя при этом меньше энергии или схожую производительность при использовании лишь 20% энергии от Skylake.

Intel поделилась подробностями о гибридной архитектуре Alder Lake и новой графике Arc

Производительные ядра Alder Lake, ранее известные как Golden Cove спроектированы для уменьшения задержек и высокой производительности в сингл-треде. Новые производительные ядра обеспечивают большой скачок в производительности и лучшую приложений с большим объемом кода.

Архитектура производительных ядер расширилась в следующих направлениях:

  • Шире: 6 декодеров (ранее 4), кэш на 8 микроопераций (ранее до 6), 6 портов переименования/распределения (ранее 5), 12 исполнительных портов (ранее 10);
  • Глубже: больше файлы регистров, больше файлы физических регистров, более глубокий буфер переупорядочивания инструкций на 512 записей;
  • Эффективнее: повышенная точность предсказания ветвлений, уменьшенная эффективная латентность кэша L1, полная предикативная оптимизация записи кэша L2.

В сочетании с другими оптимизациями и нововведениями Intel обещают:

  • Рост производительности до 19% при тестах на большом количестве популярных приложений по сравнению с архитектурой Intel® Core™ 11-го поколения (Cypress Cove) при сравнимой тактовой частоте (общий показатель роста считается как среднее геометрическое);
  • Упор на параллелизм и наращивание исполнительного параллелизма;
  • Расширения Intel® Advanced Matrix – встроенные средства ускорения ИИ нового поколения, предназначенные для инференса глубокого обучения и повышения эффективности обучения. Они включают выделенные аппаратные модули и новую архитектуру набора инструкций для значительного ускорения операций перемножения матриц;
  • Оптимизации работы с приложениями, имеющими большой объем данных и кода, в том числе c точки зрения уменьшения задержек.

Раджа Кодури рассказал о новой графике Intel Arc и первом поколении производительных дискретных решений под кодовым названием Alchemist.

Intel поделилась подробностями о гибридной архитектуре Alder Lake и новой графике Arc

SoC Alchemist на базе микроархитектуры Xe HPG спроектированы для обеспечения высокой масштабируемости и вычислительной эффективности со следующими ключевыми возможностями:

  • До 8 слоев рендеринга с фиксированной функцией для DirectX 12 Ultimate;
  • Новые ядра Xe с 16 векторными и 16 матричными движками (называемыми XMX – Xe Matrix eXtensions), кэшем и общей локальной памятью;
  • Новые модули трассировки лучей с поддержкой технологий DirectX Raytracing (DXR) и Vulkan Ray Tracing;
  • Увеличение частоты в 1,5 раза и соотношения производительности на ватт в 1,5 раза по сравнению с микроархитектурой Xe LP за счет сочетания новой архитектуры, логического построения, схемотехники, технологии производства и оптимизации программного обеспечения1;
  • Производство с нормами технологического процесса TSMC N6. 

При разработке графики Intel использует подход, ориентированный на программное обеспечение:

  • Архитектура Xe создается в тесном сотрудничестве с разработчиками в соответствии с отраслевыми стандартами;
  • Первый высокопроизводительный игровой графический процессор Intel ставит во главу производительность и качество благодаря разработке драйвера с единым унифицированным исходным кодом для интегрированных и дискретных графических продуктов;
  • Intel завершила рефакторинг ключевых компонентов графического драйвера, в том числе диспетчера памяти и компилятора, что привело к повышению производительности в процессорозависимых играх до 18% и уменьшению времени загрузки игры до 25%.

Технология XeSS

XeSS использует преимущество реализованных в Alchemist ускорителей ИИ для новой технологии масштабирования, которая обеспечивает высокую производительность и высокое качество изображения. Технология использует глубокое обучение для синтеза изображений, близких по качеству к рендерингу с высоким разрешением. Благодаря XeSS, игры, в которые можно играть только при низких настройках качества или разрешения, могут демонстрировать плавный игровой процесс с более высокими настройками качества и разрешения.

  • Работа XeSS заключается в реконструкции деталей на субпиксельном уровне из соседних пикселей, а также из предыдущих кадров с компенсацией движения;
  • Реконструкцию выполняет нейронная сеть, обученная обеспечивать высокую производительность и качество, с увеличением производительности в 2 раза;
  • XeSS обеспечивает суперсэмплинг на базе ИИ с помощью набора инструкций DP4a на широком списке оборудования, включая интегрированную графику;
  • Несколько разработчиков игр задействованы в работе над XeSS. SDK для первой версии XMX будет доступен независимым разработчикам программного обеспечения уже в этом месяце, а версия с DP4a будет доступна позже в этом году.
Другие публикации по теме
NVIDIA пока поглощает рост цен на GDDR7 для геймеров за свой счет
NVIDIA пока поглощает рост цен на GDDR7 для геймеров за свой счет
Линейка видеокарт NVIDIA Blackwell (RTX 50) столкнулась с дефицитом памяти GDDR7, приоритет поставок которой перешел к ИИ-сектору, и новые данные гласят, что пока "зеленые" самостоятельно поглощают растущие цены на память для геймеров для избегания слишком быстрого роста цен на конечные продукты.
18 января в 16:00
3390
10
Форум
Цена одной RTX 5090 скоро превысит цену готовой сборки с RTX 5090 внутри
Цена одной RTX 5090 скоро превысит цену готовой сборки с RTX 5090 внутри
В рознице в США вскоре может случиться очень забавный курьез. Суть в том, что ценники на видеокарты NVIDIA GeForce RTX 5090 растут так быстро, что они вполне успешно стремятся к обгону цен полноценных готовых ПК с такими же RTX 5090 внутри.
18 января в 15:51
544
1
Форум
AMD теперь отдает приоритет RX 9070 XT вместо обычной версии без приставки XT
AMD теперь отдает приоритет RX 9070 XT вместо обычной версии без приставки XT
Компания AMD в начале 2026 года изменила свою стратегию по выпуску линейки RDNA 4.
18 января в 12:00
449
0
Форум