Нейропроцессоры, ускорители и древние (без ИИ) ЧИПы

XUC · 9 Авг 2022

Японские физики создали квантовый процессор с рекордно высокой скоростью работы

На расчет каждой из логических операций уходит всего 6,5 наносекунд

ТАСС, 8 августа. Японские физики создали рекорно быстрый двухкубитный квантовый процессор на базе холодных атомов, способный исполнять сотни миллионов операций в секунду. Об этом в понедельник сообщила пресс-служба Национальных институтов естественных наук Японии (NINS).
"Физики уже два десятка лет ускоряют работу кубитов для снижения вероятности того, что случайные шумы породят сбои в их работе. Сверхбыстрая скорость исполнения логических операций, на расчет каждой из которых уходит всего 6,5 наносекунд, позволяет осуществлять вычисления примерно на два порядка быстрее, чем возникают шумы в работе кубитов. В теории, это позволяет игнорировать их действие на компьютер", - говорится в сообщении.
Существует несколько типов кубитов - квантовых аналогов компьютерных битов, построенных на базе сверхпроводников, одиночных атомов или ионов, а также полупроводников. Первые три типа ячеек памяти пока лидируют в "квантовой гонке" по созданию все более сложных вычислительных приборов, так как их работой удобнее управлять, а сами кубиты такого типа совершают меньше ошибок при вычислениях.
Одним из главных препятствий для дальнейшего развития подобных счетных машин является то, что они тратят остаточно много времени на совершение саже самых простых логических операций. В этом отношении большинство квантовых компьютеров уступает их кремниевым аналогам сразу на несколько порядков. Это мешает проведению сложных вычислений, включающих в себя большое число шагов.

Сверхбыстрый квантовый компьютер

Группа японских физиков под руководством Кендзи Омори, профессора Национальных институтов естественных наук Японии в Окадзаки, решила эту проблему для квантовых компьютеров на базе холодных атомов. Роль квантовых битов внутри этих машин играют особые частицы, которые ученые называют атомами Ридберга.
Они представляют собой атомы рубидия-87, чей последний электрон был "отодвинут" на большое расстояние от ядра при помощи особых импульсов лазерного излучения. Благодаря этому размеры атома увеличиваются примерно в миллион раз, что облегчает манипуляции его квантовыми свойствами и позволяет размещать рядом большое число кубитов. Первый квантовый компьютер на их основе был создан в 2017 году группой профессора Михаила Лукина, работающей в Гарвардском университете.
Профессор Омори и его коллеги ускорили работу квантовых компьютеров на базе атомов Ридберга сразу на несколько порядков. Это стало возможным благодаря разработке новой стратегии облучения атомов рубидия-87 при помощи сверхкоротких, но при этом очень мощных импульсов лазерного излучения. Они одновременно переводят соседние атомы в Ридберговское состояние и заставляют их взаимодействовать и участвовать в расчете логических операций.
По текущим оценкам физиков, весь этот процесс занимает около 6,5 наносекунд, что примерно в сто раз быстрее, чем удавалось в прошлом достичь на других квантовых компьютерах на базе холодных атомов. Как надеются исследователи, их подход приведет к созданию новых вычислительных машин, способных исполнять сотни миллионов операций в секунду и решать сложные задачи, полезные на практике.

Источник Для просмотра ссылки Войди или Зарегистрируйся

XUC · 15 Авг 2022

Intel отказалась от аппаратной поддержки API DirectX 9 в своих видеокартах — она будет осуществляться через эмулятор DirectX 12

14.08.2022 [22:23], Николай Хижняк

Компания Intel Для просмотра ссылки Войди или Зарегистрируйся от аппаратной поддержки графического API DirectX 9 интегрированными решениями на архитектуре Xe в составе процессоров Core 12-го поколения, а также дискретными видеокартами Arc A-серии на архитектуре Arc Alchemist. Вместо этого поддержка DirectX 9 будет эмулироваться с помощью API DirectX 12.

Источник изображения: Gunnir

Эмуляция будет использовать конверсионный слой — библиотеку Microsoft D3D9On12 с открытым исходным кодом. В этом случае графические команды DirectX 9 будут направляться в D3D9On12 вместо непосредственной отправки в графический драйвер Intel. Конверсионный слой D3D9On12 будет переводить графические команды D3D9 в запросы, понятные для алгоритмов API D3D12. Если проще, вместо настоящего графического драйвера от Intel функцию драйвера будет выполнять сам D3D9On12.
По словам Microsoft, уровень производительности эмуляции приблизился к уровню производительности фактической реализации API DirectX 9, а в некоторых случаях и совсем ему не уступает.

Для Intel принятое решение может принести пользу. Теперь компания сможет уделить больше внимания оптимизации своих драйверов под более свежий API DirectX 11, поскольку сейчас с этим Для просмотра ссылки Войди или Зарегистрируйся. Все задачи, связанные с оптимизацией DirectX 9 в свою очередь будут «возложены» на Microsoft. Пока неизвестно, последуют ли в итоге примеру Intel компании NVIDIA и AMD. Однако отказ от аппаратной поддержки старого API имеет свои минусы, например, в виде более высокой нагрузки на CPU (D3D9On12 работает на программном уровне) и побочных эффектов в играх с DirectX 9.

Источник: Для просмотра ссылки Войди или Зарегистрируйся

XUC · 20 Авг 2022

Почти все новые процессоры Intel Core будут иметь от 14 ядер и более. Появились спецификации большинства CPU линейки Raptor Lake

Анонс ожидается в следующем месяце

В Сети появились спецификации почти всех настольных процессоров Intel поколения Raptor Lake.
Для просмотра ссылки Войди или Зарегистрируйся
Согласно этому документу, нас ждёт 14 CPU с количеством ядер от четырёх до 24, при этом четырёхъядерник будет лишь один — Core i3-13100. Уже следующая модель (Core i5-13400) будет иметь 10 ядер, и такой она тоже будет одна, ибо Core i5-13500 и ряд более старших CPU предложит уже 14 ядер.
Для просмотра ссылки Войди или Зарегистрируйся
Новый тип кристалла получат только Core i9, так как только у них будет полная конфигурация с восемью большими и 16 малыми ядрами. К слову, Core i9-13900KS в таблице отсутствует, так что его действительно может и не быть, особенно если вспомнить недавние данные о Для просмотра ссылки Войди или Зарегистрируйся для старших Core.

Источник Для просмотра ссылки Войди или Зарегистрируйся

XUC · 20 Авг 2022

Qualcomm хочет вернуться на рынок серверных процессоров. Уже известен первый возможный покупатель

Дата выхода неизвестна

Qualcomm планирует вернуться в сегмент серверных процессоров, которые будут основаны на наработках Nuvia. Эту компанию Qualcomm приобрела в прошлом году. В самой Nuvia разрабатывают Arm-чипы, которые должны быть более быстрыми и энергоэффективными, чем AMD Epyc и Intel Xeon. Однако после слияния компаний речи о серверных решениях не велось.
Для просмотра ссылки Войди или Зарегистрируйся
Теперь же Qualcomm намерена снова вернуться на серверный рынок. Не исключено, что это сделано на фоне успехов Ampere Computig, которая поставляет свои решения для Google Cloud Platform и Microsoft Azure, а также для серверов Gigabyte, HPE и других компаний.
Помимо этого, свои Arm-процессоры Graviton есть у AWS. Там используется третье поколение, но облачный сервис, по данным источника, обратил внимание и на новые серверные чипы от Qualcomm.
Таким образом, скоро возможно расширение этого рынка и появление нового игрока на нём. Отметим, что несколько лет назад у Qualcomm были серверные процессоры Centriq 2400, но от них отказались в 2018 году, сосредоточившись на мобильных чипах.

Источник Для просмотра ссылки Войди или Зарегистрируйся

XUC · 20 Авг 2022

Работая лишь на 66% 96-ядерные процессоры AMD стирают в пыль всех конкурентов. Появились результаты тестирования Epyc Genoa в Cinebench R23

Пара CPU набирает более 110 000 баллов

В Сети появились результаты тестирования двух серверных процессоров AMD Epyc поколения Genoa с 96 ядрами у каждого. Согласно имеющимся данным, это либо Epyc 9664, либо Epyc 9654.
Для просмотра ссылки Войди или Зарегистрируйся
CPU тестировали в Cinebench R23, и нюанс в том, что это ПО распознаёт максимум 256 потоков. У двух 96-ядерных процессоров благодаря поддержке SMT имеется 384 потока. То есть результат, полученный в бенчмарке, отображает лишь две трети возможностей тестируемой пары CPU.
Для просмотра ссылки Войди или Зарегистрируйся
Несмотря на это, процессоры набрали более 110 000 баллов в многопоточном режиме. В однопоточном результат составил 1302 балла.
Для просмотра ссылки Войди или Зарегистрируйся
Для сравнения, примерно столько же (даже чуть больше) набирает один 64-ядерный Threadripper 5995WX, но разогнанный до 5,15 ГГц с применением жидкого азота. Интереснее сравнение с прямым конкурентом в лице Xeon Platinum 8480+. Система с двумя такими 56-ядерными процессорами набирает лишь около 68 500 баллов. Правда, источник говорит, что в работе этих CPU наблюдались проблемы, так что серийные процессоры могут показывать несколько лучший результат. Однако в любом случае разрыв колоссален, ведь даже два 64-ядерных Epyc 7763 текущего поколения набирают 98 000 баллов. В итоге пока неясно, смогут ли хоть как-то новые серверные процессоры Intel противостоять монстрам AMD. К тому же, судя по последним данным, Sapphire Rapids-SP в итоге задержатся ещё сильнее и выйдут только в следующем году.

Источник Для просмотра ссылки Войди или Зарегистрируйся

XUC · 20 Авг 2022

iGPU процессоров Intel Meteor Lake получит поддержку трассировки лучей

Используя графическую архитектуру RDNA 2, мобильные процессоры Ryzen 6000 первыми использовали iGPU с фиксированными функциями Ray Acceleration (RA). Теперь Intel собирается последовать их примеру, добавив те же возможности к своим процессорам Meteor Lake 14-го поколения.
Графическая архитектура Gen12 Xe, представленная в линейке Tiger Lake 11-го поколения, будет заменена модифицированной реализацией Xe-HPG. Именно на последнем основано семейство дискретных графических процессоров Arc Alchemist 1-го поколения.

Однако стоит отметить, что реализация трассировки лучей на этих iGPU следующего поколения может отличаться от Alchemist. Кроме того, блоки XMX будут отключены, что сделает матричное умножение невозможным.
Более простые рабочие нагрузки ИИ по-прежнему могут выполняться с использованием вычислений смешанной точности. Поэтому считается, что графические процессоры Meteor Lake будут оснащены векторными движками/Xe-Core, отличными от Alchemist.
Высокоточные (FP64) расчеты DP выполняются так же, как и в Gen9 и 11, с использованием единиц EM. За последние пару поколений EM был отделён от основных конвейеров FP/INT в единую конфигурацию двойной ширины. Как правило, это приводит к снижению производительности вычислений FP64 при балансировке рабочих нагрузок INT/FO.

Источник Для просмотра ссылки Войди или Зарегистрируйся

XUC · 21 Авг 2022

NVIDIA поделилась некоторыми деталями о строении Arm-процессоров Grace и гибридных чипов Grace Hopper

На GTC 2022 весной этого года NVIDIA впервые Для просмотра ссылки Войди или Зарегистрируйся о себе, как о производителе мощных серверных процессоров. Речь идёт о чипах Grace и гибридных сборках Grace Hopper, сочетающих в себе ядра Arm v9 и ускорители на базе архитектуры Hopper, поставки которых должны начаться в первой половине следующего года. Многие разработчики суперкомпьютеров уже Для просмотра ссылки Войди или Зарегистрируйся новинками. В преддверии конференции Hot Chips 34 компания раскрыла ряд подробностей о чипах.

Grace производятся с использованием техпроцесса TSMC 4N — это специально оптимизированный для решений NVIDIA вариант N4, входящий в серию 5-нм процессов тайваньского производителя. Каждый кристалл процессорной части Grace содержит 72 ядра Arm v9 с поддержкой масштабируемых векторных расширений SVE2 и расширений виртуализации с поддержкой S-EL2. Как сообщалось ранее, NVIDIA выбрала для новой платформы ядра Для просмотра ссылки Войди или Зарегистрируйся.

Для просмотра ссылки Войди или Зарегистрируйся
Источник: NVIDIA

Процессор Grace также соответствует ряду других спецификаций Arm, в частности, имеет отвечающий стандарту RAS v1.1 контроллер прерываний (Generic Interrupt Controller, GIC) версии v4.1, блок System Memory Management Unit (SMMU) версии v3.1 и средства Memory Partitioning and Monitoring (MPAM). Базовых кристаллов у Grace два, что в сумме даёт 144 ядра — рекордное количество как в мире Arm, так и x86.

Для просмотра ссылки Войди или Зарегистрируйся
Внутренняя организация кластеров ядр в Grace. Источник: NVIDIA

Внутренние блоки Grace соединяются посредством фабрики Scalable Coherency Fabric (SCF), вариации NVIDIA на тему сети CMN-700, применяемой в дизайнах Arm Neoverse. Производительность данного интерконнекта составляет 3,2 Тбайт/с. В случае Grace он предполагает наличие 117 Мбайт кеша L3 и поддерживает когерентность в пределах четырёх сокетов (посредством новой версии NVLink).

Но SCF поддерживает масштабирование. Пока что в «железе» она ограничена двумя блоками Grace, а это уже 144 ядра и 234 Мбайт L3-кеша. Ядра и кеш-разделы (SCC) рапределены по внутренней mesh-фабрике SCF. Коммутаторы (CSN) служат интерфейсами для ядер, кеш-разделов и остальными частями системы. Блоки CSN общаются непосредственно друг с другом, а также с контроллерами LPDDR5X и PCIe 5.0/cNVLink/NVLink C2C.

Для просмотра ссылки Войди или Зарегистрируйся
Блок-схема кристалла Grace. Источник: NVIDIA

В чипе реализована поддержка PCI Express 5.0. Всего контроллер поддерживает 68 линий, 12 из которых могут также работать в режиме cNVLink (NVLink с когерентностью). x16-интерфейс посредством бифуркации может быть превращен в два x8. Также на приведённой NVIDIA диаграмме можно видеть целых 16 двухканальных контроллеров LPDDR5x. Заявлена ПСП на уровне свыше 1 Тбайт/с для сборки (до 546 Гбайт/с на кристалл CPU).

Для просмотра ссылки Войди или Зарегистрируйся
Источник: NVIDIA

Основной же межчиповой связи NVIDIA видит новую версию NVLink — NVLink-C2C, которая в семь раз быстрее PCIe 5.0 и способна обеспечить двунаправленную скорость передачи данных на уровне до 900 Гбайт/с, будучи при этом в пять раз экономичнее. Удельное потребление у новинки составляет 1,3 пДж/бит, что меньше, нежели у AMD Infinity Fabric с 1,5 пДж/бит. Впрочем, существуют и более экономичные решения, например, UCIe (~0,5 пДж/бит).

Для просмотра ссылки Войди или Зарегистрируйся
Новый вариант NVLink обеспечит кластер на базе Grace Hopper единым пространством памяти. Источник: NVIDIA

NVLink-C2C позволяет реализовать унифицированный «плоский» пул памяти с общим адресным пространством для Grace Hopper. В рамках одного узла возможно свободное обращение к памяти соседей. А вот для объединения нескольких узлов понадобится уже внешний коммутатор NVSwitch. Он будет занимать 1U в высоту, и предоставлять 128 портов NVLink 4 с агрегированной пропускной способностью до 6,4 Тбайт/с в дуплексе.

Источник: NVIDIA

Производительность Grace также обещает быть рекордно высокой благодаря оптимизированной архитектуре и быстрому интерконнекту. Даже по предварительным цифрам, опубликованным NVIDIA, речь идёт о 370 очках SPECrate2017_int_base для одного кристалла Grace и 740 очках для 144-ядерной сборки из двух кристаллов — и это с использованием обычного компилятора GCC без тонких платформенных оптимизаций. Последняя цифра существенно выше Для просмотра ссылки Войди или Зарегистрируйся, показанных 128-ядерными Alibaba T-Head Yitian 710, также использующим архитектуру Arm v9, и 64-ядерными AMD EPYC 7773X.

Источник Для просмотра ссылки Войди или Зарегистрируйся

XUC · 22 Авг 2022

Образец невыпущенного процессора Intel Cannon Lake-Y с многокристальной компоновкой запечатлён на фото

Коллекционер и обозреватель аппаратного обеспечения, известный под ником YuuKi-AnS, опубликовал любопытный снимок, на котором демонстрируется невыпущенный процессор Intel линейки Cannon Lake-Y. Речь идёт о CPU меньшего по сравнению с Core i3-8121U размера, единственного процессора линейки Cannon Lake, вышедшего на рынок.

Процессор Intel Cannon Lake-Y / Источник изображения: YuuKi_AnS

Процессор имеет необычную компоновку с тремя кристаллами, что отличает его от версии с двумя кристаллами, которая была официально выпущена в рамках восьмого поколения CPU Core U-серии. Согласно имеющимся данным, третьим кристаллом является регулятор напряжения McIVR площадью 13,72 мм².

Характеристики CPU Intel Cannon Lake-Y / Источник изображения: Intel

На процессоре имеется надпись «специальный образец». Неясно, что она означает, но видно, что к изделию подключалась термопара для тестирования мощности и тепловыделения.

Материнская плата с CPU Intel Cannon Lake-Y / Источник изображения: YuuKi_AnS

CPU семейства Cannon Lake изготавливались по техпроцессу 10 нм, были доступны только в двухъядерной конфигурации и использовались в компьютерах NUC Crimson Canyon, а также некоторых доступных ноутбуках. На опубликованном выше снимке запечатлена материнская плата, которая явно не предназначена для мини-ПК NUC, и выглядит весьма необычно с таким миниатюрным процессором в центре. Вероятно, она использовалась для тестирования CPU инженерами Intel.

Источник: Для просмотра ссылки Войди или Зарегистрируйся

XUC · 22 Авг 2022

Intel заявила, что её серверный ускоритель вычислений Ponte Vecchio до 2,5 раза быстрее NVIDIA A100

В рамках конференции HotChips 34 компания Intel поделились новыми деталями о готовящихся к выпуску серверных ускорителях вычислений Для просмотра ссылки Войди или Зарегистрируйся, у которых на одной подложке объединены 63 отдельных элемента (47 функциональных включая GPU). В частности, эксперты компании рассказали о максимальной пропускной способности и производительности ускорителя Ponte Vecchio в вычислениях с одинарной и двойной точностью.

Источник изображений: Intel

В составе Ponte Vecchio используются кристаллы, выполненные по трём разным техпроцессам: Intel 7 (10 нм Enhanced SuperFin), TSMC N7 (7 нм) и TSMC N5 (5 нм). Они объединены между собой с помощью новой упаковкой Foveros и шиной EMIB. В составе одного Ponte Vecchio присутствуют 128 графических ядер Xe, 128 ускорителей трассировки лучей, 64 Мбайт кеш-памяти L1 и 408 Мбайт кеш-памяти L2. Данные ускорители также получили до 128 Гбайт высокоскоростной памяти HBM2e и поддерживают интерфейс PCIe 5.0.

Для просмотра ссылки Войди или Зарегистрируйся
Подсистема памяти и пропускная способность (ниже) Ponte Vecchio

Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся
Ponte Vecchio в задачах DPC++ в сравнении с NVIDIA A100

По словам Intel, в задачах Data Parallel C++ (DPC++) ускорители Ponte Vecchio обеспечивают в 1,4–2,5 раза более высокую производительность по сравнению с серверными ускорителями вычислений NVIDIA A100. Intel также предоставила данные о производительности своего решения в ExaSMR OpenMC (современный код Монте-Карло для исследований и разработок), где Ponte Vecchio обеспечивает вдвое более высокую производительность. А в NekRS (для решения уравнений Навье–Стокса) решение Intel показывает производительность в 1,3–1,7 раза выше конкурента.

Для просмотра ссылки Войди или Зарегистрируйся
Ponte Vecchio в задачах ExaSMR и miniBUDE

Для просмотра ссылки Войди или Зарегистрируйся

Ожидалось, что Intel Ponte Vecchio вместе с серверными процессорами Intel Sapphire Rapids Xeon дебютируют в составе первого американского эксафлопсного суперкомпьютера Aurora. Однако из-за задержки разработки это звание перехватил суперкомпьютер Frontier, оснащённый третьим поколением процессоров AMD EPYC и графическими ускорителями AMD Instinct MI250X, выдающими пиковую производительность в 1,6 Эфлопс.

Источник изображения: VideoCardz

Когда состоится релиз Ponte Vecchio — пока неизвестно. Однако на его замену Intel уже готовит ускоритель Для просмотра ссылки Войди или Зарегистрируйся.

Источник: Для просмотра ссылки Войди или Зарегистрируйся

XUC · 22 Авг 2022

Intel раскрыла подробности о процессорах Meteor Lake, Arrow Lake и Lunar Lake

Компания Intel в ходе конференции Hot Chips 34 поделилась свежими подробностями о технологии 3D-упаковки чипов, которая будет применяться в процессорах Meteor Lake, Arrow Lake и Lunar Lake, и позволит объединить на одной подложке сразу несколько кристаллов, выпускающихся по разным технологическим процессам. Одновременно производитель развеял несколько ранее звучавших слухов о серии чипов Meteor Lake.

Источник изображения: Intel

Встроенная графика процессоров Meteor Lake не будет производиться с использованием 3-нм технологического процесса, как утверждалось в некоторых слухах. По словам Intel, графика этих процессоров разрабатывалась с учётом применения 5-нм техпроцесса. Процессоры Meteor Lake будут состоять из нескольких кристаллов (плиток), объединённых с помощью шины Foveros.
Intel поделилась блок-схемой (изображение выше) потребительского Meteor Lake с шестью производительными и восемью энергоэффективными ядрами. Эти ядра будут являться частью вычислительного чиплета, который будет производиться по нормам техпроцесса Intel 4 (7 нм). Компания этого не уточняла, но показанная блок-схема, вероятнее всего, принадлежит процессору будущей мобильной серии Meteor Lake-P для компактных игровых и довольно производительных рабочих ноутбуков.

Ранее Intel Для просмотра ссылки Войди или Зарегистрируйся другой вычислительный чиплет Meteor Lake, предположительно принадлежащий одной из моделей мобильных процессоров Meteor Lake-U, которые два высокопроизводительных и до восьми энергоэффективных ядер и, вероятно, будут оснащаться менее производительной встроенной графикой.
Intel уточнила, что плитки SoC и ввода-вывода (IO) процессоров Meteor Lake будут производиться с использованием технологического процесса TSMC N6 (6 нм), кристалл встроенной графики будет использовать технологию TSMC N5 (5 нм). При этом все чиплеты будут объединены кристаллом Foveros на техпроцессе Intel 22 нм.

Для просмотра ссылки Войди или Зарегистрируйся
Intel Meteor Lake SoC с кристаллами на разных техпроцессах. Источник изображения: PCwatch

Intel также подтвердила, что запуск процессоров серий Meteor Lake и Arrow Lake ожидается в 2023 и 2024 годах соответственно. Чипы этих серий будут представлены как в мобильном, так и настольном сегментах.

Источник изображения: VideoCardz

Компания добавила, что серия процессоров Lunar Lake, которые придут после Arrow Lake, являются энергоэффективными решениями с номинальным TDP на уровне 15 Вт, что, весьма вероятно, говорит об их мобильной природе. О том, планируется ли выпуск моделей Lunar Lake с повышенным показателем TDP, компания пока не сообщает.

Источник: Для просмотра ссылки Войди или Зарегистрируйся

Нейропроцессоры, ускорители и древние (без ИИ) ЧИПы

XUC

второе пришествие

Японские физики создали квантовый процессор с рекордно высокой скоростью работы

Сверхбыстрый квантовый компьютер

XUC

второе пришествие

Intel отказалась от аппаратной поддержки API DirectX 9 в своих видеокартах — она будет осуществляться через эмулятор DirectX 12

XUC

второе пришествие