Эльбрус/архитектура: различия между версиями

Материал из ALT Linux Wiki
Строка 22: Строка 22:


Также наблюдается хорошая совместимость v5-машин с кодом v4+ и достаточная как минимум для [[rescue]]-образа работоспособность кода v3+ на v6.
Также наблюдается хорошая совместимость v5-машин с кодом v4+ и достаточная как минимум для [[rescue]]-образа работоспособность кода v3+ на v6.
Это действительно для сборки с [[Эльбрус/оптимизация#-march/-mtune|<tt>-march</tt>, не <tt>-mtune</tt>]].


== Производительность ==
== Производительность ==

Версия от 12:49, 25 октября 2022

Elbrus arch.jpg

Архитектура "Эльбрус"

Оригинальная 64-битная Little Endian VLIW; также известна как "Эльбрус-2000" (сокращённо e2k).

Не путать со SPARC и иными RISC, а также x86 (CISC).

Архитектура ядра Эльбрус

Версии

Микропроцессоры "Эльбрус" различаются версиями микроархитектуры и системы команд; на январь 2021 года известны следующие:

Совместимость

В процессе портирования Альта была отмечена отличная практическая совместимость процессоров четвёртого поколения с бинарным кодом e2kv3, включая ядро, видеоподсистему и даже бинарный транслятор; официально она не гарантируется, хотя неофициально и подтверждается.

Также наблюдается хорошая совместимость v5-машин с кодом v4+ и достаточная как минимум для rescue-образа работоспособность кода v3+ на v6.

Это действительно для сборки с -march, не -mtune.

Производительность

При сборке под e2k для производительности и совместимости следует применять компилятор, настроенный под конкретную версию архитектуры (начиная с lcc 1.23 -- возможна настройка и под конкретный процессор).

При этом разница по 7za b, собранным под v3 и v4, на v4 составила у нас порядка процента.

Известно, что при переходе на e2kv6 "штраф" бинарникам, оптимизированным под предыдущие версии архитектуры, в ряде случаев вырастет, т.к. вследствие значительного роста тактовой частоты сильно изменятся планируемые задержки при работе с памятью и не ожидающий этого код будет чаще попадать на останов конвейера.

В то время как компилируемый код благодаря большим возможностям оптимизации (в т.ч. выявления и задействования скрытого параллелизма) во время компиляции находится в потенциально выигрышном положении по сравнению с суперскалярными архитектурами, виртуальные машины для байткода и интерпретаторы симметрично находятся в положении проигрышном (для их работы характерна высокая степень зависимости по данным в циклах). Это стоит учитывать при планировании разработки.

Ссылки

  1. нет поддержки в OSL после 3.0-rc35, где ядро 3.14.79 и компилятор 1.21.25