Diit.cz - Novinky a informace o hardware, software a internetu

Llamafile 0.7 přináší podporu AVX-512 a BF16, 10× víc výkonu na Zen 4

Zdroj: AMD

Mozilla během Velikonoc vydala novou verzi Llamafile, která přináší podporu instrukcí AVX-512 a formátu BF16. V praxi to znamená 10× vyšší výkon na procesorech Zen 4 a 8× vyšší s Raspberry Pi 5…

Llamafile je považován za jeden z nejzajímavějších „neprohlížečových“ projektů Mozilly. Umožňuje totiž distribuci a užití velkých jazykových modelů (LLM, Large Language Model) prostřednictvím jediného spustitelného souboru. Díky snazší distribuci se tak velké jazykové modely stávají dostupnějšími pro uživatele. Řešení je poměrně široce kompatibilní a v současnosti schopné využívat jak procesor (CPU), tak grafické jádro (GPU).

V aktuálně vydané verzi Llamafile 0.7 byla doplněna podpora instrukcí AVX-512 a datového formátu BF16 (BFloat16). Ten vznikl z FP32 (32bit IEEE 754), který disponuje 8 bity pro dynamický rozsah (exponent) a 24 bity pro přesnost tohoto formátu (mantisa). BF16 zachovává 8 bitů dynamického rozsahu (exponent), ale přesnost formátu (mantisa) je snížena na 8 bitů. Z hlediska AI výpočtů není pro přesnost výsledků tolik důležitá přesnost formátu (mantisa) jako rozsah (exponent), takže výsledky výpočtů jsou podobně přesné jako při FP32, ale výkon je díky 16 bitům (8 bitů exponent + 8 bitů mantisa) podobný jako při použití FP16.

Podle Phoronixu hlásí uživatelé Llamafile výkonnostní nárůsty ~10× na procesorech postavených na architektuře Zen 4 a ~8× na Raspberry Pi 5 (podporuje 16bit formát). Bližší údaje zatím nejsou k dispozici, ale zhruba řádový posun výkonu lze očekávat na většině hardwaru podporujících AVX-512, zejména v kombinaci s formátem BF16. Z PC procesorů jsou to krom Zen 4 také produkty Intelu, konkrétně generace Cannon Lake, Ice Lake (včetně Rocket Lake) a Tiger Lake. Novější již ne, počínaje Alder Lake Intel podporu AVX-512 deaktivoval u všech generací, které krom velkých jader (jež jsou AVX-512-kompatibilní) disponují i jádry malými (jež jsou AVX-512-nekompatibilní).

Tagy: 
Zdroje: 

Diskuse ke článku Llamafile 0.7 přináší podporu AVX-512 a BF16, 10× víc výkonu na Zen 4

Čtvrtek, 4 Duben 2024 - 21:11 | melkor | Před (ne zas tak moc) dávnými časy bylo AVX-512...
Středa, 3 Duben 2024 - 21:13 | Ladis | Pokud potřebuješ víc než jen pocit ;-)
Středa, 3 Duben 2024 - 13:36 | del42sa | ono nejde jen o bios, od určitého data výroby/...
Středa, 3 Duben 2024 - 13:36 | dawe | Máš Intel, proč by jsi proboha potřeboval avx512...
Středa, 3 Duben 2024 - 10:21 | Martes | Jen malé doupřesnění - Intel u Alder Lake podporu...
Středa, 3 Duben 2024 - 09:18 | Tom Buri | zkousel jsem hledat jak to jede na meteor lake.....
Středa, 3 Duben 2024 - 07:31 | Pety | Ajaj, Intel z toho nebude mít radost.

Zobrazit diskusi