Tag: LLM Architecture
-
Cara open model 2026 membeli efisiensi long-context tanpa mengecilkan diri (magazine.sebastianraschka.com)Engineering · · 16 Mei 2026
-
AI · · 8 Mei 2026
-
DeepSeek-V4 menghabiskan anggaran desainnya agar konteks panjang benar-benar terpakai (huggingface.co)AI · · 24 April 2026
-
Peta varian attention yang benar-benar dipakai LLM modern (magazine.sebastianraschka.com)Engineering · · 22 Maret 2026
-
Peta Sebastian Raschka soal inference-time scaling untuk reasoning (magazine.sebastianraschka.com)Engineering · · 24 Januari 2026