DeepSeek-R1のビジュアルガイドを読んだ
2025-02-24
A Visual Guide to Reasoning LLMs - A Visual Guide to Reasoning LLMs
The Illustrated DeepSeek-R1 - Language Models & Co.
OpenAI o3やDeepSeek-R1で話題の "Reasoning" LLMモデルに関して,「Chain-of-Thoughtを勝手に実行してくれるつよいモデル」というものすごく雑なメンタルモデルだったのが,だいぶ整理された。このくらいイメージがつくと,オリジナルの論文にも挑戦できそう。
個人的には,最初にあげたMaarten Grootendorstの解説のほうがわかりやすかった。
上記2つの記事の著者,Jay AlammarとMaarten Grootendorstによる
Hands-On Large Language Models (2024年, O'Reilly)
も気になっている。
私がJay Allammarを初めて知ったのは,
だったのだけど,このビジュアライズ解説記事は本当に名作だと思う。