DeepSeek-R1のビジュアルガイドを読んだ

2025-02-24

OpenAI o3やDeepSeek-R1で話題の "Reasoning" LLMモデルに関して，「Chain-of-Thoughtを勝手に実行してくれるつよいモデル」というものすごく雑なメンタルモデルだったのが，だいぶ整理された。このくらいイメージがつくと，オリジナルの論文にも挑戦できそう。

個人的には，最初にあげたMaarten Grootendorstの解説のほうがわかりやすかった。

上記2つの記事の著者，Jay AlammarとMaarten Grootendorstによる

も気になっている。

私がJay Allammarを初めて知ったのは，

だったのだけど，このビジュアライズ解説記事は本当に名作だと思う。