Sarashina2-8x70Bモデル
https://www.sbintuitions.co.jp/blog/entry/2024/11/25/175000
>TransformerにMoE層を組み込んだアーキテクチャを採用
https://lmsys.org/blog/2024-07-01-routellm/
RouteLLM: An Open-Source Framework for Cost-Effective LLM Routing
50%zaoriku
AIまわりのPOSTを構造的に整理できないかと試してたけど、うまく行ってない感じ^^;