gpt-oss の Harmony Response Format を適切に処理する MLX-LM 用プロキシサーバをご紹介

MLX-LM が v0.30.4 で Nemotron をサポートしたということでアップデートしました。そうしたら予想通り gpt-oss のマルチターンチャットができなくなりました。MLX-LM として OpenAI … 続きを読む gpt-oss の Harmony Response Format を適切に処理する MLX-LM 用プロキシサーバをご紹介