OpenAI gpt-oss を MLX-LM で動かし、Dify や Open WebUI で API ストリーミングチャットができるようにする方法

先日アップした記事では、MLX バージョンの gpt-oss を MLX-LM の API サーバで動かすと Dify や Open WebUI 等では正しく動作しないと書きましたが、server.pyに変更を加えること … 続きを読む OpenAI gpt-oss を MLX-LM で動かし、Dify や Open WebUI で API ストリーミングチャットができるようにする方法