Chatgptが推論effortの上限を減らして出力時間を早めた、というのを聞いて、そっちにいくのかとなった 推論によるスケーリングとかどこいったんすか