Whisperで音声入力して、LLMは適当なAPIに投げて、返答はvoicevox、っての今更やってるんだけどクソ楽しいな さくらのAI Engineのおかげで3000 req / month までタダで投げられるし
会話
とりあえず工夫とかしなくても1秒くらいで返答が返ってくるのでなんかもう改善する必要がない あとはどう要約するか、メモライズの領域をどう組み立てるかがいちばんの問題だな この辺ももうある程度ベストプラクティスがありそうだな
Whisperで音声入力して、LLMは適当なAPIに投げて、返答はvoicevox、っての今更やってるんだけどクソ楽しいな さくらのAI Engineのおかげで3000 req / month までタダで投げられるし
とりあえず工夫とかしなくても1秒くらいで返答が返ってくるのでなんかもう改善する必要がない あとはどう要約するか、メモライズの領域をどう組み立てるかがいちばんの問題だな この辺ももうある程度ベストプラクティスがありそうだな