なんか久しぶりに画像生成してみようと思ってちょっと調整したらFHDサイズの画像の生成が30秒切ってワロタ 4060(vram 8gb)なのに 最適化がこんなに進んでたのか
会話
関連する投稿
- author @BD1pt0ZCnY
4/10/2026, 12:08:54 AM ToDo TTS・STT・LLMを連結したものは、だいたい作れそう。 ただ、各モデルを何にするか、VRAM 8GBでどれを採用するかは未決。 似たようなものをたくさん作ってしまっているので、どの方向性が一番よいかは整理したい。 とにかく早く、ちゃんと触れるものを作る必要がある。CLI側はある程度できているけれど、Web UIはまだない。 llamaのWeb UIはかなりよいので、そのあたりをベースにするのがよさそう。 実際に触って改善する流れにまだ入れていないのが課題。もっと触りやすくして、検証を回したい。 スマホからの音声入力も、今後の連結先として使えそう。 なのでWeb UIもPC向けより、スマホ向けを先に考えたほうがよいかもしれない。LINEっぽいUXの方向。 別件。 diary.soushou.net に過去のTwitterアーカイブを入れる。 OGP設定をもう少しちゃんとやる。 ルートドメインの活用も考える。継続的なアクセスがある。 他のドメインが全然活用できていないので、その扱いも整理したい。 更新しないという選択肢も含めて検討する。
- author @BD1pt0ZCnY
4/6/2026, 11:25:13 PM Gemma 4-26B-A4Bを動かしてみてる。 8GB VRAMしかないのでまあ8〜10 tok/s くらいしか出ないのだけど、正直意外とそこまでストレスがない。 リアルタイムなやり取りが必要なら流石に30〜40 tok/s くらい欲しくなるけど、別にテキストでのやり取りならこれくらいで十分なんだな
- author @BD1pt0ZCnY
4/5/2026, 7:53:04 PM あと気になっているのは、WhisperとGemma 4を動かしているだけなんだけど、VRAMが6.2とかになっていて。これ、俺の予測が、元々の予定だともっと小さいはずなんだよな。常駐している何らか他にもあってそれが圧迫しているのかな。メモリも意味わからないくらい使われているし、そうなのかも。
- author @BD1pt0ZCnY
3/6/2026, 6:19:30 PM 「十分高度に訓練されたセキュリティ技術者は、パラノイアと区別がつかない。」って感じだな 常識的な楽観を拒否する職業的警戒心が普通の人と相性悪すぎる https://x.com/dnobori/status/2029776804060471515
- author @BD1pt0ZCnY
12/6/2025, 10:02:42 PM 漫画家やVtuberなどの "見られる側" が、"見る側" によって炎上したとき(かつバズっているとき)は「内輪じゃないんだぞ、誰でも見れるSNSでそんなこと言ったほうが悪い」。 読者や視聴者などの "見る側" が、"見られる側" に引用されるなどして炎上したとき(かつバズっているとき)は「晒し上げ、ファンネル飛ばし、犬笛」。 こういう風にSNS上では叩かれたりするわけだけど、この構造ってだいぶ興味深い気がする。 "見る側" が "見られる側" を品評するのは想定されているのだけど、その逆は想定されていないんだよな。 Steamの特定のレビューのスクショを投稿して制作者側が苦言を呈した時も似たような構造だった。 "見られる側" は活動者とかインフルエンサーとか大衆伝達者(造語)、送り手と言ってもいいんだけど、どうも流動的でないんだよね。 この立場は静的なもので、"見られる側" と "見る側" とにはグラデーションがあるはずなのにもう片方へ遷移しにくい。 "見る側" が "品評" してバズったとしても、"見られる側"としては扱われないんだよな あくまでも"見る側"のままなんだ。 ちなみに俺の意見としては、TwitterはコロッセオでバトルアリーナなんだからTwitter上の投稿に対して殴りかかられるのは所与の前提であり、そこに対する文句はナンセンスだと思う。 外界での振る舞いをスクショとかされてTwitter上で燃やされることに対しては文句言ってもいいと思う。