IBM 於數日前發布了 Granite 4.1 系列大型語言模型(LLM)。這些模型採用 Apache 2.0 授權,並提供 3B、8B 和 30B 等不同規模的版本。 Granite 團隊成員 Yousaf Shah 所撰寫的《Granite 4.1 LLMs: How They’re Built》一文,詳細描述了這些模型的訓練過程。 Unsloth 發布了 unsloth/granite-4.1-3b-GGUF 系列,其中包含 3B 模型的 GGUF 編碼量化變體,共有 21 種不同的模型檔案,大小從 1.2GB 到 6.34GB 不等。 這 21 個 Unsloth 檔案總計達 51.3GB,這啟發我終於嘗試了一項我渴望已久的實驗:針對相同模型的不同大小量化變體,提示「生成一張騎自行車的鵜鶘 SVG 圖像」,以觀察其生成結果。 老實說,結果不如我預期地有趣。圖像品質與模型大小之間沒有可辨識的模式——它們的表現都相當糟糕! 圖片 1:六張來自 1.67GB 到 1.2GB 不同大小模型的 SVG 圖像。它們幾乎都是抽象的形狀集合——奇怪的是,最小的模型生成了最好的自行車版本,而最大的模型則生成了略微像鵜鶘的東西。 未來我可能會再次嘗試這項實驗,但會選用更擅長繪製鵜鶘的模型。