不必花大錢,也能蓋出一套 AI 應用
最好用的 AI 開發工具,很多都是開源的——一整套正在成形的生態系,讓 AI 對每個人都變得可親
「做 AI 應用一定很燒錢」——真的嗎?
很多人第一次想動手做 AI 產品,腦中浮現的都是同一個畫面:得先付一筆昂貴的 專有模型 API 帳單、租一堆昂貴的雲端向量資料庫、再買一套封閉的商用平台。彷彿 AI 這桌菜,只有口袋夠深的人才吃得起。
ByteByteGo 這篇短文想戳破的,正是這個迷思。它的主張直截了當:你不需要花一大筆錢,就能蓋出一套 AI 應用。因為現在最好用的一批 AI 開發工具,其實都是 開源的,而且一整套優秀的生態系正在成形,讓 AI 逐漸對每個人都變得可親。
把「蓋一套 AI 應用」想像成蓋一棟房子。你以為每一塊磚、每一根鋼筋都得跟同一家貴森森的建材行買——結果轉頭發現,隔壁的社區工坊早就免費提供了地基、水管、外牆、甚至裝潢,品質還不輸大廠。你要做的,只是把這些現成的好料,一層一層疊起來。
直接讀原文:這篇短文的核心主張
這段開場白,就是全篇的立論根基。它不是說「開源比較便宜」而已,而是更強的一句——最好的工具本來就是開源的。逐句對照原文最精準:
你不需要花一大筆錢,才能蓋出一套 AI 應用。
最好的 AI 開發工具都是開源的,而且一整套優秀的生態系正在成形,能讓 AI 對每個人都變得可親。
這套開源 AI 技術棧的關鍵組成如下:……(接下來就是本章的主角——五個分層)
「技術棧(stack)」這個詞,字面上就是「一疊」。它指的是打造一套完整應用,由下而上疊起來的那一整組技術——每一層各司其職,上層站在下層的肩膀上。這篇短文接下來要做的,就是把 AI 應用拆成 5 個分層,並在每一層點名幾個好用的開源工具。
開源到底幫你省下、換來了什麼
原文的立場很清楚:開源工具好用、生態系正在成熟。為了讓零背景的你更有感,這裡補上業界公認的三個直覺——注意,這是通識背景,不是原文額外的主張。
開源模型與工具通常免費取得,不必為了「先試試看」就綁定昂貴的商用授權或按次計費的 API。門檻一降,任何人都能開始動手。
原始碼與模型權重公開,你能看清底層在做什麼、按自己的需求修改,甚至把模型下載到自己的機器上跑,資料不必外流。
原文特別強調「一整套優秀的生態系正在成形」——各層都有多個成熟選項互相搭配,讓 AI 對每個人都變得可親,而不是被少數大廠鎖死。
知道了「為什麼開源能讓你不燒錢」,接下來就進入本章的主角——一張五層技術棧的互動架構圖。點一點每一層,看看它負責什麼、原文又點名了哪些開源工具。往下捲。
五層技術棧:由下而上蓋一套 AI 應用
從最底層的模型,到最上層的畫面——每一層點名幾個原文推薦的開源工具
點一點:五層開源 AI 技術棧
這就是本章的主角。原文把一套 AI 應用拆成 5 個關鍵分層,從上而下分別對應使用者看得到的畫面、一路到最底層的大型語言模型。點一點下面每一層,看看它負責什麼、原文又點名了哪些開源工具。
最下面的大型語言模型是引擎,往上是幫它存取/撈資料的資料層、串接邏輯的後端、讓答案更準的嵌入與 RAG,最上面才是使用者摸得到的前端。每一層都站在下一層的肩膀上——這也是為什麼工程師習慣把它畫成一疊「stack」。
逐層拆解:每一層在忙什麼
剛剛點過一輪,這裡再用文字把五層一次收攏。每張卡片=一層,括號裡是原文為那一層點名的開源工具。
使用者操作的畫面。要蓋出漂亮的 AI UI,NextJS 和 Streamlit 這類框架非常好用;部署則可以靠 Vercel。
嵌入模型與 RAG 函式庫,如 Nomic、JinaAI、Cognito、LLMAware,幫開發者做出準確的搜尋與 RAG 功能。
後端開發可以靠 FastAPI、Langchain、Netflix Metaflow 這些框架;要取用模型,則有 Ollama、Huggingface 可選。
資料儲存與檢索,有 Postgres、Milvus、Weaviate、PGVector、FAISS 等多個選項——其中好幾個正是專門存向量的資料庫。
根據效能基準測試,Llama、Mistral、Qwen、Phi、Gemma 這些開源模型,是 GPT、Claude 等專有 LLM 很好的替代選擇。
常有人把「嵌入與 RAG」和「資料層」搞混。可以這樣記:第 4 層的向量資料庫是倉庫(負責存放、快速撈出向量);第 2 層的嵌入模型與 RAG 函式庫是物流(負責把文件轉成向量存進去、查詢時撈出最相關的內容再交給模型)。兩層合作,才有精準的搜尋與 RAG。
開源模型,真能取代 GPT、Claude 嗎?
這是很多人最關心的一題。原文對最底層——大型語言模型——給的說法很明確,值得再看一次原句:
根據效能基準測試,Llama、Mistral、Qwen、Phi、Gemma 這些開源模型,是 GPT、Claude 這類專有 LLM 很好的替代選擇。
原文說的是開源模型「是很好的替代選擇(great alternatives)」,依據是效能基準測試——它並沒有斷言開源模型全面勝過專有模型。這正呼應全篇主張:你有得選,而且選開源不必花大錢就能蓋出可用的 AI 應用。至於在你的場景下要選哪個,仍得自己評估。
小試身手
五層各自的職責、原文的立場,來三題核對一下。
一套 AI 應用=五層堆疊:模型(LLM)→ 存取/撈資料(Data)→ 串邏輯(Backend)→ 讓答案更準(Embeddings & RAG)→ 使用者畫面(Frontend)。每一層都有成熟的開源選項,所以——你真的不必花大錢,也能蓋出一套 AI 應用。
ByteByteGo 在結尾問:「Over to you: Which other tool will you add to the Open Source AI Stack?」——換你了:你會往這套開源 AI 技術棧,再補上哪一個工具?