OpenAI 近日發布了全新的 o1 系列模型,這些模型經過強化學習訓練,能夠執行複雜的推理任務。o1 模型在回答使用者之前會先進行思考,並能在回應前產生一連串的內部思考鏈。這些模型在科學推理、競技程式設計、數學奧林匹克競賽和物理、生物、化學等領域的表現都超越了人類專家的水準。
OpenAI 也針對如何有效地使用 o1 模型提供了一些提示詞撰寫建議,包括:
- 保持提示詞簡單直接: o1 模型能很好地理解指令,因此不需要給予太多指引。
- 避免思考鏈提示: 由於這些模型能夠在內部執行推理,因此不需要提示它們”逐步思考”或”解釋推理過程”。
- 使用分隔符號以提高清晰度: 使用三重引號、XML 標籤或章節標題等分隔符號,以清楚區分輸入的不同部分,幫助模型正確解讀每一個部分。
- 在檢索增強生成任務中限制額外上下文: 在提供額外的上下文或文件時,只包含最相關的資訊,以防止模型過度複雜化其回應。
o1 模型目前仍處於預覽階段,尚未包含許多讓 ChatGPT 變得實用的功能,例如瀏覽網頁以獲取資訊和上傳檔案等。不過,對於需要深入推理且可以接受較長回應時間的應用來說,o1 模型可能是一個很好的選擇。
OpenAI 表示,這只是 o1 系列推理模型在 ChatGPT 和 API 中的早期預覽版本。除了模型更新之外,他們還計劃增加瀏覽、檔案和圖片上傳等功能,讓模型能夠對所有人都更加實用。隨著 o1 模型的推出,OpenAI 勢必將在 AI 推理能力的競賽中占據領先地位。