2023年11月中文大模型排行，GPT-4 Turbo 遠超 GPT-4 再創新高

自2022年11月30日 ChatGPT 發布以來， AI 大模型在全球範圍內掀起了有史以來規模最大的人工智能浪潮。在這股浪潮中，中文大模型的發展尤為迅速，形成了百模大戰的競爭態勢。

2023年11月中文大模型排行概覽

SuperCLUE 十大基礎能力排行榜 (2023年11月) 資料來源： SuperCLUE

截至2023年11月，中文大模型的發展已呈現出顯著成果。在這個月的排行榜中， OpenAI 的 GPT-4 和百度的文心一言4.0等模型表現突出。這些模型在各自的專業領域中展現出了卓越的能力，為 AI 領域的進一步發展奠定了堅實的基礎。

GPT-4 Turbo 的領先地位

SuperCLUE 總排行榜 (2023年11月) 資料來源： SuperCLUE

在中國最新的 SuperCLUE 評測中， GPT-4 Turbo 以89.79分的總分遙遙領先，高於中國所有大模型及國外代表性大模型。這一分數不僅凸顯了 GPT-4 Turbo 在全球範圍內的領先地位，同時也顯示了其在模型性能上的重大提升。相比之下，中國最佳模型文心一言4.0的總分為74.02分，與 GPT-4 Turbo 相差15.77分。這一數據強調了 GPT-4 Turbo 在中文大模型領域中的絕對優勢。

美中大模型的比較

SuperCLUE 專業技能與知識排行榜 (2023年11月) 資料來源：SuperCLUE中文大模型基準測評報告2023暨ChatGPT發佈一周年特別報告

在美中大模型的比較中， GPT-4 Turbo 在多個維度上展現了其獨特的優勢。特別是在語言理解與生成方面， GPT-4 Turbo 是目前唯一一個在 SuperCLUE 評測中超過90分的大模型。此外，在專業技能與知識的測評中， GPT-4 Turbo 的領先幅度同樣顯著，再次證明了其在這些關鍵領域中的卓越性能。在對比中，中國大模型文心一言4.0表現不俗，取得了81.74的高分，是中國唯一一個超過80分的大模型。這些結果不僅凸顯了 GPT-4 Turbo 的優越性，也顯示出中國大模型在持續進步。

結語

從本次測評的結果觀察， GPT-4 Turbo 在2023年11月的中文大模型排行榜中遙遙領先，並且大幅超越 GPT-4 ，展現出其在語言理解與生成等多個關鍵領域的絕對優勢。同時，中國大模型的迅猛發展也值得關注，尤其是在專業技能與知識的測評中表現出色的文心一言4.0等模型。雖然中國模型在某些方面仍存在挑戰，但其進步的足跡不容忽視。