2023年11月中文大模型排行,GPT-4 Turbo 遠超 GPT-4 再創新高

自2022年11月30日 ChatGPT 發布以來, AI 大模型在全球範圍內掀起了有史以來規模最大的人工智能浪潮。在這股浪潮中,中文大模型的發展尤為迅速,形成了百模大戰的競爭態勢​​。

2023年11月中文大模型排行概覽

SuperCLUE 十大基礎能力排行榜 (2023年11月) 資料來源: SuperCLUE

截至2023年11月,中文大模型的發展已呈現出顯著成果。在這個月的排行榜中, OpenAI 的 GPT-4 和百度的文心一言4.0等模型表現突出。這些模型在各自的專業領域中展現出了卓越的能力,為 AI 領域的進一步發展奠定了堅實的基礎​​。

GPT-4 Turbo 的領先地位

SuperCLUE 總排行榜 (2023年11月) 資料來源: SuperCLUE

在中國最新的 SuperCLUE 評測中, GPT-4 Turbo 以89.79分的總分遙遙領先,高於中國所有大模型及國外代表性大模型。這一分數不僅凸顯了 GPT-4 Turbo 在全球範圍內的領先地位,同時也顯示了其在模型性能上的重大提升。相比之下,中國最佳模型文心一言4.0的總分為74.02分,與 GPT-4 Turbo 相差15.77分。這一數據強調了 GPT-4 Turbo 在中文大模型領域中的絕對優勢​​。

美中大模型的比較

SuperCLUE 專業技能與知識排行榜 (2023年11月) 資料來源:SuperCLUE中文大模型基準測評報告2023暨ChatGPT發佈一周年特別報告

在美中大模型的比較中, GPT-4 Turbo 在多個維度上展現了其獨特的優勢。特別是在語言理解與生成方面, GPT-4 Turbo 是目前唯一一個在 SuperCLUE 評測中超過90分的大模型。此外,在專業技能與知識的測評中, GPT-4 Turbo 的領先幅度同樣顯著,再次證明了其在這些關鍵領域中的卓越性能。在對比中,中國大模型文心一言4.0表現不俗,取得了81.74的高分,是中國唯一一個超過80分的大模型。這些結果不僅凸顯了 GPT-4 Turbo 的優越性,也顯示出中國大模型在持續進步。

結語

從本次測評的結果觀察, GPT-4 Turbo 在2023年11月的中文大模型排行榜中遙遙領先,並且大幅超越 GPT-4 ,展現出其在語言理解與生成等多個關鍵領域的絕對優勢。同時,中國大模型的迅猛發展也值得關注,尤其是在專業技能與知識的測評中表現出色的文心一言4.0等模型。雖然中國模型在某些方面仍存在挑戰,但其進步的足跡不容忽視。