阿里云發(fā)布通義千問2.5
2024-05-09 14:30
文本設置
小號
默認
大號
Plus(0條)
5月9日,阿里云正式發(fā)布通義千問2.5。阿里云方面表示,該模型性能全面趕超GPT-4Turbo。阿里云表示,在權威基準OpenCompass上,通義千問2.5得分追平GPT-4Turbo,是國產(chǎn)大模型首次在該基準取得該項成績。 | 相關閱讀(第一財經(jīng))
45
裕棠
追求內(nèi)心的平靜和安寧
今年4月,清華大學基礎模型研究中心聯(lián)合中關村實驗室發(fā)布了2024年3月版《SuperBench大模型綜合能力評測報告》,報告認為,在中文推理、中文語言等評測上,文心一言遙遙領先,和其他模型拉開明顯差距,中文理解上,文心一言4.0領先優(yōu)勢明顯,領先第二名GLM-4 0.41分,GPT-4系列模型表現(xiàn)較差,排在中下游,并且和第一名文心一言4.0分差超過1分。
如今通義千問也是在“中文語境下”趕超GPT-4。但我想說的是,對于中文,國內(nèi)的公司強一點也是正常的,但還是要看到差距的是,GPT-4幾乎覆蓋了所有的語言,因此是全球的大模型,其應用還是要更加廣泛一些,國內(nèi)的互聯(lián)網(wǎng)公司大可把眼光放長遠和寬泛一些,不要老是想著只在“中文”上超越國際競爭對手。
26
懿德資本
文心一言不敢恭維、李彥宏強調說某些方面超過G PT4了、比如詩詞方面。我評論說現(xiàn)在年輕人誰好做實習、那還不如說文言文方面更勝一籌呢,結果我的評論就被屏蔽了。不是鼓吹國外的東西、都是付費版本、文心一言就是個小學生、回答問題不會變通、一板一眼的回答。而GPT4目前最低也算高中生、回答問題的邏輯性、拓展性都還可以的。