最近一篇新刊出的working paper指出,現階段主要AI模型都還看不懂時鐘。這篇報告準備了180個不同的時鐘,有些有缺一些資料,然後分別叫5位鄉民以及各種AI模型不限回答時間的回答出時鐘上的準確時間。
 
調查結果顯示,人類平均可以答對90%的時鐘準確時間,但是AI模型表現最佳的只有Gemini 2.5 Pro的13%。因此這篇文章認為至少讀時間這件事人類表現還遠好於人工智慧。

---
人類的能力還是不輸給機器人的


最近一篇新刊出的working paper指出,現階段主要AI模型都還看不懂時鐘。這篇報告準備了180個不同的時鐘,有些有缺一些資料,然後分別叫5位鄉民以及各種AI模型不限回答時間的回答出時鐘上的準確時間。   調查結果顯示,人類平均可以答對90%的時鐘準確時間,但是AI模型表現最佳的只有Gemini 2.5 Pro的13%。因此這篇文章認為至少讀時間這件事人類表現還遠好於人工智慧。 --- 人類的能力還是不輸給機器人的
Like
2
· 0 Comments ·0 Shares ·452 Views ·0 Reviews
MGBOX https://magicbox.mg