AI日報 2026-04-20

1.根據非官方消息透露,DeepSeek 預計將於本週發布參數規模達 1.6T 的 DeepSeek V4。爆料指出該模型將採用 Sparse MQA、Fused MoE Mega Kernel 以及 Hyper-Connections 三項關鍵技術優化推理表現。還有傳聞稱先前的發布延期是因為內部測試未達到預期。上述資訊均未獲得官方確認。
https://x.com/yifan_zhang_/status/2045694320993276133
https://x.com/sheriyuo/status/2045744980954960282

#轉自AI觀察日記
AI日報 2026-04-20 1.根據非官方消息透露,DeepSeek 預計將於本週發布參數規模達 1.6T 的 DeepSeek V4。爆料指出該模型將採用 Sparse MQA、Fused MoE Mega Kernel 以及 Hyper-Connections 三項關鍵技術優化推理表現。還有傳聞稱先前的發布延期是因為內部測試未達到預期。上述資訊均未獲得官方確認。 https://x.com/yifan_zhang_/status/2045694320993276133 https://x.com/sheriyuo/status/2045744980954960282 #轉自AI觀察日記
0 留言 0 分享 6 瀏覽次數 0 評論
MGBOX https://magicbox.mg