• AI日報 11月17日

    1. Google 本週將推 Gemini 3 與 Nano Banana Pro(取代 Nano Banana 2):Google Vids 內部文案首次確認正式名稱為 Nano Banana Pro,由 Gemini 3 Pro 驅動,主攻高清、專業級影像生成;若如期上線,Vids/Slides/Design 等 Workspace 產品將全面升級。最可能發布:本週 22 日
    https://www.testingcatalog.com/google-to-release-nano-banana-pro-powered-by-gemini-3-pro-next-week/

    2. Gemini Enterprise 內測多 Agent 錦標賽系統 + Chat with Your Docs:可在 40 分鐘內自動產生並排序 100 則創意;同時測試上傳 30MB PDF 的「Chat with your docs」功能 皆未公佈正式上線時間。
    https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/

    3. Google Flow 更新(皆已整合 Gemini/Veo)

    (1) Flow × Nano Banana(Gemini 2.5 Flash):新增圖像編輯,一鍵去背、主體分離、場景替換,並可直接拖進時間線產生 8 秒動畫鏡頭,Gemini 免費版即可使用。

    (2) Veo 3.1:支援 最多 3 張參考圖、全新「Ingredients to Video」、自帶 SynthID 浮水印、可輸出原生環境音。
    https://flow.google/

    4. ImagineArt 1.5(官方稱為全球最逼真的 AI 圖片模型):高忠實度理解主體、光線、姿態、構圖,景深自然、顏色逼真,圖片中文字保持清晰。
    https://www.imagine.art/image

    5. PixVerse V5 Fast 上線:比原本 V5 快 40%,可 43 秒生成 1080P 影片
    https://app.pixverse.ai/create/image-text

    6. Google NotebookLM 新增手寫板書識別:支援上傳「手寫筆記照片」,可立即轉成可檢索知識庫。
    https://notebooklm.google/

    7. Qwen-Edit-2509 多角度光照 LoRA:一鍵切換多角度光源,快速重建主體光影

    https://huggingface.co/spaces/akhaliq/Qwen-Edit-2509-Multi-Angle-Lighting

    資料來源:
    https://mp.weixin.qq.com/s/XgGpQtT24g7iXCMfmQxPpQ

    https://mp.weixin.qq.com/s/v-9W6KjpIAZCZS8qkdSD2w

    #轉自 AI觀察日記
    AI日報 11月17日 1. Google 本週將推 Gemini 3 與 Nano Banana Pro(取代 Nano Banana 2):Google Vids 內部文案首次確認正式名稱為 Nano Banana Pro,由 Gemini 3 Pro 驅動,主攻高清、專業級影像生成;若如期上線,Vids/Slides/Design 等 Workspace 產品將全面升級。最可能發布:本週 22 日 https://www.testingcatalog.com/google-to-release-nano-banana-pro-powered-by-gemini-3-pro-next-week/ 2. Gemini Enterprise 內測多 Agent 錦標賽系統 + Chat with Your Docs:可在 40 分鐘內自動產生並排序 100 則創意;同時測試上傳 30MB PDF 的「Chat with your docs」功能 皆未公佈正式上線時間。 https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/ 3. Google Flow 更新(皆已整合 Gemini/Veo) (1) Flow × Nano Banana(Gemini 2.5 Flash):新增圖像編輯,一鍵去背、主體分離、場景替換,並可直接拖進時間線產生 8 秒動畫鏡頭,Gemini 免費版即可使用。 (2) Veo 3.1:支援 最多 3 張參考圖、全新「Ingredients to Video」、自帶 SynthID 浮水印、可輸出原生環境音。 https://flow.google/ 4. ImagineArt 1.5(官方稱為全球最逼真的 AI 圖片模型):高忠實度理解主體、光線、姿態、構圖,景深自然、顏色逼真,圖片中文字保持清晰。 https://www.imagine.art/image 5. PixVerse V5 Fast 上線:比原本 V5 快 40%,可 43 秒生成 1080P 影片 https://app.pixverse.ai/create/image-text 6. Google NotebookLM 新增手寫板書識別:支援上傳「手寫筆記照片」,可立即轉成可檢索知識庫。 https://notebooklm.google/ 7. Qwen-Edit-2509 多角度光照 LoRA:一鍵切換多角度光源,快速重建主體光影 https://huggingface.co/spaces/akhaliq/Qwen-Edit-2509-Multi-Angle-Lighting 資料來源: https://mp.weixin.qq.com/s/XgGpQtT24g7iXCMfmQxPpQ https://mp.weixin.qq.com/s/v-9W6KjpIAZCZS8qkdSD2w #轉自 AI觀察日記
    Google to release Nano Banana Pro next week
    Google to release Nano Banana Pro next week
    www.testingcatalog.com
    Google is set to launch Gemini 3 and Nano Banana Pro next week, with new image generation capabilities hinted at in the recent announcements.
    0 Comments ·0 Shares ·800 Views ·0 Reviews
  • AI日報 11月14日

    1️⃣ Google 推出 SIMA 2 通用智能體
    SIMA 2 能在多種 3D 虛擬世界中依自然語言完成任務,具備感知、推理、規劃、陪玩協作能力,由人類示範 + Gemini 標註共同訓練,能理解高層目標並自我調整。
    https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

    2️⃣ OpenAI 發布 GPT-5.1 API
    新增自適應推理、24 小時提示快取、apply_patch / shell 工具,大幅提升複雜任務與程式編輯效率。
    https://openai.com/index/gpt-5-1-for-developers/
    https://cookbook.openai.com/examples/gpt-5/gpt-5.1_prompting_guide

    3️⃣ Google NotebookLM 上線 Deep Research 具有自動化線上查找、整合資料、產生研究報告能力,並新增聊天記錄與自訂化 Video Overviews。

    https://notebooklm.google/

    4️⃣ Codex 0.58.0 版本發布
    全面支援 GPT-5.1 系列,加入 apply_patch / shell 工具,並強化伺服器與整體使用體驗。
    https://github.com/openai/codex/releases/tag/rust-v0.58.0

    5️⃣ ChatGPT 開放群聊功能
    OpenAI 自 2025/11/13 起在日本、台灣、韓國、紐西蘭推出群組聊天功能(1–20 人),支援 App 與網頁,群組聊天與私人對話記憶分離,可透過分享連結邀請人加入。
    https://openai.com/index/group-chats-in-chatgpt/

    資料來源
    https://mp.weixin.qq.com/s/vPPps11CAmOl4RWDh_6rHQ

    #轉AI觀察的日記社群
    AI日報 11月14日 1️⃣ Google 推出 SIMA 2 通用智能體 SIMA 2 能在多種 3D 虛擬世界中依自然語言完成任務,具備感知、推理、規劃、陪玩協作能力,由人類示範 + Gemini 標註共同訓練,能理解高層目標並自我調整。 https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/ 2️⃣ OpenAI 發布 GPT-5.1 API 新增自適應推理、24 小時提示快取、apply_patch / shell 工具,大幅提升複雜任務與程式編輯效率。 https://openai.com/index/gpt-5-1-for-developers/ https://cookbook.openai.com/examples/gpt-5/gpt-5.1_prompting_guide 3️⃣ Google NotebookLM 上線 Deep Research 具有自動化線上查找、整合資料、產生研究報告能力,並新增聊天記錄與自訂化 Video Overviews。 https://notebooklm.google/ 4️⃣ Codex 0.58.0 版本發布 全面支援 GPT-5.1 系列,加入 apply_patch / shell 工具,並強化伺服器與整體使用體驗。 https://github.com/openai/codex/releases/tag/rust-v0.58.0 5️⃣ ChatGPT 開放群聊功能 OpenAI 自 2025/11/13 起在日本、台灣、韓國、紐西蘭推出群組聊天功能(1–20 人),支援 App 與網頁,群組聊天與私人對話記憶分離,可透過分享連結邀請人加入。 https://openai.com/index/group-chats-in-chatgpt/ 資料來源 https://mp.weixin.qq.com/s/vPPps11CAmOl4RWDh_6rHQ #轉AI觀察的日記社群
    SIMA 2: A Gemini-Powered AI Agent for 3D Virtual Worlds
    SIMA 2: A Gemini-Powered AI Agent for 3D Virtual Worlds
    deepmind.google
    Introducing SIMA 2, the next milestone in our research creating general and helpful AI agents. By integrating the advanced capabilities of our Gemini models, SIMA is evolving from an instruction-foll…
    0 Comments ·0 Shares ·1K Views ·0 Reviews
  • 《声なき祈り / Silent Prayer》|當聲帶化作火焰,祈禱在失真中重生 ver.2

    AiNA THE END,日本女性創作歌手、前 BiSH 靈魂主唱之一。
    她以 爆裂的哭腔 × 纖細的耳語 × 原始身體性 聲線著稱,能在一首歌裡完成從呢喃到撕裂的瞬間變形。
    個人作品將 post-jrock、avant-jpop、cinematic rock 糅成一種「聖潔的髒」:
    旋律像傷口,節拍像心跳,舞台像告解室。
    在這首作品裡,她把信仰與痛苦化為同義詞—
    聲音不是語言,而是活著的證明。

    主題/靈感:當寂寞登入,靈魂開始上線

    靈感取自導演 黑澤清 的電影 《Kairo / 脈衝》。
    片中「網路=孤獨的擴音器」的命題,被轉寫為 AiNA 的聲音神學:
    在失聯的城市裡,祈禱不是被聽見,而是被上傳。
    歌詞裡「Inhale the lie」不是投降,而是求生術;
    她在燃燒的天空下吞下謊言,再用破碎的聲帶吐出救贖。

    「壊れた声が神になる」—當聲帶破裂,神性才開始響起。

    聲音設計與取樣構成

    本曲以 post-jrock × avant-jpop × cinematic rock 為骨架,三首 AiNA 作品的DNA被重組為儀式性結構:

    • Main Riff / Hook(取樣〈革命道中〉):
    粗砺的主結他與爆發段嘶吼,成為整曲的「戰鬥祈禱」。

    • Chord Spine(取樣〈誰かの心臓になれたなら〉):
    弦樂+鋼琴進行構築「泣きメロ」軸心,副歌推進像胸腔被拉開。

    • Atmos / Bridge(取樣〈THE END〉):
    低頻鼓組層與呼吸式環境音,於 Bridge 與尾聲製造「白化視界」。

    • Vocal Architecture(強化 AiNA 唱腔版):
    20% 耳語 × 50% 哭腔高推胸聲 × 15% 吶喊 × 15% 易碎氣音;
    C3–E5 區間以滑音與哭腔顫音連接——像撕裂也像擁抱。

    • Mix Gesture:
    前段以三連鼓組+低頻牆堆疊張力,
    最終副歌進入全弦牆+多八度疊唱,留下黑膠尾噪如祭典後的煙。

    這不是模仿,而是一次對自身聲音史的拆解與再聖化:
    把過去的 AiNA 逐一取樣,拼成一具會呼吸的新身體。

    命題核心

    「痛みも愛も すべて祈り」
    痛與愛在這裡不是對立面,而是讓靈魂保持線上的兩種電壓。

    《声なき祈り / Silent Prayer》讓「吸入謊言」成為存活儀式:
    她在火中歌唱,在白噪裡復活。
    壞掉的聲音,正是我們尚且活著的證據。
    #linchao
    #AiNA
    #visualkei
    #AiNAtheEnd
    #avantpop
    #革命道中
    #metal
    #rock
    #声なき祈り
    #jvisualrock
    #japanese
    #japan
    #jpop
    #postrock
    #黑澤清
    #Kairo
    #BiSH
    《声なき祈り / Silent Prayer》|當聲帶化作火焰,祈禱在失真中重生 ver.2 AiNA THE END,日本女性創作歌手、前 BiSH 靈魂主唱之一。 她以 爆裂的哭腔 × 纖細的耳語 × 原始身體性 聲線著稱,能在一首歌裡完成從呢喃到撕裂的瞬間變形。 個人作品將 post-jrock、avant-jpop、cinematic rock 糅成一種「聖潔的髒」: 旋律像傷口,節拍像心跳,舞台像告解室。 在這首作品裡,她把信仰與痛苦化為同義詞— 聲音不是語言,而是活著的證明。 主題/靈感:當寂寞登入,靈魂開始上線 靈感取自導演 黑澤清 的電影 《Kairo / 脈衝》。 片中「網路=孤獨的擴音器」的命題,被轉寫為 AiNA 的聲音神學: 在失聯的城市裡,祈禱不是被聽見,而是被上傳。 歌詞裡「Inhale the lie」不是投降,而是求生術; 她在燃燒的天空下吞下謊言,再用破碎的聲帶吐出救贖。 「壊れた声が神になる」—當聲帶破裂,神性才開始響起。 聲音設計與取樣構成 本曲以 post-jrock × avant-jpop × cinematic rock 為骨架,三首 AiNA 作品的DNA被重組為儀式性結構: • Main Riff / Hook(取樣〈革命道中〉): 粗砺的主結他與爆發段嘶吼,成為整曲的「戰鬥祈禱」。 • Chord Spine(取樣〈誰かの心臓になれたなら〉): 弦樂+鋼琴進行構築「泣きメロ」軸心,副歌推進像胸腔被拉開。 • Atmos / Bridge(取樣〈THE END〉): 低頻鼓組層與呼吸式環境音,於 Bridge 與尾聲製造「白化視界」。 • Vocal Architecture(強化 AiNA 唱腔版): 20% 耳語 × 50% 哭腔高推胸聲 × 15% 吶喊 × 15% 易碎氣音; C3–E5 區間以滑音與哭腔顫音連接——像撕裂也像擁抱。 • Mix Gesture: 前段以三連鼓組+低頻牆堆疊張力, 最終副歌進入全弦牆+多八度疊唱,留下黑膠尾噪如祭典後的煙。 這不是模仿,而是一次對自身聲音史的拆解與再聖化: 把過去的 AiNA 逐一取樣,拼成一具會呼吸的新身體。 命題核心 「痛みも愛も すべて祈り」 痛與愛在這裡不是對立面,而是讓靈魂保持線上的兩種電壓。 《声なき祈り / Silent Prayer》讓「吸入謊言」成為存活儀式: 她在火中歌唱,在白噪裡復活。 壞掉的聲音,正是我們尚且活著的證據。 #linchao #AiNA #visualkei #AiNAtheEnd #avantpop #革命道中 #metal #rock #声なき祈り #jvisualrock #japanese #japan #jpop #postrock #黑澤清 #Kairo #BiSH
    0 Comments ·0 Shares ·2K Views ·15 Plays ·0 Reviews
  • 《声なき祈り / Silent Prayer》|當聲帶化作火焰,祈禱在失真中重生 ver.1

    AiNA THE END,日本女性創作歌手、前 BiSH 靈魂主唱之一。
    她以 爆裂的哭腔 × 纖細的耳語 × 原始身體性 聲線著稱,能在一首歌裡完成從呢喃到撕裂的瞬間變形。
    個人作品將 post-jrock、avant-jpop、cinematic rock 糅成一種「聖潔的髒」:
    旋律像傷口,節拍像心跳,舞台像告解室。
    在這首作品裡,她把信仰與痛苦化為同義詞—
    聲音不是語言,而是活著的證明。

    主題/靈感:當寂寞登入,靈魂開始上線

    靈感取自導演 黑澤清 的電影 《Kairo / 脈衝》。
    片中「網路=孤獨的擴音器」的命題,被轉寫為 AiNA 的聲音神學:
    在失聯的城市裡,祈禱不是被聽見,而是被上傳。
    歌詞裡「Inhale the lie」不是投降,而是求生術;
    她在燃燒的天空下吞下謊言,再用破碎的聲帶吐出救贖。

    「壊れた声が神になる」—當聲帶破裂,神性才開始響起。

    聲音設計與取樣構成

    本曲以 post-jrock × avant-jpop × cinematic rock 為骨架,三首 AiNA 作品的DNA被重組為儀式性結構:

    • Main Riff / Hook(取樣〈革命道中〉):
    粗砺的主結他與爆發段嘶吼,成為整曲的「戰鬥祈禱」。

    • Chord Spine(取樣〈誰かの心臓になれたなら〉):
    弦樂+鋼琴進行構築「泣きメロ」軸心,副歌推進像胸腔被拉開。

    • Atmos / Bridge(取樣〈THE END〉):
    低頻鼓組層與呼吸式環境音,於 Bridge 與尾聲製造「白化視界」。

    • Vocal Architecture(強化 AiNA 唱腔版):
    20% 耳語 × 50% 哭腔高推胸聲 × 15% 吶喊 × 15% 易碎氣音;
    C3–E5 區間以滑音與哭腔顫音連接——像撕裂也像擁抱。

    • Mix Gesture:
    前段以三連鼓組+低頻牆堆疊張力,
    最終副歌進入全弦牆+多八度疊唱,留下黑膠尾噪如祭典後的煙。

    這不是模仿,而是一次對自身聲音史的拆解與再聖化:
    把過去的 AiNA 逐一取樣,拼成一具會呼吸的新身體。

    命題核心

    「痛みも愛も すべて祈り」
    痛與愛在這裡不是對立面,而是讓靈魂保持線上的兩種電壓。

    《声なき祈り / Silent Prayer》讓「吸入謊言」成為存活儀式:
    她在火中歌唱,在白噪裡復活。
    壞掉的聲音,正是我們尚且活著的證據。
    #linchao
    #AiNA
    #visualkei
    #AiNAtheEnd
    #avantpop
    #革命道中
    #metal
    #rock
    #声なき祈り
    #jvisualrock
    #japanese
    #japan
    #jpop
    #postrock
    #黑澤清
    #Kairo
    #BiSH
    《声なき祈り / Silent Prayer》|當聲帶化作火焰,祈禱在失真中重生 ver.1 AiNA THE END,日本女性創作歌手、前 BiSH 靈魂主唱之一。 她以 爆裂的哭腔 × 纖細的耳語 × 原始身體性 聲線著稱,能在一首歌裡完成從呢喃到撕裂的瞬間變形。 個人作品將 post-jrock、avant-jpop、cinematic rock 糅成一種「聖潔的髒」: 旋律像傷口,節拍像心跳,舞台像告解室。 在這首作品裡,她把信仰與痛苦化為同義詞— 聲音不是語言,而是活著的證明。 主題/靈感:當寂寞登入,靈魂開始上線 靈感取自導演 黑澤清 的電影 《Kairo / 脈衝》。 片中「網路=孤獨的擴音器」的命題,被轉寫為 AiNA 的聲音神學: 在失聯的城市裡,祈禱不是被聽見,而是被上傳。 歌詞裡「Inhale the lie」不是投降,而是求生術; 她在燃燒的天空下吞下謊言,再用破碎的聲帶吐出救贖。 「壊れた声が神になる」—當聲帶破裂,神性才開始響起。 聲音設計與取樣構成 本曲以 post-jrock × avant-jpop × cinematic rock 為骨架,三首 AiNA 作品的DNA被重組為儀式性結構: • Main Riff / Hook(取樣〈革命道中〉): 粗砺的主結他與爆發段嘶吼,成為整曲的「戰鬥祈禱」。 • Chord Spine(取樣〈誰かの心臓になれたなら〉): 弦樂+鋼琴進行構築「泣きメロ」軸心,副歌推進像胸腔被拉開。 • Atmos / Bridge(取樣〈THE END〉): 低頻鼓組層與呼吸式環境音,於 Bridge 與尾聲製造「白化視界」。 • Vocal Architecture(強化 AiNA 唱腔版): 20% 耳語 × 50% 哭腔高推胸聲 × 15% 吶喊 × 15% 易碎氣音; C3–E5 區間以滑音與哭腔顫音連接——像撕裂也像擁抱。 • Mix Gesture: 前段以三連鼓組+低頻牆堆疊張力, 最終副歌進入全弦牆+多八度疊唱,留下黑膠尾噪如祭典後的煙。 這不是模仿,而是一次對自身聲音史的拆解與再聖化: 把過去的 AiNA 逐一取樣,拼成一具會呼吸的新身體。 命題核心 「痛みも愛も すべて祈り」 痛與愛在這裡不是對立面,而是讓靈魂保持線上的兩種電壓。 《声なき祈り / Silent Prayer》讓「吸入謊言」成為存活儀式: 她在火中歌唱,在白噪裡復活。 壞掉的聲音,正是我們尚且活著的證據。 #linchao #AiNA #visualkei #AiNAtheEnd #avantpop #革命道中 #metal #rock #声なき祈り #jvisualrock #japanese #japan #jpop #postrock #黑澤清 #Kairo #BiSH
    0 Comments ·0 Shares ·2K Views ·20 Plays ·0 Reviews
  • AI日報 11月3日

    1.美團發布全新開源大模型 LongCat-Flash-Omni,實現業界首個集 全模態覆蓋、端到端架構與高效推理 於一體的開源模型。新架構支援毫秒多模態回應,在文字、影像、音訊、視訊等任務中均達開源最強(SOTA)表現。另外 官方 App 同步上線公測,支援連網搜尋與語音通話,視訊通話功能即將開放,iOS 用戶可於 App Store 搜尋「LongCat」下載體驗。

    HF:https://huggingface.co/meituan-longcat/LongCat-Flash-Omni

    Github:https://github.com/meituan-longcat/LongCat-Flash-Omni

    網頁版/PC版
    https://longcat.chat/

    X:
    https://x.com/Meituan_LongCat/status/1984398560973242733

    2.阿里:通義千問 Qwen3-Max 官網上線深度思考(Deep Thinking)模式阿里通義千問Qwen3-Max在官網上線「深度思考」模式。此功能透過增強推理鏈分析與多步驟問題拆解能力,提升複雜任務處理效率。

    https://chat.qwen.ai/

    3.百度「文心」5.0重磅回歸!一鍵生成漫畫、修圖、視頻,全能AI助理全面升級

    https://yiyan.baidu.com/

    4.Pokee AI:無程式碼智能體平台,使用者描述需求即可自動規劃並建構智能體,無需手動佈線。支援流程預審/結果審、定時任務、即時進度SSE。功能涵蓋文圖音影片產生、程式碼與文件處理、跨Google、Microsoft、Slack、Notion等工具自動化工作流程。

    https://pokee.ai/

    資料來源:
    https://mp.weixin.qq.com/s/Sm0IXR0vk3KK3MDTDguLTQ

    #以上資料均準轉載於AI觀察日記之粉絲專頁
    AI日報 11月3日 1.美團發布全新開源大模型 LongCat-Flash-Omni,實現業界首個集 全模態覆蓋、端到端架構與高效推理 於一體的開源模型。新架構支援毫秒多模態回應,在文字、影像、音訊、視訊等任務中均達開源最強(SOTA)表現。另外 官方 App 同步上線公測,支援連網搜尋與語音通話,視訊通話功能即將開放,iOS 用戶可於 App Store 搜尋「LongCat」下載體驗。 HF:https://huggingface.co/meituan-longcat/LongCat-Flash-Omni Github:https://github.com/meituan-longcat/LongCat-Flash-Omni 網頁版/PC版 https://longcat.chat/ X: https://x.com/Meituan_LongCat/status/1984398560973242733 2.阿里:通義千問 Qwen3-Max 官網上線深度思考(Deep Thinking)模式阿里通義千問Qwen3-Max在官網上線「深度思考」模式。此功能透過增強推理鏈分析與多步驟問題拆解能力,提升複雜任務處理效率。 https://chat.qwen.ai/ 3.百度「文心」5.0重磅回歸!一鍵生成漫畫、修圖、視頻,全能AI助理全面升級 https://yiyan.baidu.com/ 4.Pokee AI:無程式碼智能體平台,使用者描述需求即可自動規劃並建構智能體,無需手動佈線。支援流程預審/結果審、定時任務、即時進度SSE。功能涵蓋文圖音影片產生、程式碼與文件處理、跨Google、Microsoft、Slack、Notion等工具自動化工作流程。 https://pokee.ai/ 資料來源: https://mp.weixin.qq.com/s/Sm0IXR0vk3KK3MDTDguLTQ #以上資料均準轉載於AI觀察日記之粉絲專頁
    meituan-longcat/LongCat-Flash-Omni · Hugging Face
    meituan-longcat/LongCat-Flash-Omni · Hugging Face
    huggingface.co
    We’re on a journey to advance and democratize artificial intelligence through open source and open science.
    0 Comments ·0 Shares ·550 Views ·0 Reviews
More Results
MGBOX https://magicbox.mg