科技媒體 testingcatalog 昨日(5 月 13 日)發(fā)布博文,報(bào)道稱 Anthropic 即將發(fā)布 Claude Neptune 新 AI 模型,目前正接受內(nèi)部安全測(cè)試,推出后預(yù)估與 OpenAI 的 GPT-5,以及谷歌的 Gemini Ultra 競(jìng)爭(zhēng)。
IT之家援引博文介紹,該模型已進(jìn)入內(nèi)部安全測(cè)試階段,使用 Anthropic Workbench 平臺(tái)進(jìn)行評(píng)估,紅隊(duì)演習(xí)(主要測(cè)試模型對(duì)越獄攻擊的抵抗力)將于 5 月 18 日結(jié)束。
本次演習(xí)重點(diǎn)測(cè)試 constitutional classifiers 系統(tǒng)(安全協(xié)議的核心),特別關(guān)注越獄嘗試的防范,初期測(cè)試結(jié)果表明對(duì)安全問(wèn)題,比以往模型更敏感(更強(qiáng)大)。
該媒體推測(cè) Anthropic 可能會(huì)在 5 月底或者 6 月初發(fā)布 Claude Neptune 模型,將讓它直接對(duì)抗 OpenAI 的 GPT-5 和 Google 的 Gemini Ultra,預(yù)計(jì)將加強(qiáng)多模態(tài)和智能體功能。