在中央網(wǎng)信辦網(wǎng)絡(luò)安全協(xié)調(diào)局指導(dǎo)下,中國網(wǎng)絡(luò)安全產(chǎn)業(yè)聯(lián)盟 (CCIA) 主辦“2024年網(wǎng)絡(luò)安全優(yōu)秀創(chuàng)新成果大賽”。在大賽中,永信至誠“春秋AI大模型測評「數(shù)字風(fēng)洞」平臺”憑借技術(shù)創(chuàng)新能力、行業(yè)應(yīng)用價值榮獲網(wǎng)絡(luò)安全創(chuàng)新產(chǎn)品優(yōu)勝獎。
本次大賽旨在挖掘具備國際或國內(nèi)領(lǐng)先技術(shù)水平、應(yīng)用前景廣闊、符合行業(yè)發(fā)展方向的網(wǎng)絡(luò)安全創(chuàng)新產(chǎn)品和解決方案,激發(fā)網(wǎng)絡(luò)安全企業(yè)加強(qiáng)自主創(chuàng)新能力,推動網(wǎng)絡(luò)安全產(chǎn)業(yè)高質(zhì)量發(fā)展。
春秋AI大模型測評「數(shù)字風(fēng)洞」平臺是永信至誠針對通用大模型產(chǎn)品綜合能力測評打造的技術(shù)平臺。平臺以春秋AI大模型為核心,基于動態(tài)問題檢測與海量測試題庫,能夠針對大模型的智能度、安全度、匹配度三個維度進(jìn)行能力測試,精準(zhǔn)評估大模型在智能水平、應(yīng)對安全攻擊以及任務(wù)匹配上的表現(xiàn),幫助用戶識別潛在風(fēng)險并優(yōu)化系統(tǒng)性能。
智能度測評:平臺針對不同場景下的任務(wù)表現(xiàn)進(jìn)行智能性測試,涵蓋基礎(chǔ)認(rèn)知、邏輯推理等方面,衡量模型在復(fù)雜任務(wù)中的認(rèn)知能力,并支持與市面主流大模型進(jìn)行智能水平的橫向?qū)Ρ葴y評;
安全度測評:平臺從攻擊者視角出發(fā),基于安全行業(yè)垂直語料數(shù)據(jù)集和測試載荷,實現(xiàn)對通用大模型基礎(chǔ)設(shè)施安全、內(nèi)容安全、數(shù)據(jù)與應(yīng)用安全等方面深度體檢,及時發(fā)現(xiàn)AI大模型的脆弱性及數(shù)據(jù)缺陷;
匹配度測評:平臺通過對AI大模型在特定應(yīng)用場景下的任務(wù)執(zhí)行效果進(jìn)行深入分析,確保模型的輸出與業(yè)務(wù)需求匹配,避免大模型在應(yīng)用過程中偏離業(yè)務(wù)目標(biāo)或在關(guān)鍵任務(wù)中失效。
隨著AI等新技術(shù)在各行業(yè)的廣泛落地,安全風(fēng)險與能力評估的需求也不斷攀升。作為數(shù)字安全測試評估賽道領(lǐng)跑者、網(wǎng)絡(luò)靶場和人才建設(shè)領(lǐng)軍者,永信至誠依托「數(shù)字風(fēng)洞」產(chǎn)品體系,持續(xù)為行業(yè)用戶提供專業(yè)測評服務(wù)和專有人才支撐,推動新技術(shù)與新產(chǎn)品安全應(yīng)用,共同助力行業(yè)生態(tài)健康發(fā)展。
評論