并將測(cè)試樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖輸入步驟s2訓(xùn)練得到的多模態(tài)深度集成模型中,對(duì)測(cè)試樣本進(jìn)行檢測(cè)并得出檢測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果與分析(1)樣本數(shù)據(jù)集選取實(shí)驗(yàn)評(píng)估使用了不同時(shí)期的惡意軟件和良性軟件樣本,包含了7871個(gè)良性軟件樣本和8269個(gè)惡意軟件樣本,其中4103個(gè)惡意軟件樣本是2011年以前發(fā)現(xiàn)的,4166個(gè)惡意軟件樣本是近年來(lái)新發(fā)現(xiàn)的;3918個(gè)良性軟件樣本是從全新安裝的windowsxpsp3系統(tǒng)中收集的,3953個(gè)良性軟件樣本是從全新安裝的32位windows7系統(tǒng)中收集的。所有的惡意軟件樣本都是從vxheavens網(wǎng)站中收集的,所有的樣本格式都是windowspe格式的,樣本數(shù)據(jù)集構(gòu)成如表1所示。表1樣本數(shù)據(jù)集類別惡意軟件樣本良性軟件樣本早期樣本41033918近期樣本41663953合計(jì)82697871(2)評(píng)價(jià)指標(biāo)及方法分類性能主要用兩個(gè)指標(biāo)來(lái)評(píng)估:準(zhǔn)確率和對(duì)數(shù)損失。準(zhǔn)確率測(cè)量所有預(yù)測(cè)中正確預(yù)測(cè)的樣本占總樣本的比例,*憑準(zhǔn)確率通常不足以評(píng)估預(yù)測(cè)的魯棒性,因此還需要使用對(duì)數(shù)損失。對(duì)數(shù)損失(logarithmicloss),也稱交叉熵?fù)p失(cross-entropyloss),是在概率估計(jì)上定義的,用于測(cè)量預(yù)測(cè)類別與真實(shí)類別之間的差距大小。數(shù)據(jù)安全與合規(guī):艾策科技的最佳實(shí)踐。飛航軟件測(cè)評(píng)中心
比黑盒適用性廣的優(yōu)勢(shì)就凸顯出來(lái)了。[5]軟件測(cè)試方法手動(dòng)測(cè)試和自動(dòng)化測(cè)試自動(dòng)化測(cè)試,顧名思義就是軟件測(cè)試的自動(dòng)化,即在預(yù)先設(shè)定的條件下運(yùn)行被測(cè)程序,并分析運(yùn)行結(jié)果。總的來(lái)說(shuō),這種測(cè)試方法就是將以人驅(qū)動(dòng)的測(cè)試行為轉(zhuǎn)化為機(jī)器執(zhí)行的一種過(guò)程。對(duì)于手動(dòng)測(cè)試,其在設(shè)計(jì)了測(cè)試用例之后,需要測(cè)試人員根據(jù)設(shè)計(jì)的測(cè)試用例一步一步來(lái)執(zhí)行測(cè)試得到實(shí)際結(jié)果,并將其與期望結(jié)果進(jìn)行比對(duì)。[5]軟件測(cè)試方法不同階段測(cè)試編輯軟件測(cè)試方法單元測(cè)試單元測(cè)試主要是對(duì)該軟件的模塊進(jìn)行測(cè)試,通過(guò)測(cè)試以發(fā)現(xiàn)該模塊的實(shí)際功能出現(xiàn)不符合的情況和編碼錯(cuò)誤。由于該模塊的規(guī)模不大,功能單一,結(jié)構(gòu)較簡(jiǎn)單,且測(cè)試人員可通過(guò)閱讀源程序清楚知道其邏輯結(jié)構(gòu),首先應(yīng)通過(guò)靜態(tài)測(cè)試方法,比如靜態(tài)分析、代碼審查等,對(duì)該模塊的源程序進(jìn)行分析,按照模塊的程序設(shè)計(jì)的控制流程圖,以滿足軟件覆蓋率要求的邏輯測(cè)試要求。另外,也可采用黑盒測(cè)試方法提出一組基本的測(cè)試用例,再用白盒測(cè)試方法進(jìn)行驗(yàn)證。若用黑盒測(cè)試方法所產(chǎn)生的測(cè)試用例滿足不了軟件的覆蓋要求,可采用白盒法增補(bǔ)出新的測(cè)試用例,以滿足所需的覆蓋標(biāo)準(zhǔn)。其所需的覆蓋標(biāo)準(zhǔn)應(yīng)視模塊的實(shí)際具體情況而定。代碼審計(jì)的公司2025 年 IT 趨勢(shì)展望:深圳艾策的五大技術(shù)突破。
此外格式結(jié)構(gòu)信息具有明顯的語(yǔ)義信息,但基于格式結(jié)構(gòu)信息的檢測(cè)方法沒(méi)有提取決定軟件行為的代碼節(jié)和數(shù)據(jù)節(jié)信息作為特征。某一種類型的特征都從不同的視角反映刻畫了可執(zhí)行文件的一些性質(zhì),字節(jié)碼n-grams、dll和api信息、格式結(jié)構(gòu)信息都部分捕捉到了惡意軟件和良性軟件間的可區(qū)分信息,但都存在著一定的局限性,不能充分、綜合、整體的表示可執(zhí)行文件的本質(zhì),使得檢測(cè)結(jié)果準(zhǔn)確率不高、可靠性低、泛化性和魯棒性不佳。此外,惡意軟件通常偽造出和良性軟件相似的特征,逃避反**軟件的檢測(cè)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例的目的在于提供一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法,以解決現(xiàn)有采用二進(jìn)制可執(zhí)行文件的單一特征類型進(jìn)行惡意軟件檢測(cè)的檢測(cè)方法檢測(cè)準(zhǔn)確率不高、檢測(cè)可靠性低、泛化性和魯棒性不佳的問(wèn)題,以及其難以檢測(cè)出偽造良性軟件特征的惡意軟件的問(wèn)題。本發(fā)明實(shí)施例所采用的技術(shù)方案是,基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法,按照以下步驟進(jìn)行:步驟s1、提取軟件樣本的二進(jìn)制可執(zhí)行文件的dll和api信息、pe格式結(jié)構(gòu)信息以及字節(jié)碼n-grams的特征表示,生成軟件樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖。
綜合上面的分析可以看出,惡意軟件的格式信息和良性軟件是有很多差異性的,以可執(zhí)行文件的格式信息作為特征,是識(shí)別已知和未知惡意軟件的可行方法。對(duì)每個(gè)樣本進(jìn)行格式結(jié)構(gòu)解析,提取**每個(gè)樣本實(shí)施例件的格式結(jié)構(gòu)信息,可執(zhí)行文件的格式規(guī)范都由操作系統(tǒng)廠商給出,按照操作系統(tǒng)廠商給出的格式規(guī)范提取即可。pe文件的格式結(jié)構(gòu)有許多屬性,但大多數(shù)屬性無(wú)法區(qū)分惡意軟件和良性軟件,經(jīng)過(guò)深入分析pe文件的格式結(jié)構(gòu)屬性,提取了可能區(qū)分惡意軟件和良性軟件的136個(gè)格式結(jié)構(gòu)屬性,如表2所示。表2可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)屬性特征描述數(shù)量(個(gè))引用dll的總數(shù)1引用api的總數(shù)1導(dǎo)出表中符號(hào)的總數(shù)1重定位節(jié)的項(xiàng)目總數(shù),連續(xù)的幾個(gè)字節(jié)可能是完成特定功能的一段代碼,或者是可執(zhí)行文件的結(jié)構(gòu)信息,也可能是某個(gè)惡意軟件中特有的字節(jié)碼序列。pe文件可表示為字節(jié)碼序列,惡意軟件可能存在一些共有的字節(jié)碼子序列模式,研究人員直覺(jué)上認(rèn)為一些字節(jié)碼子序列在惡意軟件可能以較高頻率出現(xiàn),且這些字節(jié)碼序列和良性軟件字節(jié)碼序列存在明顯差異??蓤?zhí)行文件通常是二進(jìn)制文件,需要把二進(jìn)制文件轉(zhuǎn)換為十六進(jìn)制的文本實(shí)施例件,就得到可執(zhí)行文件的十六進(jìn)制字節(jié)碼序列。可靠性評(píng)估連續(xù)運(yùn)行72小時(shí)出現(xiàn)2次非致命錯(cuò)誤。
在介紹諸多知識(shí)點(diǎn)的過(guò)程當(dāng)中結(jié)合直觀形象的圖表或?qū)嶋H案例進(jìn)行深入淺出的分析,從而使讀者可以更好地理解秋掌握軟件測(cè)試?yán)碚撝R(shí),并迅速地運(yùn)用到實(shí)際測(cè)試工作中去。本書適合作為各層次高等院校計(jì)算機(jī)及相關(guān)的教學(xué)用書,也可作為軟件測(cè)試人員的參考書。目錄前言第1章概述第2章軟件測(cè)試基礎(chǔ)第3章單元測(cè)試第4章集成測(cè)試第5章系統(tǒng)測(cè)試……軟件測(cè)試技術(shù)圖書2書名:軟件測(cè)試技術(shù)層次:高職高專配套:電子課件作者:徐芳出版社:機(jī)械工業(yè)出版社出版時(shí)間:2011-6-21ISBN:開本:16開定價(jià):¥內(nèi)容簡(jiǎn)介本書根據(jù)軟件測(cè)試教學(xué)的需要,結(jié)合讀者對(duì)象未來(lái)的職業(yè)要求和定位,除了盡力***闡述軟件測(cè)試技術(shù)基本概念外,采取了計(jì)劃、設(shè)計(jì)與開發(fā)、執(zhí)行這樣的工程步驟來(lái)描述軟件測(cè)試的相關(guān)知識(shí),使學(xué)生在學(xué)習(xí)軟件測(cè)試的技術(shù)知識(shí)時(shí),能夠同時(shí)獲得工程化思維方式的訓(xùn)練。本書共7章。第1章介紹軟件測(cè)試的基本知識(shí);第2章介紹如何制定軟件測(cè)試計(jì)劃;第3章介紹測(cè)試用例的設(shè)計(jì)和相關(guān)技術(shù);第4章介紹執(zhí)行測(cè)試中相關(guān)技術(shù)和方法;第5章介紹實(shí)際工作中各種測(cè)試方法;第6章介紹MI公司的一套測(cè)試工具的使用,包括功能、性能和測(cè)試管理工具;第7章通過(guò)一個(gè)實(shí)例,給出了完整的與軟件測(cè)試相關(guān)的文檔。隱私合規(guī)檢測(cè)確認(rèn)用戶數(shù)據(jù)加密符合GDPR標(biāo)準(zhǔn)要求。湖北第三方軟件評(píng)測(cè)公司
滲透測(cè)試報(bào)告暴露2個(gè)高危API接口需緊急加固。飛航軟件測(cè)評(píng)中心
在數(shù)字化轉(zhuǎn)型加速的,軟件檢測(cè)公司已成為保障各行業(yè)信息化系統(tǒng)穩(wěn)定運(yùn)行的力量。深圳艾策信息科技有限公司作為國(guó)內(nèi)軟件檢測(cè)公司領(lǐng)域的企業(yè),始終以技術(shù)創(chuàng)新為驅(qū)動(dòng)力,深耕電力能源、科研教育、政企單位、研發(fā)科技及醫(yī)療機(jī)構(gòu)等垂直場(chǎng)景,為客戶提供從需求分析到運(yùn)維優(yōu)化的全鏈條質(zhì)量保障服務(wù)。以專業(yè)能力筑牢行業(yè)壁壘作為專注于軟件檢測(cè)的技術(shù)型企業(yè),艾策科技通過(guò)AI驅(qū)動(dòng)的智能檢測(cè)平臺(tái),實(shí)現(xiàn)了測(cè)試流程的自動(dòng)化、化與智能化。其產(chǎn)品——軟件檢測(cè)系統(tǒng),整合漏洞掃描、壓力測(cè)試、合規(guī)性驗(yàn)證等20余項(xiàng)功能模塊,可快速定位代碼缺陷、性能瓶頸及安全風(fēng)險(xiǎn),幫助客戶將軟件故障率降低60%以上。針對(duì)電力能源行業(yè),艾策科技開發(fā)了電網(wǎng)調(diào)度系統(tǒng)專項(xiàng)檢測(cè)方案,成功保障某省級(jí)電力公司百萬(wàn)級(jí)用戶數(shù)據(jù)安全;在科研教育領(lǐng)域,其實(shí)驗(yàn)室管理軟件檢測(cè)服務(wù)覆蓋全國(guó)50余所高校,助力科研數(shù)據(jù)存儲(chǔ)與分析的合規(guī)性升級(jí)。此外,公司為政企單位政務(wù)云平臺(tái)、研發(fā)科技企業(yè)創(chuàng)新產(chǎn)品、醫(yī)療機(jī)構(gòu)智慧醫(yī)療系統(tǒng)提供的定制化檢測(cè)服務(wù),均獲得客戶高度認(rèn)可。差異化服務(wù)塑造行業(yè)作為軟件檢測(cè)公司,艾策科技突破傳統(tǒng)檢測(cè)模式,推出“檢測(cè)+培訓(xùn)+咨詢”一體化服務(wù)體系。通過(guò)定期發(fā)布行業(yè)安全白皮書、舉辦技術(shù)研討會(huì)。飛航軟件測(cè)評(píng)中心