之前我們深入了解了glibc malloc的運行機制(文章鏈接請看文末▼),下面就讓我們開始真正的堆溢出漏洞利用學習吧。說實話,寫這類文章,我是比較慫的,因為我當前從事的工作跟漏洞挖掘完全無關,學習這部分知識也純粹是個人愛好,于周末無聊時打發下時間,甚至我最初的目標也僅僅是能快速看懂、復現各種漏洞利用POC而已…鑒于此,后續的文章大致會由兩種內容構成:1)各種相關文章的總結,再提煉;2)某些好文章的翻譯及拓展。本文兩者皆有,主要參考文獻見這里。
首先,存在漏洞的程序如下:
#!c
/*
Heap overflow vulnerable program.
*/
#include <stdlib.h>
#include <string.h>
int main( int argc, char * argv[] )
{
char * first, * second;
/*[1]*/ first = malloc( 666 );
/*[2]*/ second = malloc( 12 );
if(argc!=1)
/*[3]*/ strcpy( first, argv[1] );
/*[4]*/ free( first );
/*[5]*/ free( second );
/*[6]*/ return( 0 );
}
在代碼3中存在一個堆溢出漏洞:如果用戶輸入的argv1的大小比first變量的666字節更大的話,那么輸入的數據就有可能覆蓋掉下一個chunk的chunk header——這可以導致任意代碼執行。而攻擊的核心思路就是利用glibc malloc的unlink機制。
上述程序的內存圖如下所示:
unlink攻擊技術就是利用”glibc malloc”的內存回收機制,將上圖中的second chunk給unlink掉,并且,在unlink的過程中使用shellcode地址覆蓋掉free函數(或其他函數也行)的GOT表項。這樣當程序后續調用free函數的時候(如上面代碼[5]),就轉而執行我們的shellcode了。顯然,核心就是理解glibc malloc的free機制。
在正常情況下,free的執行流程如下文所述:
PS: 鑒于篇幅,這里主要介紹非mmaped的chunks的回收機制,回想一下在哪些情況下使用mmap分配新的chunk,哪些情況下不用mmap?
一旦涉及到free內存,那么就意味著有新的chunk由allocated狀態變成了free狀態,此時glibc malloc就需要進行合并操作——向前以及(或)向后合并。這里所謂向前向后的概念如下:將previous free chunk合并到當前free chunk,叫做向后合并;將后面的free chunk合并到當前free chunk,叫做向前合并。
一、向后合并:
相關代碼如下:
#!c
/*malloc.c int_free函數中*/
/*這里p指向當前malloc_chunk結構體,bck和fwd分別為當前chunk的向后和向前一個free chunk*/
/* consolidate backward */
if (!prev_inuse(p)) {
prevsize = p->prev_size;
size += prevsize;
//修改指向當前chunk的指針,指向前一個chunk。
p = chunk_at_offset(p, -((long) prevsize));
unlink(p, bck, fwd);
}
//相關函數說明:
/* Treat space at ptr + offset as a chunk */
#define chunk_at_offset(p, s) ((mchunkptr) (((char *) (p)) + (s)))
/*unlink操作的實質就是:將P所指向的chunk從雙向鏈表中移除,這里BK與FD用作臨時變量*/
#define unlink(P, BK, FD) { \
FD = P->fd; \
BK = P->bk; \
FD->bk = BK; \
BK->fd = FD; \
...
}
首先檢測前一個chunk是否為free,這可以通過檢測當前free chunk的PREV_INUSE(P)比特位知曉。在本例中,當前chunk(first chunk)的前一個chunk是allocated的,因為在默認情況下,堆內存中的第一個chunk總是被設置為allocated的,即使它根本就不存在。
如果為free的話,那么就進行向后合并:
1)將前一個chunk占用的內存合并到當前chunk;
2)修改指向當前chunk的指針,改為指向前一個chunk。
3)使用unlink宏,將前一個free chunk從雙向循環鏈表中移除(這里最好自己畫圖理解,學過數據結構的應該都沒問題)。
在本例中由于前一個chunk是allocated的,所以并不會進行向后合并操作。
二、向前合并操作:
首先檢測next chunk是否為free。那么如何檢測呢?很簡單,查詢next chunk之后的chunk的 PREV_INUSE (P)即可。相關代碼如下:
#!c
……
/*這里p指向當前chunk*/
nextchunk = chunk_at_offset(p, size);
……
nextsize = chunksize(nextchunk);
……
if (nextchunk != av->top) {
/* get and clear inuse bit */
nextinuse = inuse_bit_at_offset(nextchunk, nextsize);//判斷nextchunk是否為free chunk
/* consolidate forward */
if (!nextinuse) { //next chunk為free chunk
unlink(nextchunk, bck, fwd); //將nextchunk從鏈表中移除
size += nextsize; // p還是指向當前chunk只是當前chunk的size擴大了,這就是向前合并!
} else
clear_inuse_bit_at_offset(nextchunk, 0);
……
}
整個操作與”向后合并“操作類似,再通過上述代碼結合注釋應該很容易理解free chunk的向前結合操作。在本例中當前chunk為first,它的下一個chunk為second,再下一個chunk為top chunk,此時 top chunk的?PREV_INUSE位是設置為1的(表示top chunk的前一個chunk,即second chunk, 已經使用),因此first的下一個chunk不會被“向前合并“掉。
介紹完向前、向后合并操作,下面就需要了解合并后(或因為不滿足合并條件而沒合并)的chunk該如何進一步處理了。在glibc malloc中,會將合并后的chunk放到unsorted bin中(還記得unsorted bin的含義么?)。相關代碼如下:
#!c
/*
Place the chunk in unsorted chunk list. Chunks are not placed into regular bins until after they have been given one chance to be used in malloc.
*/
bck = unsorted_chunks(av); //獲取unsorted bin的第一個chunk
/*
/* The otherwise unindexable 1-bin is used to hold unsorted chunks. */
#define unsorted_chunks(M) (bin_at (M, 1))
*/
fwd = bck->fd;
……
p->fd = fwd;
p->bk = bck;
if (!in_smallbin_range(size))
{
p->fd_nextsize = NULL;
p->bk_nextsize = NULL;
}
bck->fd = p;
fwd->bk = p;
set_head(p, size | PREV_INUSE);//設置當前chunk的size,并將前一個chunk標記為已使用
set_foot(p, size);//將后一個chunk的prev_size設置為當前chunk的size
/*
/* Set size/use field */
#define set_head(p, s) ((p)->size = (s))
/* Set size at footer (only when chunk is not in use) */
#define set_foot(p, s) (((mchunkptr) ((char *) (p) + (s)))->prev_size = (s))
*/
上述代碼完成的整個過程簡要概括如下:將當前chunk插入到unsorted bin的第一個chunk(第一個chunk是鏈表的頭結點,為空)與第二個chunk之間(真正意義上的第一個可用chunk);然后通過設置自己的size字段將前一個chunk標記為已使用;再更改后一個chunk的prev_size字段,將其設置為當前chunk的size。
注意:上一段中描述的”前一個“與”后一個“chunk,是指的由chunk的prev_size與size字段隱式連接的chunk,即它們在內存中是連續、相鄰的!而不是通過chunk中的fd與bk字段組成的bin(雙向鏈表)中的前一個與后一個chunk,切記!。
在本例中,只是將first chunk添加到unsorted bin中。
現在我們再來分析如果一個攻擊者在代碼3中精心構造輸入數據并通過strcpy覆蓋了second chunk的chunk header后會發生什么情況。
假設被覆蓋后的chunk header相關數據如下:
1) prev_size = 一個偶數,這樣其PREV_INUSE 位就是0 了,即表示前一個chunk為free。
2) size = -4
3) fd = free 函數的got表地址address – 12;(后文統一簡稱為“free addr – 12”)
4) bk = shellcode的地址
那么當程序在[4]處調用free(first)后會發生什么呢?我們一步一步分析。
一、向后合并
鑒于first的前一個chunk非free的,所以不會發生向后合并操作。
二、向前合并
先判斷后一個chunk是否為free,前文已經介紹過,glibc malloc通過如下代碼判斷:
#!c
nextinuse = inuse_bit_at_offset(nextchunk, nextsize);
這里inuse_bit_at_offset宏定義如下:
/* check/set/clear inuse bits in known places */
#define inuse_bit_at_offset(p, s) \
(((mchunkptr) (((char *) (p)) + (s)))->size & PREV_INUSE)
PS:在本例中next chunk即second chunk,為了便于理解后文統一用next chunk。
從上面代碼可以知道,它是通過將nextchunk + nextsize計算得到指向下下一個chunk的指針,然后判斷下下個chunk的size的PREV_INUSE標記位。在本例中,此時nextsize被我們設置為了-4,這樣glibc malloc就會將next chunk的prev_size字段看做是next-next chunk的size字段,而我們已經將next chunk的prev_size字段設置為了一個偶數,因此此時通過inuse_bit_at_offset宏獲取到的nextinuse為0,即next chunk為free!既然next chunk為free,那么就需要進行向前合并,所以就會調用unlink(nextchunk, bck, fwd);函數。真正的重點就是這個unlink函數!
在前文2.1節中已經介紹過unlink函數的實現,這里為了便于說明攻擊思路和過程,再詳細分析一遍,unlink代碼如下:
#!c
#define unlink(P, BK, FD) { \
FD = P->fd; \
BK = P->bk; \
FD->bk = BK; \
BK->fd = FD; \
...
}
此時P = nextchunk, BK = bck, FD = fwd。
1)首先FD = nextchunk->fd = free地址 – 12;
2)然后BK = nextchunk->bk = shellcode起始地址;
3)再將BK賦值給FD->bk,即(free地址 – 12)->bk = shellcode起始地址;
4)最后將FD賦值給BK->fd,即(shellcode起始地址)->fd = free地址 – 12。
前面兩步還好理解,主要是后面2步比較迷惑。我們作圖理解:
結合上圖就很好理解第3,4步了。細心的朋友已經注意到,free addr -12和shellcode addr對應的prev_size等字段是用虛線標記的,為什么呢?因為事實上它們對應的內存并不是chunk header,只是在我們的攻擊中需要讓glibc malloc在進行unlink操作的時候將它們強制看作malloc_chunk結構體。這樣就很好理解為什么要用free addr – 12替換next chunk的fd了,因為(free addr -12)->bk剛好就是free addr,也就是說第3步操作的結果就是將free addr處的數據替換為shellcode 的起始地址。
由于已經將free addr處的數據替換為了shellcode的起始地址,所以當程序在代碼[5]處再次執行free的時候,就會轉而執行shellcode了。
至此,整個unlink攻擊的原理已經介紹完畢,剩下的工作就是根據上述原理,編寫shellcode了。只不過這里需要注意一點,glibc malloc在unlink的過程中會將shellcode + 8位置的4字節數據替換為free addr – 12,所以我們編寫的shellcode應該跳過前面的12字節。
當前,上述unlink技術已經過時了(但不代表所有的unlink技術都失效,詳情見后文),因為glibc malloc對相應的安全機制進行了加強,具體而言,就是添加了如下幾條安全檢測機制。
該機制不允許釋放一個已經處于free狀態的chunk。因此,當攻擊者將second chunk的size設置為-4的時候,就意味著該size的PREV_INUSE位為0,也就是說second chunk之前的first chunk(我們需要free的chunk)已經處于free狀態,那么這時候再free(first)的話,就會報出double free錯誤。相關代碼如下:
#!c
/* Or whether the block is actually not marked used. */
if (__glibc_unlikely (!prev_inuse(nextchunk)))
{
errstr = "double free or corruption (!prev)";
goto errout;
}
該機制檢測next size是否在8到當前arena的整個系統內存大小之間。因此當檢測到next size為-4的時候,就會報出invalid next size錯誤。相關代碼如下:
#!c
nextsize = chunksize(nextchunk);
if (__builtin_expect (nextchunk->size <= 2 * SIZE_SZ, 0)
|| __builtin_expect (nextsize >= av->system_mem, 0)){
errstr = "free(): invalid next size (normal)";
goto errout;
}
該機制會在執行unlink操作的時候檢測鏈表中前一個chunk的fd與后一個chunk的bk是否都指向當前需要unlink的chunk。這樣攻擊者就無法替換second chunk的fd與fd了。相關代碼如下:
#!c
if (__builtin_expect (FD->bk != P || BK->fd != P, 0)) \
malloc_printerr (check_action, "corrupted double-linked list", P); \
經過上述3層安全檢測,是否意味著所有unlink技術都失效了呢?答案是否定的,因為進行漏洞攻擊的人腦洞永遠比天大!之前剛好看到一篇好文(強烈推薦),主講在Android4.4上利用unlink機制實現堆溢出攻擊。眾所周知,Android內核基于linux,且其堆內存管理也是使用的glibc malloc,雖然在一些細節上有些許不同,但核心原理類似。該文介紹的攻擊方式就成功繞過了上述三層檢測。
本文詳細介紹了unlink攻擊技術的核心原理,雖然上述介紹的unlink漏洞利用技術已經失效,而其他的unlink技術難度也越來越大,但是我們還是有必要認真學習,因為它一方面可以進一步加深我們對glibc malloc的堆棧管理機制的理解,另一方面也為后續的各種堆溢出攻擊技術提供了思路。
從上文的分析可以看出,unlink主要還是利用的glibc malloc中隱式鏈表機制,通過覆蓋相鄰chunk的數據實現攻擊,那么我們能不能在顯示鏈表中也找到攻擊點呢?請關注下一篇文章:基于fastbin的堆溢出漏洞利用介紹。