目录
title: 全局变量反汇编与重定位
date: 2019/02/23 21:10:08 toc: true ---全局变量反汇编与重定位
引入
本文完整代码地址
思考这样一个问题,全局变量是怎么存储的,怎么使用的,反汇编后是什么样子的?
最理想的取地址应该是这样的,但是并没有这样的指令,操作数不可能是一个32位的数
ldr r0,[a的地址]
所以我们还想这样,还需要 将 r1 赋值32位的地址..所以单纯的赋值没有办法实现这个操作
ldr r0,[r1]
也就是需要这么做
ldr r0,[pc,offset] ;lable1lable1: addr_vallabel2_addr_val: val
我们写这样一段代码测试一下.
#includeint a=0;int b=1;int test(int c){ c=c+1; printf("hello %d",c); return c;}typedef int (*funpt)(int);funpt pt =&test;int main(){ a=3; b=b+1; test(a); pt(b);}
makefiel如下,反汇编中加入c语言信息,加入-S
选项,cc
中加入-g
选项
all: arm-linux-gcc -g -o o.out globl_var.c -Wl,-Map=gcc.map arm-linux-objdump -D -S o.out>o.disclaen: rm *.out
nopie分析
一般我们编译的时候都是nopie,pie我是在编译uboot时候了解到的,本篇文章也是关于uboot重定位分析的子章节
MAP
我们先来看下map文件的地址,有助于后续的分析
.text 0x00008380 test.bss 0x000105f8 a.data 0x000105f0 pt 0x000105ec b
普通变量
从main
函数入手,先从[pc, #88]
的地方取得一个值,再从这个值所表示的地址中取值
a=3; 83cc: e59f2050 ldr r2, [pc, #80] ; 842483d0: e3a03003 mov r3, #3 ; 0x3 83d4: e5823000 str r3, [r2] 8424: 000105f8 .word 0x000105f8 8428: 000105ec .word 0x000105ec 842c: 000105f0 .word 0x000105f0 000105ec : 105ec: 00000001 .word 0x00000001000105f0 : 105f0: 00008380 .word 0x00008380Disassembly of section .bss:000105f4 : 105f4: 00000000 .word 0x00000000000105f8 : 105f8: 00000000 .word 0x00000000
从代码上可以看出来8424
这个地方存储的就是变量的地址,也就是这么一个示意图
可以看到a所表示的地址的值,确实是0,实际上这个是存在bss段的.
接着来看代码b=b+1
,多了一个取值的步骤
b=b+1; 83d8: e59f3048 ldr r3, [pc, #72] ; 842883dc: e5933000 ldr r3, [r3] 83e0: e2832001 add r2, r3, #1 ; 0x1 83e4: e59f303c ldr r3, [pc, #60] ; 8428 83e8: e5832000 str r2, [r3] 8424: 000105f8 .word 0x000105f8 8428: 000105ec .word 0x000105ec 842c: 000105f0 .word 0x000105f0 000105ec : 105ec: 00000001 .word 0x00000001
指针变量
接着来看下函数指针pt
的处理
pt(b); ; 取出指针的地址,这个和我们普通变量操作中先取出变量的地址是一样的 83fc: e59f3028 ldr r3, [pc, #40] ; 842c; 获取变量的值,也就是指针的值,这里就是test的地址值了 ; 可以看到 [000105f0]=00008380 确实是 00008380 : 8400: e5932000 ldr r2, [r3] ;取出变量b的地址 然后取出b的值 8404: e59f301c ldr r3, [pc, #28] ; 8428 8408: e5933000 ldr r3, [r3] ; 传递为第一个参数 840c: e1a00003 mov r0, r3 8410: e1a0e00f mov lr, pc ;r2在上面赋值就是test的值 8414: e12fff12 bx r2 842c: 000105f0 .word 0x000105f0 000105f0 : 105f0: 00008380 .word 0x00008380 00008380 :
print函数
在函数中调用了库函数,这里也是使用了相对跳转了
printf("hello %d",c);839c: e59f0018 ldr r0, [pc, #24] ; 83bc83a0: e51b1008 ldr r1, [fp, #-8]83a4: ebffffc5 bl 82c0 <_init+0x48>
pie分析
接下去的分析都是针对重定位uboot的,与一般的程序没有关系了,不属于全局变量反汇编的分析
MAP
.text 0x00008380 test.bss 0x000105f8 a.data 0x000105f0 pt 0x000105ec b// 上面是nopie 下面是pie的.text 0x000005f8 test.data 0x0000887c pt.data 0x00008878 b.bss 0x00008884 a
汇编方式
加入pie选项和其实发现,单纯的这段main
和test
代码是一致的
地址分析
69c: 00008884 .word 0x00008884 ;存放的a的地址的lable 6a0: 00008878 .word 0x00008878 ;存放的b的地址的lable 6a4: 0000887c .word 0x0000887c ;存放的pt的地址的lable
搜索这几个地址值69c
,6a0
,6a4
00000400 <.rel.dyn>: ;a 420: 0000069c muleq r0, ip, r6 424: 00000017 andeq r0, r0, r7, lsl r0 ;b 428: 000006a0 andeq r0, r0, r0, lsr #13 42c: 00000017 andeq r0, r0, r7, lsl r0 ;pt 430: 000006a4 andeq r0, r0, r4, lsr #13 434: 00000017 andeq r0, r0, r7, lsl r0 450: 0000887c andeq r8, r0, ip, ror r8 454: 00000017 andeq r0, r0, r7, lsl r0
同时,还有一个关键的东西,就是指针的值是个地址的时候,他的值也会出现在这个表里面
450: 0000887c andeq r8, r0, ip, ror r8 454: 00000017 andeq r0, r0, r7, lsl r0
这是什么意思呢
当指针的值是个地址的时候,当重定位之后,这个地址应该同样加上偏移.
uboot的pie
.bss 0x000ae4e0 0x4 board/samsung/smdk2410/libsmdk2410.o 0x000ae4e0 a .text 0x000560dc 0x240 board/samsung/smdk2410/libsmdk2410.o 0x00056278 main2 0x00056258 test.data 0x0006adfc 0x8 board/samsung/smdk2410/libsmdk2410.o 0x0006adfc b 0x0006ae00 pt
变量分析
00056278: 56278: e92d4010 push {r4, lr} ;取出b的地址 5627c: e59f402c ldr r4, [pc, #44] ; 562b0 ;r4=0006adfc是b的地址 ;取出a的地址 56280: e59f302c ldr r3, [pc, #44] ; 562b4 56284: e5942000 ldr r2, [r4] 56288: e3a01003 mov r1, #3 ; 0x3 5628c: e2822001 add r2, r2, #1 ; 0x1 56290: e1a00001 mov r0, r1 56294: e5831000 str r1, [r3] 56298: e5842000 str r2, [r4] 5629c: ebffffed bl 56258 ; pt(b) 562a0: e5940000 ldr r0, [r4] 562a4: e1a0e00f mov lr, pc ;到这里为止,r4依然是b的地址,也就是说 pt的地址就是b后面,pt的寻址都是按照b来的 ;手动计算一下 r4+4=6ae00 这确实是pt的实际地址 ; 0006ae00 : ; 6ae00: 00056258 .word 0x00056258 562a8: e594f004 ldr pc, [r4, #4] 562ac: e8bd8010 pop {r4, pc}
我们来看下具体的地址信息
;---------------------------------------------------------------------- 562b0: 0006adfc .word 0x0006adfc ;这个存的是b的地址 562b4: 000ae4e0 .word 0x000ae4e0 ;这个存的是a的地址 ; 这里没有lable存储着pt的地址,程序依靠先找到b的地址,b地址下一个偏移就是pt的地址 ; pt里面的值也是个地址 0006ae00: 6ae00: 00056258 .word 0x00056258
接下来的就是应该重定位的变量信息,也就是lable和地址,可以看到lable和指针都出现了这张表里面
;存放b的lable的地址 71854: 000562b0 .word 0x000562b0 71858: 00000017 .word 0x00000017 ;存放a的lable的地址 7185c: 000562b4 .word 0x000562b4 71860: 00000017 .word 0x00000017 ;这里没有存放pt的lable地址 ,依靠b的地址来寻找 ;pt的值也是个地址值,那么这个地址也应该处理 72c1c: 0006ae00 .word 0x0006ae00 72c20: 00000017 .word 0x00000017
小结重定位数据段
也就是说,这个特殊的段<.rel.dyn>
应该存放有所有值是地址的单元的地址.
反汇编文件可以看成数据段加指令段,这里考虑数据段
0000: ........xxxx: val 当val表示的是一个地址的时候,现在有两种情况
也就是说包含了
- lable 的地址,存放的是全局变量的地址
- 指针的地址,这个指针存放的是个地址
有了上面的<.rel.dyn>
段重定位数据段就很方便了,将里面的地址挑出来,对其值和其存放的地址都加上偏移即可
- 取出a的地址,此时a的地址应该加上offset
- a的地址怎么取的,也是从一个lable中取的,这个lable也是经过offset的了
- 当a的值是个地址,比如是个函数指针,这个函数指针的值也应该加上offset,才是新定位的函数地址
总结起来一句话