一.什么是栈?

1.基本栈介绍:

栈(又名堆栈)是一种具有特殊的访问方式的存储空间,是一种典型的先进后出(Last in First Out)的数据结构,其操作主要有压栈(push)和出栈(pup)两种操作

D6qx2T.png


2.cpu中栈及栈顶的应用(汇编):详细操作跳转至函数调用

以push指令入栈元素时,sp(指向栈顶的堆栈寄存器)自增2到达目前栈顶,pop指令出栈时,sp自减2到达新栈顶,当五元素时为空栈,当满元素时为满栈(注:cpu无法判断栈段长度,须程序员自行定义栈段长度)

D6LpMF.png D6qzxU.png


二.函数调用栈(一):

一.

程序的执行过程可看作连续的函数调用,当一个函数执行完毕时,程序要回到调用指令的下一条指令(紧接着call指令)处继续执行函数。调用过程通常使用堆栈实现,每个用户态进程对应一个调用栈结构(call stack)。编译器使用堆栈传递函数参数、保存返回地址、临时保存寄存器原有值(即函数调用的上下文)以备恢复以及存储本地局部变量。

1.寄存器

(寄存器是处理器加工数据或运行程序的重要载体,用于存放程序执行中用到的数据和指令。)

D5xGh6.png

寄存器分配

最基本的种类大致分为ax,bx,cx,dx等,其中每一个寄存器包含16位字节,对于ax而言,分为2部分,ah和al,ah存放前8个字节,al存放后8个字节(具体指令设计汇编程序语言)

寄存器使用约定

  • 当函数调用时,若主调函数希望保持这些寄存器的值,则必须在调用前显式地将其保存在栈中;被调函数可以覆盖这些寄存器,而不会破坏主调函数所需的数据。

  • 被调函数在覆盖这些寄存器的值时,必须先将寄存器原值压入栈中保存起来,并在函数返回前从栈中恢复其原值,因为主调函数可能也在使用这些寄存器。

2.栈帧结构

  • 函数调用经常是嵌套的,在同一时刻,堆栈中会有多个函数的信息。每个未完成运行的函数占用一个独立的连续区域,称作栈帧(Stack Frame)。栈帧是堆栈的逻辑片段,当调用函数时逻辑栈帧被压入堆栈, 当函数返回时逻辑栈帧被从堆栈中弹出。栈帧存放着函数参数,局部变量及恢复前一栈帧所需要的数据等。

  • 栈帧的边界由栈帧基地址指针EBP和堆栈指针ESP界定(指针存放在相应寄存器中)。EBP指向当前栈帧底部(高地址),在当前栈帧内位置固定;ESP指向当前栈帧顶部(低地址),当程序执行时ESP会随着数据的入栈和出栈而移动。

D5x0HA.png

由图可知,函数调用时入栈顺序:

D5xQB9.png

注意:

EBP指针在当前函数运行过程中(未调用其他函数时)保持不变。在函数调用前,ESP指针指向栈顶地址,也是栈底地址。在函数完成现场保护之类的初始化工作后,ESP会始终指向当前函数栈帧的栈顶,此时,若当前函数又调用另一个函数,则会将此时的EBP视为旧EBP压栈,而与新调用函数有关的内容会从当前ESP所指向位置开始压栈。

3.堆栈操作(汇编解析)

  • 函数调用时的具体步骤如下:

    1. 主调函数将控制权移交给被调函数(使用call指令)。**函数的返回地址(待执行的下条指令地址)保存在程序栈中(压栈操作隐含在call指令中)**。

    2. 若有必要,被调函数会设置帧基指针,并保存被调函数希望保持不变的寄存器值

    3. 被调函数执行自己任务,此时可能需要访问由主调函数传入的参数。若被调函数返回一个值,该值通常保存在一个指定寄存器中(如EAX)。

    4. 一旦被调函数完成操作,为该函数局部变量分配的栈空间将被释放。这通常是步骤4的逆向执行。

    5. 恢复步骤3中保存的寄存器值,包含主调函数的帧基指针寄存器。

    6. 被调函数将控制权交还主调函数(使用ret指令)。根据使用的函数调用约定,该操作也可能从程序栈上清除先前传入的参数。

    7. 主调函数再次获得控制权后,可能需要将先前的参数从栈上清除。在这种情况下,对栈的修改需要将帧基指针值恢复到步骤1之前的值。

4.以下介绍函数调用过程中的主要指令。(汇编)

压栈(push):栈顶指针ESP减小4个字节;以字节为单位将寄存器数据(四字节,不足补零)压入堆栈,从高到低按字节依次将数据存入ESP-1、ESP-2、ESP-3、ESP-4指向的地址单元。

出栈(pop):栈顶指针ESP指向的栈中数据被取回到寄存器;栈顶指针ESP增加4个字节。

rhIWZR.png

  • 可见,压栈操作将寄存器内容存入栈内存中(寄存器原内容不变),栈顶地址减小;出栈操作从栈内存中取回寄存器内容(栈内已存数据不会自动清零),栈顶地址增大。栈顶指针ESP总是指向栈中下一个可用数据。

  • 调用(call):将当前的指令指针EIP(该指针指向紧接在call指令后的下条指令)压入堆栈,以备返回时能恢复执行下条指令;然后设置EIP指向被调函数代码开始处,以跳转到被调函数的入口地址执行。

    离开(leave): 恢复主调函数的栈帧以准备返回。等价于指令序列movl %ebp, %esp(恢复原ESP值,指向被调函数栈帧开始处)和popl %ebp(恢复原ebp的值,即主调函数帧基指针)。

    返回(ret):与call指令配合,用于从函数或过程返回从栈顶弹出返回地址(之前call指令保存的下条指令地址)到EIP寄存器中,程序转到该地址处继续执行(此时ESP指向进入函数时的第一个参数)。若带立即数,ESP再加立即数(丢弃一些在执行call前入栈的参数)。使用该指令前,应使当前栈顶指针所指向位置的内容正好是先前call指令保存的返回地址。

  • 基于以上指令,使用C调用约定的被调函数典型的函数序和函数跋实现如下:

rhIhIx.png

若主调函数和调函数均未使用局部变量寄存器EDI、ESI和EBX,则编译器无须在函数序中对其压栈,以便提高程序的执行效率。

参数压栈指令因编译器而异,如下两种压栈方式基本等效:

rhITzD.png