c和汇编混合编程_忙忙碌碌网

2022-07-07 14:39:50

在各种高级语言大行其道的今天为什么要用汇编呢？其实主要的原因有：第一，在C语言在关键地方嵌入汇编可以获得最大的性能提升，比如说一些关键算法；第二，实现硬件相关的功能（这点嵌入式开发经常用到）。第三，不能用C语言实现的特性可以用汇编实现，比如说可以利用lock指令来实现原子操作。
本文介绍了如何把汇编语言嵌入到c语言中的基础，然后给了2个例子。

在数据库中，为了实现一些特殊的操作，比如tas锁，需要借助汇编来完成。比如PostgreSQL中的tas锁就是用汇编写的。那么如何用c和汇编混合编程呢？先介绍一下基本语法，c语言中嵌入汇编的语法如下：

asm [volatile] ( AssemblerTemplate
                      : OutputOperands
                      [ : InputOperands
                      [ : Clobbers ] ])

asm：标志一段嵌入式汇编的开始
volatile：关闭编译器优化，这样就就不会把某些编译器认为无效的汇编删掉
AssemblerTemplate：用于生成汇编的模板，里面包含了汇编代码和一些占位符
OutputOperands：在汇编中修改的c程序中的变量，用逗号分隔
InputOperands：在汇编中读取的c程序中的变量，用逗号分隔
Clobbers：除了在OutputOperands列出的之外被汇编修改的register或其他的值

下面分别介绍一下上述内容

AssemblerTemplate

汇编模板实际上是一个字符串，比如

"   cmpb$0,%1   \n""   jne     1f      \n""   lock            \n""   xchgb%0,%1   \n"

里面包含了对OutputOperands、InputOperands的引用。接下来编译器会把汇编魔板中的引用等等变换为实际的汇编指令。在汇编模板中除了输入汇编指令之外，还可以有一些特殊符号，特殊符号表示了其他的含义：
%n：引用OutputOperands、InputOperands中的第几个值
%%：在汇编中输出一个%符号
%=：输出一个数字，每次都是不同的。一般用来作为goto标签。
%{：输出{
%|：输出|
%}：输出}

OutputOperands

OutputOperands的语法如下：

[ [asmSymbolicName] ]constraint (cvariablename)

asmSymbolicName

asmSymbolicNameasm符号名称，如果asm模板里面用%[Value]来指定了一个名称。那么可以在OutputOperands里面用[ [asmSymbolicName] ] constraint (cvariablename)映射到具体的c程序变量名。比如：

int a,b;/* a=1;b=2;*/
    asm("mov$1,%[a]\n""mov$2,%[b]\n"
        :[a]"+rm"(a),[b]"+rm"(b)
        :/* no output */
        :"cc");printf("a=%d\nb=%d\n",a,b);

如果没有用asm符号名称的话，用0下标开始的变量名%0,%1来引用。比如：

int a,b;/* a=1;b=2;*/
    asm("mov$1,%0\n""mov$2,%1\n"
        :"+rm"(a),"+rm"(b)
        :/* no output */
        :"cc");printf("a=%d\nb=%d\n",a,b);

constraint

一个字符串用来当做界定符。界定符用来说明变量放置的位置
= 该变量覆盖已存在的变量
+ 变量用于读写
r 把变量放在register寄存器中
m 把变量放在memory中

cvariablename

引用c程序上下文中的变量名

InputOperands

正如字面意思所讲，InputOperands表示输入的变量，这些变量将被汇编使用。

Clobbers

cc以上汇编代码改动了标志位
memory以上汇编代码进行了内存读写

好了，解释了基本语法之后，简单看几个例子：

例子1–赋值

最简单的一个例子，用了汇编的mov指令，用于赋值：

#include<stdio.h>#include<stdlib.h>int main()
{int a,b;
    __asm__("mov $1,%0\n""mov $2,%1\n"
            :"+rm"(a),"+rm"(b)
            :/* no output */
            :"cc");printf("a=%d\nb=%d\n",a,b);

}

可以看到结果，a，b已经赋值了。

$ ./maina=1b=2

实际生成的汇编：

0000000000400526 <main>:400526:55                      push%rbp400527:4889 e5                mov%rsp,%rbp40052a:4883 ec10             sub$0x10,%rsp40052e:8b55 f8                mov    -0x8(%rbp),%edx400531:8b45 fc                mov    -0x4(%rbp),%eax400534:   ba01000000          mov$0x1,%edx400539:   b802000000          mov$0x2,%eax40053e:8955 f8                mov%edx,-0x8(%rbp)400541:8945 fc                mov%eax,-0x4(%rbp)400544:8b55 fc                mov    -0x4(%rbp),%edx400547:8b45 f8                mov    -0x8(%rbp),%eax40054a:89 c6                   mov%eax,%esi40054c:   bf f4054000          mov$0x4005f4,%edi400551:   b800000000          mov$0x0,%eax400556:   e8 a5 fe ff ff          callq400400 <printf@plt>40055b:   b800000000          mov$0x0,%eax400560:   c9                      leaveq400561:   c3                      retq400562:662e0f1f840000    nopw%cs:0x0(%rax,%rax,1)400569:00000040056c:0f1f4000             nopl0x0(%rax)

例子2–交换

一般在c语言中，交换a，b的值需要3条语句：

temp=a;
a=b;
b=temp;

利用汇编的xchg指令，可以一条指令就完成a，b交换，而且不用中间变量

#include<stdio.h>#include<stdlib.h>int main()
{int a=2,b=1;/* a=b;b=a;*/asm("xchg %0,%1\n"
        :"+rm"(a),"+rm"(b)
        :/* no output */
        :"cc");printf("a=%d\nb=%d\n",a,b);

}

可以看到结果，a，b已经赋值了。

$ ./maina=1b=2

例子3–tas锁

tas锁求整个操作只由一条指令完成，并且将总线锁住，以保证操作的“原子性”。相比之下，C语句在编译之后到底有几条指令是没有保证的，也无法要求在计算过程中对总线加锁。这时候就要借助lock指令来完成这个工作。

static __inline__int
tas(volatile lock_t *lock)
{register lock_t _res =1;

    __asm__ __volatile__("   cmpb    $0,%1   \n""   jne     1f      \n""   lock            \n""   xchgb   %0,%1   \n""1: \n"
:"+q"(_res),"+m"(*lock)
:/* no inputs */
:"memory","cc");return (int) _res;
}

如上代码中的lock指令确保了接下来的xchgb指令交换*lock和_res的操作是原子性的。从而一下完成了获取*lock的值作为返回值和把*lock设为1这两个动作一下完成。

如果感兴趣可以进一步阅读：
gcc官方文档：https://gcc.gnu.org/onlinedocs/gcc-6.2.0/gcc/Extended-Asm.html#Extended-Asm
Linux汇编语言开发指南：http://www.ibm.com/developerworks/cn/linux/l-assembly
一篇好的博文：http://blog.csdn.net/hu3167343/article/details/37660593