TC、BC和汇编混合编程连接技术及参数传递方法介绍

TC、BC和汇编混合编程连接技术及参数传递方法介绍

摘要:本文主要讨论如何应用混合编程技术,让汇编语言与高级语言相结合,以简化编程工作。

关键词:TurboC++;BorlandC++;TurboAssembler;混合编程

一、引言

在平常编写程序时,我们一般都希望选择C、Pascal、Basic等这样的高级语言来编写,这样的话程序开发周期比较短,省时省力。但在很多时候为了提 高程序的执行效率或其它原因,我们却不得不用汇编程序来编程。如果只用汇编语言编程的话是比较繁琐的,对于一个比较大的程序来说编写起来将非常耗时,开发 周期比较长。为了既能缩短程序开发周期,又能保证程序的执行效率,我们通常会考虑用高级语言编写主程序,而把程序中与执行效率关系密切的关键部分用汇编语 言来编写。这里就涉及到了混合编程的问题。本文选择TurboC++和BorlandC++这种以C语言为基础的程序开发工具与 TurboAssembler这样的汇编开发工具为例,来讨论一下高级语言与汇编语言混合编程的相关问题。

TC与汇编混合编程

将C语言和汇编语言混合使用的传统方式是,先完全用C语言或汇编语言写出单独的模块,编译C语言模块并汇编汇编语言模块,然后将分别编译过的模块连接到一起。按这种方式TurboC++模块和TurboAssembler模块可以很方便地进行连接。
用户可以采用以下命令,使C源文件与汇编源文件混合产生可执行文件:
tccfilenam1filenam2.asm
该命令指示TurboC++首先将FILENAM1.C编译成FILENAM1.OBJ,再激活TurboAssembler将 FILENAM2.ASM汇编成FILENAM2.OBJ,最后激活TLINK连接FILENAME1.OBJ与FILENAM2.OBJ并产生 FILENAM1.EXE。
这种分别编译的方法对于可确定大小的汇编代码程序极为有用,因为它可以让用户使用TurboAssembler的全部功能,在纯汇编语言环境中进行汇编语言程序设计,不需要asm关键字、额外的编译时间以及嵌入式汇编中与C相关的辅助开销。
TurboC++与TurboAssembler的接口中,有两个重要的问题值得注意。首先,C代码与汇编码的各个不同部分必须恰当地连接在一 起。其次,汇编码必须能恰当地处理C风格的函数调用,包括访问传递过来的参数、返回值以及遵从C函数所要求的寄存器保存规则。为了将TurboC++与 TurboAssembler模块连接在一起,必须完成以下工作:
(1)TurboC++与TurboAssembler模块必须以TurboC++可以接受的方式共享适当的函数和变量名。
(2)TurboAssembler模块必须使用与TurboC++兼容的段命名方案。
必须用TLINK将这些模块连接成可执行程序。此时,我们关心的是如何创建一种模式,以便可以按此模式编写与C兼容的汇编语言函数。为此,我们需要来了解一下以下内容:

1、内存模式和段

对于一个给定的可以由C调用的汇编语言函数,该函数必须采用与C语言一致的内存模式(tiny、small、compact、medium、 large或huge),同时必须使用与C兼容的代码段。同样,为了让C代码能够访问在汇编语言模块中定义的数据,或让汇编代码能够访问C模块中定义的数 据,汇编语言代码务必遵从C语言的数据段命名约定。
通常,汇编语言模块由三个基本段(代码段、初始化数据段和非初始化数据段)组成。每组信息被安排在各自的段中,段名取决与C程序所使用的内存模式。 Turboassembler(TASM)提供了三种简化的段伪指令(.CODE,.DATA,.DATA?)来定义这些段。其中,.CODE段标志着 程序代码段的开始,告知TurboAssembler用户指令究竟放在哪个代码段中。.DATA标志数据段的开始,用户应将内存变量放在数据段中,此段 中包含的是已初始化的数据。.DATA?的使用与.DATA一样,但.DATA?数据段中包含的是未初始化的数据。这些简化的段伪指令产生的段与 TurboC++兼容。
伪指令.MODEL告诉TurboAssembler,用简化的段伪指令创建的段与选定的内存模式兼容,并控制用PROC伪指令创建的过程的隐含类 型。由.MODEL伪指令定义的内存模式与具有同样命名的TurboC++模式是兼容的。若C程序选择了小内存模式,下面列出了采用简化的段伪指令组织 汇编模块的一种方式:

代码:

.MODELSMALL .CODE …代码段… .DATA …初始化数据段… .DATA? …非初始化数据段…
2、汇编语言与TurboC++的交互性 此处着重讨论参数传递、返回值及寄存器使用约定。假设我们编写一个求最小数的函数min,其C语言的函数原型为: extern“C”intmin(intV1,intV2); 此函数返回两个参数中的最小值。在汇编语言中其整体格式如下:
代码:

PUBLICCmin minPROCCNEAR … minENDP
这里假定min为near函数,若为far函数,可将上面格式中的near换成far。 (1)传递参数 首先考虑使用哪一种参数传递方法。除非有适当的理由,否则应该使用C参数传递方法而不用Pascal参数传递方法。对于16位的程序,当min被调用时,栈的内容如下: SP+4:V2 SP+2:V1 SP:返回地址如想不退栈就取得参数,则需保存基指针(BP),将栈顶指针(SP)送BP,然后用BP作为下标直接到栈中取得参数值。此时需注意:若把BP压入栈内,则参数的偏移量将加2,因为现在栈内又增加了两个字节。 (2)返回值 正如C函数一样,可由C调用的汇编语言函数也可以返回值。函数值的返回形式在通常情况下,16位值返回到AX中;32位值返回到DX:AX中,其中 DX存放高16位值,而AX存放低16位值;浮点值返回到8087/80287栈顶(TOS)寄存器,即ST(0)中;如果使用8087/80287仿真 器,则返回值存放在仿真器的TOS寄存器中。结构的返回要稍复杂一些。1个字节长的结构返回到AL中;2个字节长的结构返回到AX中;4个字节长的结构返 回到DX:AX中;3字节的结构或大于5字节的结构则保存在静态数据区中,然后返回指向此静态数据的指针(小数据模式置于AX中,大数据模式只有DX: AX中)。调用子程序时必须把返回值拷贝到这个指针所指的单元中。例如,min函数返回的时16位数值,所以其返回值在AX中。下面是min的汇编代码:
代码:

PUBLICCmin minPROCCNEAR PUSHBP;保存BP MOVBP,SP;将SP拷贝到BP中 MOVAX,[BP+4];将V1送到AX中 CMPAX,[BP+6];与V2比较 JLEEXIT;如果V1>V2 MOVAX,[BP+6];将V2送AX中 EXIT:POPBP;恢复BP RET;返回C minENDP
如果min是far函数,则主要在栈的入口处发生了变化,现在栈内的情况是: SP+6:V2 SP+4:V1 SP+2:返回段地址 SP:返回偏移量这就意味着栈的偏移量已增加了两个字节,因为两个额外字节(返回段地址)被压进栈内。在min函数的far版本中,V1将在[BP+6]中,V2将在[BP+8]中。这是因为返回段地址被压入栈内,V1、V2的偏移量增加了两个字节。如果使用Pascal参数传递顺序,则栈内情况变化如下(假设min是near函数): SP+4:V1 SP+2:V2 SP:返回地址此时,标识符min必须遵从Pascal类型的约定:使用大写字母和不加前缀下划线的标识符。除了V1和V2交换了位置外,此方法还需要min在返回时用ret指令清栈。在本例中,必须弹出V1和V2的四个字节(返回地址由ret只能自动弹出)。下面是采用Pascal参数传递方法的min汇编代码:
代码:

PUBLICPASCALmin minPROCPASCALNEAR PUSHBP;保存BP MOVBP,SP;将SP拷贝到BP中 MOVAX,[BP+6];将V1送到AX中 CMPAX,[BP+4];与V2比较 JLEEXIT;如果V1>V2 MOVAX,[BP+6];将V2送AX中 EXIT:POPBP;恢复BP RET4;清栈并返回 minENDP
(3)寄存器的使用约定 在min函数中,使用了多个寄存器。现在讨论在TurboC++程序中将使用哪些寄存器,以及使用中的一些约定。在所有寄存器中,BP应首先引起注意,因为一旦进入汇编程序,BP的内容在子程序入口处被压入栈内,并且栈指针(SP)的当前值必须放在BP中,在子程序出口处BP被弹出,恢复原来的值。其他需注意的是SI和DI寄存器,这两个寄存器被TurboC++用作寄存器变量。如果在一个汇编语言过程中使用它们,则应在进入时保存它们(可能在栈中),在退出时恢复它们。 3、TurboC++中调用汇编模块的方法 一般情况下,TurboC++希望所有的外部标号均以下划线“_”开头。如果汇编模块中定义的函数及变量准备供TurboC++调用,应以下划线 开头。若不想使用下划线的话,可在PUBLIC后加C标明调用的语言类型。如若有函数XXX,要定义为供TurboC++调用的函数,可这样写为 PUBLICCXXX而不需写为通常的PUBLIC_XXX。汇编程序对字母的大小写并不敏感,所以不区别对待大写字母和小写字母,而皆以大写字 母对待。因为C语言区别对待大小写字母,所以在编写准备与C模块相连接的汇编模块时,应该注意符号名的大小写,以便保持一致。而且,要通知汇编程序对大小 写区别对待,至少对于C模块和汇编模块所共享的那些符号而言应该如此。汇编程序的命令行可选项/ml和/mx可以做到这一点。汇编程序的命令行可 选项/ml使得汇编只对公共标识符和外部标识符等按大小写区别对待。按本机配置编写一个TurboC++和汇编混合编程的程序的步骤如下: (1)因为在本机上TurboC++3.0(以下简称TC)和TurboAssembler5.0(以下简称TASM)都安装在E盘,其可执行 文件分别位于E:/TC/BIN及E:/TASM/BIN目录下。于是编辑环境变量中的系统变量内的path值,添加以下内容:E:/TC/BIN; E:/TASM/BIN。这样做的目的是为了可以在TC的集成开发环境中直接调用TASM来编译汇编文件,而不需转到TASM目录在命令行下编译汇编 文件。 (2)启动TC集成开发环境新建一个工程,命名为ASMTEST.PRJ。添加ASMTEST.CPP及ADD.ASM两个文件,源码分别如下(已在TC下调试通过):
代码:

//程序名:ASMTEST.CPP #include"stdio.h" extern"C"//声明在外部模块中定义的函数 { intaddnum(int,int); } main() { intx,y;//定义变量 printf("Pleaseinputx,y,thespacekeytocompart:=>"); scanf("%d%d",&x,&y); printf("x+y=%d/n",addnum(x,y)); return(0); }
代码:

;程序名:ADD.ASM DOSSEG .MODELsmall;声明内存模式 ;.DATA;数据段未定义,此处为空 .CODE;代码段 PUBLICCaddnum;定义函数 addnumPROCCNEARx:WORD,y:WORD;定义变量 movax,x movbx,y addax,bx ret addnumENDP END
以上的ASMTEST.CPP程序调用ADD.ASM中的addnum函数,来实现两个数相加。完成代码输入后,编译后即可运行。另一种在汇编程序中定义以下划线“_”开头的函数的方法可参考附件中TOTAL工程内的文件。 二、BorlandC++与汇编的混合编程 在本机上BorlandC++(简称为BC)版本为5.02,安装在F:/BC5目录下,可执行文件位于F:/BC5/BIN目录。在此讨论在BC开发的Windows程序中调用汇编程序。 BC调用汇编模块与TC调用汇编模块的方法基本相同,只有几个需注意的地方:因为和16位Windows下的把代码分成DATA,CODE等段的内存模式不同,WIN32只有一种内存模式,即FLAT模式, 意思是"平坦"的内存模式,再没有64K的段大小限制,所有的WIN32的应用程序运行在一个连续、平坦、巨大的4GB的空间中。这同时也意 味着您无须和段寄存器打交道,您可以用任意的段寄存器寻址任意的地址空间,这对于程序员来说是非常方便的。在Win32下编程,有许多重要的规则需要遵 守。有一条很重要的是:Windows在内部频繁使用ESI,EDI,EBP,EBX寄存器,而且并不去检测这些寄存器的值是否被更改,这样当您要 使用这些寄存器时必须先保存它们的值,待用完后再恢复它们。在WIN32指定内存模式参数调用规则时可这样定义: .MODELFLAT,STDCALL 此处的STDCALL告诉编译器参数的传递约定。前面我们已经谈到了调用约定的问题,这里我们再来仔细讨论一下:在Win16下有两种约定:C和 PASCAL。C约定规定参数传递顺序是从右到左,即最右边的参数最先压栈,由调用者恢复堆栈指针。PASCAL约定和C约定正好相反,它规定参数是 从左向右传递,由被调用者恢复堆栈。Win16采用了PASCAL约定,因为PASCAL约定产生的代码量要校STDCALL是C约定和PASCAL 约定的混合体,它规定参数的传递是从右到左,恢复堆栈的工作交由被调用者。在BC所建立的工程中的汇编模块,调用C模块中的外部变量时可不在变量前加下划线“_”。由此,可建立一个调用汇编模块的简单示例程序如下(已在BC下调试通过):在BC中新建一个AsmInc工程,此处使用SDK方法,即不使用OWL,只使用WINAPI。设置为静态连接,添加以下几个文件:
代码:

//程序名:AsmInc.cpp ////////////////////////////////////////////////////////////////////////////////////////////////// //预处理 #include"windows.h" #include"stdio.h" #include"string.h" ///////////////////////////////////////////////////////////////////////////////////////////////// //全局变量 extern"C" { voidGen(void);//定义外部模块 charusername[255]="";//定义用户名和密码 charserial[255]=""; } HINSTANCEhInst;//应用程序进程句柄,一般程序中经常用到此变量,故使用全局变量 HWNDhwnd;//主窗口句柄,一般程序中经常用到此变量,故使用全局变量 ///////////////////////////////////////////////////////////////////////////////////////////////// //函数声明 LRESULTCALLBACKKeyGen(HWND,UINT,WPARAM,LPARAM); ///////////////////////////////////////////////////////////////////////////////////////////////// //主函数 intWINAPIWinMain(HINSTANCEhInstance,HINSTANCEhPrevInstance,PSTRszCmdLine,intiCmdShow) { DialogBox(hInst,MAKEINTRESOURCE(1),NULL,(DLGPROC)KeyGen); return(FALSE); } ///////////////////////////////////////////////////////////////////////////////////////////////// //对话框主函数 LRESULTCALLBACKKeyGen(HWNDhDlg,UINTmessage,WPARAMwParam,LPARAMlParam) { char*sn;//用于临时存放生成的密码 switch(message) { caseWM_COMMAND: switch(LOWORD(wParam)) { caseWM_INITDIALOG: LoadIcon(hInst,MAKEINTRESOURCE(1));//设置程序图标 break; case105://处理输入的用户名 GetDlgItemText(hDlg,103,username,255); Gen();//调用外部模块 sn=serial; SetDlgItemText(hDlg,104,sn);//把计算后的密码输出 break; case106: { MessageBox(NULL,TEXT("********混合编程示例********/n/n*******Bycao_cong********/n******2005年2月5日*****"), TEXT("关于"),MB_OK); return0; } break; case107: EndDialog(hDlg,107); break; } default:return(FALSE); } return(TRUE); }
代码:

;程序名:Gen.asm .386 .MODELFLATSTDCALL;定义使用的内存模式及参数调用方式 PUBLICGen;声明函数 .DATA EXTERNusername;声明在其他模块中定义的变量 EXTERNserial .CODE GenPROCC;主函数 PUSHEBX;保存EBX XOREAX,EAX XOREBX,EBX XORECX,ECX @LOOP:MOVEBX,[username+ECX];获得用户输入的姓名 MOVserial+ECX,EBX;把姓名送到密码中 INCECX CMPBYTEPTRES:[username+ECX],0;检测是否已送完 JNZ@LOOP POPEBX;恢复EBX ret Genendp END
代码:

//资源文件:AsmInc.rc(摘录) #defineIDI_ICON1 #defineIDD_KEYGEN1 #defineIDC_STATICTEXT1101 #defineIDC_STATICTEXT2102 #defineIDC_NAME103 #defineIDC_SN104 #defineIDEXIT107 #defineIDABOUT106 #defineIDGEN105 IDD_KEYGENDIALOG0,0,208,85 STYLEDS_MODALFRAME|DS_3DLOOK|DS_CENTER|DS_CONTEXTHELP|WS_POPUP|WS_VISIBLE|WS_CAPTION|WS_SYSMENU CAPTION"混合编程示例" FONT9,"宋体" LANGUAGELANG_CHINESE,SUBLANG_CHINESE_SIMPLIFIED { CONTROL"姓名:",IDC_STATICTEXT1,"static",SS_CENTER|WS_CHILD|WS_VISIBLE,8,16,36,12 CONTROL"密码:",IDC_STATICTEXT2,"static",SS_CENTER|WS_CHILD|WS_VISIBLE,8,40,36,12 CONTROL"",IDC_NAME,"edit",ES_LEFT|WS_CHILD|WS_VISIBLE|WS_BORDER|WS_TABSTOP,44,12,156,14 CONTROL"",IDC_SN,"edit",ES_LEFT|WS_CHILD|WS_VISIBLE|WS_BORDER|WS_TABSTOP,44,36,156,17 CONTROL"生成密码",IDGEN,"button",BS_PUSHBUTTON|BS_CENTER|BS_FLAT|WS_CHILD|WS_VISIBLE|WS_TABSTOP,24,60,44,17 CONTROL"关于",IDABOUT,"button",BS_PUSHBUTTON|BS_CENTER|BS_FLAT|WS_CHILD|WS_VISIBLE|WS_TABSTOP,90,60,44,17 CONTROL"退出",IDEXIT,"button",BS_PUSHBUTTON|BS_CENTER|BS_FLAT|WS_CHILD|WS_VISIBLE|WS_TABSTOP,156,60,44,17 }
以上程序功能主要是把你输入的姓名在密码框中输出,主要用于说明调用汇编模块的方法。 参考文献: 1、林亨利、陈维兴、成渝编译:面向对象的程序设计系统TURBOC++应用教程(中),清华大学出版社,1992 2、杨季文等编著:80X86汇编语言程序设计教程,清华大学出版社,1998 3、求实编著:最新BorlandC++实用教程1:BorlandC++入门,科学出版社,1994 4、王松张良治编:BorlandC++实用技术入门精解(3.1~4.0),电子科技大学出版社,1995 【版权声明】本文纯属技术交流,转载请注明作者并保持文章的完整,谢谢!