C语言结构体

7.C语言之结构体概述

7.1、结构体类型是一种自定义类型
C语言中的2种类型:原生类型和自定义类型。
7.2、结构体使用时先定义结构体类型再用类型定义变量
(1)结构体定义时需要先定义结构体类型,然后再用类型来定义变量。
(2)也可以在定义结构体类型的同时定义结构体变量。

#include 

//定义类型
struct people
{
	char name[20];
	int age;
};

//定义类型的同时定义变量
struct student
{
	char name[20];
	int age;
}s1;						//student是类型,s1就是变量

/*
//将类型struct student重命名为s1,s1是一个类型名,不是变量
typedef struct student
{
	char name[20];
	int age;
}s1;						
*/

int main(void)
{
	struct people p1;		//使用结构体类型定义变量
	s1.age=23;
	printf("s1.age=%d.\n",s1.age);
	
	return 0;
}

7.3、从数组到结构体的进步之处
(1)结构体可以认为是从数组发展而来的。其实数组和结构体都算是数据结构的范畴了,数组就是最简单的数据结构、结构体比数组更复杂一些,链表、哈希表之类的比结构体又复杂一些;二叉树、图等又更复杂一些。
(2)数组有2个明显的缺陷:第一个是定义时必须明确给出大小,且这个大小在以后不能再更改;第二个是数组要求所有的元素的类型必须一致。更复杂的数据结构中就致力于解决数组的这两个缺陷。
(3)结构体是用来解决数组的第二个缺陷的,可以将结构体理解为一个其中元素类型可以不相同的数组。结构体完全可以取代数组,只是在数组可用的范围内数组比结构体更简单。
结构体取代数组实例

struct score
{
	int a;
	int b;
	int c;
};

int main(void)
{
	int a[3];				//3个学生的成绩,数组的方式
	score s;				//3个学生的成绩,结构体的方式
}

7.4、结构体变量中的元素如何访问?
(1)数组中元素的访问方式:表面上有2种方式(数组下标方式和指针方式),实质上都是指针方式访问。
(2)结构体变量中的元素访问方式:只有一种,用.或者->的方式来访问。(.和->访问结构体元素其实质是一样的,只是C语言规定用结构体变量来访问元素用. ,用结构体变量的指针来访问元素用->。实际上在高级语言中已经不区分了,都用.)
(3)结构体的访问方式有点类似于数组下标的方式
思考:结构体变量的点号或者->访问元素的实质是什么?其实本质上还是用指针来访问的。
结构体的元素访问实例:

例如访问上面的score,可以使用以下方式:
s.a=12;			//实质上,编译器在内部还是转成了指针式访问:int *p=s;*(p+0)=12
s.b=44;			//int *p=s;*(p+1)=44;
s.c=64;			//int *p=s;*(p+2)=64;
//s是变量名,a/b/c是元素名
struct myStruct
{
	int a;
	double b;
	char c;
};

int main(void)
{
	struct myStruct s1;
	s1.a=12;			//int *p=(int *)&s1;*p=12;
	s1.b=4.4;			//double *p=(dounle *)((int)&s1+4);*p=4.4;   因为a是int类型,已经占了4个字节
	s1.c='a';			//char *p=(char *)((int)&s1+12);*p='a';

	printf("s1.a=%d.\n",s1.a);	
	printf("s1.b=%lf.\n",s1.b);		
	printf("s1.c=%c.\n",s1.c);	
}

8.结构体的对齐访问

8.1、举例说明什么是结构体对齐访问
(1)上节讲过结构体中元素的访问其实本质上还是用指针方式,结合这个元素在整个结构体中的偏移量和这个元素的类型来进行访问的。
(2)但是实际上结构体的元素的偏移量比我们上节讲的还要复杂,因为结构体要考虑元素的对齐访问,所以每个元素时间占的字节数和自己本身的类型所占的字节数不一定完全一样。(譬如char c实际占字节数可能是1,也可以是2,也可能是3,也可以能4····)
(3)一般来说,我们用.的方式来访问结构体元素时,我们是不用考虑结构体的元素对齐的。因为编译器会帮我们处理这个细节。但是因为C语言本身是很底层的语言,而且做嵌入式开发经常需要从内存角度,以指针方式来处理结构体及其中的元素,因此还是需要掌握结构体对齐规则。

8.2、结构体为何要对齐访问
(1)结构体中元素对齐访问主要原因是为了配合硬件,也就是说硬件本身有物理上的限制,如果对齐排布和访问会提高效率,否则会大大降低效率。
(2)内存本身是一个物理器件(DDR内存芯片,SoC上的DDR控制器),本身有一定的局限性:如果内存每次访问时按照4字节对齐访问,那么效率是最高的;如果你不对齐访问效率要低很多。
(3)还有很多别的因素和原因,导致我们需要对齐访问。譬如Cache的一些缓存特性,还有其他硬件(譬如MMU、LCD显示器)的一些内存依赖特性,所以会要求内存对齐访问。
(4)对比对齐访问和不对齐访问:对齐访问牺牲了内存空间,换取了速度性能;而非对齐访问牺牲了访问速度性能,换取了内存空间的完全利用。

8.3、结构体对齐的规则和运算
(1)编译器本身可以设置内存对齐的规则,有以下的规则需要记住:
第一个:32位编译器,一般编译器默认对齐方式是4字节对齐。

总结下:结构体对齐的分析要点和关键
1、结构体对齐要考虑:结构体整体本身必须安置在4字节对齐处,结构体对齐后的大小必须4的倍数(编译器设置为4字节对齐时,如果编译器设置为8字节对齐,则这里的4是8)
2、结构体中每个元素本身都必须对其存放,而每个元素本身都有自己的对齐规则。

int、float类型4字节对齐,double类型8字节对齐,char类型1字节对齐,short类型2字节对齐

3、编译器考虑结构体存放时,以满足以上2点要求的最少内存需要的排布来算。

struct myStruct1
{
					//1字节对齐				4字节对齐
	int a;			//4							4
	char b;			//1				 			2
	short c;		//2							2
};
/*
分析过程:
首先是整个结构体,整个结构体变量4字节对齐是由编译器保证的
其次是第一个元素a,a的开始地址就是整个结构体的开始地址,所以自然是4字节对齐的。但是a的结束地址要由下一个元素说了算
接着是第二个元素b,因为上一个元素a本身就是4字节,本身就是对齐的,所以留给b的开始地址也是4字节对齐地址, 所以b可以直接放(b放的位置就决定了a一共占4字节,因为不需要填充)
然后是第三个元素c,short类型需要2字节对齐(short类型元素必须放在类似0,2,4,8这样的地址处,不能放在1,3这样的奇数地址处),因此c不能紧凑b来存放,解决方案是在b之后添加1字节的填充(padding),然后再开始放c,c放完还没结束
当整个结构体的所有元素对齐放好后,还没结束,因为整个结构体的大小必须为4的整数倍
*/
另外一个例子:
typedef struct myStruct2
{
					//1字节对齐				4字节对齐
	char a;			//1						  4(1+3)
	int b;			//4				 		  4
	short c;		//2						  4(2+2)
};

8.4、gcc支持但不推荐的对齐指令:#pragma pack() #pragma pack(n) (n=1/2/4/8)
(1)#pragma是用来指挥编译器,或者说设置编译器的对齐方式的。编译器的默认对齐方式是4,但是有时候我不希望对齐方式是4,而希望是别的(譬如希望1字节对齐,也可能希望是8,甚至可能希望128字节对齐)。
(2)常用的设置编译器编译器对齐命令有2种:第一种是#pragma pack(),这种就是设置编译器1字节对齐(有些人喜欢讲:设置编译器不对齐访问,还有些讲:取消编译器对齐访问);第二种是#pragma pack(4),这个括号中的数字就表示我们希望多少字节对齐。
(3)我们需要#prgama pack(n)开头,以#pragma pack()结尾,定义一个区间,这个区间内的对齐参数就是n。
(4)#prgma pack的方式在很多C环境下都是支持的,但是gcc虽然也可以不过不建议使用。

8.5、gcc推荐的对齐指令__attribute__((packed)) attribute((aligned(n)))

(1)__attribute__((packed))使用时直接放在要进行内存对齐的类型定义的后面,然后它起作用的范围只有加了这个东西的这一个类型。packed的作用就是取消对齐访问。
(2)__attribute__((aligned(n)))使用时直接放在要进行内存对齐的类型定义的后面,然后它起作用的范围只有加了这个东西的这一个类型。它的作用是让整个结构体变量整体进行n字节对齐(注意是结构体变量整体n字节对齐,而不是结构体内各元素也要n字节对齐)

你可能感兴趣的