# 第一章:枚举(⭐) ## 1.1 回顾 C 语言中的变量 * C 语言中的变量,按照`数据类型`划分,如下所示: > [!NOTE] > > `构造类型`也会被人称为`自定义数据类型`!!! ![](./assets/1.png) * C 语言中的变量,按照`声明位置`划分,如下所示: ![](./assets/2.png) * C 语言中的变量,按照`存储方式`分类,如下所示: ![](./assets/3.png) ## 1.2 什么是枚举? * 在实际生活中,我们经常会遇到一些数据的值是有限的,如: * `星期`:Monday (星期一)、......、Sunday (星期天)。 - `性别`:Man (男)、Woman (女)。 - `季节`:Spring (春节)......Winter (冬天)。 - `支付方式`:Cash(现金)、WeChatPay(微信)、Alipay (支付宝)、BankCard (银 行卡)、CreditCard (信用卡)。 - `就职状态`:Busy、Free、Vocation、Dimission。 - `订单状态`:Nonpayment(未付款)、Paid(已付款)、Delivered(已发货)、 Return(退货)、Checked(已确认)Fulfilled(已配货)。 - ... * 类似上述的场景,我们就可以使用 C 语言提供的一种`构造类型` --- `枚举`(Enumeration) ,其用于`定义`一组相关的`整型常量`。它提供了一种更具可读性和可维护性的方式来定义`常量集合`。 ## 1.3 定义枚举 * 语法: ```c enum 枚举类型 { 枚举元素1, // 枚举常量1 枚举元素2, // 枚举常量2 ... } ``` > [!NOTE] > > `枚举元素`也称为`枚举成员`或`枚举常量`,具有如下的特点: > > * ① 枚举元素的值必须在同一枚举中是唯一的。 > * ② 枚举元素的值必须是整数类型,通常是 int 。 > * ③ 如果没有为枚举元素指定值,编译器会自动为它们进行分配,从 0 开始,自动递增。 > * ④ 定义枚举的时候,也可以为枚举元素自定义值,但是需要保证唯一性和整数类型。 > [!IMPORTANT] > > CLion 中`选中枚举元素`并使用快捷键 `Ctrl + Q`,或将`鼠标`悬浮在`枚举元素`上,就会自动显示枚举元素对应的值,如下所示: > > ![](./assets/4.png) * 示例:每个枚举常量的值默认为从 0 开始递增的整数 ```c #include /** * 定义枚举 */ enum Color { RED, // 0 GREEN, // 1 BLUE // 2 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); return 0; } ``` * 示例:定义带有显式值的枚举,如果给定一个常量的值,后续的常量会依次递增 ```c #include /** * 定义枚举 */ enum Color { RED = 1, GREEN, // 2 BLUE // 3 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); enum Color color = GREEN; printf("color = %d\n", color); return 0; } ``` ## 1.4 枚举变量 ### 1.4.1 概述 * 定义变量时所指定的类型是我们自定义的枚举类型,那么该变量就称为枚举变量。 ### 1.4.2 定义枚举变量 * 可以使用定义好的枚举类型来声明枚举变量。 * 语法: ```c enum 枚举名 变量名; ``` * 示例: ```c #include /** * 定义枚举 */ enum Color { RED = 1, GREEN, BLUE }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 定义枚举变量 enum Color color ; // [!code highlight] return 0; } ``` ### 1.4.3 给枚举变量赋值 * 枚举变量的值应该是枚举类型中的任意一个枚举元素(没有常量),不能是其他的值。 * 语法: ```c 枚举变量 = 枚举常量; ``` * 示例: ```c #include /** * 定义枚举 */ enum Color { RED = 1, GREEN, BLUE }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 给枚举变量赋值 enum Color color = BLUE; // [!code highlight] printf("color = %d\n", color); return 0; } ``` ## 1.5 枚举的本质到底是什么? * 尽管枚举的定义语法看起来像一种新类型,但它的底层实际上是一个整型(通常是 `int` 类型)。C 语言并不强制要求枚举使用特定的整型类型,但编译器通常会选择使用 `int` 来表示枚举。 * 在 C 语言中,枚举类型和整数类型是兼容的。你可以在需要整数的地方使用枚举值,也可以将枚举值赋给整型变量。这是因为枚举成员在编译时就被替换为其对应的整数值。 * 示例: ```c #include /** * 定义枚举 */ enum Color { RED = 1, GREEN, // 2 BLUE // 3 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); enum Color color = 0; printf("sizeof(color) = %zu \n", sizeof(color)); // sizeof(color) = 4 printf("sizeof(RED) = %zu \n", sizeof(RED)); // sizeof(RED) = 4 printf("sizeof(GREEN) = %zu \n", sizeof(GREEN)); // sizeof(GREEN) = 4 printf("sizeof(BLUE) = %zu \n", sizeof(GREEN)); // sizeof(BLUE) = 4 printf("sizeof(int) = %zu \n", sizeof(int)); // sizeof(int) = 4 return 0; } ``` ## 1.6 应用示例 * 如果枚举常量的值是连续的,我们可以使用循环遍历;如果枚举常量的值不是连续的,则无法遍历。 * 示例: ```c #include // 定义枚举类型 enum Weekday { MONDAY = 1, TUESDAY, WEDNESDAY, THURSDAY, FRIDAY, SATURDAY, SUNDAY }; int main() { // 定义枚举变量 enum Weekday day; // 使用循环遍历出所有的枚举常量 for (day = MONDAY; day <= SUNDAY; day++) { printf("%d \n", day); } return 0; } ``` ## 1.7 应用示例 * 枚举变量通常用于控制语句中,如:switch 语句。 * 示例: ```c #include /** * 定义枚举 */ enum Color { RED = 1, GREEN, // 2 BLUE // 3 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); enum Color color; printf("请输入颜色(1-3):"); scanf("%d", &color); switch (color) { case RED: printf("红色\n"); break; case GREEN: printf("绿色\n"); break; case BLUE: printf("蓝色\n"); break; default: printf("输入错误\n"); break; } return 0; } ``` # 第二章:结构体(⭐) ## 2.1 概述 * C 语言内置的数据类型,除了几种原始的基本数据类型,只有数组属于复合类型,可以同时包含多个值,但是只能包含`相同类型`的数据,实际使用场景受限。 ## 2.2 为什么需要结构体? ### 2.2.1 需求分析 1 * 现有一个需求,编写学生档案管理系统,这里需要描述一个学生的 信息。该学生的信息包括学号、姓名、性别、年龄、家庭住址等, 这些数据共同说明一个学生的总体情况。 ![](./assets/5.png) * 显然,这些数据类型各不相同,无法使用数组进行统一管理。 ### 2.2.2 需求分析 2 * 隔壁老王养了两只猫咪。一只名字叫小黄,今年 2 岁,橘色;另一只叫小黑,今年 3 岁,黑色。请编写一个程序,当用户输入小猫的名字 时,就显示该猫的名字,年龄,颜色。如果用户输入的小猫名错误,则显示老王没有这只猫。 ![](./assets/6.png) ### 2.2.3 传统的解决方案 * 尝试 ① :单独定义多个变量存储,实现需求,但是,多个变量,不便于数据的管理。 * 尝试 ② :使用数组,它是一组具有相同类型的数据的集合。但在编程中,往往还需要一组类型不同的数据,例如:猫的名字使用字符串、年龄是 int,颜色是字符串,因为数据类型不同,不能用一个数组来存放。 * 尝试 ③ :C 语言提供了结构体。使用结构体,内部可以定义多个不同类型的变量作为其成员。 ## 2.3 什么是结构体 * C 语言提供了 struct 关键字,允许自定义复合数据类型,将不同类型的值组合在一起,这种类型称为结构体(structure)类型。 ![](./assets/7.png) > [!NOTE] > > C 语言没有其他语言的对象(object)和类(class)的概念,struct 结构很大程度上提供了对象和类的功能。 ## 2.4 结构体的基本使用 ### 2.4.1 声明结构体 * 语法: ```c struct 结构体名{ 数据类型1 成员名1; // 分号结尾 数据类型2 成员名2; …… 数据类型n 成员名n; }; ``` > [!NOTE] > > 结构体中可以包含以下数据类型: > > * ① 基本数据类型:整型、浮点型、字符型、布尔型。 > * ② 指针类型。 > * ③ 枚举类型。 > * ④ 结构体类型: > * 可以包含其他结构体作为成员(称为嵌套结构体)。 > * 结构体指针。 > * ⑤ 联合体类型。 > * ⑥ 位域。 * 示例: ```c {6-12} #include /** * 声明学生的结构体 */ struct Student { int id; // 学号 char name[20]; // 姓名 char gender; // 性别 int age; // 年龄 char address[50]; // 地址 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); return 0; } ``` * 示例: ```c {6-10} #include /** * 声明猫的结构体 */ struct Cat { char name[20]; // 姓名 int age; // 年龄 char color[50]; // 颜色 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); return 0; } ``` * 示例: ```c {6-11} #include /** * 声明人类的结构体 */ struct Person { char name[20]; // 姓名 char gender; // 性别 int age; // 年龄 double weight; // 体重 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); return 0; } ``` * 示例: ```c {6-13} #include /** * 声明通讯录的结构体 */ struct Contact { char name[50]; // 姓名 int year; // 年 int month; // 月 int day; // 日 char email[100]; // 电子邮箱 char phoneNumber[15]; // 手机号 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); return 0; } ``` * 示例: ```c {6-12} #include /** * 声明员工的结构体 */ struct Employee { int id; // 员工编号 char name[20]; // 员工姓名 char gender; // 员工性别 int age; // 员工年龄 char address[30]; // 员工住址 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); return 0; } ``` ### 2.4.2 定义结构体变量 #### 2.4.2.1 概述 * 定义了新的数据类型(结构体类型)以后,就可以定义该类型的变量,这与定义其他类型变量的写法是一样的。 #### 2.4.2.2 方式一 * 语法: ```c struct 结构体类型名称 结构体变量名; ``` > [!NOTE] > > * ① 需要先定义结构体,然后再定义结构体变量。 > * ② `struct` 关键字不能省略;否则, C 语言编译器将会报错。 > [!CAUTION] > > 在 C 语言中,结构体(struct)和结构体变量是两个不同的概念,如下所示: > > * ① 结构体是一种自定义的数据类型,像一种模板,定义了数据的格式,不占用内存空间。 > * ② 结构体变量是根据结构体类型创建的变量,代表了一个具体的对象,用于存储数据,需要内存空间来存储。 * 示例: ```c #include /** * 声明学生的结构体 */ struct Student { int id; // 学号 char name[20]; // 姓名 char gender; // 性别 int age; // 年龄 char address[50]; // 地址 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 定义学生结构体的变量 struct Student student; // [!code highlight] return 0; } ``` * 示例: ```c #include /** * 声明猫的结构体 */ struct Cat { char name[20]; // 姓名 int age; // 年龄 char color[50]; // 颜色 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 定义猫结构体的变量 struct Cat cat; // [!code highlight] return 0; } ``` #### 2.4.2.3 方式二 * 语法: ```c struct 结构体名{ 数据类型1 成员名1; // 分号结尾 数据类型2 成员名2; …… 数据类型n 成员名n; } 结构体变量1,结构体变量2,...; ``` > [!NOTE] > > 在声明结构体的同时定义结构体变量。 * 示例: ```c {6,12} #include /** * 声明学生的结构体的同时定义结构体变量 */ struct Student { int id; // 学号 char name[20]; // 姓名 char gender; // 性别 int age; // 年龄 char address[50]; // 地址 } stu1,stu2; // stu1 和 stu2 是结构体变量 int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); return 0; } ``` * 示例: ```c {6,10} #include /** * 声明猫的结构体的同时定义结构体变量 */ struct Cat { char name[20]; // 姓名 int age; // 年龄 char color[50]; // 颜色 } cat; // cat 是结构体变量 int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); return 0; } ``` #### 2.4.2.4 方式三 * 语法: ```c struct { 数据类型1 成员名1; // 分号结尾 数据类型2 成员名2; …… 数据类型n 成员名n; } 结构体变量1,结构体变量2,...; ``` > [!NOTE] > > * ① 在声明结构体的同时定义结构体变量,但是不给结构体名,这种方式的结构体也称为`匿名结构体`。 > * ② 和`方式二`相比,后面的代码将无法通过该结构体来定义变量,因为没有结构体名称,除非使用 `typedef` 关键字。 * 示例: ```c {6,12} #include /** * 声明学生的结构体的同时定义结构体变量 */ struct { int id; // 学号 char name[20]; // 姓名 char gender; // 性别 int age; // 年龄 char address[50]; // 地址 } stu1,stu2; // stu1 和 stu2 是结构体变量 int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); return 0; } ``` * 示例: ```c {6,10} #include /** * 声明猫的结构体的同时定义结构体变量 */ struct { char name[20]; // 姓名 int age; // 年龄 char color[50]; // 颜色 } cat; // cat 是结构体变量 int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); return 0; } ``` ### 2.4.3 结构体变量中成员的获取和赋值 #### 2.4.3.1 概述 * 成员是结构体的一个组成部分,一般是基本数据类型、也可以是数组、指针、结构体等。结构体的成员也可以称为属性。 * 结构体和数组类似,也是一组数据的集合,结构体使用点号 `.` 获取单个成员,可以进行赋值和取值。 #### 2.4.3.2 结构体成员逐个赋值 * 语法: ```c 结构体变量名.成员名 = 值; // 值可以是常量或变量 ``` * 示例: ```c {23-26,29-32} #include #include /** * 声明人类的结构体 */ struct Person { char name[20]; // 姓名 char gender; // 性别 int age; // 年龄 double weight; // 体重 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 定义猫结构体的变量 struct Person person; // 结构体变量中成员赋值 strcpy(person.name, "张三"); person.gender = 'M'; person.age = 20; person.weight = 60.5; // 结构体变量中成员的访问 printf("姓名:%s\n", person.name); // 姓名:张三 printf("性别:%c\n", person.gender); // 性别:M printf("年龄:%d\n", person.age); // 年龄:20 printf("体重:%.2f\n", person.weight); // 体重:60.50 return 0; } ``` * 示例: ```c {24-28,31-35} #include #include /** * 声明学生的结构体 */ struct Student { int id; // 学号 char name[20]; // 姓名 char gender; // 性别 int age; // 年龄 char address[50]; // 地址 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 定义学生结构体的变量 struct Student student; // 结构体变量中成员赋值 student.id = 10001; strcpy(student.name, "张三"); student.gender = 'M'; student.age = 20; strcpy(student.address, "北京市海淀区"); // 输出结构体变量中成员的值 printf("学号: %d\n", student.id); // 学号: 10001 printf("姓名: %s\n", student.name); // 姓名: 张三 printf("性别: %c\n", student.gender); // 性别: M printf("年龄: %d\n", student.age); // 年龄: 20 printf("地址: %s\n", student.address); // 地址: 北京市海淀区 return 0; } ``` #### 2.4.3.3 使用大括号一次性对结构体所有成员赋值 * 语法: ```c struct 结构体类型 结构体变量 = {...}; ``` ```c struct 结构体类型 结构体变量 = {.成员 = xxx,...}; ``` > [!NOTE] > > * ① `struct 结构体类型 结构体变量 = {...};`,需要和声明结构体中成员的顺序保持一致。 > * ② `struct 结构体类型 结构体变量 = {.成员 = xxx,...};` ,不需要和声明结构体中成员的顺序保持一致。 > * ③ 如果初始化的属性少于声明时的属性,剩下的那些属性都会初始化为 0 。 > [!IMPORTANT] > > CLion 中其实是有这类语法提示的,如下所示: > > ![](./assets/8.png) * 示例: ```c #include #include /** * 声明学生的结构体 */ struct Student { int id; // 学号 char name[20]; // 姓名 char gender; // 性别 int age; // 年龄 char address[50]; // 地址 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 定义学生结构体的变量并进行初始化 struct Student student = {10001, "张三", 'M', 20, "北京市海淀区"}; // [!code highlight] // 输出结构体变量中成员的值 printf("学号: %d\n", student.id); // 学号: 10001 printf("姓名: %s\n", student.name); // 姓名: 张三 printf("性别: %c\n", student.gender); // 性别: M printf("年龄: %d\n", student.age); // 年龄: 20 printf("地址: %s\n", student.address); // 地址: 北京市海淀区 return 0; } ``` * 示例: ```c {19-22} #include /** * 声明人类的结构体 */ struct Person { char name[20]; // 姓名 char gender; // 性别 int age; // 年龄 double weight; // 体重 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 定义人类结构体的变量并进行初始化 struct Person person = {.gender = 'M', .name = "张三", .age = 15, .weight = 60.5}; // 结构体变量中成员的访问 printf("姓名:%s\n", person.name); // 姓名:张三 printf("性别:%c\n", person.gender); // 性别:M printf("年龄:%d\n", person.age); // 年龄:20 printf("体重:%.2f\n", person.weight); // 体重:60.50 return 0; } ``` ### 2.4.4 应用示例 * 需求:创建一个 Box 的结构体,在其中定义三个成员分别表示一个立方体的长、宽和高(长、宽、高可以由控制台输入),并且定义一个函数获取立方体的体积。 * 示例: ```c #include /** * 声明 Box 的结构体 */ struct Box { double length; // 长 double width; // 年龄 double height; // 高度 }; /** * 获取 Box 的体积 * @param box * @return */ double getVolume(struct Box box) { return box.length * box.width * box.height; } int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 创建结构体变量 struct Box box; // 输入 printf("请输入长:"); scanf("%lf", &box.length); printf("请输入宽:"); scanf("%lf", &box.width); printf("请输入高:"); scanf("%lf", &box.height); // 调用函数获取体积 printf("体积为:%.2lf\n", getVolume(box)); return 0; } ``` ### 2.4.5 总结 * `结构体`是一个`自定义数据类型`(构造类型),表示的是一种数据类型。 * `结构体变量`就是一个`具体`的`变量`,例如: ```c int num = 10; // int 是数据类型,而 num 是一个具体的 int 类型的变量 ``` ```c struct Car car ; // Car 是结构体数据类型,而 car 是一个具体的 Car 类型的变量 ``` > [!NOTE] > > * 结构体就相当于是一个汽车图纸,是一个模板。而生产出来的具体的一辆辆的汽车,就类似于一个个的结构体变量。这些结构体变量都含有相同的成员, 将结构体变量的成员比作“零件”,同一张图纸生产出来的零件的作用都是一样的。 > > ![](./assets/9.png) > > * 如果学过 Java 等面向对象的语言,就可以将`结构体`当做是`类`,而`结构体变量`当做是`对象`。但是,两者不是完全等价,因为其底层的内存结构是不一样的。 ## 2.5 进一步认识结构体 ### 2.5.1 结构体嵌套 * 之前说过,结构体中的成员可以包含以下数据类型: * ① 基本数据类型:整型、浮点型、字符型、布尔型。 * ② 指针类型。 * ③ 枚举类型。 * ④ 结构体类型: * 可以包含其他结构体作为成员(称为嵌套结构体)。 * 结构体指针。 * ⑤ 联合体类型。 * ⑥ 位域。 * 如果一个结构体的成员中是另外一个结构体,那么就构成了结构体嵌套。 > [!IMPORTANT] > > * 也许,你会有疑问,为什么结构体中的成员不能包含自己,如下所示: > > ```c > struct A { > int data; > struct A self; // 错误,结构体不能包含自己 > }; > ``` > > * 原因之一是`内存分配`问题,即:编译器会试图计算结构体`A`的大小,但是因为`A`中包含另一个`A`,这个`A`中又包含另一个`A`,这种嵌套会无限递归下去。编译器无法确定最终的大小,因为这个定义永远不会结束。 > * 原因之二是`逻辑上的循环`问题,即:如果结构体包含自己,这意味着每个结构体实例会包含另一个结构体实例,后者又包含另一个结构体实例,导致逻辑上的循环引用。这是不可能实现的,因为系统的内存和逻辑不能支持这种无穷递归。 > * 解决方案:虽然不能直接包含自己,但是可以通过`指针`来引用自身。指针有固定的大小(通常是4字节或8字节,取决于系统架构),因此不会造成上述的无限递归问题。 * 示例: ```c {7,15,17} #include #include /** * 声明姓名结构体 */ struct Name { char firstName[50]; char lastName[50]; }; /** * 声明学生的结构体 */ struct Student { int id; // 学号 struct Name name; // 姓名 char gender; // 性别 int age; // 年龄 char address[50]; // 地址 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 定义结构体变量并赋值 struct Student stu1 = {1001, {"张", "三"}, 'M', 20, "北京市海淀区"}; printf("学号: %d\n", stu1.id); printf("姓名: %s\n", strcat(stu1.name.firstName, stu1.name.lastName)); printf("性别: %c\n", stu1.gender); printf("年龄: %d\n", stu1.age); printf("地址: %s\n", stu1.address); printf("\n"); // 定义结构体变量并赋值 struct Name name = {.firstName = "李", .lastName = "四"}; struct Student stu2 = {1002, name, 'F', 21, "上海市浦东新区"}; printf("学号: %d\n", stu2.id); printf("姓名: %s\n", strcat(stu2.name.firstName, stu2.name.lastName)); printf("性别: %c\n", stu2.gender); printf("年龄: %d\n", stu2.age); printf("地址: %s\n", stu2.address); return 0; } ``` * 示例: ```c {6,15,21} #include /** * 声明日期的结构体 */ struct Date { int year; int month; int day; }; /** * 声明员工的结构体 */ struct Employee { int id; // 员工编号 char name[20]; // 员工姓名 char gender; // 员工性别 int age; // 员工年龄 char address[30]; // 员工住址 struct Date hireDate; // 员工的入职时间 }; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // 定义员工结构体的变量 struct Employee employee = {1001, "张三", 'M', 20, "北京市海淀区", {2018, 10, 1}}; printf("员工编号: %d\n", employee.id); printf("员工姓名: %s\n", employee.name); printf("员工性别: %c\n", employee.gender); printf("员工年龄: %d\n", employee.age); printf("员工住址: %s\n", employee.address); printf("入职时间: %d-%d-%d\n", employee.hireDate.year , employee.hireDate.month, employee.hireDate.day); printf("\n"); // 定义员工结构体的变量 struct Date hireDate = {2019, 10, 1}; struct Employee employee2 = {.id = 1002, .name = "李四", .gender = 'F', .age = 21, .address = "上海市浦东新区"}; employee2.hireDate = hireDate; printf("员工编号: %d\n", employee2.id); printf("员工姓名: %s\n", employee2.name); printf("员工性别: %c\n", employee2.gender); printf("员工年龄: %d\n", employee2.age); printf("员工住址: %s\n", employee2.address); printf("入职时间: %d-%d-%d\n", employee2.hireDate.year, employee2.hireDate.month, employee2.hireDate.day); return 0; } ``` ### 2.5.2 结构体占用的内存空间 #### 2.5.2.1 概述 * 假设结构体变量是这样定义的,如下所示: ```c struct Student{ char *name; //姓名 int num; //学号 int age; //年龄 char group; //所在学习小组 float score; //成绩 } stu1,stu2 ; ``` * 理论上讲结构体变量的各个成员在内存中是连续存储的,和数组类似,如:上面的结构体变量 `stu1` 和 `stu2` 的内存分布,如下所示: ![](./assets/10.svg) * 我们也可以通过代码,来验证: ```c #include struct Student { char *name; // 姓名 int num; // 学号 int age; // 年龄 char group; // 所在学习小组 float score; // 成绩 } stu1, stu2; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // sizeof(stu1.name) = 8 printf("sizeof(stu1.name) = %zu\n", sizeof(stu1.name)); // sizeof(stu1.num) = 4 printf("sizeof(stu1.num) = %zu\n", sizeof(stu1.num)); // sizeof(stu1.age) = 4 printf("sizeof(stu1.age) = %zu\n", sizeof(stu1.age)); // sizeof(stu1.group) = 1 printf("sizeof(stu1.group) = %zu\n", sizeof(stu1.group)); // sizeof(stu1.score) = 4 printf("sizeof(stu1.score) = %zu\n", sizeof(stu1.score)); // total = 21 printf("total = %zu\n", sizeof(stu1.name) + sizeof(stu1.num) + sizeof(stu1.age) + sizeof(stu1.group) + sizeof(stu1.score)); return 0; } ``` * 但是,在编译器的具体实现中,各个成员之间可能会存在缝隙,对于 `stu1` 和 `stu2` 来说,成员变量 `group` 和 `score` 之间存在 `3` 个字节的空白填充,如下所示: ![](./assets/11.svg) * 我们也可以通过代码,来验证: ```c #include struct Student { // 没有写 stu char *name; // 姓名 int num; // 学号 int age; // 年龄 char group; // 所在学习小组 float score; // 成绩 } stu1, stu2; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); // sizeof(stu1.name) = 8 printf("sizeof(stu1.name) = %zu\n", sizeof(stu1.name)); // sizeof(stu1.num) = 4 printf("sizeof(stu1.num) = %zu\n", sizeof(stu1.num)); // sizeof(stu1.age) = 4 printf("sizeof(stu1.age) = %zu\n", sizeof(stu1.age)); // sizeof(stu1.group) = 1 printf("sizeof(stu1.group) = %zu\n", sizeof(stu1.group)); // sizeof(stu1.score) = 4 printf("sizeof(stu1.score) = %zu\n", sizeof(stu1.score)); // total = 21 printf("total = %zu\n", sizeof(stu1.name) + sizeof(stu1.num) + sizeof(stu1.age) + sizeof(stu1.group) + sizeof(stu1.score)); // sizeof(stu1) = 24 printf("sizeof(stu1) = %zu\n", sizeof(stu1)); return 0; } ``` * 至于结构体变量中的各个成员变量,为什么会存在“裂缝”,就是因为`内存对齐`。 #### 2.5.2.2 内存对齐 * 计算机的内存是以字节(Bytes)为单位进行划分的,理论上 CPU 可以访问任意内存地址上的字节数据。但是,实际情况并非如此。 * CPU 是通过`地址总线`来访问内存的,一次能处理几个字节的数据,就命令地址总线读取几个字节的数据,如下所示: ![](./assets/12.jpg) > [!NOTE] > > * ① 32 位的 CPU 一次可以处理 4 个字节的数据,那么每次就从内存读取 4 个字节的数据。 > * ② 64 位的 CPU 一次可以处理 8 个字节的数据,那么每次就从内存读取 8 个字节的数据。 * 以 `32` 位的 CPU 为例,实际寻址的步长是 `4` 个字节,也就是只对编号为 `4` 的倍数的内存进行寻址,如:0、4、8、12 等,而不会对编号为 1、2、3、5 等的内存编号进行寻址,如下所示: ![](./assets/13.svg) > [!NOTE] > > 好处:可以做到最快速度的寻址,既不会遗漏一个字节,也不会重复对一个字节进行寻址。 * 对于程序来说,一个变量最好在一个寻址步长范围内,这样就可以一次就读取到变量的值。如果要进行跨步长存储,那么就需要读取两次,然后再拼接数据,效率显而易见的降低。 > [!NOTE] > > * ① 对于一个 int 类型的数据而言,其在内存中的长度是 4 个字节。 > > ![](./assets/14.svg) > > * ② 如果其存储时的内存地址的编号是 4 ,非常好办,直接对编号为 4 的内存进行寻址一次就可以了。 > > ![](./assets/15.svg) > > * ③ 如果其存储时的内存地址的编号是 6,就比较麻烦,CPU 首先需要先对编号为 4 的内存进行寻址,读取 4 个字节,得到该数据的前半部分,然后再对编号为 8 的内存进行寻址,读取 4 个字节,得到该数据的后半部分,再将这两部分数据拼接起来,才能取得数据的值。 > > ![](./assets/16.svg) > [!IMPORTANT] > > * ① 将一个数据尽量放到一个步长之内,避免跨步长存储和读取,这称为`内存对齐`。 > * ② 在 `32` 位编译模式下,默认以 `4` 字节对齐。在 `64` 位编译模式下,默认以 `8` 字节对齐。 * 为了满足对齐要求,编译器有时会在数据结构中插入一些“填充”字节,这就会产生一定的内存浪费。例如:假设一个结构体包含一个`char`和一个`int`字段,编译器可能会插入 3 个字节的填充以确保`int`字段对齐到 4 字节的边界。这种填充虽然会浪费少量内存,但可以显著提升数据访问效率。 * 我们可以通过代码,来验证: ```c #include struct { int a; char b; int c; } t = {10, 'C', 20}; int main() { // 禁用 stdout 缓冲区 setbuf(stdout, nullptr); printf("sizeof(t): %zu\n", sizeof(t)); // sizeof(t): 12 printf("&a: %p\n", &t.a); // &a: 0x559d28db8010 printf("&b: %p\n", &t.b); // &b: 0x559d28db8014 printf("&c: %p\n", &t.c); // &c: 0x559d28db8018 return 0; } ``` * 其内存结构,如下所示: ![](./assets/17.svg) > [!CAUTION] > > * ① 不管是`结构体变量`,还是`普通变量`都存在内存对齐。 > * ② 内存对齐的规则:只能存放在自己类型整数倍的内存地址上(`内存地址`和`占用字节`是可以整除)。 > * 1 字节的数据,如:`char`类型,通常可以存放在任何地址。 > * 2 字节的数据,如:`short`类型,通常存放在偶数地址。 > * 4 字节的数据,如:`int`类型,通常存放在能被 4 整除的地址。 > * 8 字节的数据,如:`double`类型,通常存放在能被 8 整除的地址。 > * ③ `结构体变量`的内存对齐:`结构体变量`的内存对齐除了遵循上述的内存规则之外,还会插入“填充”字节。`结构体变量`的总大小是最大类型的整数倍。 > * ④ 内存对齐的时候可能会出现“填充”字节,但是并不会改变原来数据的大小,即:char 类型的数据即使“填充”字节之后,本身还是 1 个字节。 > * ⑤ `心得`:我们会将小的数据类型,写在最上面;大的数据类型,写在最下面(节省内存空间)。 # 第三章:共用体