# 第一章:计算机组成原理 ## 1.1 计算机系统 * 计算机(Computer),俗称`"电脑"`,是一种能够接收和存储信息,并按照存储在其内部的程序对海量的数据进行自动、高速的处理,然后将处理结果输出的现代化智能电子设备。 * 计算机有很多形式,如:台式电脑、笔记本电脑、智能手机、平板电脑等,还有生产环境中提供重要业务支撑的各种服务器。 ![](./assets/1.jpg) * 一个完整的`计算机系统`由`硬件(Hardware)系统`和`软件(Software)系统`两大部分组成,即: ![](./assets/2.png) ## 1.2 冯·诺依曼体系结构 * `冯·诺依曼`是一位多才多艺的科学家,他在数学、物理学、计算机科学、经济学等领域都有杰出的贡献。 ![](./assets/3.jpg) * `冯·诺依曼`的主要成就: - 在计算机科学领域的最著名贡献是提出了`冯·诺依曼`体系结构(1946 年),这是`现代计算机设计的基础`。 - 促进了计算机的可编程性和通用性,使得计算机能够执行各种复杂的任务。 - 对核武器设计、自动化控制系统、人工智能等领域的发展产生了重要影响。 - …… > [!IMPORTANT] > > `冯·诺依曼体系结构`是现代计算机(量子计算机除外)设计的`基础`。 * `冯·诺依曼`体系结构的理论要点如下: - ① **存储程序**:`程序指令`和`数据`都存储在计算机的内存中,这使得程序可以在运行时修改。 - ② **二进制逻辑**:所有`数据`和`指令`都以`二进制`形式表示。 - ③ **顺序执行**:指令按照它们在内存中的顺序执行,但可以有条件地改变执行顺序。 - ④ **五大部件**:计算机由`运算器`、`控制器`、`存储器`、`输入设备`和`输出设备`组成。 - ⑤ **指令结构**:指令由操作码和地址码组成,操作码指示要执行的操作,地址码指示操作数的位置。 - ⑥ **中心化控制**:计算机的控制单元(CPU)负责解释和执行指令,控制数据流。 ![](./assets/4.png) > [!NOTE] > > 上述的组件协同工作,构成了一个完整的计算机系统: > > * **运算器**和**控制器**通常被集成在一起,组成中央处理器(CPU),负责数据处理和指令执行。 > * **存储器**保存数据和程序,是计算机运作的基础。 > * **输入设备**和**输出设备**负责与外界的交互,确保用户能够输入信息并接收计算机的处理结果。 ## 1.3 各种硬件处理速度和性能优化 * 计算机的性能短板:如果 CPU 有每秒处理 1000 个服务请求的能力,各种总线的负载能力能达到 500 个, 但网卡只能接受 200个请求,而硬盘只能负担 150 个的话,那这台服务器得处理能力只能是 150 个请求/ 秒,有 85% 的处理器计算能力浪费了,在计算机系统当中,`硬盘`的读写速率已经成为影响系统性能进一 步提高的瓶颈。 ![img](./assets/5.jpg) * 计算机的各个设备部件的延迟从高到低的排列,依次是机械硬盘(HDD)、固态硬盘(SSD)、内存、CPU 。 ![img](./assets/6.png) * 从上图中,我们可以知道,CPU 是最快的,一个时钟周期是 0.3 ns ,内存访问需要 120 ns ,固态硬盘访问需要 50-150 us,传统的硬盘访问需要 1-10 ms,而网络访问是最慢,需要 40 ms 以上。 * 时间的单位换算如下: ```txt 1 秒 = 1000 毫秒,即 1 s = 1000 ms。 1 毫秒 = 1000 微妙,即 1 ms = 1000 us 。 1 微妙 = 1000 纳秒,即 1 us = 1000 ns。 ``` * 按照上图,将计算机世界的时间和人类世界的时间进行对比,即: ```txt 如果 CPU 的时钟周期按照 1 秒计算, 那么,内存访问就需要 6 分钟; 那么,固态硬盘就需要 2-6 天; 那么,传统硬盘就需要 1-12 个月; 那么,网络访问就需要 4 年以上。 ``` * 所以,对于 CPU 来说,这个世界真的是太慢了!!! * 其实,中国古代中的文人,通常以`蜉蝣`来表示时间的短暂(和其他生物的寿命比),也是类似的道理,即: ```txt 鹤寿千岁,以极其游,蜉蝣朝生而暮死,尽其乐,盖其旦暮为期,远不过三日尔。 --- 出自 西汉淮南王刘安《淮南子》 ``` ```txt 寄蜉蝣于天地,渺沧海之一粟。 哀吾生之须臾,羡长江之无穷。 挟飞仙以遨游,抱明月而长终。 知不可乎骤得,托遗响于悲风。 --- 出自 苏轼《赤壁赋》 ``` >[!NOTE] > >对于`蜉蝣`来说,从早到晚就是一生;而对于我们`人类`而言,却仅仅只是一天。 * 存储器的层次结构(CPU 中也有存储器,即:寄存器、高速缓存 L1、L2 和 L3),如下所示: ![img](./assets/7.png) >[!NOTE] > >上图以层次化的方式,展示了价格信息,揭示了一个真理,即:鱼和熊掌不可兼得。 > >- ① 存储器越往上速度越快,但是价格越来越贵, 越往下速度越慢,但是价格越来越便宜。 >- ② 正是由于计算机各个部件的速度不同,容量不同,价格不同,导致了计算机系统/编程中的各种问题以及相应的解决方案。 > >总结:CPU 都是直接和内存打交道的,即:CPU 会直接从内存中读取数据,待数据处理完毕之后,会将结果再次写入到内存中;如果需要将数据持久化(永久)保存(内存是易失性存储器,内存中的数据是以电荷形式存储在存储单元中的。当计算机关闭或断电时,这些电荷很快消散,导致存储在内存中的数据丢失),那么就需要将内存中的数据再刷新到磁盘或硬盘上,即:落盘。 ## 1.4 计算机软件 ### 1.4.1 操作系统的来源 * 在上古时期,硬件资源不够丰富,计算机设计的也非常简陋。那个时候,很多应用程序都是直接跑在硬件上的,即:一个计算机只能跑一个应用程序。 ![](./assets/8.png) * 随着技术的发展,硬件越来越丰富,功能也越来越强大,性能也越来越好。这种情况下,如果一台计算机只能跑一个程序,实在是太浪费了。而且,底层硬件不断丰富,应用程序需要对接的硬件也将越来越多,如果每个应用程序都这么干,不显示工作很重复吗?于是,操作系统应运而生了。 ![](./assets/9.png) - 操作系统的功能: - 硬件驱动。 - 进程管理。 - 内存管理。 - 网络管理。 - 安全管理。 - 文件管理。 * 那么,操作系统的作用,就是这样的,即: * 对下,管理计算机的硬件资源。 * 对上,提供使用计算机资源的操作方式,有: * `系统调用`:是一套已经写好的代码接口,应用程序通过调用这些接口来请求操作系统执行特定的硬件操作。它们直接与硬件交互,提供底层功能支持,如:文件操作、进程管理、内存管理等。`开发者`通过系统调用可以实现对底层资源的直接控制,确保程序能够高效、安全地运行。 * `终端命令`:是一种文本命令接口,通过命令行输入各种指令来控制操作系统和软件的行为。终端命令可以执行文件操作、系统配置、网络管理等各种任务。主要针对`开发人员`和`高级用户`,他们通过命令行可以快速、精确地完成各种操作,提高工作效率。 * `图形用户界面`(GUI)是通过图形元素(如:窗口、图标、按钮等)与用户进行交互的界面。供直观、易用的操作方式,使用户能够通过鼠标点击、拖拽等简单操作完成复杂任务。主要面向`普通用户`,降低了计算机操作的门槛,提高了用户体验和工作效率。 ![](./assets/10.png) ### 1.4.2 用户态和内核态 * 在现代操作系统中,`用户态(User Mode)`和`内核态(Kernel Mode)`是两种不同的执行模式,它们对系统资源的访问权限有着本质的区别。这种区分是为了提供一个稳定和安全的运行环境,防止用户程序直接操作硬件设备和关键的系统资源,从而可能引起系统的不稳定或安全问题。 ![](./assets/11.png) - 核态(Kernel Mode) VS 用户态(User Mode): | 类型 | 内核态(Kernel Mode) | 用户态(User Mode) | | :----- | :----------------------------------------------------------- | :----------------------------------------------------------- | | 权限 | 内核态是操作系统代码运行的模式,拥有访问系统全部资源和执行硬件操作的`最高权限`。在这种模式下,操作系统的核心部分可以直接访问内存、硬件设备控制、管理文件系统和网络通信等。 | 用户态是普通应用程序运行的模式,具有`较低`的系统资源访问权限。在用户态,程序不能直接执行硬件操作,必须通过操作系统提供的接口(即系统调用)来请求服务。 | | 安全性 | 由于内核态具有如此高的权限,因此只有可信的、经过严格审查的操作系统核心组件才被允许在此模式下运行。这样可以保护系统不被恶意软件破坏。 | 用户态为系统提供了一层保护,确保用户程序不能直接访问关键的系统资源,防止系统崩溃和数据泄露。 | | 功能 | 内核态提供了`系统调用`的接口,允许用户态程序安全地请求使用操作系统提供的服务,比如:文件操作、网络通信、内存管理等。 | 用户态保证了操作系统的稳定性和安全性,同时也使得多个程序可以在相互隔离的环境中同时运行,避免相互干扰。 | > [!NOTE] > > - ① 操作系统通过用户态和内核态的分离,实现了对系统资源的保护和控制。 > - ② 当用户程序需要进行文件读写、网络通信或其他需要操作系统介入的操作时,会发生从用户态到内核态的切换。这通过系统调用(System Call)实现,系统调用是用户程序与操作系统内核通信的桥梁。 > - ③ 执行完毕后,系统从内核态返回用户态,继续执行用户程序。 > - ④ 用户态和内核态的这种分离设计是现代操作系统中实现安全、稳定运行的关键机制之一。 * 示例: ```java import java.io.IOException; import java.nio.file.Files; import java.nio.file.Path; import java.nio.file.Paths; import java.util.List; public class Demo { public static void writeFile(String filePath, String content) { Path path = Paths.get(filePath); try { Files.write(path, content.getBytes()); } catch (IOException e) { e.printStackTrace(); } } public static void main(String[] args){ int a = 10; // 用户态 int b = 20; // 用户态 int c = a + b; // 用户态 string filePath = "c:/demo.txt"; // 用户态 string txt = a + b + c; // 用户态 writeFile(filePath, a); // 从用户态切换到内核态完成文件写入 System.out.println(a); // 从内核态切换回用户态 System.out.println(b); // 用户态 System.out.println(c); // 用户态 } } ``` ### 1.4.3 ISA、ABI 和 API - ISA 、ABI 和 API 的参考模型如下: ![](./assets/12.jpg) * 在底层,硬件模型以指令集架构 (ISA) 表示,该架构定义了处理器、寄存器、存储器和中断管理的指令集。ISA 是硬件和软件之间的接口,对于操作系统 (OS) 开发人员 (System ISA) 和直接管理底层硬件的应用程序 (User ISA) 的开发人员来说非常重要。 > [!NOTE] > > - ① ISA 是计算机体系结构中定义的一组指令,它规定了处理器能够执行的操作。ISA 包括指令的编码、寄存器的使用、内存访问模式等。不同的处理器可能有不同的 ISA,例如:x86、ARM、MIPS 等。 > - ② 在设计一个新的操作系统时,开发者需要确保操作系统能够支持特定的 ISA ,以便在特定的硬件上运行。例如:如果操作系统旨在运行在 ARM 架构的处理器上,那么它必须能够理解和执行 ARM ISA 定义的指令集。 - 应用程序二进制接口 (ABI) 将`操作系统层`与由操作系统管理的`应用程序`和`库`分开。ABI 涵盖了低级数据类型、对齐方式和调用约定等详细信息,并定义了可执行程序的格式。系统调用在此级别定义。此接口允许应用程序和库在实现相同 ABI 的操作系统之间移植。 > [!NOTE] > > - ① ABI 是指在二进制级别上,应用程序与操作系统、库或应用程序的不同部分之间的接口。它定义了数据类型的大小、布局、对齐方式,以及函数调用的约定(如参数如何传递、返回值如何处理等)。ABI 确保了编译后的二进制文件能够在特定的操作系统和硬件平台上正确地运行。 > - ② 在 windows 上的应用程序的运行格式是:`PE`(portable executable)格式、`.dll` (dynamic link library)格式和 `.lib` 格式;而在 Linux 上的应用程序的运行格式是:`ELF`(executable and linking format)格式、`.so` (shared object)格式和 `.a` 格式。 > - ③ 在 Linux 中可以通过 `file /bin/ls` 命令查看指定可执行应用程序的 ABI 格式;从而也可以论证,在 Windows 上可以运行的程序,在 Linux 上运行不了。 > - ④ 当开发者在 Linux 系统上编写 C 语言程序,并使用特定的编译器(如:GCC)编译时,编译器会遵循 Linux 平台的 ABI 规范来生成二进制文件。这样,生成的可执行文件就可以在任何遵循相同 ABI 规范的 Linux 系统上运行。 > - ⑤ 如果一个应用程序需要跨平台(操作系统)运行,就需要使用`一套代码,多平台编译`的方式(针对 C 或 C++ 等),即:相同的源代码,在不同平台(操作系统)上使用特定平台的编译器(如:GCC)来分别编译成符合自己平台的 ABI 规范的二进制文件。 - 最高级别的抽象由应用程序编程接口 (API) 表示,它将`应用程序`连接到`库`或`底层操作系统`。 > [!NOTE] > > - ① API 是一组预定义的函数、协议和工具,用于构建软件和应用程序。API 允许不同的软件系统相互交互,它定义了软件组件之间如何相互通信。API 可以是库、框架、协议或服务。 > - ② 在 Web 开发中,开发者可能会使用 JavaScript 的 Fetch API 来与服务器进行通信,获取数据或提交表单。这个 API 提供了一种标准化的方式来发送 HTTP 请求和处理响应,而不需要开发者关心底层的网络协议细节。 ### 1.4.4 系统调用(System Call)和函数库(Library Call) * 在现代操作系统中,应用程序都不能直接作用于硬件,而是运行在操作系统之上。 ![](./assets/13.png) - 并且,在上文的图示中,我们也会看到`系统调用(System Call)`和`函数库(Library Call)`的身影,如下: ![](./assets/14.png) ![](./assets/15.png) * 其实,`系统调用(System Call)`和`函数库(Library Call)`的区别如下: | 类型 | 系统调用(System Call) | 函数库(Library Call) | | :------- | :----------------------------------------------------------- | :----------------------------------------------------------- | | 定义 | 系统调用是操作系统提供给程序员的一组接口,这些接口允许用户空间的程序请求操作系统内核提供的服务,比如文件操作、进程控制、通信和内存管理等。 | 函数库调用是指使用高级语言编写的一组预先编译好的函数,这些函数实现了一些常用的功能,比如:字符串处理、数学计算等。程序员可以在自己的程序中直接调用这些函数,而无需重新实现它们。 | | 权限 | 执行系统调用时,会从用户态切换到内核态。这是因为系统调用涉及到访问受保护的系统资源,这些操作必须由操作系统控制以确保系统的稳定性和安全性。 | 函数库调用通常在用户态执行,不涉及到用户态与内核态之间的切换。它们直接使用操作系统通过系统调用提供的服务,或者完全在用户空间内完成计算,不需要操作系统介入。 | | 性能开销 | 由于涉及到用户态与内核态之间的切换,系统调用的执行成本相对较高。因此,频繁的系统调用可能会影响程序的性能。 | 相对于系统调用,函数库调用的性能开销较小。因为它们通常不涉及到模式切换,且执行的操作多在用户空间完成。 | | 示例 | open(),read(),write(),fork(),exec() 等 UNIX/Linux 系统调用。 | C 标准库中的 printf() 等函数;数学库中的 sin(),cos() 等函数。 | > [!NOTE] > > - ① **执行层级**:系统调用直接与操作系统内核交互,执行更底层的操作;而函数库调用运行在用户空间,通常使用系统调用来实现其功能。 > - ② **性能开销**:系统调用由于涉及到用户态与内核态的切换,性能开销相对较大;函数库调用则因为主要在用户态执行,性能开销较小。 > - ③ **使用目的**:系统调用提供了访问操作系统资源和服务的能力;函数库调用则提供了方便、高效执行常见任务的手段。 # 第二章:初识计算机语言 ## 2.1 计算机语言是什么? * `人类语言`是人和人之间用于沟通的一种方式,例如:中国人和中国人之间使用普通话沟通,而中国人和美国人交流,则可以使用英语。 > [!NOTE] > > * ① 中文有自己的`固定格式`和`固定词汇`(即:`语法规则`),英文也是自己的`固定格式`和`固定词汇`(即:`语法规则`);同样的道理,法语、韩国等各种`人类语言`都有自己的`固定格式`和`固定词汇`(即:`语法规则`)。 > * ② 在和别的国家的人进行交流的时候,我们必须正确的表达,对方才会理解我们;否则,如果不熟悉对方国家的语言的语法规则,乱用语法规则,可能会贻笑大方,如:中文中的`望其项背`原指看见对方的背影,形容差距不大,能赶上;但是,很多人却认为这是形容遥不可及或难以企及的目标。 > * ③ 就算和本国家的人进行交流的时候,我们也必须正确的表达,对方才会理解我们;否则,如果乱用语法规则,可能也会让对方感觉奇怪,听不懂我们的意思,如:`借我 5000 RMB 买 iphone` 或者 `5000 RMB 我买 iphone 借`。 * `计算机编程语言`是人和计算机交流的方式。人们可以使用`编程语言`对计算机下达`命令(指令)`,让计算机完成人们需要的功能。 > [!NOTE] > > * ① 计算机语言也有自己`固定格式`和`固定词汇`(即:`语法规则`),我们必须学习其语法规则,才能控制计算机,让计算机完成我们所需要的功能。 > * ② 计算机语言有很多种,如:C、C++、Java、Go、JavaScript、Python、Scala 等。 ## 2.2 为什么要学习计算机语言? * 编程语言到底是什么?编程语言就是由文字和符号组成的,如: ```c #include // 这是编译预处理指令 int main() { // 定义主函数 printf("你好,世界!!!"); // 输出所指定的一行信息 return 0; // 函数执行完毕时返回函数值0 } ``` * 编程语言就是用于控制计算机,让其完成我们需要的功能。而我们学习编程语言,其实就是学习这些文字和符号编写的规则。 * 因为 CPU 只能识别二进制的指令,而我们`编写`的程序叫做`源代码`,是人类能看懂;但是,计算机却不能识别。那么,我们就需要让计算机能识别我们编写的源程序,就需要将我们编写的源代码交给编译器程序,其会帮助我们将所编写的源代码转换为计算机能够识别的二进制指令。 > [!NOTE] > > 编译器就是运行在操作系统之上的程序,其作用就是用来将程序员编写的源代码转换为计算机能够识别的二进制指令。 * 如果我们用 Java 语言编写了程序(源代码),那么编写的程序也是不能直接运行的,需要通过 Java 语言的编译器将 Java 程序编译为计算机能够识别的二进制指令。 * 如果我们用 Python 语言编写了程序(源代码),那么编写的程序也是不能直接运行的,需要通过 Python 语言的编译器将 Python 程序编译为计算机能够识别的二进制指令。 * …… * 总而言之,无论我们学习任何一门编程语言,想要将程序运行起来,都必须做如下的两件事情: * ① 学习该语言的文字和符号编写的规则,即:`语法规则`。 * ② 需要在操作系统上安装对应编程语言的`编译器`程序,将源程序编译为计算机能够识别的二进制指令。 ## 2.3 计算机语言简史 ### 2.3.1 机器语言(相当于人类的石器时代) * 1946 年 2 月 14 日,世界上第一台计算机 `ENIAC` 诞生,使用的是最原始的`穿透卡片`。 ![](./assets/16.png) * 这种卡片使用的是用`二进制代码`表示的语言,和人类语言差别极大,这种语言就称为`机器语言`,如: ```txt 0000,0000,000000010000 代表 LOAD A, 16 0000,0001,000000000001 代表 LOAD B, 1 0001,0001,000000010000 代表 STORE B, 16 ``` * 这种语言本质上是计算机能识别的`唯一语言`,人类很难理解;换言之,当时的程序员 99.9% 都是异类!!! > [!IMPORTANT] > > * ① 不同类型(CPU 架构,如:x86_64、arm 等)的处理器有不同的机器语言指令集,指令集架构(ISA)决定了机器语言的具体形式。 > * ② 换言之,机器语言与特定硬件架构紧密相关,机器语言程序几乎没有可移植性。 ### 2.3.2 汇编语言(相当于人类的青铜&铁器时代) * `汇编语言`使用`助记符`(如:MOV、ADD、SUB)代替二进制操作码,使程序更易于人类编写和理解;因此,`汇编语言`也被称为`符号语言`。 ![](./assets/17.png) * 汇编语言的`优点`是能编写`高效率`的程序;但是,`缺点`和机器语言没什么不同,汇编语言同样`依赖于具体的计算机架构(面向机器)`,程序不具备跨平台的可移植性。 > [!NOTE] > > * ① 汇编语言,目前仍然应用于工业电子编程领域、软件的加密解密、计算机病毒分析等。 > * ② 汇编语言是编程语言的拓荒年代,它非常底层,直接和计算机硬件打交道,开发效率低,学习成本高。 ### 2.3.3 高级语言(相当于人类的信息时代) * `高级语言`是一种`接近于人们使用习惯`的程序设计语言。`它允许程序员使用接近日常英语的指令来编写程序`,程序中的符号和算式也和`日常使用的数学公式`差不多,接近于自然语言和数学语言,容易被人们掌握。 ![](./assets/18.png) * 高级语言`独立于计算机硬件`,有一定的通用性;计算机不能直接识别和执行用高级语言编写的程序,需要使用`编译器`或`解释器`转换为机器语言,才能被计算机识别和执行。 ![](./assets/19.png) > [!NOTE] > > * ① 普遍使用的高级编程语言,有:C、C++、Java、Python、C#、JavaScript、Go、SQL 等。 > * ② C 语言是“[面向过程](https://zh.wikipedia.org/wiki/%E8%BF%87%E7%A8%8B%E5%BC%8F%E7%BC%96%E7%A8%8B)”的编程语言,已经脱离了计算机硬件,可以用来设计和开发`中等`规模的程序。 > * ③ Java、C++、Python、C# 等都是“[面向对象](https://zh.wikipedia.org/wiki/%E9%9D%A2%E5%90%91%E5%AF%B9%E8%B1%A1%E7%A8%8B%E5%BA%8F%E8%AE%BE%E8%AE%A1)”的编程语言(它们在“[面向过程](https://zh.wikipedia.org/wiki/%E8%BF%87%E7%A8%8B%E5%BC%8F%E7%BC%96%E7%A8%8B)”的基础上又增加了很多概念),可以用来设计和开发`中大型`规模的程序。 > > 总结:C 语言出现的时候,已经度过了编程语言的拓荒年代,具备了现代编程语言的特性,但是这个时候还没有出现“[软件危机](https://zh.wikipedia.org/wiki/%E8%BD%AF%E4%BB%B6%E5%8D%B1%E6%9C%BA)”,人们没有动力去开发更加高级的语言,所以也没有太复杂的编程思想;而之后出现的“[面向对象](https://zh.wikipedia.org/wiki/%E9%9D%A2%E5%90%91%E5%AF%B9%E8%B1%A1%E7%A8%8B%E5%BA%8F%E8%AE%BE%E8%AE%A1)”的编程思想解决了一部分在“[软件危机](https://zh.wikipedia.org/wiki/%E8%BD%AF%E4%BB%B6%E5%8D%B1%E6%9C%BA)”上的窘境。 ### 2.3.4 总结 * 编写语言的对比,如下所示: | 类别 | 特征 | 优点 | 缺点 | 示例 | | :----------- | :--------------------------------- | :----------------------------------------------- | :----------------------------------------------------------- | :------------------ | | **机器语言** | 直接由计算机执行的二进制代码 | 执行速度快 | 编写困难,可读性差,与具体硬件强绑定 | 二进制代码 | | **汇编语言** | 用助记符代替二进制代码的低级语言 | 相对机器语言更易编写和理解,允许直接控制硬件资源 | 依然需要了解硬件,不够抽象,与具体硬件或平台相关 | MOV,ADD 等助记符 | | **高级语言** | 接近人类语言,提供了更高层次的抽象 | 易于编写和维护,可移植性好,支持多种编程范式 | 需要通过编译器或解释器转换为机器语言,可能存在一定的性能损失 | C,Java, Python 等 | > [!NOTE] > > - ① 这三种编程语言类型从低级到高级提供了不同层次的抽象,以满足不同的编程需求和场景。 > - ② 随着计算机科学的发展,高级语言因其强大的表达能力、良好的可移植性和易用性,成为了日常软件开发的主流选择。 # 第三章:初识 C 语言 ## 3.1 C 语言的由来 * 1969 年,美国贝尔实验室的`肯·汤姆森`(Ken Thompson)和`丹尼斯·里奇`(Dennis Ritchie)一起开发了 Unix 操作系统。Unix 最初是使用`汇编语言`编写的,依赖于计算机硬件。为了程序的`可读性`和`可移植性`,它们决定使用高级语言重写。但是。当时的高级语言无法满足他们的要求,`肯·汤姆森`就在 BCPL 语言的基础上发明了 `B` 语言。 * 1972 年,`丹尼斯·里奇`(Dennis Ritchie)在 `B` 语言的基础上重新设计了一种新的语言,这种新语言取代了 `B` 语言,即 `C` 语言。 ![](./assets/20.png) * 1973 年,`整个 Unix 系统都使用 C 语言重写`。 > [!NOTE] > > C 语言最初是作为 Unix 系统的开发工具而发明的。 * 此后,这种语言快速流传,广泛用于各种操作系统和系统软件的开发,如:Unix、MS-DOS、Microsoft Windows 以及 Linux 等。 ![](./assets/21.png) * 1988 年,美国国家标准协会(ANSI)正式将 `C 语言标准化`,标志着 C 语言开始稳定和规范化。 ## 3.2 为什么要学习 C 语言? * ① `C 语言具有可移植好、跨平台的特点`:用 C 语言编写的代码可以在不同的操作系统和硬件平台上编译和运行。 > [!NOTE] > > * ① C 语言的最原始的设计目的,就是为了将 Unix 操作系统移植到其他的计算机架构上,这使得它从一开始就非常注重可移植性。 > * ② 这边所说的 C 语言的可移植性,是和汇编语言相比的;如果 C 语言和现代化的高级编程语言相比,可移植性还是很差的,如:Java 的口号是“一次编译,到处运行”,Go 的口号是“一次编译,到处执行”。 * ② `C 语言在许多领域应用广泛`。 * `操作系统`:C 广泛用于开发操作系统,如:Unix、Linux 和 Windows。 * `嵌入式系统`:C 是一种用于开发嵌入式系统(如:微控制器、微处理器和其它电子设备)的流程语言。 * `系统软件`:C 用于开发设备驱动程序、编译器和汇编器等系统软件。 * `网络`:C 语言广泛用于开发网络应用程序,例如:Web 服务器、网络协议和网络驱动程序。 * `数据库系统`:C 用于开发数据库系统,例如:Oracle、MySQL 和 PostgreSQL 。 * `游戏`:由于 C 能够处理低级硬件交互,因此经常用于开发计算机游戏。 * `人工智能`:C 用于开发人工智能和机器学习的应用程序,例如:神经网络和深度学习算法。 * `科学应用`:C 用于开发科学应用程序,例如:仿真软件和数值分析工具。 * `金融应用`:C 用于开发股票市场分析和交易系统等金融应用。 * ③ C 语言能够直接对硬件进行操作、管理内存以及和操作系统对话,这使得它是一种非常接近底层的语言,非常适合`写需要和硬件交互、有极高性能要求`的程序。 > [!NOTe] > > * C 语言毕竟诞生的时间非常早(20 世纪 70 年代),属于 70 后了,有点落后于现在的时代,虽然执行效率高,但是开发效率低。 > * 随着时间的推移,人们在 C 语言的基础上增加了面向对象的机制([软件危机](https://zh.wikipedia.org/wiki/%E8%BD%AF%E4%BB%B6%E5%8D%B1%E6%9C%BA)),形成了一门新的编程语言,它的名字是 C++ 。 > * 但是,C++ 的特性实在是太多了(因为 C++ 兼容 C,并增加了很多自己独有的特性,可以是当今最复杂的编程语言,没有之一),于是人们在 C++ 的基础上,删减了一些非必要的特性,就形成了 Java 和 C# ,也可以认为 Java 和 C# 是 C++--。 > * 当然,近年来,Go 语言也很火,它的设计者之一就是 `Unix` 操作系统的的开发者`肯·汤姆森`(Ken Thompson),Go 诞生的背景据说是`肯·汤姆森`(Ken Thompson)在 C++ 委员会在为其演讲 C++ 新特性的时候,觉得 C++ 新特性太多太复杂,于是就开发了 Go 语言;所以,Go 语言中有很多 C 语言的身影。 > * 其实,在 C 语言之后的许多编程语言,或多或少都参考了 C 语言;所以,编程界流传了一句话:汇编生 C ,C 生万物。 * ④ `学习 C 语言有助于快速上手其他编程语言`,如:C++(原先是 C 语言的一个扩展,在 C 语言的基础上嫁接了面向对象编程思想)、C#、Java 等,这些语言都继承或深受 C 语言的影响和启发。 * ⑤ C 语言长盛不衰。`C 语言至今,依然是最广泛使用、最流行的编程语言之一`,包括很多大学将 C 语言作为计算机教学的入门语言,拥有庞大而活跃的用户社区,这意味着有许多资源和库可供开发人员使用。 ## 3.3 计算机语言排行榜 * [TIOBE](https://www.tiobe.com/tiobe-index/) 是一个流行编程语言排行,每月更新。排名权重基于世界范围内工程师数量,Google、Bing、Yahoo! 、Wikipedia、Amazon、Youtube 和百度这些主流的搜索引擎,也将作为排名权重的参考指标。 ![](./assets/22.png) * 计算机语言走势图: ![](./assets/23.png) ## 3.4 C 语言的版本选择 * 随着微型计算机的日益普及,出现了许多 C 语言版本(标准): * 版本 1(K&R C):K&R C 指的是 C 语言的原始版本。1978年,C 语言的发明者布莱恩·柯林(Brian `K`ernighan)和丹尼斯·里奇(Dennis `R`itchie)合写了一本著名的教材《C 编程语言》(The C programming language)。 >[!NOTE] > >由于 C 语言还没有成文的语法标准,这本书就成了公认标准,以两位作者的姓氏首字母作为版本简称 “K&R C”。 * 版本 2(ANSI C,又称 C89 或 C90):C 语言的原始版本非常简单,对很多情况的描述非常模糊,加上 C 语法依然在快速发展,要求将 C 语言标准化的呼声越来越高。1989 年,美国国家标准协会(ANSI)制定了一套 C 语言标准,并于次年被国际标准化组织(ISO)通过。它被称为 “ANSI C”,也可以按照发布年份,称为 “C89 或 C90”。 * 版本 3(C99):C 语言标准的第一次`大型修订`,发生在 1999 年,增加了许多语言特性,比如:双斜杠( // )的注释语法,可变长度数组、灵活的数组成员、复数、内联函数和指定的初始值设定项,这个版本称为 C99,`是目前最流行的 C 版本`。 * 版本 4(C11):2011 年,标准化组织再一次对 C 语言进行修订,增加了_Generic、static_assert 和原子类型限定符。这个版本称为 C11。 > [!NOTE] > > 需要强调的是,修订标准的原因并不是因为原标准不能用,而是需要跟进新的技术。 * 版本 5(C17):C11 标准在 2017 年进行了修补,但发布是在 2018 年。新版本只是解决了 C11 的一些缺陷,没有引入任何新功能。这个版本称为 C17。 * 版本 6(C23):2023 年发布,计划进一步增强安全性,消除实现定义的行为,引入模块化语言概念等新特性,使 C 语言在安全和可靠性方面有重大提高。 * …… # 第四章:C 语言的学习技巧 ## 4.1 如何学习 C 语言? * 对于大部分的初学者, 学习 C 语言的目的可能是为了成为一名合格的程序员,开发出优秀的软件。但是,在学习了 C 语言的基本语法后,却发现只能在`控制台`(`黑底白字`)上玩玩,没有漂亮的用户界面以及人性化的交互。于是,开始学习数据结构、算法、数据库、操作系统,越陷越深,越来越迷茫,不知道学习 C 语言能做什么,认为学习编程很难,开始怀疑自己,直到放弃!!! * 其实,C 语言本身就是一门非常简单的语言,提供的实用功能不多,大部分的时候需要`借助`操作系统、第三方库以及以及一些硬件才能发挥它的威力!!! > [!IMPORTANT] > > * ① 学习 C 语言仅仅是让你踏上程序员之路的第一步而已,只学习 C 语言也做不了什么。 > * ② 系统、扎实的学习 C 语言可以让你了解底层硬件、一些简单的数据结构和算法,并培养计算机思维。 * C 语言是一门通用性的语言,并没有针对某个领域进行优化,在实际项目中,C 语言主要用于比较底层的开发,例如: * Windows、Linux、Unix 等操作系统的内核 90% 以上都使用 C 语言开发(Rust 语言有望未来,在操作系统开发中占据一席之地,特别是在对安全性和性能要求极高的领域)。 * 开发硬件驱动,让硬件和操作系统连接起来,这样用户才能更有效的使用硬件。 * 单片机和嵌入式属于软硬件的结合,是使用 C 语言最多的地方。 * 开发系统组件或服务,用于支撑上层应用。 * …… * 貌似感觉 C 语言的应用还是很多的啊,那为什么感觉学习 C 语言还是做不了什么?原因除了 C 语言通常都是开发最`底层`的应用之外,最重要的一点就是`生态`。 > [!IMPORTANT] > > 现代化的高级编程语言的流行程度,除了和编程语言的设计是否优秀有关,最主要的原因就是`生态`。 > > * ① 很多编程语言都自带`标准库`(语言本身提供的,开箱即用),如:Java、Go 等。 > * ② 很多编程语言都有自己的`包管理器`(用于管理第三方库)解决方案,如:Java 中的 Maven、Gradle、Go 中的 go modules ,JavaScript 的 npm 等。 > > 遗憾的是,C 语言的`标准库`非常简单,只有`输入输出`、`文件操作`、`日期时间`、`字符串处理`、`内存管理`,对于`网络编程`、`GUI`、`数据库`、`并发`等`需要`大量的`第三方库`或`操作系统的功能`来扩展 C 语言的功能(Java 语言、Go 语言等其他的现代化高级编程语言,都是直接将这些常见的开发场景内置到标准库中,开箱即用,极大的降低了软件开发的难度)。C 语言的`第三方库`也不是很多(和其它现代化高级编程语言相比),社区也不是很活跃(和其它现代化高级编程语言相比),更别提缺少自己的包管理器。 > > 不过,现在 C 语言社区也开始诞生了一些包管理器,如:Conan 和 vcpkg ;也有自己的项目构建工具,如:cmake 、xmake 等。 > [!NOTE] > > JavaScript 的作者 Brendan Eich(布兰登·艾奇) 曾经这么说:“与其说我爱 JavaScript,不如说我恨它。它是 C 语言和 Self 语言一夜情的产物(`致敬 C 语言`)。十八世纪英国文学家约翰逊博士说得好:"它的优秀之处并非原创,它的原创之处并不优秀。"” > ## 4.2 项目构建工具和包管理器 ### 4.2.1 概述 * `项目构建工具`和`包管理器`在软件开发中扮演着不同的角色,它们虽然有时会有重叠的功能,但主要关注的点是不同的。 ### 4.2.2 项目构建工具 * `项目构建工具`是用于`自动化编译、测试、打包、部署`等一系列任务的软件工具。它们帮助开发者简化和管理整个软件开发生命周期中的各个步骤,尤其是在构建过程中的复杂性管理上。 * 其功能有: * 编译代码:自动编译源代码(如 :`.java`、`.c` 等)为可执行文件或中间文件(如:`.class` 文件)。 * 运行测试:集成单元测试、集成测试,自动运行测试用例并生成报告。 * 打包:将编译后的代码、依赖库、资源文件等打包成可分发的格式(如:JAR、WAR、可执行文件等)。 * 依赖管理:自动下载、更新和管理项目所需的第三方库(这部分功能有时与包管理器重叠)。 * 部署:将打包后的应用程序自动部署到测试环境、生产环境等。 * 任务自动化:除了基本的构建流程外,还可以自动化执行一些常见任务,如:代码检查、文档生成等。 * 常用的项目构建工具: * Maven(Java):一个流行的构建工具和依赖管理工具,广泛用于 Java 项目。 * Gradle(Java、Kotlin、Groovy):一个灵活的构建工具,支持声明式的构建脚本和多种语言。 * Make(C/C++):一个经典的构建工具,使用 `Makefile` 来定义构建规则和依赖关系。 * CMake(C/C++):一个跨平台的构建系统,帮助生成标准的构建文件,如:Makefile 或 Visual Studio 项目文件。 * …… ### 4.2.3 包管理器 * `包管理器`是用于`自动化安装、更新、配置`和`管理软件包及其依赖关系`的工具。它主要关注于获取和管理项目所需的第三方库或工具包,并确保它们正确地集成到项目中。 * 其功能有: * 依赖管理:根据项目配置文件(如:`package.json`、`requirements.txt`)自动下载和安装项目所需的依赖包。 * 版本控制:管理包的版本,允许开发者指定某个特定版本或版本范围,确保项目中的库版本一致性。 * 包的发布和共享:开发者可以通过包管理器发布自己的库,并且共享给社区或组织内部的其他项目使用。 * 环境隔离:有些包管理器提供虚拟环境功能,可以将不同项目的依赖隔离开,避免版本冲突。 * 更新和卸载:包管理器可以自动更新依赖包到最新的兼容版本或卸载不再需要的包。 * 常见的包管理器: * npm(Node.js):用于管理 JavaScript 和 Node.js 项目的包和模块。 * pip(Python):用于安装和管理 Python 的软件包。 * Cargo(Rust):Rust 编程语言的包管理器和构建工具。 * Yarn(JavaScript):是 npm 的替代品,提供更快和更可靠的包管理体验。 * Homebrew(macOS):用于 macOS 系统下的命令行工具和库的管理。 * …… ### 4.2.3 注意事项 * 对于 `Java` 项目中的 `Maven` 或 `Gradle` 而言,其不仅是`项目构建工具`也是`包管理工具`。 > [!NOTE] > > * ① Gradle 也支持原生项目的开发,如:C 和 C++ 。 > * ② 不过,目前而言,业界开发 C/C++ 项目时,使用最多的项目构建工具和包管理器是 Cmake 和 Conan 。 # 第五章:附录 ## 5.1 嵌入式领域中的 C 语言 ### 5.1.1 概述 * C 语言在 C51、STM32 和 ARM 平台上的应用场景非常广泛,涵盖了各种嵌入式系统的开发需求。 ### 5.1.2 C51(8051 系列微控制器) * `背景`:8051 是由 Intel 于 1980 年设计的一种 8 位微控制器架构。它具有指令集简单、结构紧凑的特点,广泛应用于低端嵌入式系统中。 * `开发工具`:C51 是指针对 8051 系列微控制器的 C 语言编译器,如:Keil C51。这种编译器将 C 语言代码编译为适合 8051 架构的汇编代码。 * `C 语言的作用`:C 语言在 8051 微控制器上的应用使得开发更加高效和可维护。尽管 8051 的硬件资源有限,但 C 语言仍然能够在不损失性能的前提下提供高级编程的便利。 * `应用场景`: * **简单的控制系统**:家用电器(微波炉、洗衣机、空调)的控制板等。这些设备通常不需要复杂的运算能力,但要求可靠和稳定的控制。 * **低功耗传感器接口**:C51 微控制器常用于低功耗传感器的数据采集和传输,如:温度、湿度、压力传感器。 * **工业自动化设备**:用于简单的工业自动化控制,如:小型电机驱动、工业传感器数据处理和传输。 * **电子玩具**:许多简单的电子玩具使用 8051 系列微控制器来控制声音、LED 灯光、显示屏等。 > [!NOTE] > > 总结:C51 微控制器适用于资源受限、需要低成本的简单控制系统,非常适合使用 C 语言来进行开发!!! ### 5.1.3 STM32(STM32 系列微控制器) * `背景`:STM32 是意法半导体(STMicroelectronics)推出的一系列基于 ARM Cortex-M 内核的 32 位微控制器。它们广泛用于需要高性能和低功耗的嵌入式应用中,如:工业控制、消费电子和物联网设备。 * `开发工具`:开发 STM32 微控制器通常使用 Keil、IAR Embedded Workbench 或 STM32CubeIDE 等开发环境。这些环境中使用的编程语言主要是 C(有时也包括 C++)。 * `C 语言的作用`:C 语言在 STM32 上的应用非常广泛,开发者可以利用它直接控制硬件寄存器,同时也能方便地使用 STM32 提供的 HAL(硬件抽象层)库或 LL(低层)库进行开发。C 语言在这个平台上不仅能实现底层控制,还能编写复杂的应用逻辑。 * `应用场景`: * **物联网(IoT)设备**:STM32 微控制器常用于各种物联网设备,如:智能家居控制系统、环境监测设备、可穿戴设备等。这些设备通常需要低功耗和强大的处理能力,并且需要支持多种通信协议,如:Wi-Fi、Bluetooth、LoRa。 * **消费电子**:智能手表、健身追踪器、电子书阅读器、无人机等,这些设备需要具备实时处理能力、低功耗和良好的外设支持。 * **医疗设备**:STM32 微控制器被广泛应用于便携式医疗设备中,如:血糖监测仪、心率监测器、便携式超声设备等,这些设备需要精确的传感器数据采集和处理。 * **工业自动化控制**:PLC(可编程逻辑控制器)、工业机器人、伺服电机控制等,STM32 能够处理复杂的控制算法和实时任务。 * **汽车电子**:用于汽车中的传感器管理、车载信息娱乐系统、车身控制系统(车窗、电动座椅调节等)。 > [!NOTE] > > 总结:STM32 微控制器在物联网、消费电子、医疗设备和工业控制等领域表现出色,非常适合使用 C 语言来进行开发,因为 C 语言允许直接进行硬件控制并支持复杂的应用开发。 ### 5.1.3 ARM 架构(特别是 ARM Cortex 系列) * `背景`:ARM 是一种广泛使用的处理器架构,特别是在嵌入式系统中,ARM Cortex 系列处理器(如 Cortex-M、Cortex-R 和 Cortex-A)非常流行。Cortex-M 系列主要用于微控制器,Cortex-R 用于实时系统,Cortex-A 则用于高性能嵌入式系统。 * `开发工具`:针对 ARM 架构的开发,常用工具包括 ARM Keil MDK、IAR、GCC for ARM 和 ARM Development Studio。这些工具均支持使用 C 语言进行开发。 * `C 语言的作用`:C 语言在 ARM 架构上的应用广泛。它被用于操作系统内核(如 FreeRTOS、Zephyr)、设备驱动、应用层逻辑等。在 ARM Cortex-M 和 Cortex-R 系列中,C 语言的高效性和低级别硬件访问能力是开发实时、低延迟系统的关键。 * `应用场景`: * **高级嵌入式操作系统**:ARM Cortex-A 系列处理器广泛用于运行 Linux、Android 等操作系统的嵌入式设备,如:智能手机、平板电脑、智能电视和车载娱乐系统。 * **实时系统**:ARM Cortex-R 系列处理器用于实时系统,如:汽车的 ABS(防抱死制动系统)、ESC(电子稳定控制系统),以及航空电子设备,这些系统要求极低的延迟和高可靠性。 * **高性能物联网网关**:Cortex-A 系列处理器可以用来开发支持多协议、多设备管理的物联网网关,这些网关通常需要强大的计算能力和多线程处理能力。 * **边缘计算设备**:在边缘计算场景中,ARM Cortex-A 处理器用于执行本地数据处理和决策,如:视频分析、图像处理、语音识别等。 * **智能家居设备**:ARM Cortex-M 系列微控制器广泛应用于智能家居产品,如:智能灯泡、智能音箱、家庭安全系统,这些设备需要高效的处理能力和低功耗。 * **机器人控制系统**:ARM Cortex-M 和 Cortex-A 系列处理器用于机器人系统的控制和通信,如:无人机、工业机器人、服务机器人等,处理复杂的运动控制、路径规划和传感器数据融合。 > [!NOTE] > > 总结:ARM Cortex 系列适用于从实时系统到高级嵌入式操作系统的各类应用,支持从低功耗控制到高性能计算的多种需求,非常适合使用 C 语言来进行开发,因为 C 语言不仅用于控制硬件,还广泛应用于操作系统和应用程序的开发。