diff --git a/docs/.vitepress/sidebar/index.ts b/docs/.vitepress/sidebar/index.ts index 4106ebb..de99902 100644 --- a/docs/.vitepress/sidebar/index.ts +++ b/docs/.vitepress/sidebar/index.ts @@ -12,10 +12,11 @@ export const sidebar: DefaultTheme.Sidebar = { { text: 'C 语言入门二', link: `/notes/01_c-basic/03_${commonDirectoryName}/` }, { text: '变量和进制', link: `/notes/01_c-basic/04_${commonDirectoryName}/` }, { text: '数据类型和运算符', link: `/notes/01_c-basic/05_${commonDirectoryName}/` }, - { text: '流程控制', link: `/notes/01_c-basic/06_${commonDirectoryName}/` }, - { text: '内存泄漏和内存溢出', link: `/notes/01_c-basic/07_${commonDirectoryName}/` }, - { text: '数组一', link: `/notes/01_c-basic/08_${commonDirectoryName}/` }, - { text: '数组二', link: `/notes/01_c-basic/09_${commonDirectoryName}/` }, + { text: 'C 语言中的字符集', link: `/notes/01_c-basic/06_${commonDirectoryName}/` }, + { text: '流程控制', link: `/notes/01_c-basic/07_${commonDirectoryName}/` }, + { text: '内存泄漏和内存溢出', link: `/notes/01_c-basic/08_${commonDirectoryName}/` }, + { text: '数组一', link: `/notes/01_c-basic/09_${commonDirectoryName}/` }, + { text: '数组二', link: `/notes/01_c-basic/10_${commonDirectoryName}/` }, ] }, { diff --git a/docs/notes/01_c-basic/06_xdx/assets/1.png b/docs/notes/01_c-basic/06_xdx/assets/1.png new file mode 100644 index 0000000..338dd78 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/1.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/10.svg b/docs/notes/01_c-basic/06_xdx/assets/10.svg new file mode 100644 index 0000000..98cfce6 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/10.svg @@ -0,0 +1,4 @@ + + + +
0/1
高位
低位
定点存储(有符号整数)
符号位
最高位
真值(数据位)
机器数
0 表示正数,1 表示负数
高位
低位
定点存储(无符号整数,正整数)
真值(只有数据位,没有符号位)
机器数
存储和计算使用的是补码,
读取的时候,补码转换为原码
原码、反码、补码三码合一
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/11.svg b/docs/notes/01_c-basic/06_xdx/assets/11.svg new file mode 100644 index 0000000..17acda5 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/11.svg @@ -0,0 +1,4 @@ + + + +
高位
低位
浮点存储
符号位
最高位
指数部分
尾数部分
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/12.png b/docs/notes/01_c-basic/06_xdx/assets/12.png index ecc4ca8..ba1e8e2 100644 Binary files a/docs/notes/01_c-basic/06_xdx/assets/12.png and b/docs/notes/01_c-basic/06_xdx/assets/12.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/13.png b/docs/notes/01_c-basic/06_xdx/assets/13.png new file mode 100644 index 0000000..3d34796 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/13.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/14.png b/docs/notes/01_c-basic/06_xdx/assets/14.png new file mode 100644 index 0000000..27ac468 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/14.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/15.png b/docs/notes/01_c-basic/06_xdx/assets/15.png new file mode 100644 index 0000000..1dd549d Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/15.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/16.png b/docs/notes/01_c-basic/06_xdx/assets/16.png new file mode 100644 index 0000000..62d1c5b Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/16.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/17.svg b/docs/notes/01_c-basic/06_xdx/assets/17.svg new file mode 100644 index 0000000..bec2286 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/17.svg @@ -0,0 +1,4 @@ + + + +
00100010
11001011
01001100
00001010
01001100
11001011
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
内存条
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
00100010
11001011
01001100
00001010
01001100
11001011
01001100
11001011
01001100
11001011
01001100
11001011
01001100
11001011
01001100
11001011
01001100
11001011
01001100
11001011
01001100
11001011
存储单元
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/18.svg b/docs/notes/01_c-basic/06_xdx/assets/18.svg new file mode 100644 index 0000000..a94581d --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/18.svg @@ -0,0 +1,4 @@ + + + +
地址(000)
地址(001)
地址(002)
地址(003)
地址(008)
地址(009)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
内存条
地址(004)
地址(005)
地址(006)
地址(007)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
地址(...)
存储单元
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/19.svg b/docs/notes/01_c-basic/06_xdx/assets/19.svg new file mode 100644 index 0000000..fc887e8 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/19.svg @@ -0,0 +1,4 @@ + + + +
程序
内存条
00000000
00000000
00000000
00001010
内存地址
存储单元
0x7ffc3e5cc514
0x7ffc3e5cc515
0x7ffc3e5cc516
0x7ffc3e5cc517
num(变量)
内存地址:0x7ffc3e5cc514
10 的二进制
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/2.png b/docs/notes/01_c-basic/06_xdx/assets/2.png index 41e6842..6ec2712 100644 Binary files a/docs/notes/01_c-basic/06_xdx/assets/2.png and b/docs/notes/01_c-basic/06_xdx/assets/2.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/20.svg b/docs/notes/01_c-basic/06_xdx/assets/20.svg new file mode 100644 index 0000000..b853678 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/20.svg @@ -0,0 +1,4 @@ + + + +
int
a
=
10
;
int
b
=
20
;
int
c
=
a + b
;
表达式
语句
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/21.svg b/docs/notes/01_c-basic/06_xdx/assets/21.svg new file mode 100644 index 0000000..3897cad --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/21.svg @@ -0,0 +1,4 @@ + + + +
int
c
=
a
+
表达式
语句
b
;
操作数
操作数
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/22.svg b/docs/notes/01_c-basic/06_xdx/assets/22.svg new file mode 100644 index 0000000..d8b6e69 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/22.svg @@ -0,0 +1,4 @@ + + + +
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
9 的补码
9 & 7
结果(补码)
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
符号位
数值位(真值)
补码运算
0
0
0
0
0
0
0
0
7 的补码
0
0
0
0
0
1
1
1
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/23.svg b/docs/notes/01_c-basic/06_xdx/assets/23.svg new file mode 100644 index 0000000..0f5f2fb --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/23.svg @@ -0,0 +1,4 @@ + + + +
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
-9 的原码
-9 & 7
结果(补码)
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
符号位
数值位(真值)
补码运算
0
0
0
0
0
0
0
0
7 的补码
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
0
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
-9 的反码
-9 的补码
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/24.svg b/docs/notes/01_c-basic/06_xdx/assets/24.svg new file mode 100644 index 0000000..9ec5071 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/24.svg @@ -0,0 +1,4 @@ + + + +
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
9 的补码
9 | 7
结果(补码)
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
符号位
数值位(真值)
补码运算
0
0
0
0
0
0
0
0
7 的补码
0
0
0
0
0
1
1
1
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/25.svg b/docs/notes/01_c-basic/06_xdx/assets/25.svg new file mode 100644 index 0000000..8c1650f --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/25.svg @@ -0,0 +1,4 @@ + + + +
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
-9 的原码
-9 | 7
结果(补码)
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
符号位
数值位(真值)
补码运算
0
0
0
0
0
0
0
0
7 的补码
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
0
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
-9 的反码
-9 的补码
结果(反码)
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
0
结果(原码)
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/26.svg b/docs/notes/01_c-basic/06_xdx/assets/26.svg new file mode 100644 index 0000000..8e04448 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/26.svg @@ -0,0 +1,4 @@ + + + +
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
9 的补码
9 ^ 7
结果(补码)
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
符号位
数值位(真值)
补码运算
0
0
0
0
0
0
0
0
7 的补码
0
0
0
0
0
1
1
1
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/27.svg b/docs/notes/01_c-basic/06_xdx/assets/27.svg new file mode 100644 index 0000000..3271c99 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/27.svg @@ -0,0 +1,4 @@ + + + +
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
-9 的原码
-9 ^ 2
结果(补码)
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
符号位
数值位(真值)
补码运算
0
0
0
0
0
0
0
0
7 的补码
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
0
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
-9 的反码
-9 的补码
结果(反码)
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
结果(原码)
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/28.svg b/docs/notes/01_c-basic/06_xdx/assets/28.svg new file mode 100644 index 0000000..9dc9d97 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/28.svg @@ -0,0 +1,4 @@ + + + +
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
9 的补码
~9
结果(补码)
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
0
符号位
数值位(真值)
结果(反码)
1
1
1
1
1
1
1
1
1
1
1
1
0
1
0
1
结果(原码)
1
0
0
0
0
0
0
0
0
0
0
0
1
0
1
0
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/29.svg b/docs/notes/01_c-basic/06_xdx/assets/29.svg new file mode 100644 index 0000000..1ccb404 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/29.svg @@ -0,0 +1,4 @@ + + + +
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
-9 的原码
~-9
结果(补码)
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
符号位
数值位(真值)
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
0
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
-9 的反码
-9 的补码
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/3.jpg b/docs/notes/01_c-basic/06_xdx/assets/3.jpg new file mode 100644 index 0000000..25c068b Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/3.jpg differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/30.svg b/docs/notes/01_c-basic/06_xdx/assets/30.svg new file mode 100644 index 0000000..f93ab91 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/30.svg @@ -0,0 +1,4 @@ + + + +
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
3 的补码
3 << 4
符号位
数值位(真值)
0
0
0
0
0
0
0
0
0
0
0
0
溢出,丢弃
0
0
0
0
0
0
0
0
右边补 0
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/31.svg b/docs/notes/01_c-basic/06_xdx/assets/31.svg new file mode 100644 index 0000000..3808ef5 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/31.svg @@ -0,0 +1,4 @@ + + + +
1
0
0
0
0
0
0
0
0
1
0
0
0
1
0
1
-69 的原码
-3 << 4
1
1
1
1
1
1
1
1
符号位
数值位(真值)
1
1
1
1
1
1
1
1
1
0
1
1
1
0
1
0
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
1
-3 的反码
-3 的补码
溢出,丢弃
1
1
0
1
0
0
0
0
1
1
1
1
右边补 0
补码
反码
1
1
1
1
1
1
1
1
1
1
0
0
1
1
1
1
原码
1
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/32.svg b/docs/notes/01_c-basic/06_xdx/assets/32.svg new file mode 100644 index 0000000..b45f98b --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/32.svg @@ -0,0 +1,4 @@ + + + +
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
69 的补码
69 >> 4
符号位
数值位(真值)
0
0
0
0
溢出,丢弃
0
0
0
0
0
0
0
0
左边补 0
0
0
0
0
0
0
0
0
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/33.svg b/docs/notes/01_c-basic/06_xdx/assets/33.svg new file mode 100644 index 0000000..e344b54 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/33.svg @@ -0,0 +1,4 @@ + + + +
1
0
0
0
0
0
0
0
0
1
0
0
0
1
0
1
-69 的原码
-69 >> 4
符号位
数值位(真值)
1
1
1
1
1
1
1
1
1
0
1
1
1
0
1
0
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
1
-69 的反码
-69 的补码
左边补1
补码
反码
原码
1
0
1
1
1
1
1
1
溢出,丢弃
1
1
1
1
1
1
1
1
1
1
1
1
补码
反码
原码
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/35.png b/docs/notes/01_c-basic/06_xdx/assets/35.png new file mode 100644 index 0000000..097d775 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/35.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/36.gif b/docs/notes/01_c-basic/06_xdx/assets/36.gif new file mode 100644 index 0000000..c69607b Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/36.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/37.png b/docs/notes/01_c-basic/06_xdx/assets/37.png new file mode 100644 index 0000000..ebf9def Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/37.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/38.gif b/docs/notes/01_c-basic/06_xdx/assets/38.gif new file mode 100644 index 0000000..44bc138 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/38.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/39.gif b/docs/notes/01_c-basic/06_xdx/assets/39.gif new file mode 100644 index 0000000..271960b Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/39.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/4.svg b/docs/notes/01_c-basic/06_xdx/assets/4.svg new file mode 100644 index 0000000..ba7e414 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/4.svg @@ -0,0 +1,4 @@ + + + +
0
0
0
0
0
0
0
0
unsigned char 
最小值
1
1
1
1
1
1
1
1
最大值
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/40.png b/docs/notes/01_c-basic/06_xdx/assets/40.png new file mode 100644 index 0000000..597db56 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/40.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/41.gif b/docs/notes/01_c-basic/06_xdx/assets/41.gif new file mode 100644 index 0000000..271960b Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/41.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/42.gif b/docs/notes/01_c-basic/06_xdx/assets/42.gif new file mode 100644 index 0000000..b7b5a3a Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/42.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/43.gif b/docs/notes/01_c-basic/06_xdx/assets/43.gif new file mode 100644 index 0000000..be3daad Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/43.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/44.png b/docs/notes/01_c-basic/06_xdx/assets/44.png new file mode 100644 index 0000000..b2ae375 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/44.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/45.gif b/docs/notes/01_c-basic/06_xdx/assets/45.gif new file mode 100644 index 0000000..0cf1580 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/45.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/46.gif b/docs/notes/01_c-basic/06_xdx/assets/46.gif new file mode 100644 index 0000000..4389330 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/46.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/47.gif b/docs/notes/01_c-basic/06_xdx/assets/47.gif new file mode 100644 index 0000000..3b922cb Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/47.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/48.gif b/docs/notes/01_c-basic/06_xdx/assets/48.gif new file mode 100644 index 0000000..23ecb74 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/48.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/49.gif b/docs/notes/01_c-basic/06_xdx/assets/49.gif new file mode 100644 index 0000000..a64e6b4 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/49.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/5.svg b/docs/notes/01_c-basic/06_xdx/assets/5.svg new file mode 100644 index 0000000..5de8f00 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/5.svg @@ -0,0 +1,4 @@ + + + +
0
0
0
0
0
0
0
0
unsigned char 
最小值
1
1
1
1
1
1
1
1
最大值
0
0
0
0
0
0
0
0
unsigned char 
1
1
1
1
1
1
1
1
+1
1
0
0
0
0
0
0
0
0
-1
1
1
1
1
1
1
1
1
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/50.gif b/docs/notes/01_c-basic/06_xdx/assets/50.gif new file mode 100644 index 0000000..d26b729 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/50.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/51.gif b/docs/notes/01_c-basic/06_xdx/assets/51.gif new file mode 100644 index 0000000..d2cbbbb Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/51.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/52.gif b/docs/notes/01_c-basic/06_xdx/assets/52.gif new file mode 100644 index 0000000..3e6d892 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/52.gif differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/53.png b/docs/notes/01_c-basic/06_xdx/assets/53.png new file mode 100644 index 0000000..0d50080 Binary files /dev/null and b/docs/notes/01_c-basic/06_xdx/assets/53.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/6.svg b/docs/notes/01_c-basic/06_xdx/assets/6.svg new file mode 100644 index 0000000..cd99879 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/6.svg @@ -0,0 +1,4 @@ + + + +
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
高位
低位
2^16 - 1 
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
2^16 -1 + 1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
溢出,丢弃
无符号,上溢出
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/7.png b/docs/notes/01_c-basic/06_xdx/assets/7.png deleted file mode 100644 index de0e958..0000000 Binary files a/docs/notes/01_c-basic/06_xdx/assets/7.png and /dev/null differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/7.svg b/docs/notes/01_c-basic/06_xdx/assets/7.svg new file mode 100644 index 0000000..dc020e9 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/7.svg @@ -0,0 +1,4 @@ + + + +
0
0
0
0
0
0
0
0
补码运算
0
0
0
0
0
0
0
0
高位
低位
0 的补码
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
-1 的原码
结果 2^16 -1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
无符号,下溢出
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
-1 的反码
-1 的补码
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/8.svg b/docs/notes/01_c-basic/06_xdx/assets/8.svg new file mode 100644 index 0000000..01b7c35 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/8.svg @@ -0,0 +1,4 @@ + + + +
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
高位
低位
2^16 - 1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
符号位
最高位
真值(数据位)
机器数
2^16 - 1 + 1
有符号位,上溢出
补码,该值是负数
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/assets/9.png b/docs/notes/01_c-basic/06_xdx/assets/9.png deleted file mode 100644 index b24eaa6..0000000 Binary files a/docs/notes/01_c-basic/06_xdx/assets/9.png and /dev/null differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/9.svg b/docs/notes/01_c-basic/06_xdx/assets/9.svg new file mode 100644 index 0000000..8838ba6 --- /dev/null +++ b/docs/notes/01_c-basic/06_xdx/assets/9.svg @@ -0,0 +1,4 @@ + + + +
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
高位
低位
- 2^16 
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
符号位
最高位
真值(数据位)
机器数
-1 原码
有符号位,下溢出
该值是正数,最大的正数
-1 反码
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
-1 补码
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
补码运算
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
- 2^16 -1
溢出,丢弃
\ No newline at end of file diff --git a/docs/notes/01_c-basic/06_xdx/index.md b/docs/notes/01_c-basic/06_xdx/index.md index 6b55119..b59a291 100644 --- a/docs/notes/01_c-basic/06_xdx/index.md +++ b/docs/notes/01_c-basic/06_xdx/index.md @@ -1,389 +1,448 @@ -# 第一章:概述 +# 第一章:数据类型(⭐) -* `流程控制结构`是用来控制程序中`各语句执行顺序`的语句,并且可以将语句组合成能`完成一定功能`的`小逻辑模块`。 -* 在程序设计中规定了`三种`流程结构,如下所示: - * `顺序结构`:程序从上到下逐行执行,中间没有任何判断和跳转。 - * `分支结构`:根据条件,有选择的执行某段代码。在 C 语言中,有 `if...else` 和 `switch...case` 两种分支语句。 - * `循环结构`:根据循环条件,重复性的执行某段代码。在 C 语言中,有 `for`、`while`、`do...while` 三种循环结构。 +## 1.1 概述 -* 在生活中的`洗衣工厂`,就包含了上述的三种流程结构,如下所示: +* 根据`变量`中`存储`的`值`的`不同`,我们可以将`变量`分为两类: + * `普通变量`:变量所对应的内存中存储的是`普通值`。 + * `指针变量`:变量所对应的内存中存储的是`另一个变量的地址`。 -![](./assets/1.jpg) +* 如下图所示: +![](./assets/1.png) +> [!NOTE] +> +> 普通变量和指针变量的相同点: +> +> * 普通变量有内存空间,指针变量也有内存空间。 +> * 普通变量有内存地址,指针变量也有内存地址。 +> * 普通变量所对应的内存空间中有值,指针变量所对应的内存空间中也有值。 +> +> 普通变量和指针变量的不同点: +> +> * 普通变量所对应的内存空间存储的是普通的值,如:整数、小数、字符等;指针变量所对应的内存空间存储的是另外一个变量的地址。 +> * 普通变量有普通变量的运算方式,而指针变量有指针变量的运算方式(后续讲解)。 -# 第二章:顺序结构 - -## 2.1 概述 - -* 程序从上到下逐行地执行,表达式语句都是顺序执行的,并且上一行对某个变量的修改对下一行会产生影响。 +* 那么,在 C 语言中变量的数据类型就可以这么划分,如下所示: ![](./assets/2.png) -## 2.2 应用示例 +> [!NOTE] +> +> * 根据`普通变量`中`存储`的`值`的类型不同,可以将`普通变量类型`划分为`基本数据类型`(整型、字符类型、浮点类型、布尔类型)和`复合数据类型`(数组类型、结构体类型、共用体类型、枚举类型)。 +> * 根据`指针变量`所`指向空间`中`存储`的`值`的类型不同,可以将`指针类型`分为`基本数据类型指针`、`复合数据类型指针`、`函数指针`、`数组指针`等,例如:如果指针所指向的空间保存的是 int 类型,那么该指针就是 int 类型的指针。 -* 示例: +## 1.2 整数类型 -```c -#include +### 1.2.1 概述 -int main() { +* 整数类型简称整型,用于存储整数值,如:12、20、50 等。 +* 根据所占`内存空间`大小的不同,可以将整数类型划分为: +* ① 短整型: - int x = 1; - int y = 2; - printf("x = %d \n", x); // x = 1 - printf("y = %d \n", y); // y = 2 +| 类型 | 存储空间(内存空间) | 取值范围 | +| ------------------------------------ | -------------------- | ----------------------------------- | +| unsigned short (无符号短整型) | 2 字节 | 0 ~ 65,535 (2^16 - 1) | +| [signed] short(有符号短整型,默认) | 2 字节 | -32,768 (- 2^15) ~ 32,767 (2^15 -1) | - // 对 x 和 y 的值进行修改 - x++; - y = 2 * x + y; - x = x * 10; +* ② 整型: - printf("x = %d \n", x); // x = 20 - printf("y = %d \n", y); // y = 6 +| 类型 | 存储空间(内存空间) | 取值范围 | +| -------------------------------- | -------------------- | ------------------------------------------- | +| unsigned int(无符号整型) | 4 字节(通常) | 0 ~ 4294967295 (0 ~2^32 -1) | +| [signed] int(有符号整型,默认) | 4 字节(通常) | -2147483648(- 2^31) ~ 2147483647 (2^31-1) | - return 0; -} -``` +* ③ 长整型: +| 类型 | 存储空间(内存空间) | 取值范围 | +| ----------------------------------- | -------------------- | --------------- | +| unsigned long(无符号长整型) | 4 字节(通常) | 0 ~2^32 -1 | +| [signed] long(有符号长整型,默认) | 4 字节(通常) | - 2^31 ~ 2^31-1 | +* ④ 长长整型: -# 第三章:分支结构(⭐) +| 类型 | 存储空间(内存空间) | 取值范围 | +| ---------------------------------------- | -------------------- | --------------- | +| unsigned long long(无符号长整型) | 8 字节(通常) | 0 ~2^64 -1 | +| [signed] long long(有符号长整型,默认) | 8 字节(通常) | - 2^63 ~ 2^63-1 | -## 3.1 概述 +> [!NOTE] +> +> * ① 数据类型在内存中占用的存储单元(字节数),就称为该数据类型的长度(步长),如:short 占用 2 个字节的内存,就称 short 的长度(步长)是 2。 +> +> * ② C 语言并没有严格规定各种整数数据类型在内存中所占存储单元的长度,只做了宽泛的限制: +> +> * short 至少占用 2 个字节的存储单元。 +> * int 建议为一个机器字长(指计算机的处理器在一次操作中能够处理的二进制数据的位数,机器字长是处理器的“字”长度,它决定了处理器在一个时钟周期内能够处理的数据量,如:早期的计算机的处理器通常是 8 位的机器字长,意味着处理器一次只能处理 8 位(二进制)数据;之后的计算机的处理器有 16 位的机器字长,意味着处理器一次可以处理 16 位的数据;再之后计算机的处理器有 32 位或 64 位的机器字长,意味着处理器一次可以处理 32 位或 64位的数据)。即:32 位环境下 int 占用 4 个字节的存储单元,64 位环境下 int 占用 8 个字节的存储单元。 +> * short 的长度(步长)不能大于 int,long 的长度(步长)不能小于 int,long long 不能小于 long。 +> +> * ③ 那么,各种整数数据类型在内存中所占存储单元的长度的公式就是 `2 ≤ sizeof(short) ≤ sizeof(int) ≤ sizeof(long) ≤ sizeof(long long)`,具体的存储空间由编译系统自行决定。其中,`sizeof` 是测量类型或变量、常量长度的`运算符`。 -* 根据特定条件执行不同的代码块,从而实现灵活的程序控制和更复杂的逻辑。 +> [!IMPORTANT] +> +> * ① 之所以这么规定,是为了可以让 C 语言长久使用,因为目前主流的 CPU 都是 64 位,但是在 C 语言刚刚出现的时候,CPU 还是以 8 位和 16 位为主。如果当时就将整型定死为 8 位或 16 位,那么现在我们肯定不会再学习 C 语言了。 +> * ② 整型分为有符号 signed 和无符号 unsigned 两种,默认是 signed。 +> * ③ 在实际开发中,`最常用的整数类型`就是 `int` 类型了,如果取值范围不够,就使用 long 或 long long 。 +> * ④ C 语言中的`格式占位符`非常多,只需要大致了解即可;因为,我们在实际开发中,一般都会使用 C++ 或 Rust 以及其它的高级编程语言,如:Java 等,早已经解决了必须通过`格式占位符`来才能将变量进行输入和输出。 -## 3.2 单分支结构 - -### 3.2.1 概述 +### 1.2.2 短整型(了解) * 语法: ```c -if(条件表达式){ - 语句; -} +unsigned short x = 10 ; // 无符号短整型 +``` + +```c +short x = -10; // 有符号短整型 ``` > [!NOTE] > -> * ① 在 C 语言中,严格意义上是没有 boolean 类型的,使用`非0` 表示`真(true)`,`0` 表示`假(false)`。 -> * ② 当条件表达式为真(`非0` ),就会执行代码块中的语句;否则,就不会执行代码块中的语句。 - -* 流程图,如下所示: - -![](./assets/3.png) - -### 3.2.2 应用示例 - -* 需求:成年人心率的正常范围是每分钟 60~100 次。体检时,如果心率不在此范围内,则提示需要做进一步的检查。 +> * ① 有符号表示的是正数、负数和 0 ,即有正负号。无符号表示的是 0 和正数,即正整数,没有符号。 +> * ② 在 `printf` 中`无符号短整型(unsigned short)`的`格式占位符`是 `%hu` ,`有符号短整型(signed short)`的`格式占位符`是 `%hd` 。 +> * ③ 可以通过 `sizeof` 运算符获取`无符号短整型(unsigned short)` 和 `有符号短整型(signed short)` 的`存储空间(所占内存空间)`。 +> * ③ 可以通过 `#include ` 来获取 `无符号短整型(unsigned short)` 和`有符号短整型(signed short)`的`取值范围`。 -* 示例: +* 示例:定义和打印短整型变量 ```c #include int main() { - int heartBeats = 0; - printf("请输入您的心率:"); - scanf("%d", &heartBeats); + // 定义有符号 short 类型 + signed short s1 = -100; - if (heartBeats < 60 || heartBeats > 100) { - printf("您的心率不在正常范围内,请做进一步的检查。\n"); - } + printf("s1 = %hd \n", s1); // s1 = -100 - printf("体检结束!!!"); + // 定义无符号 short 类型 + unsigned short s2 = 100; + printf("s2 = %hu \n", s2); // s2 = 100 + + // 定义 short 类型,默认是有符号 + short s3 = -200; + printf("s3 = %hd \n", s3); // s3 = -200 return 0; } ``` -### 3.2.3 应用示例 - -* 需求:根据年龄判断,如果是未成年人,则提示 "未成年人请在家长陪同下访问!" 。 - -* 示例: +* 示例:获取类型占用的内存大小(存储空间) ```c #include int main() { - int age = 0; - printf("请输入你的年龄:"); - scanf("%d", &age); + size_t s1 = sizeof(unsigned short); + printf("unsigned short 的存储空间是 %zu 字节 \n", s1); // 2 - if (age < 18) { - printf("未成年人请在家长陪同下访问!\n"); - } + size_t s2 = sizeof(signed short); + printf("signed short 的存储空间是 %zu 字节 \n", s2); // 2 - printf("欢迎继续访问!"); + size_t s3 = sizeof(short); + printf("short 的存储空间是 %zu 字节 \n", s3); // 2 return 0; } ``` -## 3.3 双分支结构 -### 3.3.1 概述 + +* 示例:获取类型的取值范围 + +```c +#include +#include + +int main() { + + printf("unsigned short 类型的范围是[0,%hu]\n", USHRT_MAX); // [0,65535] + printf("short 类型的范围是[%hd,%hd]\n", SHRT_MIN,SHRT_MAX); // [-32768,32767] + + return 0; +} +``` + +### 1.2.3 整型 * 语法: ```c -if(条件表达式) { - 语句块1; -}else { - 语句块2; -} +unsigned int x = 10 ; // 无符号整型 +``` + +```c +int x = -10; // 有符号整型 ``` > [!NOTE] > -> * ① 在 C 语言中,严格意义上是没有 boolean 类型的,使用`非0` 表示`真(true)`,`0` 表示`假(false)`。 -> * ② 当条件表达式为真(`非0` ),就会执行代码块 1 中的语句;否则,执行代码块 2 中的语句。 - -* 流程图,如下所示: - -![](./assets/4.png) - -### 3.3.2 应用示例 - -* 需求:判断一个整数,是奇数还是偶数。 +> * ① 有符号表示的是正数、负数和 0 ,即有正负号。无符号表示的是 0 和正数,即正整数,没有符号。 +> * ② 在 `printf` 中`无符号整型(unsigned int)`的`格式占位符`是 `%u` ,`有符号整型(signed int)`的`格式占位符`是 `%d` 。 +> * ③ 可以通过 `sizeof` 运算符获取`无符号整型(unsigned int)` 和 `有符号整型(signed int)` 的`存储空间(所占内存空间)`。 +> * ③ 可以通过 `#include ` 来获取 `无符号整型(unsigned int)` 和`有符号整型(signed int)`的`取值范围`。 -* 示例: +* 示例:定义和打印整型变量 ```c #include int main() { - int num = 0; - printf("请输入一个整数:"); - scanf("%d", &num); + // 定义有符号 int 类型 + signed int i1 = -100; - if (num % 2 == 0) { - printf("%d 是偶数\n", num); - } else { - printf("%d 是奇数\n", num); - } + printf("i1 = %d \n", i1); // i1 = -100 + + // 定义无符号 int 类型 + unsigned int i2 = 100; + printf("i2 = %u \n", i2); // i2 = 100 + + // 定义 int 类型,默认是有符号 + short i3 = -200; + printf("i3 = %d \n", i3); // i3 = -200 return 0; } ``` -### 3.3.2 应用示例 - -* 需求:输入年龄,如果大于18岁,则输出 "你年龄大于18,要对自己的行为负责!";否则,输出 "你的年龄不大这次放过你了。" - -* 示例: +* 示例:获取类型占用的内存大小(存储空间) ```c #include int main() { - int age = 0; - printf("请输入年龄:"); - scanf("%d", &age); + size_t i1 = sizeof(unsigned int); + printf("unsigned int 的存储空间是 %zu 字节 \n", i1); // 4 - if (age > 18) { - printf("你年龄大于18,要对自己的行为负责!\n"); - } else { - printf("你的年龄不大,这次放过你了!\n"); - } + size_t i2 = sizeof(signed int); + printf("signed int 的存储空间是 %zu 字节 \n", i2); // 4 + + size_t i3 = sizeof(int); + printf("int 的存储空间是 %zu 字节 \n", i3); // 4 return 0; } ``` -### 3.3.3 应用示例 - -* 需求:判定某个年份是否为闰年? - ->[!NOTE] -> ->* ① year 是 400 的整倍数: year%400==0 ->* ② 能被 4 整除,但不能被 100 整除:year % 4 == 0 && year % 100 != 0 - -* 示例: +* 示例:获取类型的取值范围 ```c +#include #include int main() { - int year = 0; - printf("请输入年份:"); - scanf("%d", &year); - - if (year % 400 == 0 || (year % 4 == 0 && year % 100 != 0)) { - printf("%d 是闰年\n", year); - } else { - printf("%d 不是闰年\n", year); - } + printf("unsigned int 类型的范围是[0,%u]\n", UINT_MAX); // [0,4294967295] + printf("int 类型的范围是[%d,%d]\n", INT_MIN,INT_MAX); // [-2147483648,2147483647] return 0; } ``` -## 3.4 多重分支结构 - -### 3.4.1 概述 +### 1.2.4 长整型(了解) * 语法: ```c -if (条件表达式1) { - 语句块1; -} else if (条件表达式2) { - 语句块2; -} -... -} else if (条件表达式n) { - 语句块n; -} else { - 语句块n+1; -} +unsigned long x = 10 ; // 无符号长整型 +``` + +```c +long x = -10; // 有符号长整型 ``` > [!NOTE] > -> * ① 在 C 语言中,严格意义上是没有 boolean 类型的,使用`非0` 表示`真(true)`,`0` 表示`假(false)`。 -> * ② 首先判断关系表达式 1 的结果是真(值为 `非0`)还是假(值为 `0`): -> * 如果为真,就执行语句块 1,然后结束当前多分支。 -> * 如果是假,就继续判断条件表达式 2,看其结果是真还是假。 -> * 如果是真,就执行语句块 2,然后结束当前多分支。 -> * 如果是假,就继续判断条件表达式…看其结果是真还是假。 -> * ... -> * 如果没有任何关系表达式为真,就执行语句块 n+1,然后结束当前多分支。 -> * ③ 当条件表达式之间是`互斥`(彼此之间没有交集)关系时,条件判断语句及执行语句间顺序无所谓。 -> * ④ 当条件表达式之间是`包含`关系时,必须`小上大下 / 子上父下`,否则范围小的条件表达式将不可能被执行。 -> * ⑤ 当 if-else 结构是多选一的时候,最后的 else 是可选的,可以根据需要省略。 -> * ⑥ 如果语句块中只有一条执行语句的时候,`{}`是可以省略的;但是,强烈建议保留!!! - -* 流程图,如下所示: - -![image-20240722075241253](./assets/5.png) - -### 3.4.1 应用示例 - -* 需求:张三参加考试,他和父亲达成协议,如果成绩不到 60 分没有任何奖励;如果成绩 60分(含)到 80 分,奖励一个肉夹馍;如果成绩 80 分(含)到 90 分,奖励一个 ipad;如果成绩 90 分及以上,奖励一部华为 mate60 pro 。 +> * ① 有符号表示的是正数、负数和 0 ,即有正负号。无符号表示的是 0 和正数,即正整数,没有符号。 +> * ② 在 `printf` 中`无符号长整型(unsigned long)`的`格式占位符`是 `%lu` ,`有符号长整型(signed long)`的`格式占位符`是 `%ld` 。 +> * ③ 可以通过 `sizeof` 运算符获取`无符号长整型(unsigned long)` 和 `有符号长整型(signed long)` 的`存储空间(所占内存空间)`。 +> * ③ 可以通过 `#include ` 来获取 `无符号长整型(unsigned long)` 和`有符号长整型(signed long)`的`取值范围`。 -* 示例: +* 示例:定义和打印长整型变量 ```c #include int main() { - int score = 0; - printf("请输入分数:"); - scanf("%d", &score); + // 定义有符号 long 类型 + signed long l1 = -100; - // 容错:分数不可能小于 0 或大于 100 - if (score < 0 || score > 100) { - printf("输入的分数有误!\n"); - return 0; - } + printf("l1 = %ld \n", l1); // l1 = -100 - if (score >= 90) { - printf("奖励你一部华为 mate60 pro\n"); - } else if (score >= 80) { - printf("奖励你一个 ipad\n"); - } else if (score >= 60) { - printf("奖励你一个肉夹馍\n"); - } else { - printf("你的成绩不及格,没有任何奖励!"); - } + // 定义无符号 long 类型 + unsigned long l2 = 100; + printf("l2 = %lu \n", l2); // l2 = 100 + + // 定义 long 类型,默认是有符号 + long l3 = -200; + printf("l3 = %ld \n", l3); // l3 = -200 return 0; } ``` -### 3.4.2 应用示例 - -* 需求:判断水的温度,如果大于 95℃,则打印 "开水";如果大于 70℃ 且小于等于 95℃,则打印 "热水";如果大于 40℃ 且小于等于 70℃,则打印 "温水";如果小于等于 40℃,则打印 "凉水"。 - -* 示例: +* 示例:获取类型占用的内存大小(存储空间) ```c #include int main() { - int temperature = 0; - printf("请输入水的温度:"); - scanf("%d", &temperature); + size_t l1 = sizeof(unsigned long); + printf("unsigned long 的存储空间是 %zu 字节 \n", l1); // 4 - if (temperature > 95) { - printf("开水 \n"); - } else if (temperature > 70 && temperature <= 95) { - printf("热水 \n"); - } else if (temperature > 40 && temperature <= 70) { - printf("温水 \n"); - } else { - printf("凉水 \n"); - } + size_t l2 = sizeof(signed long); + printf("signed long 的存储空间是 %zu 字节 \n", l2); // 4 + + size_t l3 = sizeof(long); + printf("long 的存储空间是 %zu 字节 \n", l3); // 4 return 0; } ``` -## 3.5 多重分支结构 switch -### 3.5.1 概述 + +* 示例:获取类型的取值范围 + +```c +#include +#include + +int main() { + + printf("unsigned long 类型的范围是[0,%lu]\n", ULONG_MAX); // [0,4294967295] + printf("long 类型的范围是[%ld,%ld]\n", LONG_MIN,LONG_MAX); // [-2147483648,2147483647] + + return 0; +} +``` + +### 1.2.5 长长整型(了解) * 语法: ```c -switch(表达式){ - case 常量值1: - 语句块1; - //break; - case 常量值2: - 语句块2; - //break; - ... - - case 常量值n: - 语句块n; - //break; - [default: - 语句块n+1; - ] -} +unsigned long long x = 10 ; // 无符号长长整型 +``` + +```c +long long x = -10; // 有符号长长整型 ``` > [!NOTE] > -> * ① switch 后面表达式的值必须是一个整型(char、short、int、long 等)或枚举类型。 -> * ② case 后面的值必须是常量,不能是变量。 -> * ③ default 是可选的,当没有匹配的 case 的时候,就执行 default 。 -> * ④ break 语句可以使程序跳出 switch 语句块,如果没有 break,会执行下一个 case 语句块,直到遇到 break 或者执行到 switch 结尾,这个现象称为穿透。 +> * ① 有符号表示的是正数、负数和 0 ,即有正负号。无符号表示的是 0 和正数,即正整数,没有符号。 +> * ② 在 `printf` 中`无符号长长整型(unsigned long long)`的`格式占位符`是 `%llu` ,`有符号长长整型(signed long long)`的`格式占位符`是 `%lld` 。 +> * ③ 可以通过 `sizeof` 运算符获取`无符号长长整型(unsigned long long)` 和 `有符号长长整型(signed long long)` 的`存储空间(所占内存空间)`。 +> * ③ 可以通过 `#include ` 来获取 `无符号长长整型(unsigned long long)` 和`有符号长长整型(signed long long)`的`取值范围`。 -* 流程图,如下所示: -![](./assets/6.png) -### 3.5.2 应用示例 +* 示例:定义和打印长长整型变量 -* 需求:编写一个程序,该程序可以接收一个字符,比如:a、b、c、d;其中, a 表示星期一,b 表示星期二…,根据用户的输入显示相应的信息,要求使用 switch 语句。 +```c +#include + +int main() { + + // 定义有符号 long long 类型 + signed long long ll1 = -100; + + printf("ll1 = %lld \n", ll1); // ll1 = -100 + + // 定义无符号 long long 类型 + unsigned long long ll2 = 100; + printf("ll2 = %llu \n", ll2); // ll2 = 100 + + // 定义 long long 类型,默认是有符号 + long long ll3 = -200; + printf("ll3 = %lld \n", ll3); // ll3 = -200 + + return 0; +} +``` + + + +* 示例:获取类型占用的内存大小(存储空间) + +```c +#include + +int main() { + + size_t ll1 = sizeof(unsigned long long); + printf("unsigned long long 的存储空间是 %zu 字节 \n", ll1); // 8 + + size_t ll2 = sizeof(signed long long); + printf("signed long long 的存储空间是 %zu 字节 \n", ll2); // 8 + + size_t ll3 = sizeof(long long); + printf("long long 的存储空间是 %zu 字节 \n", ll3); // 8 + + return 0; +} +``` + + + +* 示例:获取类型的取值范围 + +```c +#include +#include + +int main() { + + printf("unsigned long long 类型的范围是[0,%llu]\n", ULLONG_MAX); // [0,18446744073709551615] + printf("long long 类型的范围是[%lld,%lld]\n", LLONG_MIN,LLONG_MAX); // [-9223372036854775808,9223372036854775807] + + return 0; +} +``` + +### 1.2.6 字面量后缀 + +* `字面量`是`源代码`中一个`固定值`的`表示方法`,用于直接表示数据,即: + +```c +int num1 = 100; // 100 就是字面量 +``` + +```c +long num2 = 100L; // 100L 就是字面量 +``` + +```c +long long num3 = 100LL; // 100LL 就是字面量 +``` + +> [!NOTE] +> +> * ① 默认情况下的,整数字面量的类型是 int 类型。 +> * ② 如果需要表示 `long` 类型的字面量,需要添加后缀 `l` 或 `L` ,建议 `L`。 +> * ③ 如果需要表示 `long long` 类型的字面量,需要添加后缀 `ll` 或 `LL`,建议 `LL` 。 +> * ④ 如果需要表示`无符号`整数类型的字面量,需要添加 `u` 或 `U`,建议 `U` 。 @@ -394,39 +453,53 @@ switch(表达式){ int main() { - char chs; - printf("请输入一个字符(a、b、c、d):"); - scanf("%c", &chs); + int num = 100; + printf("num = %d\n", num); // num = 100 - switch (chs) { - case 'a': - printf("今天是星期一 \n"); - printf("窗前明月光 \n"); - break; - case 'b': - printf("今天是星期二 \n"); - printf("疑是地上霜 \n"); - break; - case 'c': - printf("今天是星期三 \n"); - printf("举头望明月 \n"); - break; - case 'd': - printf("今天是星期四 \n"); - printf("低头思故乡 \n"); - break; - default: - printf("输入错误!"); - break; - } + long num2 = 100L; + printf("num2 = %ld\n", num2); // num2 = 100 + + long long num3 = 100LL; + printf("num3 = %lld\n", num3); // num3 = 100 + + unsigned int num4 = 100U; + printf("num4 = %u\n", num4); // num4 = 100 + + unsigned long num5 = 100LU; + printf("num5 = %lu\n", num5); // num5 = 100 + + unsigned long long num6 = 100ULL; + printf("num6 = %llu\n", num6); // num6 = 100 return 0; } ``` -### 3.5.3 应用示例 +### 1.2.7 精确宽度类型 -* 需求:编写程序,输入月份,输出该月份有多少天。说明:1 月、3 月、5 月、7月、8 月、10 月、12 月有 31 天,4 月、6 月、9 月、11 月有 30 天,2 月有 28 天或 29 天。 +* 在前文,我们了解到 C 语言的整数类型(short 、int、long、long long)在不同计算机上,占用的字节宽度可能不一样。但是,有的时候,我们希望整数类型的存储空间(字节宽度)是精确的,即:在任意平台(计算机)上都能一致,以提高程序的可移植性。 + +> [!NOTE] +> +> * Java 语言中的数据类型的存储空间(字节宽度)是一致的,这也是 Java 语言能够跨平台的原因之一(最主要的原因还是 JVM)。 +> * 在嵌入式开发中,使用精确宽度类型可以确保代码在各个平台上的一致性。 + +* 在 C 语言的标准头文件 `` 中定义了一些新的类型别名,如下所示: + +| 类型名称 | 含义 | +| -------- | --------------- | +| int8_t | 8 位有符号整数 | +| int16_t | 16 位有符号整数 | +| int32_t | 32 位有符号整数 | +| int64_t | 64 位有符号整数 | +| uint8_t | 8 位无符号整数 | +| uint16_t | 16 位无符号整数 | +| uint32_t | 32 位无符号整数 | +| uint64_t | 64 位无符号整数 | + +> [!NOTE] +> +> 上面的这些类型都是类型别名,编译器会指定它们指向的底层类型,如:在某个系统中,如果 int 类型是 32 位,那么 int32_t 就会指向 int ;如果 long 类型是 32 位,那么 int32_t 就会指向 long。 @@ -434,528 +507,500 @@ int main() { ```c #include +#include int main() { - int month; - printf("请输入月份 (1-12):"); - scanf("%d", &month); - - switch (month) { - case 1: - case 3: - case 5: - case 7: - case 8: - case 10: - case 12: - printf("%d 月有 31 天\n", month); - break; - case 4: - case 6: - case 9: - case 11: - printf("%d 月有 30 天\n", month); - break; - case 2: - printf("%d 月有 28 天或 29 天\n", month); - break; - default: - printf("输入错误!"); - break; - } + // 变量 x32 声明为 int32_t 类型,可以保证是 32 位(4个字节)的宽度。 + int32_t x32 = 45933945; + printf("x32 = %d \n", x32); // x32 = 45933945 return 0; } ``` -### 3.5.4 switch 和 if else if 的比较 - -* ① 如果判断条件是判等,而且符合整型、枚举类型,虽然两个语句都可以使用,建议使用 swtich 语句。 -* ② 如果判断条件是区间判断,大小判断等,使用 if...else...if。 - -## 3.6 嵌套分支 - -### 3.6.1 概述 - -* 嵌套分支是指,在一个分支结构中又嵌套了另一个分支结构,里面的分支的结构称为内层分支,外面的分支结构称为外层分支。 - -> [!NOTE] -> -> 嵌套分支层数不宜过多,建议最多不要超过 3 层。 - -### 3.6.2 应用示例 - -* 需求:根据淡旺季的月份和年龄,打印票价。 - -> [!NOTE] -> -> * ① 4 -10 是旺季: -> * 成人(18-60):60 。 -> * 儿童(<18):半价。 -> * 老人(>60):1/3 。 -> * ② 其余是淡季: -> * 成人:40。 -> * 其他:20。 - - - -* 示例: - -```c -#include - -int main() { - - int month; - int age; - double price = 60; - - printf("请输入月份 (1-12):"); - scanf("%d", &month); - - printf("请输入年龄:"); - scanf("%d", &age); - - // 旺季 - if (month >= 4 && month <= 10) { - if (age < 18) { - price /= 2; - } else if (age > 60) { - price /= 3; - } - } else { - if (age >= 18) { - price = 40; - } else { - price = 20; - } - } - - printf("票价: %.2lf\n", price); - - return 0; -} -``` - - - -# 第四章:随机数 - -## 4.1 概述 - -* 所谓的随机数就是没有规则,并且不能预测的一些数字,也称为真随机数。 -* 程序中也是可以产生随机数的,但是是通过一些固定规则产生的,称为伪随机数。 -* 常见的伪随机数(线性同余方程,LCG)的公式,如下所示: - -$X_{n+1} = (a \cdot X_n + b) \mod m$ - -* 其中,X 是伪随机序列,a 是乘数(通常选择一个大于 0 的常数,典型值有 1664525),b 是增量(选择一个大于 0 的常数,典型值有 1013904223), m 是模数( 通常选择一个大的常数,常见值有 ( 2^{32} ) ,即 4294967296))。 - -> [!NOTE] -> -> 假设 a = 31 ,b = 13 ,m = 100 ;那么,伪随机数的公式就是 `X_{n+1} = (31 × X_n + 13) % 100 `。 -> -> * 如果 `X_{n}` = 1 ,那么 `X_{n+1}` = 44 。 -> * 如果 `X_{n}` = 44 ,那么 `X_{n+1}` = 77 。 -> * 如果 `X_{n}` = 77 ,那么 `X_{n+1}` = 0 。 -> * ... -> -> 最后,将得到 44、77、0、13、16、9 、92、65、28 ... ,其中 1 也称为初始种子(随机数种子)。 - -* 工作原理: - * ① 设置初始种子(X_0): - * 种子值是算法生成随机数序列的起点。 - * 不同的种子值会产生不同的随机数序列。 - * ② 递归生成随机数: - * 从初始种子开始,通过公式不断生成新的随机数。 - * 每次迭代都使用前一次生成的随机数作为输入。 - -> [!NOTE] -> -> 如果种子的值相同,那么每次生成的随机数将相同,解决方案就是将种子的值设置为当前的时间戳。 - -## 4.2 C 语言中随机数的产生 - -* ① 设置随机数种子: - -```c -srand(10); // seed 种⼦ rand random 随机 -``` - -> [!NOTE] -> -> 随机数函数在 `#include ` 中声明。 - -* ② 根据随机数种⼦计算出⼀个伪随机数: - -```c -// 根据种⼦值产⽣⼀个 0-32767 范围的随机数 -int result = rand(); -``` - -* ③ 产生一个指定范围内的随机数: - -```c -int random_in_range(int min, int max) { - return rand() % (max - min + 1) + min; -} -``` - - - -* 示例: - -```c -#include -#include -#include - -// 生成指定范围的随机数的函数 -int randomInRange(int min, int max) { - return rand() % (max - min + 1) + min; -} - -int main() { - - // 使用当前时间作为种子 - srand(time(0)); - - // 定义范围 - int min = 1; - int max = 100; - - // 生成并打印随机数 - for (int i = 0; i < 10; ++i) { - int random = randomInRange(min, max); - printf("%d \n", random); - } - - return 0; -} -``` - - - -# 第五章:循环结构(⭐) - -## 5.1 概述 - -* 循环结构:在某些条件满足的情况下,反复执行特定代码的功能。 - -## 5.2 for 循环 - -### 5.2.1 概述 +### 1.2.8 sizeof 运算符 * 语法: ```c -for(初始化条件①;循环条件表达式②;迭代语句④){ - 循环体语句③ -} +sizeof(表达式) ``` > [!NOTE] > -> * ① 初始化条件,用于初始化循环变量,只会执行一次,且循环开始前就执行(可以声明多个变量,但是必须是同一类型,用逗号 `,` 隔开)。 -> * ② 循环条件表达式每次循环都执行,同 while 循环一样,每次先判断后执行循环体语句。 -> * ③ 迭代语句每次循环都执行,在大括号中循环体语句之后执行(如果有多个变量更新,用逗号 `,` 隔开)。 +> * ① sizeof 是运算符,不是内置函数。 +> +> * ② 表达式可以是任何类型的数据类型、变量或常量。 +> * ③ 用来获取某种数据类型、变量或常量占用的字节数量(内存中的存储单元),并且 `sizeof(...)` 的`返回值类型`是 `size_t` ;并且,如果是变量名称,可以省略 `()`;如果是数据类型,则不能省略 `()`。 +> * ④ 在 `printf` 中使用占位符 `%zu` 来处理 `size_t` 类型的值。 +> * ⑤ 之前,也提过,C 语言没有一个统一的官方机构来制定或强制执行其标准,而是由一个标准委员会负责制定标准。不同的编译器可以选择部分或完全遵循这些标准。因此,C 语言的编译器实现可能会有所不同,这就要求程序员在编写跨平台代码时特别注意数据类型的大小和布局。 +> * ⑥ 与 C 语言不同,Java 和 JavaScript 等语言的标准是强制性的。在 Java 语言中,`int` 类型在所有平台上都是 4 个字节,无论是在 Linux、MacOS 还是 Windows 上。因此,这些语言不需要像 C 语言那样依赖 `sizeof` 来处理不同平台上的数据类型大小差异,因为编译器已经在底层处理了这些差异。换言之,`sizeof` 运算符在 C 语言中的重要性在于它为程序员提供了一个处理不同平台上数据类型大小差异的工具。当然,如果你在 C 语言中,使用精确宽度类型,如:`int8_t`、`int16_t`、`int32_t`、`uint8_t`、 `uint16_t`、`uint32_t` 等,也可以确保代码在各个平台上的一致性。 -* 流程图,如下所示: -![](./assets/7.png) + +* 示例:参数是数据类型 + +```c +#include +#include + +int main() { + + size_t s = sizeof(int); + + printf("%zu \n", s); // 4 + + return 0; +} +``` + + + +* 示例:参数是变量 + +```c +#include +#include + +int main() { + + int num = 10; + + size_t s = sizeof(num); + + printf("%zu \n", s); // 4 + + return 0; +} +``` + + + +* 示例:参数是常量 + +```c +#include +#include + +int main() { + + size_t s = sizeof(10); + + printf("%zu \n", s); // 4 + + return 0; +} +``` + +## 1.3 数值溢出 + +### 1.3.1 概述 + +* 在生活中,如果一个容器的容量是固定的,我们不停的向其中注入水,那么当容器中充满水之后,再继续注入,水就会从杯子中溢出来,如下所示: + +![](./assets/3.jpg) + +* 在程序中也是一样的,各种整数类型在内存中占用的存储单元是不同的,如:short 在内存中占用 2 个字节的存储单元,int 在内存中占用 4 个字节的存储单元。这也就意味着,各种整数类型只能存储有限的数值,当数值过大或多小的时候,超出的部分就会被直接截掉,那么数值就不能被正确的存储,我们就将这种现象就称为`溢出`(overflow)。 > [!NOTE] > -> 执行过程是:① --> ② --> ③ --> ④ --> ② --> ③ --> ④ --> ... --> ② 。 +> * 如果这个数目前是`最大值`,再进行`加法`计算,数据就会超过该类型能够表示的最大值,叫做`上溢出`(如果最大值 + 1 会“绕回”到最小值)。 +> * 如果这个数目前是`最小值`,再进行`减法`计算,数据就会超过该类型能够表示的最小值, 叫做`下溢出`(如果最小值 - 1 会“绕回”到最大值)。 +> +> [!IMPORTANT] +> +> * ① 在 C 语言中,程序产生数值溢出的时候,并不会引发错误而使程序自动停止,这是因为计算机底层是采用二进制补码的运算规则进行处理的(很多编程语言也是这样处理的,如:Java 等)。 +> * ② 但是,这可能会导致不可预料的后果,如:1996 年的亚利安 5 号运载火箭爆炸、2004 年的 Comair 航空公司航班停飞事故。 +> * ③ 在实际开发中,编程时要特别注意,以避免数值溢出问题,特别是在涉及大数或小数的运算(特指整数)。 +### 1.3.2 无符号数的取值范围 -### 5.2.2 应用示例 +* 在 C 语言中,`无符号数`(unsigned 类型)的取值范围(最大值和最小值)的计算是很容易的,即:将内存中的所有位,设置为 `0` 就是`最小值`,设置为 `1` 就是`最大值`。 -* 需求:输出 5 行 `Hello World!` 。 +> [!IMPORTANT] +> +> 在 C 语言中,无符号整数,最高位不是符号位,它是数值的一部分。 +* 以 `unsigned char` 类型为例,它在内存中占用的存储单元是 1 个字节,即 8 位。如果所有位都设置为 `0` ,它的最小值就是 `0` ;如果所有位设置为 `1` ,它的最大值就是 `2⁸ - 1 = 255` ,如下所示: +![](./assets/4.svg) -* 示例: +* 那么,`unsigned char` 的最大值是如何计算出来的?最简单的方法就是这样的,如下所示: -```c -#include - -int main() { - - for (int i = 1; i <= 5; ++i) { - printf("Hello World!\n"); - } - - return 0; -} +```txt + 1 × 2⁰ + 1 × 2¹ + 1 × 2² + 1 × 2³ + 1 × 2⁴ + 1 × 2⁵ + 1 × 2⁶ + 1 × 2⁷ += 1 + 2 + 4 + 8 + 16 + 32 + 64 + 128 += 255 ``` -### 5.2.3 应用示例 +* 但是,这种计算方法虽然有效,但是非常麻烦,如果是 8 个字节的 long ,那么计算就非常麻烦了(可能要计算半天)。当然,我们也知道,这就是等比数列(高中知识),等比数列的公式,如下所示: -* 需求:求 1 ~ 100 之内所有偶数的和,以及偶数的个数。 +$S_n = a_1 \times \frac{1 - r^n}{1 - r}$ +* 那么,结果就是:$S_8 = 1 \times \frac{1 - 2^8}{1 - 2} = \frac{1 - 256}{-1} = 255$ +* 但是,貌似还是很复杂,我们可以换个思路,就是让 `1111 1111` 先 `+1` ,然后再 `-1`,这样一增一减正好抵消掉,并且不会影响最终的结果,如下所示: -* 示例: - -```c -#include - -int main() { - - int sum = 0; - int count = 0; - - for (int i = 1; i <= 100; i++) { - if (i % 2 == 0) { - sum += i; - count++; - } - } - - printf("1 ~ 100 中的所有偶数的和为: %d \n", sum); - printf("1 ~ 100 中的所有偶数的个数为: %d \n", count); - - return 0; -} +```txt + 1111 1111 + 1 - 1 += 10000 0000 - 1 += 2⁹⁻¹ - 1 += 2⁸ - 1 += 255 ``` -### 5.2.4 应用示例 +* 其对应的换算过程,如下所示: -* 需求:输出所有的水仙花数,所谓水仙花数是指一个 3 位数,其各个位上数字立方和等于其本身,例如:`153 = 1×1×1 + 3×3×3 + 5×5×5`。 +![](./assets/5.svg) +> [!IMPORTANT] +> +> * ① 当内存中所有的位都是 1 的时候,这种“凑整”的技巧非常实用!!! +> * ② 按照上述的技巧,我们可以很容易得计算出: +> * `unsinged char`(1 个字节) 的取值范围是:`[0, 2⁸ - 1]`。 +> * `unsinged short`(2 个字节)的取值范围是:`[0, 2¹⁶ - 1]`。 +> * `unsinged int`(4 个字节)的取值范围是:`[0, 2³² - 1]`。 +> * `unsinged long`(8 个字节)的取值范围是:`[0, 2⁶⁴ - 1]`。 +### 1.3.3 有符号数的取值范围 -* 示例: +* 在 C 语言中,`有符号数`(signed 类型)在计算机底层是以`补码`的形式存储的(计算的时候,也是以补码的形式进行计算的,并且符号位参与计算);但是,在读取的时候,需要采用`逆向`的转换,即:将补码转换为原码。 -```c -#include +> [!IMPORTANT] +> +> 在 C 语言中,有符号整数,最高位是符号位,用于表示正负数。 -int main() { +* 以 `char` 类型为例,它的取值范围,如下所示: - int count = 0; +| 补码 | 反码 | 原码 | 值 | +| ------------- | --------- | --------- | -------- | +| 1111 1111 | 1111 1110 | 1000 0001 | -1 | +| 1111 1110 | 1111 1101 | 1000 0010 | -2 | +| 1111 1101 | 1111 1100 | 1000 0011 | -3 | +| ... | ... | ... | ... | +| 1000 0011 | 1000 0010 | 1111 1101 | -125 | +| 1000 0010 | 1000 0001 | 1111 1110 | -126 | +| 1000 0001 | 1000 0000 | 1111 1111 | -127 | +| **1000 0000** | **---** | **---** | **-128** | +| 0111 1111 | 0111 1111 | 0111 1111 | 127 | +| 0111 1110 | 0111 1110 | 0111 1110 | 126 | +| 0111 1101 | 0111 1101 | 0111 1101 | 125 | +| ... | ... | ... | ... | +| 0000 0010 | 0000 0010 | 0000 0010 | 2 | +| 0000 0001 | 0000 0001 | 0000 0001 | 1 | +| 0000 0000 | 0000 0000 | 0000 0000 | 0 | - for (int i = 100; i <= 999; i++) { - // 获取三位数 - int ge = i % 10; - int shi = i / 10 % 10; - int bai = i / 100; +* 从上面的列表中,我们可以得知,`char` 类型的取值范围是:`[-2⁸, 2⁸ - 1]`,即:`[-128, 127]`。 +* 对于 `-128` 而言,它的补码是 `1000 0000`,是无法按照传统的补码表示法来计算原码的,因为在补码转换到反码的时候需要 `-1` ,而 `1000 0000 - 1`需要向高位借 `1` ,而最高位是符号位是不能借的,这就非常矛盾。 - // 判定是否为水仙花数 - if (ge * ge * ge + shi * shi * shi + bai * bai * bai == i) { - printf("水仙花数:%d\n", i); - count++; - } - } +> [!IMPORTANT] +> +> 计算机规定,`1000 0000` 这个特殊的补码就表示 `-128` 。 - printf("水仙花数总个数:%d\n", count); - - return 0; -} -``` - -### 5.2.5 应用示例 - -* 需求:将 1 ~ 10 倒序输出,如:10 、9 、8 ... - - - -* 示例: - -```c -#include - -int main() { - - for (int i = 10; i >= 0; i--) { - printf("%d ", i); - } - - return 0; -} -``` - -### 5.2.6 应用示例 - -* 需求:输入两个正整数 m 和 n ,求其最大公约数和最小公倍数,例如:12 和 20 的最大公约数是 4 ,最小公倍数是 60 。 +* 但是,为什么偏偏是 `-128` ,而不是其它数字?是因为 `-128` 使得 `char` 类型的取值范围保持连贯,中间没有“空隙”。如果我们按照传统的方式来计算 `-128` 的补码,如下所示: + * ① 原码:在原码表示法中,-128 的数据位是 `1000 0000`,但是 char 的数据位只有 `7` 位,那么最高位 `1` 就变为了符号位,剩下的数据位就是 `000 0000`;所以,`-128` 的原码就是 `1000 0000`。 + * ② 反码:对数据位取反,-128 的反码就是:`1111 1111` 。 + * ③ 补码:在反码的基础上 `+1`,得到 `1000 0000`,是因为符号位被覆盖了,补码最终依然是 `1000 0000`。 > [!NOTE] > -> * 如果数 a 能被数 b 整除,且结果是整数,那么 a 就叫做 b 的倍数,b 就叫做 a 的约数(因数)。 -> * 如果一个整数同时是几个整数的约数,则称该整数为这些整数的公约数;其中,数值最大的称为最大公约数。 -> * 如果一个整数同时为两个或多个整数的倍数的数,则称该整数为这些整数的公倍数;其中,数值最小的称为最小公倍数。 +> `-128` 从原码转换到补码的过程中,符号位被 `1` 覆盖了两次,而负数的符号位本来就是 `1`,被 `1` 覆盖多少次也不会影响到数字的符号。 + +* 虽然从 `1000 0000` 这个补码推算不出 `-128`,但是从 `-128` 却能推算出 `1000 0000` 这个补码,即:有符号数在存储之前先要转换为补码。 + +> [!IMPORTANT] +> +> * ① 通过这种方式,`-128` 就成为了补码的最小值 `1000 0000`,而这个值不会与其他任何正数或负数的补码冲突。 +> * 如果采用`原码`存储,那么将会出现 `+0` 和 `-0` 的情况,即:`0000 0000`、`1000 0000`,这样在取值范围内,就存在两个相同的值,多此一举。 +> * 如果采用`原码`存储,最大值不变是 `127` ,但是最小值只能存储到 `-127` ,不能存储到 `-128`,因为 `-128` 的原码是 `1000 0000`,和 `-0` 的原码冲突。 +> * ② 这就是补码系统的强大之处,它能让整数的范围连贯,并且实现了加法和减法的统一处理。 +> * ③ 按照上述的方法,我们可以很容易得计算出: +> * `char`(1 个字节) 的取值范围是:`[-2⁸, 2⁸ - 1]`。 +> * `short`(2 个字节)的取值范围是:`[-2¹⁶, 2¹⁶ - 1]`。 +> * `int`(4 个字节)的取值范围是:`[-2³², 2³² - 1]`。 +> * `long`(8 个字节)的取值范围是:`[-2⁶⁴, 2⁶⁴ - 1]`。 + +### 1.3.4 数值溢出 + +* 对于`无符号`的数值溢出: + * 当数据到达最大值的时候,再 `+1` 就会回到无符号数的最小值。 + * 当数据达到最小值的时候,再 `-1` 就会回到无符号数的最大值。 + +> [!IMPORTANT] +> +> * ① 对于无符号整数的运算,如:加、减、乘、除、取余等,其最小值是 0 ,最大值是 `2^n - 1` 。如果某个计算结果超出了这个范围,计算机会自动将结果对 `2^N` 取余(模),从而丢失高位,只保留低位。 +> * ② 以 `8` 位无符号整数而言,最大值是 `255`(1111 1111);那么, `255 + 1` 的结果就是 `(2^8 -1 + 1) % 2^8 = 0`,商是 `256`。 +> * ③ 以 `8` 位无符号整数而言,最小值是 `0`(0000 0000),那么, `0 - 1` 的结果就是 `(0 - 1) % 2^8 = 255`,商是 `-1`。 + +* 那么,`无符号`的`上溢出`,原理就是这样的: + +![](./assets/6.svg) + +* 那么,`无符号`的`下溢出`,原理就是这样的: + +![](./assets/7.svg) + +* 对于`有符号`的数值溢出: + * 当数据到达最大值的时候,再 `+1` 就会回到有符号数的最小值。 + * 当数据达到最小值的时候,再 `-1` 就会回到有符号数的最大值。 + +* 那么,`有符号`的`上溢出`,原理就是这样的: + +![](./assets/8.svg) + +* 那么,`有符号`的`下溢出`,原理就是这样的: + +![](./assets/9.svg) -* 示例: +* 示例:无符号的上溢出和下溢出 ```c +#include #include int main() { - int m = 12, n = 20; + unsigned short s1 = USHRT_MAX + 1; + printf("无符号的上溢出 = %hu \n", s1); // 0 - // 取出两个数中的较小值 - int min = (m < n) ? m : n; - - for (int i = min; i >= 1; i--) { - - if (m % i == 0 && n % i == 0) { - printf("最大公约数是:%d\n", i); // 公约数 - - break; //跳出当前循环结构 - } - } - - // 取出两个数中的较大值 - int max = (m > n) ? m : n; - for (int i = max; i <= m * n; i++) { - - if (i % m == 0 && i % n == 0) { - - printf("最小公倍数是:%d\n", i); // 公倍数 - - break; - } - } + unsigned short s2 = 0 - 1; + printf("无符号的下溢出 = %hu \n", s2); // 65535 return 0; } ``` -## 5.3 while 循环 -### 5.3.1 概述 -* 语法: +* 示例:有符号的上溢出和下溢出 ```c -初始化条件①; -while (循环条件语句②) { - 循环体语句③; - 迭代语句④; +#include +#include + +int main() { + + short s1 = SHRT_MAX + 1; + printf("有符号的上溢出 = %hd \n", s1); // -32768 + + short s2 = SHRT_MIN - 1; + printf("有符号的下溢出 = %hd \n", s2); // 32767 + + return 0; } ``` +## 1.4 浮点类型 + +### 1.4.1 概述 + +* 在生活中,我们除了使用`整数`,如:18、25 之外,还会使用到`小数`,如:3.1415926、6.18 等,`小数`在计算机中也被称为`浮点数`(和底层存储有关)。 +* `整数`在计算机底层的存储被称为`定点存储`,如下所示: + +![](./assets/10.svg) + +* `小数`在计算机底层的存储被称为`浮点存储`,如下所示: + +![](./assets/11.svg) + > [!NOTE] > -> * ① `while(循环条件部分)` 中循环条件为`非0`值,表示 `true`、`真`;为`0`值,表示 `false`、`假`。 -> * ② 当循环条件表达式成立,就执行循环体语句,直到条件不成立停止循环。 -> * ③ 为避免死循环,循环条件表达式不能永远成立,且随着循环次数增加,应该越来越趋向于不成立。 -> * ④ for 循环和 while 循环`可以相互转换`,二者没有性能上的差别。 -> * ⑤ for 循环与 while 循环的区别:`初始化条件部分的作用域不同`。 +> * ① 计算机底层就是采取类似科学计数法的形式来存储小数的,而科学计数法的表现就是这样的,如:3.12 * 10^-2 ;其中,10 是基数,-2 是指数,而 3.12 是尾数。 +> * ② 因为尾数区的内存空间的宽度不同,导致了小数的精度也不相同,所以小数在计算机中也称为浮点数。 -* 流程图,如下所示: +* 在 C 语言中,变量的浮点类型,如下所示: -![](./assets/8.png) +| 类型 | 存储大小 | 值的范围 | 有效小数位数 | +| ----------------------- | -------- | --------------------- | ------------ | +| float(单精度) | 4 字节 | 1.2E-38 ~ 3.4E+38 | 6 ~ 9 | +| double(双精度) | 8 字节 | 2.3E-308 ~ 1.7E+308 | 15 ~ 18 | +| long double(长双精度) | 16 字节 | 3.4E-4932 ~ 1.2E+4932 | 18 或更多 | > [!NOTE] > -> 执行过程是:① --> ② --> ③ --> ④ --> ② --> ③ --> ④ --> ... --> ② 。 +> * ① 各类型的存储大小和精度受到操作系统、编译器、硬件平台的影响。 +> * ② 浮点型数据有两种表现形式: +> * 十进制数形式:3.12、512.0f、0.512(.512,可以省略 0 ) +> * 科学计数法形式:5.12e2(e 表示基数 10)、5.12E-2(E 表示基数 10)。 +> * ③ 在实际开发中,对于浮点类型,建议使用 `double` 类型;如果范围不够,就使用 `long double` 类型。 -### 5.3.2 应用示例 +### 1.4.2 格式占位符 -* 需求:输出 5 行 `Hello World!` 。 - - - -* 示例: - -```c -#include - -int main() { - int i = 1; - while (i <= 5) { - printf("Hello World!\n"); - i++; - } - - return 0; -} -``` - -### 5.3.3 应用示例 - -* 需求:求 1 ~ 100 之内所有偶数的和,以及偶数的个数。 - - - -* 示例: - -```c -#include - -int main() { - - int sum = 0; - int count = 0; - - int i = 1; - while (i <= 100) { - if (i % 2 == 0) { - sum += i; - count++; - } - i++; - } - - printf("1 ~ 100 中的所有偶数的和为: %d \n", sum); - printf("1 ~ 100 中的所有偶数的个数为: %d \n", count); - - return 0; -} -``` - -### 5.3.4 应用示例 - -* 需求:世界最高山峰是珠穆朗玛峰,它的高度是 8848.86 米,假如我有一张足够大的纸,它的厚度是 0.1 毫米。请问,我折叠多少次,可以折成珠穆朗玛峰的高度? - - - -* 示例: - -```c -#include - -int main() { - - // 折叠的次数 - int count = 0; - - // 珠峰的高度 - int zfHeight = 8848860; - - // 每次折叠的高度 - double paperHeight = 0.1; - - while (paperHeight <= zfHeight) { - count++; - paperHeight *= 2; - } - - printf("需要折叠 %d 次,才能得到珠峰的高度。\n", count); - printf("折纸的高度为 %.2f 米,超过了珠峰的高度", paperHeight / 1000); - - return 0; -} -``` - -### 5.3.5 应用示例 - -* 需求:给出一个整数 n ,判断该整数是否是 2 的幂次方。如果是,就输出 yes ;否则,输出 no 。 +* 对于 `float` 类型的格式占位符,是 `%f` ,默认会保留 `6` 位小数,不足 `6` 位以 `0` 补充;可以指定小数位,如:`%.2f` 表示保留 `2` 位小数。 +* 对于 `double` 类型的格式占位符,是 `%lf` ,默认会保留 `6` 位小数,不足 `6` 位以 `0` 补充;可以指定小数位,如:`%.2lf` 表示保留 `2` 位小数。 +* 对于 `long double` 类型的格式占位符,是 `%Lf` ,默认会保留 `6` 位小数,不足 `6` 位以 `0` 补充;可以指定小数位,如:`%.2Lf` 表示保留 `2` 位小数。 > [!NOTE] > -> 思路: +> * ① 如果想输出`科学计数法`形式的 `float` 类型的浮点数,则使用 `%e`。 +> * ② 如果想输出`科学计数法`形式的 `double` 类型的浮点数,则使用 `%le`。 +> * ③ 如果想输出`科学计数法`形式的 `long double` 类型的浮点数,则使用 `%Le`。 + +> [!NOTE] > -> * ① 2^ 0 = 1 ,2^1 = 2 ,2^2 = 4,2^3 = 8,2^4 = 16,2^5 = 32 ...,规律:每一个数字都是前一个数字的 2 倍(任意一个数字,不断的除以 2 ,最终看结果是否是数字 1 )。 -> * ② 循环终止条件: -> * 结果是 1 的时候,就可以结束,输出 yes 。 -> * 如果在除以 2 的时候,无法被 2 整数,也可以结束,输出 no ,如: 100 / 2 = 50,50 / 2 = 25 。 +> * ① 浮点数还有一种更加智能的输出方式,就是使用 `%g`(`g` 是 `general format` 的缩写,即:通用格式),`%g` 会根据数值的大小自动判断,选择使用普通的浮点数格式(`%f`)进行输出,还是使用科学计数法(`%e`)进行输出,即:`float` 类型的两种输出形式。 +> * ② 同理,`%lg` 会根据数值的大小自动判断,选择使用普通的浮点数格式(`%lf`)进行输出,还是使用科学计数法(`%le`)进行输出,即:`double` 类型的两种输出形式。 +> * ③ 同理,`%Lg` 会根据数值的大小自动判断,选择使用普通的浮点数格式(`%Lf`)进行输出,还是使用科学计数法(`%Le`)进行输出,即:`long double` 类型的两种输出形式。 + + + +* 示例: + +```c +#include + +int main() { + + float f1 = 10.0; + + printf("f1 = %f \n", f1); // f1 = 10.000000 + printf("f1 = %.2f \n", f1); // f1 = 10.00 + + return 0; +} +``` + + + +* 示例: + +```c +#include + +int main() { + + double d1 = 13.14159265354; + + printf("d1 = %lf \n", d1); // d1 = 13.141593 + printf("d1 = %.2lf \n", d1); // d1 = 13.14 + + return 0; +} +``` + + + +* 示例: + +```c +#include + +int main() { + + long double d1 = 13.14159265354; + + printf("d1 = %LF \n", d1); // d1 = 13.141593 + printf("d1 = %.2LF \n", d1); // d1 = 13.14 + + return 0; +} +``` + + + +* 示例: + +```c +#include + +int main() { + + float f1 = 3.1415926; + double d2 = 3.14e2; + + printf("f1 = %.2f \n", f1); // f1 = 3.14 + printf("f1 = %.2e \n", f1); // f1 = 3.14e+00 + printf("d2 = %.2lf \n", d2); // d2 = 314.00 + printf("d2 = %.2e \n", d2); // d2 = 3.14e+02 + + return 0; +} +``` + +### 1.4.3 字面量后缀 + +* 浮点数字面量默认是 double 类型。 +* 如果需要表示 `float` 类型的字面量,需要后面添加后缀 `f` 或 `F`,建议 `F`。 +* 如果需要表示 `long double` 类型的字面量,需要后面添加后缀 `l` 或 `L`,建议 `L`。 + + + +* 示例: + +```c +#include + +int main() { + + float f1 = 3.1415926f; + double d2 = 3.1415926; + long double d3 = 3.1415926L; + + printf("f1 = %.2f \n", f1); // f1 = 3.14 + printf("d2 = %.3lf \n", d2); // d2 = 3.142 + printf("d3 = %.4Lf \n", d3); // d3 = 3.1416 + + return 0; +} +``` + +### 1.4.4 类型占用的内存大小(存储空间) + +* 可以通过 `sizeof` 运算符来获取 float、double 以及 long double 类型占用的内存大小(存储空间)。 + + + +* 示例: + +```c +#include + +int main() { + + printf("float 的存储空间是 %zu 字节 \n", sizeof(float)); // 4 + printf("double 的存储空间是 %zu 字节 \n", sizeof(double)); // 8 + printf("long double 的存储空间是 %zu 字节 \n", sizeof(long double)); // 16 + + return 0; +} +``` + +### 1.4.5 类型的取值范围 + +* 可以通过 `#include ` 来获取类型的取值范围。 + + + +* 示例: + +```c +#include +#include + +int main() { + + printf("float 的取值范围是:[%.38f, %f] \n", FLT_MIN, FLT_MAX); + printf("double 的取值范围是:[%lf, %lf] \n", DBL_MIN, DBL_MAX); + printf("double 的取值范围是:[%Lf, %Lf] \n", LDBL_MIN, LDBL_MAX); + + return 0; +} +``` + +### 1.4.6 整数和浮点数的相互赋值 + +* 在 C 语言中,整数和浮点数是可以相互赋值的,即: + * 将一个整数赋值给小数类型,只需要在小数点后面加 0 就可以了。 + * 将一个浮点数赋值给整数类型,就会将小数部分丢掉,只会取整数部分,会改变数字本身的值。 + +> [!WARNING] +> +> * ① 在 C 语言中,浮点数赋值给整数类型,会直接截断小数点后面的数,编译器一般只会给出警告,让我们注意一下(C 语言在检查类型匹配方面不太严格,最好不要养成这样的习惯)。 +> * ② 但是,在 Java 等编程语言中,这样的写法是不可以的,会在编译阶段直接报错。 @@ -969,31 +1014,48 @@ int main() { // 禁用 stdout 缓冲区 setbuf(stdout, NULL); - int n = 0; - printf("请输入一个整数:"); - scanf("%d", &n); - - while (n > 1 && n % 2 == 0) { - n /= 2; - } - - if (n == 1) { - printf("yes"); - } else { - printf("no"); - } + float a = 123; // 整数赋值给浮点类型,只需要在小数点,后面加 0 即可 + printf("a=%f \n", a); // a=123.000000 + int b = 123.00; // 浮点赋值给整数类型,会直接截断小数点后面的数 + printf("b=%d \n", b); // b=123 return 0; } ``` -### 5.3.6 应用示例 -* 需求:整数反转,如:123 --> 321 。 + +## 1.5 字符类型 + +### 1.5.1 概述 + +* 在生活中,我们会经常说:今天天气真 `好`,我的性别是 `女`,我今年 `10` 岁等。像这类数据,在 C 语言中就可以用`字符类型`(char)来表示。`字符类型`表示`单`个字符,使用单引号(`''`)括起来,如:`'1'`、`'A'`、`'&'`。 +* 但是,在生活中,也许会听到:`你是好人,只是现阶段,我想学习`、`好的啊,我们在一起`等。像这类数据,在 C 语言中就可以用`字符串`(String)来表示。`字符串类型`表示`多`个字符的集合,使用双引号(`""`)括起来,如:`"1"`、`"A"`、`"&"`、`"我们"`。 > [!NOTE] > -> 思路:从右边开始,依次获取每一位数字,再拼接起来。 +> * ① C 语言的出现在 1972 年,由美国人丹尼斯·里奇设计出来;那个时候,只需要 1 个字节的内存空间,就可以完美的表示拉丁体系(英文)文字,如:a-z、A-Z、0-9 以及一些特殊符号;所以,C 语言中不支持多个字节的字符,如:中文、日文等。 +> * ② 像拉丁体系(英文)文字,如:a-z、A-Z、0-9 以及一些特殊符号,只需要单个字节的内存存储空间就能存储的,我们就称为窄类型;而像中文、日文等单个字节的内存空间存储不了的,我们就称为宽类型。 +> * ③ 在 C 语言中,是没有字符串类型,是使用字符数组(char 数组)来模拟字符串的。字符串中的字符在内存中按照次序、紧挨着排列,整个字符串占用一块连续的内存。 +> * ④ 在 C 语言中,如果想要输出中文、日文等多字节字符,就需要使用字符数组(char 数组)。 +> * ⑤ 在 C++、Java 等高级编程语言中,已经提供了 String (字符串)类型,原生支持 Unicode,可以方便地处理多语言和特殊字符。 + +* 在 C 语言中,可以使用`转义字符 \`来表示特殊含义的字符。 + +| **转义字符** | **说明** | +| ------------ | -------- | +| `\b` | 退格 | +| `\n` | 换行符 | +| `\r` | 回车符 | +| `\t` | 制表符 | +| `\"` | 双引号 | +| `\'` | 单引号 | +| `\\` | 反斜杠 | +| ... | | + +### 1.5.2 格式占位符 + +* 在 C 语言中,使用 `%c` 来表示 char 类型。 @@ -1004,196 +1066,23 @@ int main() { int main() { - // 禁用 stdout 缓冲区 - setbuf(stdout, NULL); + char c = '&'; - int num = 0; - int original = 0; - int rev = 0; - printf("请输入一个整数:"); - scanf("%d", &num); - original = num; + printf("c = %c \n", c); // c = & - // 从右边开始,依次获取每个数字,然后拼接到 rev 中 - /** - * 第 1 次,123 % 10 = 3,rev = 0 * 10 + 3 = 3 - * 第 2 次,12 % 10 = 2,rev = 3 * 10 + 2 = 32 - * 第 3 次,1 % 10 = 1,rev = 32 * 10 + 1 = 321 - */ - // 循环结束的条件是 num == 0 - while (num != 0) { - // 获取 num 右边的第一位数字 - int temp = num % 10; - // 去掉最后一位数字 - num /= 10; - // 将 temp 拼接到 rev 的后面 - rev = rev * 10 + temp; - } + char c2 = 'a'; + printf("c2 = %c \n", c2); // c2 = a - printf("%d 的反转是 %d\n", original, rev); + char c3 = 'A'; + printf("c3 = %c \n", c3); // c3 = A return 0; } ``` -## 5.4 do-while 循环 +### 1.5.3 类型占用的内存大小(存储空间) -### 5.4.1 概述 - -* 语法: - -```c -①初始化部分; -do{ - ③循环体部分 - ④迭代部分 -}while(②循环条件部分); -``` - -> [!NOTE] -> -> * ① `do{} while();`最后有一个分号。 -> * ② do-while 结构的循环体语句是至少会执行一次,这个和 for 、while 是不一样的。 -> * ③ 循环的三个结构 for、while、do-while 三者是可以相互转换的。 - -* 流程图,如下所示: - -![](./assets/9.png) - -> [!NOTE] -> -> 执行过程是:① --> ③ --> ④ --> ② --> ③ --> ④ --> ② --> ... --> ② 。 - -### 5.4.2 应用示例 - -* 需求:求 1 ~ 100 之内所有偶数的和,以及偶数的个数。 - -```c -#include - -int main() { - - int sum = 0; - int count = 0; - - int i = 1; - do { - if (i % 2 == 0) { - sum += i; - count++; - } - i++; - } while (i <= 100); - - printf("1 ~ 100 中的所有偶数的和为: %d \n", sum); - printf("1 ~ 100 中的所有偶数的个数为: %d \n", count); - - return 0; -} -``` - -### 5.4.3 应用示例 - -* 需求:实现 ATM 取款机功能。 - - - -* 示例: - -```c -#include - -int main() { - // 账户余额 - double balance = 0.0; - // 客户选择 - int selection; - // 存款金额 - double addMoney; - // 取款金额 - double minusMoney; - // 退出标识 - bool exitFlag = false; - do { - printf("=========ATM========\n"); - printf("\t1、存款\n"); - printf("\t2、取款\n"); - printf("\t3、显示余额\n"); - printf("\t4、退出\n"); - printf("请选择(1-4):"); - - scanf("%d", &selection); - - switch (selection) { - case 1: - printf("您当前的余额是: %.2f\n", balance); - printf("请输入存款金额:"); - scanf("%lf", &addMoney); - balance += addMoney; - printf("存款成功,您当前的余额是:%.2f\n", balance); - break; - case 2: - printf("您当前的余额是: %.2f\n", balance); - printf("请输入取款金额:"); - scanf("%lf", &minusMoney); - if (minusMoney > balance) { - printf("余额不足,取款失败。\n"); - } else { - balance -= minusMoney; - printf("取款成功,您的余额为:%.2f\n", balance); - } - break; - case 3: - printf("您的账户余额为:%.2f\n", balance); - break; - case 4: - exitFlag = true; - printf("欢迎下次再来。\n"); - break; - default: - printf("输入有误,请重新输入。\n"); - break; - } - - } while (!exitFlag); - - return 0; -} -``` - -## 5.5 嵌套循环 - -### 5.5.1 概述 - -* 所谓的嵌套循环,是指一个循环结构 A 的循环体是另一个循环结构 B 。例如:for 循环里面还有一个for 循环,就是嵌套循环。 -* 语法: - -```c -for(初始化语句①; 循环条件语句②; 迭代语句⑦) { - for(初始化语句③; 循环条件语句④; 迭代语句⑥) { - 循环体语句⑤; - } -} -``` - -* 其中,for 、while 、do-while 均可以作为外层循环或内层循环。 - - 外层循环:循环结构 A - - 内层循环:循环结构 B - -![](./assets/10.png) - -> [!NOTE] -> -> * ① 实际上,嵌套循环就是将内层循环当成外层循环的循环体。当只有内层循环的循环条件为 false ,才会完全跳出内层循环,才可结束外层的当次循环,开始下一次循环。 -> * ② 假设外层循环次数为 m 次,内层循环次数为 n 次,则内层循环体实际上需要执行 m × n 次。 -> * ③ 从二维图形的角度看,外层循环控制`行数`,内层循环控制`列数`。 -> * ④ 实际开发中,我们最多见到的嵌套循环是两层,一般不会出现超过三层的嵌套循环。如果将要出现,一定要停下来重新梳理业务逻辑,重新思考算法的实现,控制在三层以内;否则,可读性会很差。 - - - -### 5.5.2 应用示例 - -* 需求:打印 5 行 `*` ,要求每行 6 个 `*` 。 +* 可以通过 `sizeof` 运算符来获取 char 类型占用的内存大小(存储空间)。 @@ -1204,293 +1093,85 @@ for(初始化语句①; 循环条件语句②; 迭代语句⑦) { int main() { - for (int i = 1; i <= 5; ++i) { - for (int j = 1; j < 6; ++j) { - printf("* "); - } - printf("\n"); - } + printf("char 的存储空间是 %d 字节\n", sizeof(char)); // 1 + printf("unsigned char 的存储空间是 %d 字节\n", sizeof(unsigned char)); // 1 return 0; } - ``` -### 5.5.3 应用示例 +### 1.5.4 类型的取值范围 -* 需求:打印 5 行直角三角形。 +* 可以通过 `#include ` 来获取类型的取值范围。 * 示例: ```c +#include #include int main() { - for (int i = 1; i <= 5; ++i) { - for (int j = 1; j <= i; ++j) { - printf("* "); - } - printf("\n"); - } + printf("char 范围是[%d,%d] \n", CHAR_MIN,CHAR_MAX); // [-128,127] + printf("unsigned char 范围是[0,%d]\n", UCHAR_MAX); // [0,255] return 0; } ``` -### 5.5.4 应用示例 +### 1.5.5 字符类型的本质 -* 需求:打印 5 行倒直角三角形。 - - - -* 示例: - -```c -#include - -int main() { - - for (int i = 1; i <= 5; ++i) { - for (int j = 1; j <= 6 - i; ++j) { - printf("* "); - } - printf("\n"); - } - - return 0; -} -``` - -### 5.5.5 应用示例 - -* 需求:打印 9 `×` 9 乘法表。 - - - -* 示例: - -```c -#include - -int main() { - - for (int i = 1; i <= 9; ++i) { - for (int j = 1; j <= i; ++j) { - printf("%d × %d = %d ", i, j, i * j); - } - printf("\n"); - } - - return 0; -} -``` - -## 5.6 无限循环 - -* 语法: - -```c -while(1){ - ... -} -``` - -```c -for(;;){ - ... -} -``` - -> [!NOTE] -> -> * ① 在开发中,有的时候并不确定需要循环多少次,就需要根据循环体内部的某些条件,来控制循环的结束(break)。 -> * ② 如果上述的循环结构不能终止,就会构成死循环;所以,在实际开发中,要避免出现死循环!!! - - - -* 示例:从键盘读入个数不确定的整数,并判断读入的正数和负数的个数,输入为 0 时结束程序 - -```c -#include - -int main() { - - // 记录输入的整数 - int num = 0; - // 记录正数个数 - int positiveCount = 0; - // 记录负数个数 - int negativeCount = 0; - - while (true) { - printf("请输入一个整数:"); - scanf("%d", &num); - if (num > 0) { - positiveCount++; - } else if (num < 0) { - negativeCount++; - } else { - printf("程序结束!\n"); - break; - } - } - - printf("正数的个数:%d\n", positiveCount); - printf("负数的个数:%d\n", negativeCount); - - return 0; -} - -``` - -## 5.7 跳转控制语句 - -### 5.7.1 break - -* break 的使用场景:break 语句用于终止某个语句块的执行,用在switch语句或者循环语句中。 - -> [!NOTE] -> -> break 一旦执行,就结束(或跳出)当前循环结构;并且,此关键字的后面,不能声明其它语句。 - -* 流程图,如下所示: - -![](./assets/11.png) - - - -* 示例:打印 0 ~ 10 ,如果遇到 `3` ,就停止打印 - -```c -#include - -int main() { - - for (int i = 0; i < 10; ++i) { - if (i == 3) { - break; - } - printf("%d \n", i); - } - - printf("程序结束!\n"); - - return 0; -} -``` - - - -* 示例:编写程序,要求输入一个数字,判断该数字是否是质数 - -```c -#include - -int main() { - - bool isFlag = false; - int num = 0; - do { - - printf("请输入一个整数(必须大于 1 ):"); - scanf("%d", &num); - - if (num <= 1) { - printf("输入的数字不是合法,请重新输入!!!\n"); - isFlag = true; - } else { - isFlag = false; - } - - } while (isFlag); - - bool isPrime = true; - for (int i = 2; i < num; i++) { - if (num % i == 0) { - isPrime = false; - break; - } - } - if (isPrime) { - printf("%d 是一个质数\n", num); - } else { - printf("%d 不是一个质数\n", num); - } - - printf("程序结束!\n"); - - return 0; -} -``` - -### 5.7.2 continue - -* continue 的使用场景:continue 语句用于结束本次循环,继续执行下一次循环。 - -> [!NOTE] -> -> continue 一旦执行,就结束(或跳出)当次循环结构;并且,此关键字的后面,不能声明其它语句。 - - - -* 流程图,如下所示: +* 在 C 语言中,char 本质上就是一个整数,是 ASCII 码中对应的数字,占用的内存大小是 1 个字节(存储空间),所以 char 类型也可以进行数学运算。 ![](./assets/12.png) +* char 类型同样分为 signed char(无符号)和 unsigned char(有符号),其中 signed char 取值范围 -128 ~ 127,unsigned char 取值范围 0 ~ 255,默认是否带符号取决于当前运行环境。 +* `字符类型的数据`在计算机中`存储`和`读取`的过程,如下所示: + +![](./assets/13.png) -* 示例:打印 0 ~ 10 ,如果遇到 `3` ,就继续下一次打印 + +* 示例: ```c +#include #include int main() { + // char 类型字面量需要使用单引号包裹 + char a1 = 'A'; + char a2 = '9'; + char a3 = '\t'; + printf("c1=%c, c3=%c, c2=%c \n", a1, a3, a2); - for (int i = 0; i < 10; ++i) { - if (i == 3) { - continue; - } - printf("%d \n", i); - } + // char 类型本质上整数可以进行运算 + char b1 = 'b'; + char b2 = 101; + printf("%c->%d \n", b1, b1); + printf("%c->%d \n", b2, b2); + printf("%c+%c=%d \n", b1, b2, b1 + b2); - printf("程序结束!\n"); + // char 类型取值范围 + unsigned char c1 = 200; // 无符号 char 取值范围 0 ~255 + signed char c2 = 200; // 有符号 char 取值范围 -128~127,c2会超出范围 + char c3 = 200; // 当前系统,char 默认是 signed char + printf("c1=%d, c2=%d, c3=%d", c1, c2, c3); return 0; } ``` +### 1.5.6 输出字符方式二(了解) - -* 示例:输出 100 以内(包括 100)的数字,跳过那些 7 的倍数或包含 7 的数字 - -```c -#include - -int main() { - - for (int i = 1; i <= 100; i++) { - if (i % 7 == 0 || i % 10 == 7 || i / 10 == 7) { - continue; - } - printf("%d ", i); - } - - printf("程序结束!\n"); - - return 0; -} -``` - -### 5.7.3 return - -* return :并非专门用于结束循环的,它的功能是结束一个方法。当一个方法执行到一个 return 语句的时候,这个方法将被结束。 +* 在 C 语言中,除了可以使用 `printf()` 函数输出字符之外,还可以使用 `putchar()`函数输出字符。 > [!NOTE] > -> 和 break 和 continue 不同的是,return 直接结束整个方法,不管这个 return 处于多少层循环之内。 +> * ① `putchar()` 函数每次只能输出一个字符,如果需要输出多个字符需要调用多次;而 `printf()` 函数一次可以输出多个字符,并且 `char` 类型对应的格式占位符是 `%c`。 +> * ② 在实际开发中,使用 `printf()` 函数居多。 @@ -1501,16 +1182,1648 @@ int main() { int main() { - for (int i = 1; i <= 100; i++) { - if (i % 7 == 0 || i % 10 == 7 || i / 10 == 7) { - return 0; // 结束整个函数或方法 - } - printf("%d ", i); - } + char a = '1'; + char b = '2'; + char c = '&'; - printf("程序结束!\n"); + /* 12& */ + putchar(a); + putchar(b); + putchar(c); return 0; } ``` +### 1.5.7 初谈字符串(了解) + +* 在 C 语言中没有专门的字符串类型,是使用`字符数组`来模拟字符串的,即:可以使用字符数组来存储字符串。 + +> [!NOTE] +> +> * ① 在 C 语言中,`数组`和`指针`通常会一起出现,所以当`字符数组`可以保存字符串,也就意味着可以使用`指针`来间接存储字符串。 +> * ② 在 C 语言中,可以使用 `puts()` 函数输出字符串,每调用一次 `puts()` 函数,除了输出字符串之外,还会在字符串后面加上换行,即:`\n` 。 +> * ③ 在 C 语言中,可以使用 `printf()` 函数输出字符串,并且字符串对应的格式占位符是 `%s`。和 `puts()` 函数不同的是,`printf()` 函数不会在字符串后面加上换行,即:`\n`。 +> * ④ 在实际开发中,使用 `printf()` 函数居多。 + + + +* 示例: + +```c +#include + +int main() { + + // 存储字符串 + char str[] = "我"; + char *str2 = "爱你"; + + puts(str); // 我 + puts(str2); // 爱你 + + return 0; +} +``` + + + +* 示例: + +```c +#include + +int main() { + + // 存储字符串 + char str[] = "你"; + char *str2 = "是好人"; + + printf("%s\n", str); // 你 + printf("%s\n", str2); // 是好人 + + return 0; +} +``` + +## 1.6 布尔类型 + +### 1.6.1 概述 + +* 布尔值用于表示 true(真)、false(假)两种状态,通常用于逻辑运算和条件判断。 + +### 1.6.2 早期的布尔类型 + +* 在 C 语言标准(C89)中,并没有为布尔值单独设置一个数据类型,所以在判断真、假的时候,使用 `0` 表示 `false`(假),`非 0` 表示 `true`(真)。 + + + +* 示例: + +```c +#include + +int main() { + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + // 使用整型来表示真和假两种状态 + int handsome = 0; + printf("帅不帅[0 丑,1 帅]: "); + scanf("%d", &handsome); + + if (handsome) { + printf("你真的很帅!!!"); + } else { + printf("你真的很丑!!!"); + } + + return 0; +} +``` + +### 1.6.3 宏定义的布尔类型 + +* 判断真假的时候,以 `0` 为 `false`(假)、`1` 为 `true`(真),并不直观;所以,我们可以借助 C 语言的宏定义。 + + + +* 示例: + +```c +#include + +// 宏定义 +#define BOOL int +#define TRUE 1 +#define FALSE 0 + +int main() { + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + BOOL handsome = 0; + printf("帅不帅[FALSE 丑,TRUE 帅]: "); + scanf("%d", &handsome); + + if (handsome) { + printf("你真的很帅!!!"); + } else { + printf("你真的很丑!!!"); + } + + return 0; +} +``` + +### 1.6.4 C99 标准中的布尔类型 + +* 在 C99 中提供了 `_Bool` 关键字,用于表示布尔类型;其实,`_Bool`类型的值是整数类型的别名,和一般整型不同的是,`_Bool`类型的值只能赋值为 `0` 或 `1` (0 表示假、1 表示真),其它`非 0` 的值都会被存储为 `1` 。 + + + +* 示例: + +```c +#include + +int main() { + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + int temp; // 使用 int 类型的变量临时存储输入 + _Bool handsome = 0; + printf("帅不帅[0 丑,1 帅]: "); + scanf("%d", &temp); + + // 将输入值转换为 _Bool 类型 + handsome = (temp != 0); + + if (handsome) { + printf("你真的很帅!!!"); + } else { + printf("你真的很丑!!!"); + } + + return 0; +} +``` + +### 1.6.5 C99 标准头文件中的布尔类型(推荐) + +* 在 C99 中提供了一个头文件 ``,定义了 `bool` 代表 `_Bool`,`false` 代表 `0` ,`true` 代表 `1` 。 + +> [!IMPORTANT] +> +> * ① 在 C++、Java 等高级编程语言中是有 `boolean` 类型的关键字的。 +> * ② 在 C23 标准中,将一些 C11 存在的关键字改为小写并去掉前置下划线,如:`_Bool` 改为 `bool`,以前的写法主要是为了避免与旧的代码发生冲突。 +> * ③ 在 C23 标准中,加入了 `true` 和 `false` 关键字。 + + + +* 示例: + +```c +#include +#include +#include + +int main() { + + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + char input[10]; + bool handsome = false; + + printf("帅不帅[false 丑,true 帅]: "); + scanf("%s", input); // 使用 %s 读取字符串 + + // 将输入字符串转换为布尔值 + if (strcmp(input, "true") == 0) { + handsome = true; + } else if (strcmp(input, "false") == 0) { + handsome = false; + } else { + printf("无效输入!\n"); + return 1; + } + + if (handsome) { + printf("你真的很帅!!!"); + } else { + printf("你真的很丑!!!"); + } + + return 0; +} +``` + +## 1.7 数据类型转换 + +### 1.7.1 概述 + +* 在 C 语言编程中,经常需要对不同类型的数据进行运算,运算前需要先转换为同一类型,再运算。为了解决数据类型不一致的问题,需要对数据的类型进行转换。 + +### 1.7.2 自动类型转换(隐式转换) + +#### 1.7.2.1 运算过程中的自动类型转换 + +* 不同类型的数据进行混合运算的时候,会发生数据类型转换,`窄类型会自动转换为宽类型`,这样就不会造成精度损失。 + +![](./assets/14.png) + +* 转换规则: + * ① 不同类型的整数进行运算的时候,窄类型整数会自动转换为宽类型整数。 + * ② 不同类型的浮点数进行运算的时候,精度小的类型会自动转换为精度大的类型。 + * ③ 整数和浮点数进行运算的时候,整数会自动转换为浮点数。 +* 转换方向: + +![](./assets/15.png) + +> [!WARNING] +> +> 最好避免无符号整数与有符号整数的混合运算,因为这时 C 语言会自动将 signed int 转为 unsigned int ,可能不会得到预期的结果。 + + + +* 示例: + +```c +#include + +/** + * 不同的整数类型混合运算时,宽度较小的类型会提升为宽度较大的类型。 + * 比如 short 转为 int ,int 转为 long 等。 + */ +int main() { + + short s1 = 10; + + int i = 20; + + // s1 是 short 类型,i 是 int 类型。 + // 当 s1 和 i 运算的时候,会自动转为 int 类型后,然后再计算。 + int result = s1 + i; + + printf("result = %d \n", result); + + return 0; +} +``` + + + +* 示例: + +```c +#include + + +int main() { + + int n2 = -100; + unsigned int n3 = 20; + + // n2 是有符号,n3 是无符号。 + // 当 n2 和 n3 运算的时候,会自动转为无符号类型后,然后再计算。 + int result = n2 + n3; + + printf("result = %d \n", result); + + return 0; +} +``` + + + +* 示例: + +```c +#include + +/** +* 不同的浮点数类型混合运算时,宽度较小的类型转为宽度较大的类型。 +* 比如 float 转为 double ,double 转为 long double 。 +*/ +int main() { + + float f1 = 1.25f; + double d2 = 4.58667435; + + // f1 是 float 类型,d2 是 double 类型。 + // 当 f1 和 d2 运算的时候,会自动转为 double 类型后,然后再计算。 + double result = f1 + d2; + + printf("result = %.8lf \n", result); + + return 0; +} +``` + + + +* 示例: + +```c +#include + +/** + * 整型与浮点型运算,整型转为浮点型 + */ +int main() { + + int n4 = 10; + double d3 = 1.67; + + // n4 是 int 类型,d3 是 double 类型。 + // 当 n4 和 d3 运算的时候,会自动转为 double 类型后,然后再计算。 + double result = n4 + d3; + + printf("%.2lf", result); + + return 0; +} +``` + +#### 1.7.2.2 赋值时的自动类型转换 + +* 在赋值运算中,赋值号两边量的数据类型不同时,等号右边的类型将转换为左边的类型。 +* 如果窄类型赋值给宽类型,不会造成精度损失;如果宽类型赋值给窄类型,会造成精度损失。 + +![](./assets/16.png) + +> [!WARNING] +> +> C 语言在检查类型匹配方面不太严格,最好不要养成这样的习惯。 + + + +* 示例: + +```c +#include + +int main() { + + // 赋值:窄类型赋值给宽类型 + int a1 = 10; + double a2 = a1; + printf("a2: %.2f\n", a2); // a2: 10.00 + + // 转换:将宽类型转换为窄类型 + double b1 = 10.5; + int b2 = b1; + printf("b2: %d\n", b2); // b2: 10 + + return 0; +} +``` + +### 1.7.3 强制类型转换 + +* 隐式类型转换中的宽类型赋值给窄类型,编译器是会产生警告的,提示程序存在潜在的隐患,如果非常明确地希望转换数据类型,就需要用到强制(或显式)类型转换。 +* 语法: + +```c +数据类型 变量名 = (类型名)变量、常量或表达式; +``` + +> [!WARNING] +> +> 强制类型转换可能会导致精度损失!!! + + + +* 示例: + +```c +#include + +int main(){ + double d1 = 1.934; + double d2 = 4.2; + int num1 = (int)d1 + (int)d2; // d1 转为 1,d2 转为 4,结果是 5 + int num2 = (int)(d1 + d2); // d1+d2 = 6.134,6.134 转为 6 + int num3 = (int)(3.5 * 10 + 6 * 1.5); // 35.0 + 9.0 = 44.0 -> int = 44 + + printf("num1=%d \n", num1); + printf("num2=%d \n", num2); + printf("num3=%d \n", num3); + + return 0; +} +``` + +### 1.7.4 数据类型转换只是临时性的 + +* 无论是自动类型转换还是强制类型转换,都是为了本次运算而进行的临时性转换,其转换的结果只会保存在临时的内存空间,并不会改变数据原先的类型或值,如下所示: + +```c {8} +#include +int main() { + + double total = 100.12; // 总价 + int count = 2; // 总数 + double price = 0.0; // 单价 + + int totalInt = (int)total; // 强制类型转换 + + price = total / count; // 计算单价 + + printf("total = %.2lf\n", total); // total = 100.12 + printf("totalInt = %d\n", totalInt); // totalInt = 100 + printf("price = %.2lf\n", price); // price = 50.06 + + return 0; +} +``` + +* 虽然 `total` 变量,通过强制类型转换变为了 `int` 类型,才可以赋值给 `totalInt`变量;但是,这种转换并没有影响 `total` 变量本身的`类型`和`值`。 + +> [!NOTE] +> +> * ① 如果 `total` 变量的`值`或`类型`变化了,那么 `total` 的显示结果,就应该是 `100.00` ,而不是 `100.12` 。 +> * ② 那么,`price` 的结果,显而易见就应该是 `50.00` ,而不是 `50.06` 了。 + +### 1.7.5 自动类型转换 VS 强制类型转换 + +* 在 C 语言中,有些数据类型即可以自动类型转换,也可以强制类型转换,如:`int --> double`、`double --> int` 等。但是,有些数据类型只能强制类型转换,不能自动类型转换,如:`void* --> int*` 。 +* 可以自动类型转换的类型一定可以强制类型转换;但是,可以强制类型转换的类型却不一定能够自动类型转换。 + +> [!NOTE] +> +> * ① 目前学习到的数据类型,既可以自动类型转换,也可以强制类型转换。 +> * ② 后面,如果学到指针,就会发生指针有的时候,只能强制类型转换却不能自动类型转换;需要说明的是,并非所有的指针都可以强制类型转换,是有条件的,后文讲解。 + +* 可以自动类型转换的类型,在发生类型转换的时候,一般风险较低,不会给程序带来严重的后果,如:`int --> double` 就没什么毛病,而 `double --> int` 无非丢失精度而已。但是 ,只能强制类型转换的类型,在发生类型转换的时候,通常风险较高,如:`char* --> int*` 就非常奇怪,会导致取得的值也很奇怪,进而导致程序崩溃。 + +> [!IMPORTANT] +> +> * ① 在实际开发中,如果使用 C 语言进行开发,在进行强制类型转换的时候,需要小心谨慎,防止出现一些奇怪的问题,进而导致程序崩溃!!! +> * ② 现代化的高级编程语言,如:Java 等,直接屏蔽了指针。所以,在使用这些编程语言的时候,无需担心进行强制类型转换时,会出现一些奇怪的问题,进而导致程序崩溃!!! + +## 1.8 再谈数据类型 + +* 通过之前的知识,我们知道,CPU 是直接和内存打交道的,CPU 在处理数据的时候,会将数据临时存放到内存中。内存那么大,CPU 是怎么找到对应的数据的? + +* 首先,CPU 会将内存按照字节(1 Bytes = 8 bit,我们也称为存储单元)进行划分,如下所示: + +> [!NOTE] +> +> * ① 操作系统其实并不会直接操作实际的内存,而是会通过内存管理单元(MMU)来操作内存,并通过虚拟地址映射(Virtual Address Mapping)将程序使用的虚拟地址转换为物理地址。虚拟地址映射可以实现内存保护、内存共享和虚拟内存等功能,使得程序能够使用比实际物理内存更大的内存空间,同时确保程序间不会相互干扰。 +> * ② 为了方便初学者学习,后文一律会描述 CPU 直接操作内存(这种说法不严谨,但足够简单和方便理解)。 +> * ③ 这些存储单元中,存储的都是 0 和 1 这样的数据,因为计算机只能识别二进制数。 + +![](./assets/17.svg) + +* 并且,为了方便管理,每个独立的小单元格,即:存储单元,都有自己唯一的编号(内存地址),如下所示: + +> [!NOTE] +> +> 之所以,要给每个存储单元加上内存地址,就是为了`加快`数据的`存取速度`,可以类比生活中的`字典`以及`快递单号`。 + +![](./assets/18.svg) + +* 我们在定义变量的时候,是这么定义的,如下所示: + +```c +int num = 10; +``` + +> [!NOTE] +> +> 上述的代码其实透露了三个重要的信息: +> +> * ① 数据存储在哪里。 +> * ② 数据的长度是多少。 +> * ③ 数据的处理方式。 + +* 其实,在编译器对程序进行编译的时候,是这样做的,如下所示: + +> [!NOTE] +> +> * ① 编译器在编译的时候,就将变量替换为内存中存储单元的内存地址(知道了你家的门牌号),这样就可以方便的进行存取数据了(解答了上述的问题 ① )。 +> * ② 变量中其实存储的是初始化值 10 在内存中存储单元的首地址,我们也知道,数据类型 int 的存储空间是 4 个字节,那么根据首地址 + 4 个字节就可以完整的将数据从内存空间中取出来或存进去(解答了上述的问题 ② )。 +> * ③ 我们知道,数据在计算机底层的存储方式是不一样的,如:整数在计算机底层的存储就是计算机补码的方式,浮点数在计算机底层的存储类似于科学计数法;但是,字符类型在计算机底层的存储和整数以及浮点数完全不同,需要查码表,即:在存储的时候,需要先查询码表,转换为二进制进行存储;在读取的时候,也需要先查询码表,将二进制转换为对应的字符(解答了上述的问题 ③ )。 + +> [!IMPORTANT] +> +> * ① 数据类型只在定义变量的时候声明,而且必须声明;在使用变量的时候,就无需再声明,因为此时的数据类型已经确定的。 +> * ② 在实际开发中,我们通常将普通变量等价于内存中某个区域的值(底层到底是怎么转换的,那是编译器帮我们完成的,我们通常无需关心,也没必要关心)。 +> * ③ 某些动态的编程语言,如:JavaScript ,在定义变量的时候,是不需要给出数据类型的,编译器会根据赋值情况自动推断出变量的数据类型,貌似很智能;但是,这无疑增加了编译器的工作,降低了程序的性能(动态一时爽,重构火葬场,说的就是动态编程语言,不适合大型项目的开发;所以,之后微软推出了 TypeScript ,就是为了给 JavaScript 增加强类型系统,以提高开发和运行效率)。 + +* 程序中的变量在内存中的表示,就是这样的,如下所示: + +![](./assets/19.svg) + + + +# 第二章:运算符(⭐) + +## 2.1 概述 + +* 运算符是一种特殊的符号,用于数据的运算、赋值和比较等。 +* `表达式`指的是一组运算数、运算符的组合,表达式`一定具有值`,一个变量或一个常量可以是表达式,变量、常量和运算符也可以组成表达式,如: + +![](./assets/20.svg) + +* `操作数`指的是`参与运算`的`值`或者`对象`,如: + +![](./assets/21.svg) + +* 根据`操作数`的`个数`,可以将运算符分为: + * 一元运算符(一目运算符)。 + * 二元运算符(二目运算符)。 + * 三元运算符(三目运算符)。 +* 根据`功能`,可以将运算符分为: + * 算术运算符。 + * 关系运算符(比较运算符)。 + * 逻辑运算符。 + * 赋值运算符。 + * 逻辑运算符。 + * 位运算符。 + * 三元运算符。 + + +> [!NOTE] +> +> 掌握一个运算符,需要关注以下几个方面: +> +> * ① 运算符的含义。 +> * ② 运算符操作数的个数。 +> * ③ 运算符所组成的表达式。 +> * ④ 运算符有无副作用,即:运算后是否会修改操作数的值。 + +## 2.2 算术运算符 + +* 算术运算符是对数值类型的变量进行运算的,如下所示: + +| 运算符 | 描述 | 操作数个数 | 组成的表达式的值 | 副作用 | +| ------ | ------------ | ---------- | ------------------------ | ------ | +| `+` | 正号 | 1 | 操作数本身 | ❎ | +| `-` | 负号 | 1 | 操作数符号取反 | ❎ | +| `+` | 加号 | 2 | 两个操作数之和 | ❎ | +| `-` | 减号 | 2 | 两个操作数之差 | ❎ | +| `*` | 乘号 | 2 | 两个操作数之积 | ❎ | +| `/` | 除号 | 2 | 两个操作数之商 | ❎ | +| `%` | 取模(取余) | 2 | 两个操作数相除的余数 | ❎ | +| `++` | 自增 | 1 | 操作数自增前或自增后的值 | ✅ | +| `--` | 自减 | 1 | 操作数自减前或自减后的值 | ✅ | + +> [!NOTE] +> +> 自增和自减: +> +> * ① 自增、自减运算符可以写在操作数的前面也可以写在操作数后面,不论前面还是后面,对操作数的副作用是一致的。 +> * ② 自增、自减运算符在前在后,对于表达式的值是不同的。 如果运算符在前,表达式的值是操作数自增、自减之后的值;如果运算符在后,表达式的值是操作数自增、自减之前的值。 +> * ③ `变量前++`:变量先自增 1 ,然后再运算;`变量后++`:变量先运算,然后再自增 1 。 +> * ④ `变量前--`:变量先自减 1 ,然后再运算;`变量后--`:变量先运算,然后再自减 1 。 +> * ⑤ 对于 `i++` 或 `i--` ,各种编程语言的用法和支持是不同的,例如:C/C++、Java 等完全支持,Python 压根一点都不支持,Go 语言虽然支持 `i++` 或 `i--` ,却只支持这些操作符作为独立的语句,并且不能嵌入在其它的表达式中。 + + + +* 示例:正号和负号 + +```c +#include + +int main() { + + int x = 12; + int x1 = -x, x2 = +x; + + int y = -67; + int y1 = -y, y2 = +y; + + printf("x1=%d, x2=%d \n", x1, x2); // x1=-12, x2=12 + printf("y1=%d, y2=%d \n", y1, y2); // y1=67, y2=-67 + + return 0; +} +``` + + + +* 示例:加、减、乘、除(整数之间做除法时,结果只保留整数部分而舍弃小数部分)、取模 + +```c +#include + +int main() { + + int a = 5; + int b = 2; + + printf("%d + %d = %d\n", a, b, a + b); // 5 + 2 = 7 + printf("%d - %d = %d\n", a, b, a - b); // 5 - 2 = 3 + printf("%d × %d = %d\n", a, b, a * b); // 5 × 2 = 10 + printf("%d / %d = %d\n", a, b, a / b); // 5 / 2 = 2 + printf("%d %% %d = %d\n", a, b, a % b); // 5 % 2 = 1 + + return 0; +} +``` + + + +* 示例:取模(运算结果的符号与被模数也就是第一个操作数相同。) + +```c +#include + +int main() { + + int res1 = 10 % 3; + printf("10 %% 3 = %d\n", res1); // 10 % 3 = 1 + + int res2 = -10 % 3; + printf("-10 %% 3 = %d\n", res2); // -10 % 3 = -1 + + int res3 = 10 % -3; + printf("10 %% -3 = %d\n", res3); // 10 % -3 = 1 + + int res4 = -10 % -3; + printf("-10 %% -3 = %d\n", res4); // -10 % -3 = -1 + + return 0; +} +``` + + + +* 示例:自增和自减 + +```c +#include + +int main() { + + int i1 = 10, i2 = 20; + int i = i1++; + printf("i = %d\n", i); // i = 10 + printf("i1 = %d\n", i1); // i1 = 11 + + i = ++i1; + printf("i = %d\n", i); // i = 12 + printf("i1 = %d\n", i1); // i1 = 12 + + i = i2--; + printf("i = %d\n", i); // i = 20 + printf("i2 = %d\n", i2); // i2 = 19 + + i = --i2; + printf("i = %d\n", i); // i = 18 + printf("i2 = %d\n", i2); // i2 = 18 + + return 0; + +``` + + + +* 示例: + +```c +#include + +/* + 随意给出一个整数,打印显示它的个位数,十位数,百位数的值。 + 格式如下: + 数字xxx的情况如下: + 个位数: + 十位数: + 百位数: + 例如: + 数字153的情况如下: + 个位数:3 + 十位数:5 + 百位数:1 + */ +int main() { + + int num = 153; + + int bai = num / 100; + int shi = num % 100 / 10; + int ge = num % 10; + printf("百位为:%d \n", bai); + printf("十位为:%d \n", shi); + printf("个位为:%d \n", ge); + + return 0; +} +``` + +## 2.3 关系运算符(比较运算符) + +* 常见的关系运算符,如下所示: + +| 运算符 | 描述 | 操作数个数 | 组成的表达式的值 | 副作用 | +| ------ | -------- | ---------- | ---------------- | ------ | +| `==` | 相等 | 2 | 0 或 1 | ❎ | +| `!=` | 不相等 | 2 | 0 或 1 | ❎ | +| `<` | 小于 | 2 | 0 或 1 | ❎ | +| `>` | 大于 | 2 | 0 或 1 | ❎ | +| `<=` | 小于等于 | 2 | 0 或 1 | ❎ | +| `>=` | 大于等于 | 2 | 0 或 1 | ❎ | + +> [!NOTE] +> +> * ① C 语言中,没有严格意义上的布尔类型,可以使用 0(假) 或 1(真)表示布尔类型的值。 +> * ② 不要将 `==` 写成 `=`,`==` 是比较运算符,而 `=` 是赋值运算符。 +> * ③ `>=` 或 `<=`含义是只需要满足 `大于或等于`、`小于或等于`其中一个条件,结果就返回真。 + + + +* 示例: + +```c +#include + +int main() { + + int a = 8; + int b = 7; + + printf("a > b 的结果是:%d \n", a > b); // a > b 的结果是:1 + printf("a >= b 的结果是:%d \n", a >= b); // a >= b 的结果是:1 + printf("a < b 的结果是:%d \n", a < b); // a < b 的结果是:0 + printf("a <= b 的结果是:%d \n", a <= b); // a <= b 的结果是:0 + printf("a == b 的结果是:%d \n", a == b); // a == b 的结果是:0 + printf("a != b 的结果是:%d \n", a != b); // a != b 的结果是:1 + + return 0; +} +``` + +## 2.4 逻辑运算符 + +* 常见的逻辑运算符,如下所示: + +| 运算符 | 描述 | 操作数个数 | 组成的表达式的值 | 副作用 | +| ------ | ------ | ---------- | ---------------- | ------ | +| `&&` | 逻辑与 | 2 | 0 或 1 | ❎ | +| `\|\|` | 逻辑或 | 2 | 0 或 1 | ❎ | +| `!` | 逻辑非 | 2 | 0 或 1 | ❎ | + +* 逻辑运算符提供逻辑判断功能,用于构建更复杂的表达式,如下所示: + +| a | b | a && b | a \|\| b | !a | +| ------- | ------- | ------- | -------- | ------- | +| 1(真) | 1(真) | 1(真) | 1(真) | 0(假) | +| 1(真) | 0(假) | 0(假) | 1(真) | 0(假) | +| 0(假) | 1(真) | 0(假) | 1(真) | 1(真) | +| 0(假) | 0(假) | 0(假) | 0(假) | 1(真) | + +> [!NOTE] +> +> * ① 对于逻辑运算符来说,任何`非零值`都表示`真`,`零值`表示`假`,如:`5 || 0` 返回 `1` ,`5 && 0` 返回 `0` 。 +> * ② 逻辑运算符的理解: +> * `&&` 的理解就是:`两边条件,同时满足`。 +> * `||`的理解就是:`两边条件,二选一`。 +> * `!` 的理解就是:`条件取反`。 +> * ③ 短路现象: +> * 对于 `a && b` 操作来说,当 a 为假(或 0 )时,因为 `a && b` 结果必定为 0,所以不再执行表达式 b。 +> * 对于 `a || b` 操作来说,当 a 为真(或非 0 )时,因为 `a || b` 结果必定为 1,所以不再执行表达式 b。 + + + +* 示例: + +```c +#include + +int main() { + + int a = 0; + int b = 0; + + printf("请输入整数a的值:"); + scanf("%d", &a); + printf("请输入整数b的值:"); + scanf("%d", &b); + + if (a > b) { + printf("%d > %d", a, b); + } else if (a < b) { + printf("%d < %d", a, b); + } else { + printf("%d = %d", a, b); + } + + return 0; +} +``` + + + +* 示例: + +```c +#include + +// 短路现象 +int main() { + + int i = 0; + int j = 10; + if (i && j++ > 0) { + printf("床前明月光\n"); // 这行代码不会执行 + } else { + printf("我叫郭德纲\n"); + } + printf("%d \n", j); //10 + + return 0; +} +``` + + + +* 示例: + +```c +#include + +// 短路现象 + +int main() { + + int i = 1; + int j = 10; + if (i || j++ > 0) { + printf("床前明月光 \n"); + } else { + printf("我叫郭德纲 \n"); // 这行代码不会被执行 + } + printf("%d\n", j); //10 + + return 0; +} +``` + +## 2.5 赋值运算符 + +* 常见的赋值运算符,如下所示: + +| 运算符 | 描述 | 操作数个数 | 组成的表达式的值 | 副作用 | +| ------ | ------------ | ---------- | ---------------- | ------ | +| `==` | 赋值 | 2 | 左边操作数的值 | ✅ | +| `+=` | 相加赋值 | 2 | 左边操作数的值 | ✅ | +| `-=` | 相减赋值 | 2 | 左边操作数的值 | ✅ | +| `*=` | 相乘赋值 | 2 | 左边操作数的值 | ✅ | +| `/=` | 相除赋值 | 2 | 左边操作数的值 | ✅ | +| `%=` | 取余赋值 | 2 | 左边操作数的值 | ✅ | +| `<<=` | 左移赋值 | 2 | 左边操作数的值 | ✅ | +| `>>=` | 右移赋值 | 2 | 左边操作数的值 | ✅ | +| `&=` | 按位与赋值 | 2 | 左边操作数的值 | ✅ | +| `^=` | 按位异或赋值 | 2 | 左边操作数的值 | ✅ | +| `\|=` | 按位或赋值 | 2 | 左边操作数的值 | ✅ | + +> [!NOTE] +> +> * ① 赋值运算符的第一个操作数(左值)必须是变量的形式,第二个操作数可以是任何形式的表达式。 +> * ② 赋值运算符的副作用针对第一个操作数。 + + + +* 示例: + +```c +#include + +int main() { + + int a = 3; + a += 3; // a = a + 3 + printf("a = %d\n", a); // a = 6 + + int b = 3; + b -= 3; // b = b - 3 + printf("b = %d\n", b); // b = 0 + + int c = 3; + c *= 3; // c = c * 3 + printf("c = %d\n", c); // c = 9 + + int d = 3; + d /= 3; // d = d / 3 + printf("d = %d\n", d); // d = 1 + + int e = 3; + e %= 3; // e = e % 3 + printf("e = %d\n", e); // e = 0 + + return 0; +} +``` + +## 2.6 位运算符(了解) + +### 2.6.1 概述 + +* C 语言提供了一些位运算符,能够让我们操作二进制位(bit)。 +* 常见的位运算符,如下所示。 + +| 运算符 | 描述 | 操作数个数 | 运算规则 | 副作用 | +| ------ | ---------- | ---------- | ------------------------------------------------------------ | ------ | +| `&` | 按位与 | 2 | 两个二进制位都为 1 ,结果为 1 ,否则为 0 。 | ❎ | +| `\|` | 按位或 | 2 | 两个二进制位只要有一个为 1(包含两个都为 1 的情况),结果为 1 ,否则为 0 。 | ❎ | +| `^` | 按位异或 | 2 | 两个二进制位一个为 0 ,一个为 1 ,结果为 1,否则为 0 。 | ❎ | +| `~` | 按位取反 | 2 | 将每一个二进制位变成相反值,即 0 变成 1 , 1 变 成 0 。 | ❎ | +| `<<` | 二进制左移 | 2 | 将一个数的各二进制位全部左移指定的位数,左 边的二进制位丢弃,右边补 0。 | ❎ | +| `>>` | 二进制右移 | 2 | 将一个数的各二进制位全部右移指定的位数,正数左补 0,负数左补 1,右边丢弃。 | ❎ | + +> [!NOTE] +> +> 操作数在进行位运算的时候,以它的补码形式计算!!! + +### 2.6.2 输出二进制位 + +* 在 C 语言中,`printf` 是没有提供输出二进制位的格式占位符的;但是,我们可以手动实现,以方便后期操作。 + + + +* 示例: + +```c +#include + +/** + * 获取指定整数的二进制表示 + * @param num 整数 + * @return 二进制表示的字符串,不包括前导的 '0b' 字符 + */ +char* getBinary(int num) { + static char binaryString[33]; + int i, j; + + for (i = sizeof(num) * 8 - 1, j = 0; i >= 0; i--, j++) { + const int bit = (num >> i) & 1; + binaryString[j] = bit + '0'; + } + + binaryString[j] = '\0'; + return binaryString; +} + +int main() { + + int a = 17; + int b = -12; + + printf("整数 %d 的二进制表示:%s \n", a, getBinary(a)); + printf("整数 %d 的二进制表示:%s \n", b, getBinary(b)); + + return 0; +} +``` + +### 2.6.3 按位与 + +* 按位与 `&` 的运算规则是:如果二进制对应的位上都是 1 才是 1 ,否则为 0 ,即: + * `1 & 1` 的结果是 `1` 。 + * `1 & 0` 的结果是 `0` 。 + * `0 & 1` 的结果是 `0` 。 + * `0 & 0` 的结果是 `0` 。 + + + +* 示例:`9 & 7 = 1` + +![](./assets/22.svg) + + + +* 示例:`-9 & 7 = 7` + +![](./assets/23.svg) + +### 2.6.4 按位或 + +* 按位与 `|` 的运算规则是:如果二进制对应的位上只要有 1 就是 1 ,否则为 0 ,即: + * `1 | 1` 的结果是 `1` 。 + * `1 | 0` 的结果是 `1` 。 + * `0 | 1` 的结果是 `1` 。 + * `0 | 0` 的结果是 `0` 。 + + + +* 示例:`9 | 7 = 15` + +![](./assets/24.svg) + + + +* 示例:`-9 | 7 = -9` + +![](./assets/25.svg) + +### 2.6.5 按位异或 + +* 按位与 `^` 的运算规则是:如果二进制对应的位上一个为 1 一个为 0 就为 1 ,否则为 0 ,即: + * `1 ^ 1` 的结果是 `0` 。 + * `1 ^ 0` 的结果是 `1` 。 + * `0 ^ 1` 的结果是 `1` 。 + * `0 ^ 0` 的结果是 `0` 。 + +> [!NOTE] +> +> 按位异或的场景有: +> +> * ① 交换两个数值:异或操作可以在不使用临时变量的情况下交换两个变量的值。 +> * ② 加密或解密:异或操作用于简单的加密和解密算法。 +> * ③ 错误检测和校正:异或操作可以用于奇偶校验位的计算和检测错误(RAID-3 以及以上)。 +> * …… + + + +* 示例:`9 ^ 7 = 14` + +![](./assets/26.svg) + + + +* 示例:`-9 ^ 7 = -16` + +![](./assets/27.svg) + +### 2.6.6 按位取反 + +* 运算规则:如果二进制对应的位上是 1,则结果为 0;如果是 0 ,则结果为 1 。 + * `~0` 的结果是 `1` 。 + * `~1` 的结果是 `0` 。 + + + +* 示例:`~9 = -10` + +![](./assets/28.svg) + + + +* 示例:`~-9 = 8` + +![](./assets/29.svg) + +### 2.6.7 二进制左移 + +* 在一定范围内,数据每向左移动一位,相当于原数据 × 2。(正数、负数都适用) + + + +* 示例:`3 << 4 = 48` (3 × 2^4) + + ![](./assets/30.svg) + + + +* 示例:`-3 << 4 = -48` (-3 × 2 ^4) + +![](./assets/31.svg) + +### 2.6.8 二进制右移 + +* 在一定范围内,数据每向右移动一位,相当于原数据 ÷ 2。(正数、负数都适用) + +> [!NOTE] +> +> * ① 如果不能整除,则向下取整。 +> * ② 右移运算符最好只用于无符号整数,不要用于负数。因为不同系统对于右移后如何处理负数的符号位,有不同的做法,可能会得到不一样的结果。 + + + +* 示例:`69 >> 4 = 4` (69 ÷ 2^4 ) + +![](./assets/32.svg) + + + +* 示例:`-69 >> 4 = -5` (-69 ÷ 2^4 ) + +![](./assets/33.svg) + +## 2.7 三元运算符 + +* 语法: + +```c +条件表达式 ? 表达式1 : 表达式2 ; +``` + +> [!NOTE] +> +> * 如果条件表达式为非 0 (真),则整个表达式的值是表达式 1 。 +> * 如果条件表达式为 0 (假),则整个表达式的值是表达式 2 。 + + + +* 示例: + +```c +#include + +int main() { + + int m = 110; + int n = 20; + int result = m > n ? m : n; + printf("result = %d\n", result); // result = 110 + + return 0; +} +``` + +## 2.8 运算符优先级 + +* 在数学中,如果一个表达式是 `a + b * c` ,我们知道其运算规则就是:先算乘除再算加减。其实,在 C 语言中也是一样的,先算乘法再算加减,即:C 语言中乘除的运算符比加减的运算符的优先级要高。 + +> [!NOTE] +> +> 所谓`优先级`,就是当多个运算符出现在同一个表达式中时,先执行哪个运算符。 + +* C 语言中运算符的优先级有几十个,有的运算符优先级不同,有的运算符优先级相同,如下所示: + +| **优先级** | **运算符** | **名称或含义** | **结合方向** | +| ---------- | ---------- | ---------------- | ------------- | +| **1** | `[]` | 数组下标 | ➡️(从左到右) | +| | `()` | 圆括号 | | +| | `.` | 成员选择(对象) | | +| | `->` | 成员选择(指针) | | +| **2** | `-` | 负号运算符 | ⬅️(从右到左) | +| | `(类型)` | 强制类型转换 | | +| | `++` | 自增运算符 | | +| | `--` | 自减运算符 | | +| | `*` | 取值运算符 | | +| | `&` | 取地址运算符 | | +| | `!` | 逻辑非运算符 | | +| | `~` | 按位取反运算符 | | +| | `sizeof` | 长度运算符 | | +| **3** | `/` | 除 | ➡️(从左到右) | +| | `*` | 乘 | | +| | `%` | 余数(取模) | | +| **4** | `+` | 加 | ➡️(从左到右) | +| | `-` | 减 | | +| **5** | `<<` | 左移 | ➡️(从左到右) | +| | `>>` | 右移 | | +| **6** | `>` | 大于 | ➡️(从左到右) | +| | `>=` | 大于等于 | | +| | `<` | 小于 | | +| | `<=` | 小于等于 | | +| **7** | `==` | 等于 | ➡️(从左到右) | +| | `!=` | 不等于 | | +| **8** | `&` | 按位与 | ➡️(从左到右) | +| **9** | `^` | 按位异或 | ➡️(从左到右) | +| **10** | `\|` | 按位或 | ➡️(从左到右) | +| **11** | `&&` | 逻辑与 | ➡️(从左到右) | +| **12** | `\|\|` | 逻辑或 | ➡️(从左到右) | +| **13** | `?:` | 条件运算符 | ⬅️(从右到左) | +| **14** | `=` | 赋值运算符 | ⬅️(从右到左) | +| | `/=` | 除后赋值 | | +| | `*=` | 乘后赋值 | | +| | `%=` | 取模后赋值 | | +| | `+=` | 加后赋值 | | +| | `-=` | 减后赋值 | | +| | `<<=` | 左移后赋值 | | +| | `>>=` | 右移后赋值 | | +| | `&=` | 按位与后赋值 | | +| | `^=` | 按位异或后赋值 | | +| | `\|=` | 按位或后赋值 | | +| **15** | `,` | 逗号运算符 | ➡️(从左到右) | + +> [!WARNING] +> +> * ① 不要过多的依赖运算符的优先级来控制表达式的执行顺序,这样可读性太差,尽量`使用小括号来控制`表达式的执行顺序。 +> * ② 不要把一个表达式写得过于复杂,如果一个表达式过于复杂,则把它`分成几步`来完成。 +> * ③ 运算符优先级不用刻意地去记忆,总体上:一元运算符 > 算术运算符 > 关系运算符 > 逻辑运算符 > 三元运算符 > 赋值运算符。 + + + +# 第三章:附录 + +## 3.1 字符集和字符集编码 + +### 3.3.1 概述 + +* 字符集和字符集编码(简称编码)计算机系统中处理文本数据的两个基本概念,它们密切相关但又有区别。 +* 字符集(Character Set)是一组字符的集合,其中每个字符都被分配了一个`唯一的编号`(通常是数字)。字符可以是字母、数字、符号、控制代码(如换行符)等。`字符集定义了可以表示的字符的范围`,但它并不直接定义如何将这些字符存储在计算机中。 + +> [!NOTE] +> +> ASCII(美国信息交换标准代码)是最早期和最简单的字符集之一,它只包括了英文字母、数字和一些特殊字符,共 128 个字符。每个字符都分配给了一个从 0 到 127 的数字。 + +* 字符集编码(Character Encoding,简称编码)是一种方案或方法,`它定义了如何将字符集中的字符转换为计算机存储和传输的数据(通常是一串二进制数字)`。简而言之,编码是字符到二进制数据之间的映射规则。 + +> [!NOTE] +> +> ASCII 编码方案定义了如何将 ASCII 字符集中的每个字符表示为 7 位的二进制数字。例如:大写字母`'A'`在 ASCII 编码中表示为二进制的`1000001`,十进制的 `65` 。 + +* `字符集`和`字符集编码`之间的关系如下: + +![](./assets/35.png) + +* Linux 中安装帮助手册: + +![](./assets/36.gif) + +### 3.3.2 ASCII 编码 + +* 从`冯·诺依曼`体系结构中,我们知道,计算机中所有的`数据`和`指令`都是以`二进制`的形式表示的;所以,计算机中对于文本数据的数据也是以二进制来存储的,那么对应的流程如下: + +![](./assets/37.png) + +* 我们知道,计算机是上个世纪 60 年代在美国研制成功的,为了实现字符和二进制的转换,美国就制定了一套字符编码,即英语字符和二进制位之间的关系,即 ASCII (American Standard Code for Information Interchange)编码: + - ASCII 编码只包括了英文字符、数字和一些特殊字符,一共 128 个字符,并且每个字符都分配了唯一的数字,范围是 0 - 127。 + - ASCII 编码中的每个字符都使用 7 位的二进制数字表示;但是,计算机中的存储的最小单位是 1 B = 8 位,那么最高位统一规定为 0 。 + +> [!NOTE] +> +> - ① 其实,早期是没有字符集的概念的,只是后来为了解决乱码问题,而产生了字符集的概念。 +> - ② 对于英文体系来说,`a-zA-Z0-9`以及一些`特殊字符`一共 `128` 就可以满足实际存储需求;所以,在也是为什么 ASCII 码使用 7 位二进制(2^7 = 128 )来存储的。 + +* 在操作系统中,就内置了对应的编码表,Linux 也不例外;可以使用如下的命令查看: + +```shell +man ascii +``` + +![](./assets/38.gif) + +* 其对应的 ASCII 编码表,如下所示: + +![](./assets/39.gif) + +* 但是,随着计算机的发展,计算机开始了东征之路,由美国传播到东方: + +![](./assets/40.png) + +- 先是传播到了欧洲,欧洲在兼容 ASCII 编码的基础上,推出了 ISO8859-1 编码,即: + - ISO8859-1 编码包括基本的拉丁字母表、数字、标点符号,以及西欧语言中特有的一些字符,如:法语中的 `è`、德语中的 `ü` 等。 + - ISO 8859-1 为每个字符分配一个单字节(8 位)编码,意味着它可以表示最多 256 (2^8)个不同的字符(编号从 0 到 255)。 + - ISO 8859-1 的前 128 个字符与 ASCII 编码完全一致,这使得 ASCII 编码的文本可以无缝转换为 ISO 8859-1 编码。 + +![](./assets/41.gif) + +![](./assets/42.gif) + +- 计算机继续传播到了亚洲,亚洲(双字节)各个国家分别给出了自己国家对应的字符集编码,如: + - 日本推出了 Shift-JIS 编码: + - 单字节 ASCII 范围:0 - 127。 + - 双字节范围: + - 第一个字节:129 - 159 和 224 - 239 。 + - 第二个字节:64 - 126 和 128 - 252 。 + - 韩国推出了 EUC-KR 编码: + - 单字节 ASCII 范围:0 - 127。 + - 双字节范围:从 41281 - 65278。 + - 中国推出了 GBK 编码: + - 单字节 ASCII 范围:0 - 127。 + - 双字节范围:33088 - 65278 。 + +> [!NOTE] +> +> - ① 通过上面日本、韩国、中国的编码十进制范围,我们可以看到,虽然这些编码系统在技术上的编码范围存在重叠(特别是在高位字节区域),但因为它们各自支持的字符集完全不同,所以实际上它们并不直接冲突。 +> - ② 但是,如果一个中国人通过 GBK 编码写的文章,通过邮件发送给韩国人,因为韩国和中国在字符集编码上的高位字节有重叠部分,必然会造成歧义。 + +### 3.3.3 Unicode 编码 + +- 在 Unicode 之前,世界上存在着数百种不同的编码系统,每一种编码系统都是为了支持特定语言或一组语言的字符集。这些编码系统,包括:ASCII、ISO 8859 系列、GBK、Shift-JIS、EUC-KR 等,它们各自有不同的字符范围和编码方式。这种多样性虽然在局部范围内解决了字符表示的问题,但也带来了以下几个方面的挑战: + - `编码冲突`:由于不同的编码系统可以为相同的字节值分配不同的字符,因此在不同编码之间转换文本时,如果没有正确处理编码信息,就很容易产生乱码。这种编码冲突在尝试处理多种语言的文本时尤为突出。 + - `编码的复杂性`:随着全球化的发展,软件和系统需要支持越来越多的语言,这就要求开发者和系统同时处理多种不同的编码系统。这不仅增加了开发和维护的复杂性,而且也增加了出错的风险。 + - `资源限制`:在早期计算机技术中,内存和存储资源相对有限。不同的编码标准要求系统存储多套字符集数据,这无疑增加了对有限资源的消耗。 + - …… +- 针对上述的种种问题,为了推行全球化,Unicode 应运而生,Unicode 的核心规则和设计原则是建立一个全球统一的字符集,使得世界上所有的文字和符号都能被唯一地识别和使用,无论使用者位于何地或使用何种语言。这套规则包括了字符的编码、表示、处理和转换机制,旨在确保不同系统和软件间能够无缝交换和处理文本数据。 + - `通用字符集 (UCS)`:Unicode 为每一个字符分配一个唯一的编号(称为`“码点”`)。这些码点被组织在一个统一的字符集中,官方称之为 “通用字符集”(Universal Character Set,UCS)。码点通常表示为 `U+` 后跟一个十六进制数,例如:`U+0041` 代表大写的英文字母 `“A”`。 + - `编码平面和区段`:Unicode 码点被划分为多个 “平面(Planes)”,每个平面包含 65536(16^4)个码点。目前,Unicode定义了 17 个平面(从 0 到16),每个平面被分配了一个编号,从 “基本多文种平面(BMP)” 的 0 开始,到 16 号平面结束。这意味着 Unicode 理论上可以支持超过 110万(17*65536)个码点。 + +- Unicode 仅仅只是字符集,给每个字符设置了唯一的数字编号而已,却没有给出这些数字编号实际如何存储,可以通过如下命令查看: + +![](./assets/43.gif) + +- 为了在计算机系统中表示 Unicode 字符,定义了几种编码方案,这些方案包括 UTF-8、UTF-16 和 UTF-32 等。 + - **UTF-8**:使用 1 - 4 个字节表示每个 Unicode 字符,兼容 ASCII,是网络上最常用的编码。 + - **UTF-16**:使用 2 - 4 个字节表示每个 Unicode 字符,适合于需要经常处理基本多文种平面之外字符的应用。 + - **UTF-32**:使用固定的 4 个字节表示每个 Unicode 字符,简化了字符处理,但增加了存储空间的需求。 + +> [!NOTE] +> +> * ① 只有 UTF-8 兼容 ASCII,UTF-32 和 UTF-16 都不兼容 ASCII,因为它们没有单字节编码。 +> * UTF-8 使用尽量少的字节来存储一个字符,不但能够节省存储空间,而且在网络传输时也能节省流量,所以很多纯文本类型的文件,如:各种编程语言的源文件、各种日志文件和配置文件等以及绝大多数的网页,如:百度、新浪、163 等都采用 UTF-8 编码。但是,UTF-8 的缺点是效率低,不但在存储和读取时都要经过转换,而且在处理字符串时也非常麻烦。例如:要在一个 UTF-8 编码的字符串中找到第 10 个字符,就得从头开始一个一个地检索字符,这是一个很耗时的过程,因为 UTF-8 编码的字符串中每个字符占用的字节数不一样,如果不从头遍历每个字符,就不知道第 10 个字符位于第几个字节处,就无法定位。不过,随着算法的逐年精进,UTF-8 字符串的定位效率也越来越高了,往往不再是槽点了。 +> * UTF-32 是“以空间换效率”,正好弥补了 UTF-8 的缺点,UTF-32 的优势就是效率高:UTF-32 在存储和读取字符时不需要任何转换,在处理字符串时也能最快速地定位字符。例如:在一个 UTF-32 编码的字符串中查找第 10 个字符,很容易计算出它位于第 37 个字节处,直接获取就行,不用再逐个遍历字符了,没有比这更快的定位字符的方法了。但是,UTF-32 的缺点也很明显,就是太占用存储空间了,在网络传输时也会消耗很多流量。我们平常使用的字符编码值一般都比较小,用一两个字节存储足以,用四个字节简直是暴殄天物,甚至说是不能容忍的,所以 UTF-32 在应用上不如 UTF-8 和 UTF-16 广泛。 +> * UTF-16 可以看做是 UTF-8 和 UTF-32 的折中方案,它平衡了存储空间和处理效率的矛盾。对于常用的字符,用两个字节存储足以,这个时候 UTF-16 是不需要转换的,直接存储字符的编码值即可。 +> * ② 总而言之,**UTF-8** 编码兼容性强,适合大多数应用,特别是英文文本处理。**UTF-16** 编码适合处理大量亚洲字符,但在处理英文或其他拉丁字符时相对浪费空间。**UTF-32**编码简单直接,但非常浪费空间,适合需要固定字符宽度的特殊场景。 +> * ③ 在实际应用中,UTF-8 通常是最常用的编码方式,因为它在兼容性和空间效率之间提供了良好的平衡。 + +> [!IMPORTANT] +> +> * ① Windows 内核、.NET Framework、Java String 内部采用的都是 `UTF-16` 编码,主要原因是为了在兼顾字符处理效率的同时,能够有效处理多种语言的字符集,即:历史遗留问题、兼容性要求和多语言支持的需要。 +> * ② 不过,UNIX 家族的操作系统(Linux、Mac OS、iOS 等)内核都采用 `UTF-8` 编码,主要是为了兼容性和灵活性,因为 UTF-8 编码可以无缝处理 ASCII 字符,同时也能够支持多字节的 Unicode 字符,即:为了最大限度地兼容 ASCII,同时保持系统的简单性、灵活性和效率。 + + + +- `Unicode 字符集`和对应的`UTF-8 字符编码`之间的关系,如下所示: + +![](./assets/44.png) + +>[!NOTE] +> +>`宽字符`和`窄字符`是编程和计算机系统中对字符类型的一种分类,主要用于描述字符在内存中的表示形式及其与编码方式的关系。 +> +>* ① `窄字符`通常指使用单个字节(8 位)来表示的字符。在许多传统的编码系统中,窄字符通常代表 ASCII 字符或其它单字节字符集中的字符。换言之,`窄字符`适合处理简单的单字节字符集,如:ASCII,适用于处理西方语言的应用。 +>* ② `宽字符`指使用多个字节(通常是两个或更多)来表示的字符。这些字符通常用于表示比 ASCII 范围更广的字符集,如 Unicode 字符。换言之,`宽字符`适合处理多字节字符集,如:UTF-32、UTF-16 等,适用于需要处理多种语言和符号的国际化应用。 +> +>在现代编程中,`窄字符`通常与 `UTF-8` 编码关联,特别是在处理文本输入、输出和网络传输时。尽管 `UTF-8` 是变长编码,由于其高效的空间利用和对 `ASCII` 的优化,通常与`窄字符`概念关联。而`宽字符`通常与 `UTF-16` 编码或 `UTF-32`编码关联,这些编码使用更大的固定或半固定长度来表示字符,适合处理更大的字符集。 + +## 3.2 WSL2 中设置默认编码为中文 + +### 3.2.1 概述 + +* 查看 WSL2 的 Linux 发行版的默认编码: + +```shell +echo $LANG +``` + +![](./assets/45.gif) + +> [!NOTE] +> +> `C.UTF-8` 是一种字符编码设置,结合了 `C` 区域设定和 `UTF-8` 字符编码。 +> +> * ① **C 区域设定**:这是一个标准的、最小化的区域设置,通常用于系统默认的语言环境。`C` 区域设定下,所有字符都被认为是 ASCII 字符集的一部分,这意味着仅支持基本的英文字符和符号。在 `C` 区域设定中,字符串的排序和比较是基于简单的二进制值比较,这与本地化的语言设置相比相对简单。 +> * ② **UTF-8 编码**:UTF-8 是一种变长的字符编码方式,可以编码所有的 Unicode 字符。它是一种广泛使用的字符编码,能够支持多种语言和符号。每个 UTF-8 字符可以由1到4个字节表示,这使得它兼容 ASCII(对于标准 ASCII 字符,UTF-8 只使用一个字节)。 +> +> 因此,`C.UTF-8` 结合了 `C` 区域设定和 UTF-8 字符编码的优势。使用 `C.UTF-8` 时,系统默认语言环境保持简单和高效,同时支持更广泛的字符集,特别是多语言和非英语字符。这样可以在需要兼容性的同时,提供对全球化字符的支持。 + +### 3.2.2 AlmaLinux9 设置默认编码 + +* ① 搜索中文语言包: + +```shell +dnf search locale zh +``` + +![](./assets/46.gif) + +* ② 安装中文语言包: + +```shell +dnf -y install glibc-langpack-zh +``` + +![](./assets/47.gif) + +* ③ 切换语言环境为中文: + +```shell +localectl set-locale LANG=zh_CN.UTF-8 +``` + +![](./assets/48.gif) + +* ④ 手动加载配置文件,使其生效: + +```shell +source /etc/locale.conf +``` + +![](./assets/49.gif) + +### 3.2.3 Ubuntu 22.04 设置默认编码 + +* ① 安装中文语言包: + +```shell +apt update -y && apt install language-pack-zh-hans -y +``` + +![](./assets/50.gif) + +* ② 切换环境为中文: + +```shell +update-locale LANG=zh_CN.UTF-8 LANGUAGE=zh_CN:zh +``` + +![](./assets/51.gif) + +* ③ 手动加载配置文件,使其生效: + +```shell +source /etc/default/locale +``` + +![](./assets/52.gif) + +## 3.3 在 C 语言中使用中文字符 + +### 3.3.1 概述 + +* 大部分 C 语言文章或教材对中文字符的处理讳莫如深,甚至只字不提,导致很多初学者认为 C 语言只能处理英文,而不支持中文。 +* 其实,这是不对的。C 语言作为一门系统级别的编程语言,理应支持世界上任何一个国家的文字,如:中文、日文、韩文等。 + +> [!NOTE] +> +> 如果 C 语言不支持中文,那么简体中文 Windows 操作系统将无从谈起,我们只能被迫使用英文 Windows 操作系统,这对计算机的传播而言将会是一种巨大的阻碍。 + +### 3.3.2 中文字符的存储 + +* 要想正确的存储中文字符,需要解决如下的两个问题: + * ① 足够长的数据类型:char 的长度是 1 个字节,只能存储拉丁体系的问题,并不能存储中文字符,所以至少需要 2 个字节的内存空间。 + * ② 包含中文的字符集:C 语言规定,对于中文、日文、韩文等非 ASCII 编码之外的单个字符,需要有专门的字符类型,也就是需要使用宽字符的编码方式。而常见的宽字符的编码有 UTF-16 和 UTF-32,它们都是基于 Unicode 字符集的,都能够支持全球的文字。 + +> [!NOTE] +> +> 上文提及过,在现代编程中,`窄字符`通常与 `UTF-8` 编码关联,特别是在处理文本输入、输出和网络传输时。尽管 `UTF-8` 是变长编码,由于其高效的空间利用和对 `ASCII` 的优化,通常与`窄字符`概念关联。而`宽字符`通常与 `UTF-16` 编码或 `UTF-32`编码关联,这些编码使用更大的固定或半固定长度来表示字符,适合处理更大的字符集。 + +* 在真正实现的时候,微软的 MSVC 编译器采用 UTF-16 编码,即:使用 2 个字节来存储一个字符,使用 unsigned short 类型就可以容纳。而 GCC、LLVM/Clang 采用 UTF-32 编码,使用 4 个字节存储字符,用 unsigned int 类型就可以容纳。 + +> [!NOTE] +> +> 不同的编译器可以使用不同的整数类型,来存储宽字符,这对于跨平台开发来说,非常不友好。 + +* 为了解决上述的问题,C 语言推出了一种全新的类型 `wchar_t` 类型,用来存储宽字符类型。 + * 在微软的 MSVC 编译器中,它的长度是 2 个字节。 + * 在 GCC、LLVM/Clang 中,它的长度是 4 个字节。 + +> [!NOTE] +> +> * ① `wchar_t` 中的 `w`是 wide 的首字母,`t` 是 type 的首字母,所以 `wchar_t` 就是宽字符类型,足够见名知意。 +> * ② `wchar_t` 是用 typedef 关键字定义的一个别名,后文讲解,`wchar_t` 在不同的编译器下长度不一样。 +> * ③ `wchar_t` 类型位于 `` 头文件中,它使得代码在具有良好移植性的同时,也节省了不少内存,以后我们就用它来存储宽字符。 + +* 对于普通的拉丁体系的字符,我们使用 `''` 括起来,来表示字符,如:`'A'`、`'&'` 等。但是,如果要想表示宽字符,就需要加上 `L` 前缀了,如:`L'A'`、`L'中'`。 + +> [!NOTE] +> +> 宽字符字面量中的 `L` 是 `Long` 的缩写,意思是比普通的字符(char)要长。 + + + +* 示例: + +```c +#include + +int main() { + + /* 存储宽字符,如:中文 */ + wchar_t a = L'中'; + wchar_t b = L'中'; + wchar_t c = L'中'; + wchar_t d = L'中'; + wchar_t e = L'中'; + + return 0; +} +``` + +### 3.3.3 中文字符的输出 + +* 对于宽字符,就不能使用 `putchar` 函数和 `printf` 函数来进行输出了,需要使用 `putwchar` 函数和 `wprintf` 函数。 + +> [!NOTE] +> +> * ① `putchar` 函数和 `printf` 函数,只能输出窄字符,即:`char` 类型表示的字符。 +> * ② `putwchar` 函数可以用来输出宽字符,用法和 `putchar` 函数类似。 +> * ③ `wprintf`函数可以用来输出宽字符,用法和 `printf` 函数类型,只不过格式占位符是 `%lc` 。 +> * ④ 在输出宽字符之前,还需要使用 `setlocale` 函数进行本地化设置,告诉程序如何才能正确地处理各个国家的语言文化。 + + + +* 示例: + +```c +#include +#include +#include + +int main() { + + /* 存储宽字符,如:中文 */ + wchar_t a = L'中'; + wchar_t b = L'国'; + wchar_t c = L'人'; + wchar_t d = L'你'; + wchar_t e = L'好'; + + // 将本地环境设置为简体中文 + setlocale(LC_ALL, "zh_CN.UTF-8"); + + // 使用专门的 putwchar 输出宽字符 + putwchar(a); + putwchar(b); + putwchar(c); + putwchar(d); + putwchar(e); + putwchar(L'\n'); // 只能使用宽字符 + + // 使用通用的 wprintf 输出宽字符 + wprintf(L"%lc %lc %lc %lc %lc\n", a, b, c, d, e); + + return 0; +} +``` + +### 3.3.4 宽字符串 + +* 如果给字符串加上 `L` 前缀,就变成了宽字符串,即:它包含的每个字符都是宽字符,一律采用 UTF-16 或者 UTF-32 编码。 + +> [!NOTE] +> +> * ① 输出宽字符串可以使用 头文件中的 wprintf 函数,对应的格式控制符是`%ls`。 +> * ② 不加`L`前缀的窄字符串也可以处理中文,我们之前就在 `printf` 函数中,使用格式占位符 `%s` 输出含有中文的字符串,至于为什么,看下文讲解。 + + + +* 示例: + +```c +#include +#include +#include + +int main() { + + /* 存储宽字符,如:中文 */ + wchar_t a[] = L"中国人"; + wchar_t *b = L"你好"; + + // 将本地环境设置为简体中文 + setlocale(LC_ALL, "zh_CN.UTF-8"); + + // 使用通用的 wprintf 输出字符串 + wprintf(L"%ls %ls\n", a, b); + + return 0; +} +``` + +## 3.4 C 语言到底使用什么编码? + +### 3.4.1 概述 + +* 在 C 语言中,只有 `char` 类型的`窄字符`才会使用 ASCII 编码。而 `char` 类型的`窄字符串`、`wchar_t` 类型的`宽字符`和`宽字符串`都不使用 ASCII 编码。 +* `wchar_t` 类型的`宽字符`和`宽字符串`使用 UTF-16 或者 UTF-32 编码,这个在上文已经讲解了,现在只剩下 `char` 类型的`窄字符串`没有讲解了,这也是下文的重点。 + +> [!NOTE] +> +> * ① 其实,对于`char` 类型的窄字符串,C 语言并没有规定使用哪一种特定的编码,只要选用的编码能够适应当前的环境即可。换言之,`char` 类型的窄字符串的编码与操作系统以及编译器有关。 +> * ② 但是,`char` 类型的窄字符串一定不是 ASCII 编码,因为 ASCII 编码只能显示拉丁体系的文字,而不能输出中文、日文、韩文等。 +> * ③ 讨论窄字符串的编码要从以下两个方面下手。 + +### 3.4.2 源文件使用什么编码? + +* 源文件用来保存我们编写的代码,它最终会被存储到本地硬盘,或者远程服务器,这个时候就要尽量压缩文件体积,以节省硬盘空间或者网络流量,而代码中大部分的字符都是 ASCII 编码中的字符,用一个字节足以容纳,所以 UTF-8 编码是一个不错的选择。 +* UTF-8 兼容 ASCII,代码中的大部分字符可以用一个字节保存。另外,UTF-8 基于 Unicode,支持全世界的字符,我们编写的代码可以给全球的程序员使用,真正做到技术无国界。 +* 常见的 IDE 或者编辑器,如:Sublime Text、Vim 等,在创建源文件的时候一般默认就是 UTF-8 编码。就算不是,我们也会推荐设置为 UTF-8 编码,如下所示: + +![](./assets/53.png) + +* 对于 C 语言编译器来说,它往往支持多种编码格式的源文件。微软的 MSVC 、GCC 和 LLVM/Clang 都支持 UTF-8 和本地编码的源文件。 + +### 3.4.3 窄字符串使用什么编码? + +* 前文提到,可以使用 `puts` 函数或 `printf` 函数来输出窄字符串,如下所示: + +```c +#include + +int main() { + + // 存储字符串 + char str[] = "我"; + char *str2 = "爱你"; + + puts(str); // 我 + puts(str2); // 爱你 + + // 存储字符串 + char str3[] = "你"; + char *str4 = "是好人"; + + printf("%s\n", str3); // 你 + printf("%s\n", str4); // 是好人 + + return 0; +} +``` + +* 像 `"我"`、`"爱你"`、`"你"`、`"是好人"`就是需要被处理的窄字符串,当程序运行的时候,它们会被加载进内存。并且,这些字符串中是包含中文的,所以一定不会使用 ASCII 编码。 + +> [!NOTE] +> +> 其实,对于代码中需要被处理的窄字符串,不同的编译器差别还是挺大的: +> +> * 微软的 MSVC 编译器使用本地编码来保存这些字符。对于简体中文版的 Windows,使用的是 GBK 编码。 +> * GCC、LLVM/Clang 编译器使用和源文件相同的编码来保存这些字符:如果源文件使用的是 UTF-8 编码,那么这些字符也使用 UTF-8 编码;如果源文件使用的是 GBK 编码,那么这些字符也使用 GBK 编码。 + +### 3.3.4 总结 + +* ① 对于 `char` 类型的窄字符,在 C 语言中,使用的是 `ASCII` 编码。 +* ② 对于 `wchar_t` 类型的`宽字符`和`宽字符串`,在 C 语言中,使用的 `UTF-16` 编码或者 `UTF-32` 编码,它们都是基于 Unicode 字符集的。 +* ③ 对于 `char` 类型的`窄字符串`,微软的 MSVC 编译器使用本地编码,GCC、LLVM/Clang 使用和源文件编码相同的编码。 +* ④ 处理窄字符和处理宽字符使用的函数也不一样,如下所示: + * `` 头文件中的 `putchar`、`puts`、`printf` 函数只能用来处理窄字符。 + * `` 头文件中的 `putwchar`、`wprintf` 函数只能用来处理宽字符。 + +> [!IMPORTANT] +> +> * ① C 语言作为一门较为底层和古老的语言,对于字符的处理,之所以有这么多种方式,是因为历史遗留的原因和早期计算机资源有限的背景密切相关。 +> * ② 现代化的编程语言,如:C++ 、Java、Python 等都对字符串处理进行了改进和抽象,如:C++ 中的 `std::string` 和 Java 中的 `String`。并且,现代编程语言通常会自动管理内存,这样开发者就不需要手动处理字符串的内存分配和释放,从而减少了内存泄漏和缓冲区溢出等问题。当然,现代编程语言通常内置了对各种字符编码的支持,能够方便地处理不同语言的字符,如:Java 的 `String` 类和 Python 的 `str` 类型都默认支持 Unicode,可以轻松处理中文等多字节字符。 + +### 3.3.5 编码字符集和运行字符集 + +* 源文件使用的字符集,通常称为`编码字符集`,即:写代码的时候所使用的字符集。 + +> [!NOTE] +> +> 源文件需要保存到硬盘,或者在网络上传输,使用的编码要尽量节省存储空间,同时要方便跨国交流,所以一般使用 UTF-8,这就是选择编码字符集的标准。 + +* 程序中的字符或者字符串使用的字符集,通常称为`运行字符集`,即:程序运行时所使用的字符集。 + +> [!NOTE] +> +> 程序中的字符或者字符串,在程序运行后必须被载入到内存,才能进行后续的处理,对于这些字符来说,要尽量选用能够提高处理速度的编码,如:UTF-16 和 UTF-32 编码就能够快速定位(查找)字符。 + +* `编码字符集`是站在`存储`和`传输`的角度,而`运行字符集`是站在`处理`或者`操作`的角度,所以它们并不一定相同。 diff --git a/docs/notes/01_c-basic/06_xdx/assets/1.jpg b/docs/notes/01_c-basic/07_xdx/assets/1.jpg similarity index 100% rename from docs/notes/01_c-basic/06_xdx/assets/1.jpg rename to docs/notes/01_c-basic/07_xdx/assets/1.jpg diff --git a/docs/notes/01_c-basic/06_xdx/assets/10.png b/docs/notes/01_c-basic/07_xdx/assets/10.png similarity index 100% rename from docs/notes/01_c-basic/06_xdx/assets/10.png rename to docs/notes/01_c-basic/07_xdx/assets/10.png diff --git a/docs/notes/01_c-basic/06_xdx/assets/11.png b/docs/notes/01_c-basic/07_xdx/assets/11.png similarity index 100% rename from docs/notes/01_c-basic/06_xdx/assets/11.png rename to docs/notes/01_c-basic/07_xdx/assets/11.png diff --git a/docs/notes/01_c-basic/07_xdx/assets/12.png b/docs/notes/01_c-basic/07_xdx/assets/12.png new file mode 100644 index 0000000..ecc4ca8 Binary files /dev/null and b/docs/notes/01_c-basic/07_xdx/assets/12.png differ diff --git a/docs/notes/01_c-basic/07_xdx/assets/13.png b/docs/notes/01_c-basic/07_xdx/assets/13.png deleted file mode 100644 index 9e43182..0000000 Binary files a/docs/notes/01_c-basic/07_xdx/assets/13.png and /dev/null differ diff --git a/docs/notes/01_c-basic/07_xdx/assets/2.png b/docs/notes/01_c-basic/07_xdx/assets/2.png new file mode 100644 index 0000000..41e6842 Binary files /dev/null and b/docs/notes/01_c-basic/07_xdx/assets/2.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/3.png b/docs/notes/01_c-basic/07_xdx/assets/3.png similarity index 100% rename from docs/notes/01_c-basic/06_xdx/assets/3.png rename to docs/notes/01_c-basic/07_xdx/assets/3.png diff --git a/docs/notes/01_c-basic/06_xdx/assets/4.png b/docs/notes/01_c-basic/07_xdx/assets/4.png similarity index 100% rename from docs/notes/01_c-basic/06_xdx/assets/4.png rename to docs/notes/01_c-basic/07_xdx/assets/4.png diff --git a/docs/notes/01_c-basic/06_xdx/assets/5.png b/docs/notes/01_c-basic/07_xdx/assets/5.png similarity index 100% rename from docs/notes/01_c-basic/06_xdx/assets/5.png rename to docs/notes/01_c-basic/07_xdx/assets/5.png diff --git a/docs/notes/01_c-basic/06_xdx/assets/6.png b/docs/notes/01_c-basic/07_xdx/assets/6.png similarity index 100% rename from docs/notes/01_c-basic/06_xdx/assets/6.png rename to docs/notes/01_c-basic/07_xdx/assets/6.png diff --git a/docs/notes/01_c-basic/07_xdx/assets/7.png b/docs/notes/01_c-basic/07_xdx/assets/7.png index ab88f98..de0e958 100644 Binary files a/docs/notes/01_c-basic/07_xdx/assets/7.png and b/docs/notes/01_c-basic/07_xdx/assets/7.png differ diff --git a/docs/notes/01_c-basic/06_xdx/assets/8.png b/docs/notes/01_c-basic/07_xdx/assets/8.png similarity index 100% rename from docs/notes/01_c-basic/06_xdx/assets/8.png rename to docs/notes/01_c-basic/07_xdx/assets/8.png diff --git a/docs/notes/01_c-basic/07_xdx/assets/9.png b/docs/notes/01_c-basic/07_xdx/assets/9.png index 03969dd..b24eaa6 100644 Binary files a/docs/notes/01_c-basic/07_xdx/assets/9.png and b/docs/notes/01_c-basic/07_xdx/assets/9.png differ diff --git a/docs/notes/01_c-basic/07_xdx/index.md b/docs/notes/01_c-basic/07_xdx/index.md index 79a6812..6b55119 100644 --- a/docs/notes/01_c-basic/07_xdx/index.md +++ b/docs/notes/01_c-basic/07_xdx/index.md @@ -1,510 +1,1516 @@ -# 第一章:内存泄漏(Memory Leak) +# 第一章:概述 -## 1.1 概述 +* `流程控制结构`是用来控制程序中`各语句执行顺序`的语句,并且可以将语句组合成能`完成一定功能`的`小逻辑模块`。 +* 在程序设计中规定了`三种`流程结构,如下所示: + * `顺序结构`:程序从上到下逐行执行,中间没有任何判断和跳转。 + * `分支结构`:根据条件,有选择的执行某段代码。在 C 语言中,有 `if...else` 和 `switch...case` 两种分支语句。 + * `循环结构`:根据循环条件,重复性的执行某段代码。在 C 语言中,有 `for`、`while`、`do...while` 三种循环结构。 -* 有没有过这样的日子,总感觉我们的电脑,不是一个尖端的设备,而像一只疲惫的蜗牛。它在缓慢的爬行,并试图背着重重的楼房去跑马拉松,如下所示: +* 在生活中的`洗衣工厂`,就包含了上述的三种流程结构,如下所示: -![](./assets/1.jpeg) +![](./assets/1.jpg) -> [!NOTE] -> -> 儿歌《蜗牛与黄鹂鸟》的歌词是这样的,如下所示: -> -> * 阿门阿前一棵葡萄树。 -> * 阿嫩阿嫩绿地刚发芽。 -> * 蜗牛背着那重重的壳呀。 -> * 一步一步地往上爬。 -> * 阿树阿上两只黄鹂鸟。 -> * 阿嘻阿嘻哈哈在笑它。 -> * 葡萄成熟还早得很哪。 -> * 现在上来干什么。 -> * 阿黄阿黄鹂儿不要笑。 -> * 等我爬上它就成熟了。 -> -> 虽然歌曲的主旨是想通过蜗牛与黄鹂鸟的对话,表达了努力和坚持的重要性,即使速度慢,只要坚定地往前走,总会达到目标。但是,也从侧面说明了蜗牛的速度真的很慢。 -* 亦或者,我们的电脑就像一个蹒跚学步的孩子在发脾气,我们多么希望她们耐心点,并配合我们。可是,她们总是拒绝和我们合作,如下所示: -![](./assets/2.jpg) +# 第二章:顺序结构 -* 如果这些场景,你都感觉很熟悉,那么你很有可能就是`内存泄漏`的受害者。 +## 2.1 概述 -> [!NOTE] -> -> * ① `内存泄漏`虽然不可见,但是它会悄悄的蚕食计算机的性能,让曾经快速的系统变成一台陈旧的机器。 -> * ② 最为糟糕的时,和留下明显迹象的`漏水`不同,`内存泄漏`是不可见的,这使得它们难以识别,甚至难以修复。也正是因为这个特点,让开发人员和计算机用户都感觉头疼。 +* 程序从上到下逐行地执行,表达式语句都是顺序执行的,并且上一行对某个变量的修改对下一行会产生影响。 -## 1.2 什么是内存泄漏? +![](./assets/2.png) -* 我们可以将我们的计算机想象成一个繁华的城市,城市的`道路`就代表着计算器的`内存`(计算机的内存是有限的,普遍的家用个人台式机电脑最多只支持 `4` 根内存条。如果是 `DDR4` 的话,最多也就支持 `128` GB。就算是服务器,也不是无穷无尽的),在其上运行的`程序`就像`车辆`一样,每辆车都执行各自的任务,如下所示: +## 2.2 应用示例 -> [!NOTE] -> -> * ① 操作系统或计算机允许程序自己分配内存,并自由使用。并且,当程序执行完自己的任务之后,还可以释放掉内存,将内存还给操作系统或计算机。 -> * ② 需要说明的是,并不是程序结束运行,才会释放掉内存:在 C/C++ 等语言中,是可以在程序执行完任务之后,由程序员手动释放之前申请的内存,即:调用释放内存的函数。而 Java 等 GC 的编程语言,会由 GC 帮助程序员释放内存,当然从理论上讲会有稍许停顿。但是,像 Java 语言中的 ZGC 现在已经可以控制在 10ms 了,人几乎感觉不到!!! -> * ③ 所谓的`分配内存`,就是程序向计算机或操作系统,申请一块内存空间,然后自己使用。 -> * ④ 所谓的`释放内存`,就是程序告诉计算机或操作系统,不再需要使用之前申请的内存空间,那么就可以将之前申请的内存空间,归还给操作系统或计算机,让其它的程序使用。 -> * ⑤ 上面例子中的`程序`就像`车辆`一样,每辆车都执行各自的任务,类似于程序在执行的时候,向操作系统申请自己的内存空间,并完成自己的任务。 - -![](./assets/3.jpg) - -* 但是,如果有些车辆在完成自己的任务之后,就决定无限期的停在路上,而不是离开。那么,可以想象到的是,随着时间的推移,这些停放的汽车就会开始阻塞城市的道路,减慢交通速度,如下所示: - -![](./assets/4.jpg) - -> [!NOTE] -> -> * ① 需要说明的是,道路或网络的利用率并非越高越好。 -> * ② 如果使用 D0 表示道路或网络空闲时的时延(数据包(或车辆)几乎没有排队,时延 D0 只是基本的传输或行驶时间),而 D 表示道路或网络当前的时延(数据包(或车辆)可能需要排队,这导致了额外的时延,时延 D 是包含了排队时间的总时延),那么在理想的条件下,可以使用如下的表达式来表示 D、D0 以及道路或网络利用率 U 之间的关系,即:$U = \frac{D - D_0}{D}$,经过换算一下,其结果就是:$D = \frac{D_0}{1 - U}$。 -> * ③ 显而易见,道路或网络利用率并不是越大越好,过高的道路或网络利用率会产生非常大的时延。 - -* 由此可见,在极端情况下,这座城市甚至可能陷入停顿。 - -> [!NOTE] -> -> 这实际上就是`内存泄漏`对计算机的影响,即: -> -> * ① 程序可能会变慢,甚至崩溃,特别是在长时间运行的程序中。 -> * ② `内存泄漏`会逐渐耗尽系统内存,造成资源浪费,并导致系统性能下降。 - -* 再或者,在生活中,我们必然需要用水,如果规定每个人一个月的用水量不能超过 `10t`,那么三口之间每个月的用水量就不能超过 `30t`。假设,由于水管老化或小动物(老鼠)的影响,而导致家中的水管产生轻微的破损,产生漏水的现象,如下所示: - -![](./assets/5.jpg) - -* 那么,家中隐藏的漏水问题在很长一段时间内是不会被注意到的。亦或者,假设每个人的用水量都没有限制,那么如果要用到 `30t` ,必然会比之前没有漏水的时候,产生的水费也要多很多。 - -> [!IMPORTANT] -> -> 官方定义:`内存泄漏`是指计算机程序无意中消耗的一种特定类型的内存,其中程序无法释放不再需要或使用的内存(这种内存虽然不再被程序使用,但仍然占据着系统资源),进而导致这些内存无法被系统或其他程序再次使用,随着时间的推荐,会逐渐耗尽系统内存,并最终导致系统性能下降。 - -## 1.3 什么会触发内存泄漏? - -* 导致`内存泄漏`的原因很多,具体取决于编程语言、平台和特定的应用程序场景。以下是一些最常见的原因: - * ① **未关闭的资源**:未能关闭文件、数据库连接或网络套接字等资源可能会导致`内存泄漏`。如果这些资源保持打开状态,可能会随着时间的推移而累积并消耗大量内存。 - * ② **未释放的对象引用**:保留不再需要的对象引用可以防止垃圾回收器(在具有它们的语言中)回收内存。 - * ③ **循环引用**:在某些语言中,两个相互引用的对象可能会导致两个对象都无法被垃圾回收的情况,即使程序的其他部分没有引用它们。 - * ④ **静态集合**:使用随时间增长而从未清除的静态数据结构可能会导致`内存泄漏`。例如:将元素添加到静态列表而不删除它们可能会导致列表无限增长。 - * ⑤ **事件侦听器**:不分离事件侦听器或回调可能会导致`内存泄漏`,尤其是在 Web 浏览器等环境中。如果对象已附加到事件但不再使用,则不会对其进行垃圾回收,因为该事件仍包含对它的引用。 - * ⑥ **中间件和第三方库**:有时,`内存泄漏`的原因可能不在于应用程序代码,而在于它使用的中间件或第三方库。这些组件中的错误或低效代码可能会导致`内存泄漏`。 - * ⑦ **内存管理不当**:在开发人员手动管理内存的语言,如: C、C++ 中,使用后未能释放内存或使用 “悬空指针” 可能会导致泄漏。 - * ⑧ **内存碎片**:虽然不是传统意义上的泄漏,但碎片会导致内存使用效率低下。随着时间的推移,内存分配之间的小间隙会累积,从而难以分配更大的内存块。 - * ⑨ **孤立线程**:生成但未正确终止的线程可能会消耗内存资源。这些孤立线程会随着时间的推移而累积,尤其是在长时间运行的应用程序中。 - * ⑩ **缓存过度使用**:在没有适当驱逐策略的情况下实施缓存机制可能会导致内存无限消耗,尤其是在缓存无限增长的情况下。 - -* 在 C 语言中,可以使用 `while` 循环并结合 `malloc` 函数来实现一个内存泄漏的例子,即: +* 示例: ```c -#include -#include +#include int main() { - while (true) { // 死循环 - malloc(1024); // 分配1024个字节的内存 - } + + int x = 1; + int y = 2; + printf("x = %d \n", x); // x = 1 + printf("y = %d \n", y); // y = 2 + + // 对 x 和 y 的值进行修改 + x++; + y = 2 * x + y; + x = x * 10; + + printf("x = %d \n", x); // x = 20 + printf("y = %d \n", y); // y = 6 + return 0; } ``` -* 如果我们在 Windows 上运行该程序,就可以打开 Windows 的任务管理器(快捷键是`Ctrl + Shift + ESC`),将会发现内存的使用率在飙升。当然,稍等片刻后程序会被终止,是因为 Windows 的内存管理机制,发现我们的程序占用内存太多,会让它崩溃,防止系统卡死(其它的操作系统也有相应的措施)。 - -![](./assets/6.gif) - -## 1.4 内存泄漏会导致什么后果? - -* ① **内存使用量增加**:随着泄漏和释放的内存越来越多,整体系统内存使用量会增加。这会减少可用于其他进程和应用程序的内存,从而降低系统速度。 -* ② **增加分页**:随着`内存泄漏`的累积,系统可能会开始将内存内容交换到磁盘以释放 RAM,从而导致更多的磁盘 I/O。这会导致性能降低,因为磁盘操作比内存操作慢得多。 -* ③ **内存不足错误**:如果`内存泄漏`足够多,系统最终可能会完全耗尽可用内存。这可能会导致崩溃、内存分配失败和程序终止。 -* ④ **资源争用**:较高的内存使用率还会导致对缓存和资源(如:CPU 时间等)的更多争用,因为系统尝试管理有限的资源。这会进一步降低性能。 -* ⑤ **应用程序不稳定**:随着内存使用量随着时间的推移而增长,存在`内存泄漏`的应用程序可能会遇到崩溃、意外行为和间歇性故障。这会导致不稳定和可靠性问题。 -* ⑥ **安全风险**:`内存泄漏`会使数据在内存中的延迟时间超过预期。此数据可能包含密码、密钥或其他敏感信息,如果恶意软件或攻击者访问这些信息,则会带来安全风险。 - -## 1.5 检测内存泄漏的工具或技术 - -* ① **分析工具**: - * ① Valgrind:用于构建动态分析工具的检测框架,最有名的 Memcheck 的套件,可以检测 C 和 C++ 程序中的内存泄漏。 - * ② Java VisualVM:适用于 Java 应用程序的监控、故障排除和分析工具。 - * ③ .NET Memory Profiler:用于查找内存泄漏并优化 .NET 应用程序中的内存使用的工具。 - * ④ Golang pprof:该工具可让您收集 Go 程序的 CPU 配置文件、跟踪和堆配置文件。 - -* ② **浏览器开发工具**:Chrome、Firefox 和 Edge 等现代 Web 浏览器附带内置的开发人员工具,可帮助识别 Web 应用程序中的内存泄漏,尤其是 JavaScript 中的内存泄漏。 - -* ③ **静态分析**:Lint、SonarQube 或 Clang Static Analyzer 等工具可以扫描代码以识别可能导致内存泄漏的模式。 - -* ④ **自动化测试**:将内存泄漏检测整合到自动化测试中有助于在开发周期的早期捕获泄漏,如:JUnit(适用于 Java)或 pytest(适用于 Python)等工具可以与内存分析工具集成,以自动执行此过程。 - -* ⑤ **堆分析**:检查应用程序的堆转储,可以深入了解正在消耗内存的对象,如:Eclipse MAT(内存分析器工具)或 Java 堆分析工具 (jhat)等工具可以协助进行此分析。 - -* ⑥ **指标**:实施指标来监控一段时间内的内存使用情况,有助于识别导致内存消耗增加的模式或特定操作,如:Prometheus 和 Grafana 等。 - -* ⑦ **第三方库和中间件**:一些第三方解决方案提供内置的内存泄漏检测功能。如果我们怀疑这些组件可能是泄漏源,则必须查看与这些组件相关的文档或论坛。 -* ⑧ **手动代码审查**:有时,识别内存泄漏的最佳方法是对代码进行彻底的手动审查,尤其是在分配和释放内存的区域中。 -* ⑨ **压力测试**:在高负载或长时间运行应用程序,有助于暴露在正常情况下可能不明显的内存泄漏。 - -## 1.6 如何避免内存泄漏? - -* ① **及时释放内存**:在程序中,确保在不再需要使用内存时及时释放它。 -* ② **智能指针**:使用智能指针来帮助在 C++ 等编程语言中进行自动内存管理。 -* ③ **将编程语言与垃圾回收器一起使用**:内存分配和释放由 Python 和 Java 等编程语言自动处理,这些语言包含内置的垃圾收集系统。 -* ④ **利用内存管理策略:** 有效的内存管理可以防止内存泄漏。这包括始终监控我们的软件使用了多少内存,并了解何时分配和取消分配内存,即:检测内存泄漏的工具或技术。 - -## 1.7 总结 - -* **内存泄漏**是由于未释放不再使用的内存,导致内存资源逐渐减少,但不会立即导致程序崩溃,而是`长时间`运行后可能出现性能问题或最终崩溃。 - -# 第二章:内存溢出(Out Of Memory,OOM) - -## 2.1 概述 - -* 首先,说明一点,在国内的很多文章中,都将 `Out Of Memory(OOM)`翻译为 `内存溢出`,但是本人认为翻译为`内存不足`更为贴切。 -* 在生活中,我们在使用计算机的时候,可能会遇到打开视频网站的时候,视频网站崩溃了,并且在浏览器上显示报错信息`Error Code Out Of Memory`,如下所示: - -![](./assets/7.png) - -* 当然,我们在使用微软办公套件,如:Outlook 的时候,可能也会遇到系统提示 `Out Of Memory`,如下所示: - -![](./assets/8.jpg) - -* 亦或者,我们在打游戏的时候,会遇到系统提示 `Out Of Memory`,如下所示: - -![](./assets/9.png) - -* 上述的种种情景,都表明了内存溢出(内存不足,OOM)是`立即显现`的问题,尤其是当系统无法分配足够内存时,会直接导致程序崩溃或异常。 - -> [!NOTE] -> -> * ① 内存泄漏是一种`逐渐积累`的问题,会耗尽系统内存,可能最终导致内存不足(理解:站着茅坑不拉稀,最终可能导致可用的茅坑越来越少,后面的人就只能等着o(╥﹏╥)o)。 -> * ② 内存溢出(不足)是一种`立即显现`的问题,当系统无法分配足够内存时,会`直接`导致程序崩溃或异常(理解:大象塞进冰箱,冰箱不是无限大,最终可能导致大象身体的一部分露出来,这不就`溢出`吗?换言之,就是冰箱(内存)的容量有限啊,`不`能满`足`实际需要)。 - -> [!IMPORTANT] -> -> 官方定义:当计算机没有足够的内存来执行操作或运行应用程序时,会发生内存不足 (OOM) 错误。此内存可以是`物理 RAM`(随机存取内存) 或`虚拟内存`,它使用磁盘空间扩展物理内存。当系统耗尽可用内存时,它无法再满足`内存分配`请求,从而导致 OOM 错误。此错误表示除非释放或添加内存,否则系统无法处理进一步的需求。 - -## 2.2 什么会触发内存溢出? - -* 导致`内存溢出`的原因很多,具体取决于编程语言、平台和特定的应用程序场景。以下是一些最常见的原因: - * ① **无限循环或递归**:如果程序中的循环或递归没有正确终止条件,可能会一直运行,消耗掉所有可用内存。 - * ② **内存泄漏**:程序不断分配内存而不释放,最终导致可用内存耗尽。这通常是因为程序在使用完某些数据后,没有正确地释放相关的内存。 - * ③ **处理大数据集**:如果程序试图一次性加载或处理一个超大的数据集,而该数据集的大小超过了系统的可用内存,这可能会导致内存溢出。 - * ④ **资源过度分配**:一些程序在运行时,可能会为某些资源(如缓存、临时数据)分配过多的内存,导致整体系统内存不足。 - * ⑤ **错误的内存管理**:在手动管理内存的编程语言中(如:C 或 C++),如果程序错误地管理内存(如:重复释放、未释放或非法访问内存),也可能引发内存泄漏,进而导致内存溢出。 - * ⑥ **并发操作**:如果多个进程或线程并发地进行大量内存分配操作,且这些操作没有得到有效控制,也可能导致系统内存被耗尽。 - * ⑦ **外部库或工具的 Bug**:使用的第三方库或工具中存在内存管理相关的 bug,也可能导致内存溢出。 - -## 2.3 如何避免内存溢出? - -* ① **优化数据处理**: - * 分块处理大数据集:如果需要处理大数据集,可以将数据分块处理,而不是一次性加载整个数据集到内存中。例如:处理大型文件时,可以逐行读取或分批读取。 - * 使用流式处理:对于需要处理大量数据的操作,可以采用流式处理(streaming),这样只保留当前处理的部分数据在内存中,而非全部数据。 -* ② **管理对象生命周期**: - * 及时释放不再使用的对象:在使用动态分配内存的编程语言(如:C++、C#、Java 等)时,确保在对象不再需要时及时释放内存。即使在使用垃圾回收机制的语言(如:Java、Python),也要尽量避免保留对不必要对象的引用,以便垃圾回收器可以及时清理它们。 - * 使用智能指针或自动内存管理:在手动管理内存的编程语言中,使用智能指针(如:C++中的`std::unique_ptr`或`std::shared_ptr`)来自动管理内存,减少内存泄漏的风险。 -* ③ **优化算法**: - * 选择更高效的算法:对于需要大量计算或数据处理的任务,选择内存占用更少的算法。例如:尽量使用原地(in-place)算法,它们不需要额外的内存空间。 - * 减少冗余数据:避免在内存中存储冗余数据,尽可能在计算过程中利用已有的数据结构,避免重复分配相同的数据。 -* ④ **监控和调试**: - * 使用内存分析工具:在开发过程中,使用内存分析工具(如:Valgrind、VisualVM、Py-Spy等)来监控程序的内存使用情况,查找和修复内存泄漏或不必要的内存分配。 - * 设置内存使用限制:在某些环境中,可以设置程序的最大内存使用量,这样当程序达到内存限制时,可以捕捉并处理内存溢出的情况。 -* ⑤ **避免无限循环和递归** - - 设置循环或递归的终止条件:确保所有循环和递归都有明确的终止条件,避免因逻辑错误导致无限执行,从而耗尽内存。 - - 使用尾递归优化:在支持尾递归优化的语言中,尽量使用尾递归,以减少递归调用带来的内存消耗。 -* ⑥ **并发编程中的内存管理**: - * 控制并发操作的内存分配:在并发编程中,尽量避免多个线程或进程同时大量分配内存。可以通过任务分配、锁机制等方式合理控制并发操作的内存使用。 - * 避免死锁:确保在并发编程中避免死锁情况,因为死锁可能会导致内存资源无法被释放,从而引发内存溢出。 -* ⑦ **使用适当的数据结构**: - * 选择合适的数据结构:根据需要选择内存效率更高的数据结构。例如,使用数组而不是链表来存储连续的数据,使用哈希表来提高查找效率等。 - * 避免不必要的缓存:在程序中使用缓存时,确保缓存的大小是合理的,并且有清理机制,防止缓存占用过多内存。 - -> [!NOTE] -> -> 避免内存溢出通常需要良好的内存管理实践,如:优化数据处理算法、合理控制资源分配、以及定期检查和释放不再使用的内存。 - -## 2.4 总结 - -* `内存溢出`则是由于内存资源耗尽,程序试图分配新内存时失败,通常会导致程序的`立即`崩溃或异常终止。 - - - -# 第三章:内存泄漏 VS 内存溢出 +# 第三章:分支结构(⭐) ## 3.1 概述 -* `内存泄漏`是由于未释放不再使用的内存导致内存资源逐渐减少,但不会立即导致程序崩溃,而是长时间运行后可能出现性能问题或最终崩溃。 -* `内存溢出`则是由于内存资源耗尽,程序试图分配新内存时失败,通常会导致程序的立即崩溃或异常终止。 +* 根据特定条件执行不同的代码块,从而实现灵活的程序控制和更复杂的逻辑。 + +## 3.2 单分支结构 + +### 3.2.1 概述 + +* 语法: + +```c +if(条件表达式){ + 语句; +} +``` > [!NOTE] > -> * ① `内存泄漏`和`内存溢出`都与内存管理不当有关,但它们发生的机制和直接影响是不同的。 -> * ② 避免`内存泄漏`和`内存溢出`都是编写高效、可靠软件的重要方面。 +> * ① 在 C 语言中,严格意义上是没有 boolean 类型的,使用`非0` 表示`真(true)`,`0` 表示`假(false)`。 +> * ② 当条件表达式为真(`非0` ),就会执行代码块中的语句;否则,就不会执行代码块中的语句。 -## 3.2 内存泄漏和内存溢出的联系和区别 +* 流程图,如下所示: -> [!IMPORTANT] -> -> `内存泄漏`和`内存溢出`之间并不是必然的因果关系,而是两者可能会相互影响。 -* ① `内存泄漏`导致`内存溢出`的可能性: - * 如果一个程序长期运行并且持续发生`内存泄漏`,未被释放的内存会慢慢积累,最终占用系统的大部分内存资源。如果`内存泄漏`严重到占用了所有可用内存,那么程序就会因为无法再分配新的内存,而出现`内存溢出`(Out of Memory)的情况。 - * 因此,`内存泄漏`可以**间接**地导致`内存溢出`,特别是在长时间运行的程序或系统中。 -* ② `内存泄漏`和`内存溢出`的区别: - * `内存泄漏`是指程序持续占用内存却不释放,导致可用内存逐渐减少。这种情况可能会在`长时间`内不显现问题,特别是如果程序只泄漏了少量内存。 - * `内存溢出`则是一个更`急剧`的问题,它通常在程序尝试分配超过系统可用内存的大块内存时`立刻`发生,导致程序崩溃或异常终止。 -* ③ 不必然性: - * 一个程序可能会发生`内存泄漏`,但因为泄漏的内存量很小,系统资源丰富,所以在短时间内不会出现`内存溢出`。 - * `内存溢出`也可以在没有`内存泄漏`的情况下发生,如:一个程序需要处理非常大的数据集,直接导致内存不足。 -> [!IMPORTANT] -> -> * ① `内存泄漏`有可能会在长时间积累后导致`内存溢出`,但这并不是必然的。 -> * ② `内存溢出`可以在多种情况下发生,而`内存泄漏`只是其中可能的一个诱因。 -> * ③ 因此,虽然`内存泄漏`可能最终引发`内存溢出`,但两者之间并非每次都是直接关联的。 +![](./assets/3.png) + +### 3.2.2 应用示例 + +* 需求:成年人心率的正常范围是每分钟 60~100 次。体检时,如果心率不在此范围内,则提示需要做进一步的检查。 -# 第四章:内存泄漏检测和性能分析(⭐) +* 示例: -## 4.1 内存泄漏检测 +```c +#include -### 4.1.1 概述 +int main() { -* C 语言中的指针是否使用是个颇具争议的话题,现代化的高级编程语言通过各种策略和机制,在编译期就能解决指针危险的问题。但是,遗憾的是,C 语言的指针很大程度上,在运行期才会暴露问题。 -* 幸运的是,我们可以使用 `Valgrind` 项目来进行`内存泄漏检测`和`性能分析`,而 `Valgrind` 只支持 Linux 。 + int heartBeats = 0; + printf("请输入您的心率:"); + scanf("%d", &heartBeats); -### 4.1.2 安装 + if (heartBeats < 60 || heartBeats > 100) { + printf("您的心率不在正常范围内,请做进一步的检查。\n"); + } -* 在 WSL2 上安装 Valgrind : + printf("体检结束!!!"); -```shell -dnf -y upgrade && dnf -y install valgrind # AlmaLinux + return 0; +} ``` -```shell -apt -y update && apt -y upgrade && apt -y install valgrind # Ubuntu +### 3.2.3 应用示例 + +* 需求:根据年龄判断,如果是未成年人,则提示 "未成年人请在家长陪同下访问!" 。 + + + +* 示例: + +```c +#include + +int main() { + + int age = 0; + printf("请输入你的年龄:"); + scanf("%d", &age); + + if (age < 18) { + printf("未成年人请在家长陪同下访问!\n"); + } + + printf("欢迎继续访问!"); + + return 0; +} ``` -![](./assets/10.gif) +## 3.3 双分支结构 -* 查看 valgrind 可执行文件的安装位置: +### 3.3.1 概述 -```shell -which valgrind +* 语法: + +```c +if(条件表达式) { + 语句块1; +}else { + 语句块2; +} ``` -![](./assets/11.gif) - -### 4.1.3 整合 - -* CLion 中将工具链设置为 WSL2 : - -![](./assets/12.gif) - -* CLion 中配置 valgrind 的路径: - -![](./assets/13.png) - -* 查看 WSL2 中 cmake 的版本: - -```shell -cmake --version -``` - -![](./assets/14.png) - -* 修改项目中 CMakeLists.txt 中 cmake 的版本: - -```{1} txt -cmake_minimum_required(VERSION 3.26.5) # 3.26.5 - -# 项目名称和版本号 -project(c-study VERSION 1.0 LANGUAGES C) - -# 设置 C 标准 -set(CMAKE_C_STANDARD 23) -set(CMAKE_C_STANDARD_REQUIRED True) - -# 辅助函数,用于递归查找所有源文件 -function(collect_sources result dir) - file(GLOB_RECURSE new_sources "${dir}/*.c") - set(${result} ${${result}} ${new_sources} PARENT_SCOPE) -endfunction() - -# 查找顶层 include 目录(如果存在) -if (EXISTS "${CMAKE_SOURCE_DIR}/include") - include_directories(${CMAKE_SOURCE_DIR}/include) -endif () - -# 查找所有源文件 -set(SOURCES) -collect_sources(SOURCES ${CMAKE_SOURCE_DIR}) - -# 用于存储已经处理过的可执行文件名,防止重复 -set(EXECUTABLE_NAMES) - -# 创建可执行文件 -foreach (SOURCE ${SOURCES}) - # 获取文件的相对路径 - file(RELATIVE_PATH REL_PATH ${CMAKE_SOURCE_DIR} ${SOURCE}) - # 将路径中的斜杠替换为下划线,生成唯一的可执行文件名 - string(REPLACE "/" "_" EXECUTABLE_NAME ${REL_PATH}) - string(REPLACE "\\" "_" EXECUTABLE_NAME ${EXECUTABLE_NAME}) - string(REPLACE "." "_" EXECUTABLE_NAME ${EXECUTABLE_NAME}) - - # 处理与 CMakeLists.txt 文件同名的问题 - if (${EXECUTABLE_NAME} STREQUAL "CMakeLists_txt") - set(EXECUTABLE_NAME "${EXECUTABLE_NAME}_exec") - endif () - - # 检查是否已经创建过同名的可执行文件 - if (NOT EXECUTABLE_NAME IN_LIST EXECUTABLE_NAMES) - list(APPEND EXECUTABLE_NAMES ${EXECUTABLE_NAME}) - - # 链接 math 库 - LINK_LIBRARIES(m) - - # 创建可执行文件 - add_executable(${EXECUTABLE_NAME} ${SOURCE}) - - # 查找源文件所在的目录,并添加为包含目录(头文件可能在同一目录下) - get_filename_component(DIR ${SOURCE} DIRECTORY) - target_include_directories(${EXECUTABLE_NAME} PRIVATE ${DIR}) - - # 检查并添加子目录中的 include 目录(如果存在) - if (EXISTS "${DIR}/include") - target_include_directories(${EXECUTABLE_NAME} PRIVATE ${DIR}/include) - endif () - - # 检查并添加 module 目录中的所有 C 文件(如果存在) - if (EXISTS "${DIR}/module") - file(GLOB_RECURSE MODULE_SOURCES "${DIR}/module/*.c") - target_sources(${EXECUTABLE_NAME} PRIVATE ${MODULE_SOURCES}) - endif () - endif () -endforeach () -``` - -* 在 CLion 中正常运行代码: - -![](./assets/15.gif) - -* 在 CLion 中通过 valgrind 运行代码: - -![](./assets/16.gif) - -## 4.2 性能分析 - -### 4.2.1 概述 - -* `perf` 是一个 Linux 下的性能分析工具,主要用于监控和分析系统性能。它可以帮助开发者和系统管理员了解系统中哪些部分在消耗资源、识别性能瓶颈以及分析程序的运行效率。 - -### 4.2.2 安装 - -#### 4.2.2.1 AlmaLinux9 - -* 在 WSL2 中的 AlmaLinux 安装 perf : - -```shell -dnf -y install perf -``` - -![](./assets/17.gif) - -#### 4.2.2.2 Ubuntu 22.04 - -* 在 WSL2 中的 Ubuntu 安装 perf : - -```shell -apt -y update \ - && apt -y install linux-tools-common \ - linux-tools-generic linux-tools-$(uname -r) -``` - -![](./assets/18.gif) - > [!NOTE] > -> 之所以报错的原因,在于 WSL2 中的 Ubuntu 的内核是定制化的(微软自己维护的),并非 Ubuntu 的母公司 Canonical 发布的标准内核,所以需要我们手动编译安装。 +> * ① 在 C 语言中,严格意义上是没有 boolean 类型的,使用`非0` 表示`真(true)`,`0` 表示`假(false)`。 +> * ② 当条件表达式为真(`非0` ),就会执行代码块 1 中的语句;否则,执行代码块 2 中的语句。 -* 查看内核版本: +* 流程图,如下所示: -```shell -uname -sr +![](./assets/4.png) + +### 3.3.2 应用示例 + +* 需求:判断一个整数,是奇数还是偶数。 + + + +* 示例: + +```c +#include + +int main() { + + int num = 0; + printf("请输入一个整数:"); + scanf("%d", &num); + + if (num % 2 == 0) { + printf("%d 是偶数\n", num); + } else { + printf("%d 是奇数\n", num); + } + + return 0; +} ``` -![](./assets/19.gif) +### 3.3.2 应用示例 -* 设置环境变量,方便后续引用: +* 需求:输入年龄,如果大于18岁,则输出 "你年龄大于18,要对自己的行为负责!";否则,输出 "你的年龄不大这次放过你了。" -```shell -export KERNEL_VERSION=$(uname -r | cut -d'-' -f1) + + +* 示例: + +```c +#include + +int main() { + + int age = 0; + printf("请输入年龄:"); + scanf("%d", &age); + + if (age > 18) { + printf("你年龄大于18,要对自己的行为负责!\n"); + } else { + printf("你的年龄不大,这次放过你了!\n"); + } + + return 0; +} ``` -![](./assets/20.gif) +### 3.3.3 应用示例 -* 安装依赖库: +* 需求:判定某个年份是否为闰年? -```shell -apt -y update && \ - apt -y install binutils-dev debuginfod default-jdk \ - default-jre libaio-dev libbabeltrace-dev libcap-dev \ - libdw-dev libdwarf-dev libelf-dev libiberty-dev \ - liblzma-dev libnuma-dev libperl-dev libpfm4-dev \ - libslang2-dev libssl-dev libtraceevent-dev libunwind-dev \ - libzstd-dev libzstd1 python3-setuptools python3 \ - python3-dev systemtap-sdt-dev zlib1g-dev bc dwarves \ - bison flex libnewt-dev libdwarf++0 \ - libelf++0 libbfb0-dev python-dev-is-python3 +>[!NOTE] +> +>* ① year 是 400 的整倍数: year%400==0 +>* ② 能被 4 整除,但不能被 100 整除:year % 4 == 0 && year % 100 != 0 + + + +* 示例: + +```c +#include + +int main() { + + int year = 0; + printf("请输入年份:"); + scanf("%d", &year); + + if (year % 400 == 0 || (year % 4 == 0 && year % 100 != 0)) { + printf("%d 是闰年\n", year); + } else { + printf("%d 不是闰年\n", year); + } + + return 0; +} ``` -![](./assets/21.gif) +## 3.4 多重分支结构 -* 下载源码: +### 3.4.1 概述 -```shell -git clone \ - --depth 1 \ - --single-branch --branch=linux-msft-wsl-${KERNEL_VERSION} \ - https://github.com/microsoft/WSL2-Linux-Kernel.git +* 语法: + +```c +if (条件表达式1) { + 语句块1; +} else if (条件表达式2) { + 语句块2; +} +... +} else if (条件表达式n) { + 语句块n; +} else { + 语句块n+1; +} ``` -![](./assets/22.gif) +> [!NOTE] +> +> * ① 在 C 语言中,严格意义上是没有 boolean 类型的,使用`非0` 表示`真(true)`,`0` 表示`假(false)`。 +> * ② 首先判断关系表达式 1 的结果是真(值为 `非0`)还是假(值为 `0`): +> * 如果为真,就执行语句块 1,然后结束当前多分支。 +> * 如果是假,就继续判断条件表达式 2,看其结果是真还是假。 +> * 如果是真,就执行语句块 2,然后结束当前多分支。 +> * 如果是假,就继续判断条件表达式…看其结果是真还是假。 +> * ... +> * 如果没有任何关系表达式为真,就执行语句块 n+1,然后结束当前多分支。 +> * ③ 当条件表达式之间是`互斥`(彼此之间没有交集)关系时,条件判断语句及执行语句间顺序无所谓。 +> * ④ 当条件表达式之间是`包含`关系时,必须`小上大下 / 子上父下`,否则范围小的条件表达式将不可能被执行。 +> * ⑤ 当 if-else 结构是多选一的时候,最后的 else 是可选的,可以根据需要省略。 +> * ⑥ 如果语句块中只有一条执行语句的时候,`{}`是可以省略的;但是,强烈建议保留!!! -* 编译内核代码: +* 流程图,如下所示: -```shell -cd WSL2-Linux-Kernel +![image-20240722075241253](./assets/5.png) + +### 3.4.1 应用示例 + +* 需求:张三参加考试,他和父亲达成协议,如果成绩不到 60 分没有任何奖励;如果成绩 60分(含)到 80 分,奖励一个肉夹馍;如果成绩 80 分(含)到 90 分,奖励一个 ipad;如果成绩 90 分及以上,奖励一部华为 mate60 pro 。 + + + +* 示例: + +```c +#include + +int main() { + + int score = 0; + printf("请输入分数:"); + scanf("%d", &score); + + // 容错:分数不可能小于 0 或大于 100 + if (score < 0 || score > 100) { + printf("输入的分数有误!\n"); + return 0; + } + + if (score >= 90) { + printf("奖励你一部华为 mate60 pro\n"); + } else if (score >= 80) { + printf("奖励你一个 ipad\n"); + } else if (score >= 60) { + printf("奖励你一个肉夹馍\n"); + } else { + printf("你的成绩不及格,没有任何奖励!"); + } + + return 0; +} ``` -```shell -make -j $(nproc) KCONFIG_CONFIG=Microsoft/config-wsl +### 3.4.2 应用示例 + +* 需求:判断水的温度,如果大于 95℃,则打印 "开水";如果大于 70℃ 且小于等于 95℃,则打印 "热水";如果大于 40℃ 且小于等于 70℃,则打印 "温水";如果小于等于 40℃,则打印 "凉水"。 + + + +* 示例: + +```c +#include + +int main() { + + int temperature = 0; + printf("请输入水的温度:"); + scanf("%d", &temperature); + + if (temperature > 95) { + printf("开水 \n"); + } else if (temperature > 70 && temperature <= 95) { + printf("热水 \n"); + } else if (temperature > 40 && temperature <= 70) { + printf("温水 \n"); + } else { + printf("凉水 \n"); + } + + return 0; +} ``` -![](./assets/23.gif) +## 3.5 多重分支结构 switch -* 编译 perf 工具: +### 3.5.1 概述 -```shell -cd tools/perf +* 语法: + +```c +switch(表达式){ + case 常量值1: + 语句块1; + //break; + case 常量值2: + 语句块2; + //break; + ... + + case 常量值n: + 语句块n; + //break; + [default: + 语句块n+1; + ] +} ``` -```shell -make clean && make +> [!NOTE] +> +> * ① switch 后面表达式的值必须是一个整型(char、short、int、long 等)或枚举类型。 +> * ② case 后面的值必须是常量,不能是变量。 +> * ③ default 是可选的,当没有匹配的 case 的时候,就执行 default 。 +> * ④ break 语句可以使程序跳出 switch 语句块,如果没有 break,会执行下一个 case 语句块,直到遇到 break 或者执行到 switch 结尾,这个现象称为穿透。 + +* 流程图,如下所示: + +![](./assets/6.png) + +### 3.5.2 应用示例 + +* 需求:编写一个程序,该程序可以接收一个字符,比如:a、b、c、d;其中, a 表示星期一,b 表示星期二…,根据用户的输入显示相应的信息,要求使用 switch 语句。 + + + +* 示例: + +```c +#include + +int main() { + + char chs; + printf("请输入一个字符(a、b、c、d):"); + scanf("%c", &chs); + + switch (chs) { + case 'a': + printf("今天是星期一 \n"); + printf("窗前明月光 \n"); + break; + case 'b': + printf("今天是星期二 \n"); + printf("疑是地上霜 \n"); + break; + case 'c': + printf("今天是星期三 \n"); + printf("举头望明月 \n"); + break; + case 'd': + printf("今天是星期四 \n"); + printf("低头思故乡 \n"); + break; + default: + printf("输入错误!"); + break; + } + + return 0; +} ``` -![](./assets/24.gif) +### 3.5.3 应用示例 -* 复制到 PATH 变量所指向的路径中: +* 需求:编写程序,输入月份,输出该月份有多少天。说明:1 月、3 月、5 月、7月、8 月、10 月、12 月有 31 天,4 月、6 月、9 月、11 月有 30 天,2 月有 28 天或 29 天。 -```shell -cp perf /usr/bin/ + + +* 示例: + +```c +#include + +int main() { + + int month; + printf("请输入月份 (1-12):"); + scanf("%d", &month); + + switch (month) { + case 1: + case 3: + case 5: + case 7: + case 8: + case 10: + case 12: + printf("%d 月有 31 天\n", month); + break; + case 4: + case 6: + case 9: + case 11: + printf("%d 月有 30 天\n", month); + break; + case 2: + printf("%d 月有 28 天或 29 天\n", month); + break; + default: + printf("输入错误!"); + break; + } + + return 0; +} ``` -![](./assets/25.gif) +### 3.5.4 switch 和 if else if 的比较 -### 4.2.3 整合 +* ① 如果判断条件是判等,而且符合整型、枚举类型,虽然两个语句都可以使用,建议使用 swtich 语句。 +* ② 如果判断条件是区间判断,大小判断等,使用 if...else...if。 -* CLion 中配置 perf 的路径: +## 3.6 嵌套分支 -![](./assets/26.png) +### 3.6.1 概述 -* 在 CLion 中通过 perf 运行代码: +* 嵌套分支是指,在一个分支结构中又嵌套了另一个分支结构,里面的分支的结构称为内层分支,外面的分支结构称为外层分支。 + +> [!NOTE] +> +> 嵌套分支层数不宜过多,建议最多不要超过 3 层。 + +### 3.6.2 应用示例 + +* 需求:根据淡旺季的月份和年龄,打印票价。 + +> [!NOTE] +> +> * ① 4 -10 是旺季: +> * 成人(18-60):60 。 +> * 儿童(<18):半价。 +> * 老人(>60):1/3 。 +> * ② 其余是淡季: +> * 成人:40。 +> * 其他:20。 + + + +* 示例: + +```c +#include + +int main() { + + int month; + int age; + double price = 60; + + printf("请输入月份 (1-12):"); + scanf("%d", &month); + + printf("请输入年龄:"); + scanf("%d", &age); + + // 旺季 + if (month >= 4 && month <= 10) { + if (age < 18) { + price /= 2; + } else if (age > 60) { + price /= 3; + } + } else { + if (age >= 18) { + price = 40; + } else { + price = 20; + } + } + + printf("票价: %.2lf\n", price); + + return 0; +} +``` + + + +# 第四章:随机数 + +## 4.1 概述 + +* 所谓的随机数就是没有规则,并且不能预测的一些数字,也称为真随机数。 +* 程序中也是可以产生随机数的,但是是通过一些固定规则产生的,称为伪随机数。 +* 常见的伪随机数(线性同余方程,LCG)的公式,如下所示: + +$X_{n+1} = (a \cdot X_n + b) \mod m$ + +* 其中,X 是伪随机序列,a 是乘数(通常选择一个大于 0 的常数,典型值有 1664525),b 是增量(选择一个大于 0 的常数,典型值有 1013904223), m 是模数( 通常选择一个大的常数,常见值有 ( 2^{32} ) ,即 4294967296))。 + +> [!NOTE] +> +> 假设 a = 31 ,b = 13 ,m = 100 ;那么,伪随机数的公式就是 `X_{n+1} = (31 × X_n + 13) % 100 `。 +> +> * 如果 `X_{n}` = 1 ,那么 `X_{n+1}` = 44 。 +> * 如果 `X_{n}` = 44 ,那么 `X_{n+1}` = 77 。 +> * 如果 `X_{n}` = 77 ,那么 `X_{n+1}` = 0 。 +> * ... +> +> 最后,将得到 44、77、0、13、16、9 、92、65、28 ... ,其中 1 也称为初始种子(随机数种子)。 + +* 工作原理: + * ① 设置初始种子(X_0): + * 种子值是算法生成随机数序列的起点。 + * 不同的种子值会产生不同的随机数序列。 + * ② 递归生成随机数: + * 从初始种子开始,通过公式不断生成新的随机数。 + * 每次迭代都使用前一次生成的随机数作为输入。 + +> [!NOTE] +> +> 如果种子的值相同,那么每次生成的随机数将相同,解决方案就是将种子的值设置为当前的时间戳。 + +## 4.2 C 语言中随机数的产生 + +* ① 设置随机数种子: + +```c +srand(10); // seed 种⼦ rand random 随机 +``` + +> [!NOTE] +> +> 随机数函数在 `#include ` 中声明。 + +* ② 根据随机数种⼦计算出⼀个伪随机数: + +```c +// 根据种⼦值产⽣⼀个 0-32767 范围的随机数 +int result = rand(); +``` + +* ③ 产生一个指定范围内的随机数: + +```c +int random_in_range(int min, int max) { + return rand() % (max - min + 1) + min; +} +``` + + + +* 示例: + +```c +#include +#include +#include + +// 生成指定范围的随机数的函数 +int randomInRange(int min, int max) { + return rand() % (max - min + 1) + min; +} + +int main() { + + // 使用当前时间作为种子 + srand(time(0)); + + // 定义范围 + int min = 1; + int max = 100; + + // 生成并打印随机数 + for (int i = 0; i < 10; ++i) { + int random = randomInRange(min, max); + printf("%d \n", random); + } + + return 0; +} +``` + + + +# 第五章:循环结构(⭐) + +## 5.1 概述 + +* 循环结构:在某些条件满足的情况下,反复执行特定代码的功能。 + +## 5.2 for 循环 + +### 5.2.1 概述 + +* 语法: + +```c +for(初始化条件①;循环条件表达式②;迭代语句④){ + 循环体语句③ +} +``` + +> [!NOTE] +> +> * ① 初始化条件,用于初始化循环变量,只会执行一次,且循环开始前就执行(可以声明多个变量,但是必须是同一类型,用逗号 `,` 隔开)。 +> * ② 循环条件表达式每次循环都执行,同 while 循环一样,每次先判断后执行循环体语句。 +> * ③ 迭代语句每次循环都执行,在大括号中循环体语句之后执行(如果有多个变量更新,用逗号 `,` 隔开)。 + +* 流程图,如下所示: + +![](./assets/7.png) + +> [!NOTE] +> +> 执行过程是:① --> ② --> ③ --> ④ --> ② --> ③ --> ④ --> ... --> ② 。 + + + +### 5.2.2 应用示例 + +* 需求:输出 5 行 `Hello World!` 。 + + + +* 示例: + +```c +#include + +int main() { + + for (int i = 1; i <= 5; ++i) { + printf("Hello World!\n"); + } + + return 0; +} +``` + +### 5.2.3 应用示例 + +* 需求:求 1 ~ 100 之内所有偶数的和,以及偶数的个数。 + + + +* 示例: + +```c +#include + +int main() { + + int sum = 0; + int count = 0; + + for (int i = 1; i <= 100; i++) { + if (i % 2 == 0) { + sum += i; + count++; + } + } + + printf("1 ~ 100 中的所有偶数的和为: %d \n", sum); + printf("1 ~ 100 中的所有偶数的个数为: %d \n", count); + + return 0; +} +``` + +### 5.2.4 应用示例 + +* 需求:输出所有的水仙花数,所谓水仙花数是指一个 3 位数,其各个位上数字立方和等于其本身,例如:`153 = 1×1×1 + 3×3×3 + 5×5×5`。 + + + +* 示例: + +```c +#include + +int main() { + + int count = 0; + + for (int i = 100; i <= 999; i++) { + // 获取三位数 + int ge = i % 10; + int shi = i / 10 % 10; + int bai = i / 100; + + // 判定是否为水仙花数 + if (ge * ge * ge + shi * shi * shi + bai * bai * bai == i) { + printf("水仙花数:%d\n", i); + count++; + } + } + + printf("水仙花数总个数:%d\n", count); + + return 0; +} +``` + +### 5.2.5 应用示例 + +* 需求:将 1 ~ 10 倒序输出,如:10 、9 、8 ... + + + +* 示例: + +```c +#include + +int main() { + + for (int i = 10; i >= 0; i--) { + printf("%d ", i); + } + + return 0; +} +``` + +### 5.2.6 应用示例 + +* 需求:输入两个正整数 m 和 n ,求其最大公约数和最小公倍数,例如:12 和 20 的最大公约数是 4 ,最小公倍数是 60 。 + +> [!NOTE] +> +> * 如果数 a 能被数 b 整除,且结果是整数,那么 a 就叫做 b 的倍数,b 就叫做 a 的约数(因数)。 +> * 如果一个整数同时是几个整数的约数,则称该整数为这些整数的公约数;其中,数值最大的称为最大公约数。 +> * 如果一个整数同时为两个或多个整数的倍数的数,则称该整数为这些整数的公倍数;其中,数值最小的称为最小公倍数。 + + + +* 示例: + +```c +#include + +int main() { + + int m = 12, n = 20; + + // 取出两个数中的较小值 + int min = (m < n) ? m : n; + + for (int i = min; i >= 1; i--) { + + if (m % i == 0 && n % i == 0) { + printf("最大公约数是:%d\n", i); // 公约数 + + break; //跳出当前循环结构 + } + } + + // 取出两个数中的较大值 + int max = (m > n) ? m : n; + for (int i = max; i <= m * n; i++) { + + if (i % m == 0 && i % n == 0) { + + printf("最小公倍数是:%d\n", i); // 公倍数 + + break; + } + } + + return 0; +} +``` + +## 5.3 while 循环 + +### 5.3.1 概述 + +* 语法: + +```c +初始化条件①; +while (循环条件语句②) { + 循环体语句③; + 迭代语句④; +} +``` + +> [!NOTE] +> +> * ① `while(循环条件部分)` 中循环条件为`非0`值,表示 `true`、`真`;为`0`值,表示 `false`、`假`。 +> * ② 当循环条件表达式成立,就执行循环体语句,直到条件不成立停止循环。 +> * ③ 为避免死循环,循环条件表达式不能永远成立,且随着循环次数增加,应该越来越趋向于不成立。 +> * ④ for 循环和 while 循环`可以相互转换`,二者没有性能上的差别。 +> * ⑤ for 循环与 while 循环的区别:`初始化条件部分的作用域不同`。 + +* 流程图,如下所示: + +![](./assets/8.png) + +> [!NOTE] +> +> 执行过程是:① --> ② --> ③ --> ④ --> ② --> ③ --> ④ --> ... --> ② 。 + +### 5.3.2 应用示例 + +* 需求:输出 5 行 `Hello World!` 。 + + + +* 示例: + +```c +#include + +int main() { + int i = 1; + while (i <= 5) { + printf("Hello World!\n"); + i++; + } + + return 0; +} +``` + +### 5.3.3 应用示例 + +* 需求:求 1 ~ 100 之内所有偶数的和,以及偶数的个数。 + + + +* 示例: + +```c +#include + +int main() { + + int sum = 0; + int count = 0; + + int i = 1; + while (i <= 100) { + if (i % 2 == 0) { + sum += i; + count++; + } + i++; + } + + printf("1 ~ 100 中的所有偶数的和为: %d \n", sum); + printf("1 ~ 100 中的所有偶数的个数为: %d \n", count); + + return 0; +} +``` + +### 5.3.4 应用示例 + +* 需求:世界最高山峰是珠穆朗玛峰,它的高度是 8848.86 米,假如我有一张足够大的纸,它的厚度是 0.1 毫米。请问,我折叠多少次,可以折成珠穆朗玛峰的高度? + + + +* 示例: + +```c +#include + +int main() { + + // 折叠的次数 + int count = 0; + + // 珠峰的高度 + int zfHeight = 8848860; + + // 每次折叠的高度 + double paperHeight = 0.1; + + while (paperHeight <= zfHeight) { + count++; + paperHeight *= 2; + } + + printf("需要折叠 %d 次,才能得到珠峰的高度。\n", count); + printf("折纸的高度为 %.2f 米,超过了珠峰的高度", paperHeight / 1000); + + return 0; +} +``` + +### 5.3.5 应用示例 + +* 需求:给出一个整数 n ,判断该整数是否是 2 的幂次方。如果是,就输出 yes ;否则,输出 no 。 + +> [!NOTE] +> +> 思路: +> +> * ① 2^ 0 = 1 ,2^1 = 2 ,2^2 = 4,2^3 = 8,2^4 = 16,2^5 = 32 ...,规律:每一个数字都是前一个数字的 2 倍(任意一个数字,不断的除以 2 ,最终看结果是否是数字 1 )。 +> * ② 循环终止条件: +> * 结果是 1 的时候,就可以结束,输出 yes 。 +> * 如果在除以 2 的时候,无法被 2 整数,也可以结束,输出 no ,如: 100 / 2 = 50,50 / 2 = 25 。 + + + +* 示例: + +```c +#include + +int main() { + + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + int n = 0; + printf("请输入一个整数:"); + scanf("%d", &n); + + while (n > 1 && n % 2 == 0) { + n /= 2; + } + + if (n == 1) { + printf("yes"); + } else { + printf("no"); + } + + return 0; +} +``` + +### 5.3.6 应用示例 + +* 需求:整数反转,如:123 --> 321 。 + +> [!NOTE] +> +> 思路:从右边开始,依次获取每一位数字,再拼接起来。 + + + +* 示例: + +```c +#include + +int main() { + + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + int num = 0; + int original = 0; + int rev = 0; + printf("请输入一个整数:"); + scanf("%d", &num); + original = num; + + // 从右边开始,依次获取每个数字,然后拼接到 rev 中 + /** + * 第 1 次,123 % 10 = 3,rev = 0 * 10 + 3 = 3 + * 第 2 次,12 % 10 = 2,rev = 3 * 10 + 2 = 32 + * 第 3 次,1 % 10 = 1,rev = 32 * 10 + 1 = 321 + */ + // 循环结束的条件是 num == 0 + while (num != 0) { + // 获取 num 右边的第一位数字 + int temp = num % 10; + // 去掉最后一位数字 + num /= 10; + // 将 temp 拼接到 rev 的后面 + rev = rev * 10 + temp; + } + + printf("%d 的反转是 %d\n", original, rev); + + return 0; +} +``` + +## 5.4 do-while 循环 + +### 5.4.1 概述 + +* 语法: + +```c +①初始化部分; +do{ + ③循环体部分 + ④迭代部分 +}while(②循环条件部分); +``` + +> [!NOTE] +> +> * ① `do{} while();`最后有一个分号。 +> * ② do-while 结构的循环体语句是至少会执行一次,这个和 for 、while 是不一样的。 +> * ③ 循环的三个结构 for、while、do-while 三者是可以相互转换的。 + +* 流程图,如下所示: + +![](./assets/9.png) + +> [!NOTE] +> +> 执行过程是:① --> ③ --> ④ --> ② --> ③ --> ④ --> ② --> ... --> ② 。 + +### 5.4.2 应用示例 + +* 需求:求 1 ~ 100 之内所有偶数的和,以及偶数的个数。 + +```c +#include + +int main() { + + int sum = 0; + int count = 0; + + int i = 1; + do { + if (i % 2 == 0) { + sum += i; + count++; + } + i++; + } while (i <= 100); + + printf("1 ~ 100 中的所有偶数的和为: %d \n", sum); + printf("1 ~ 100 中的所有偶数的个数为: %d \n", count); + + return 0; +} +``` + +### 5.4.3 应用示例 + +* 需求:实现 ATM 取款机功能。 + + + +* 示例: + +```c +#include + +int main() { + // 账户余额 + double balance = 0.0; + // 客户选择 + int selection; + // 存款金额 + double addMoney; + // 取款金额 + double minusMoney; + // 退出标识 + bool exitFlag = false; + do { + printf("=========ATM========\n"); + printf("\t1、存款\n"); + printf("\t2、取款\n"); + printf("\t3、显示余额\n"); + printf("\t4、退出\n"); + printf("请选择(1-4):"); + + scanf("%d", &selection); + + switch (selection) { + case 1: + printf("您当前的余额是: %.2f\n", balance); + printf("请输入存款金额:"); + scanf("%lf", &addMoney); + balance += addMoney; + printf("存款成功,您当前的余额是:%.2f\n", balance); + break; + case 2: + printf("您当前的余额是: %.2f\n", balance); + printf("请输入取款金额:"); + scanf("%lf", &minusMoney); + if (minusMoney > balance) { + printf("余额不足,取款失败。\n"); + } else { + balance -= minusMoney; + printf("取款成功,您的余额为:%.2f\n", balance); + } + break; + case 3: + printf("您的账户余额为:%.2f\n", balance); + break; + case 4: + exitFlag = true; + printf("欢迎下次再来。\n"); + break; + default: + printf("输入有误,请重新输入。\n"); + break; + } + + } while (!exitFlag); + + return 0; +} +``` + +## 5.5 嵌套循环 + +### 5.5.1 概述 + +* 所谓的嵌套循环,是指一个循环结构 A 的循环体是另一个循环结构 B 。例如:for 循环里面还有一个for 循环,就是嵌套循环。 +* 语法: + +```c +for(初始化语句①; 循环条件语句②; 迭代语句⑦) { + for(初始化语句③; 循环条件语句④; 迭代语句⑥) { + 循环体语句⑤; + } +} +``` + +* 其中,for 、while 、do-while 均可以作为外层循环或内层循环。 + - 外层循环:循环结构 A + - 内层循环:循环结构 B + +![](./assets/10.png) + +> [!NOTE] +> +> * ① 实际上,嵌套循环就是将内层循环当成外层循环的循环体。当只有内层循环的循环条件为 false ,才会完全跳出内层循环,才可结束外层的当次循环,开始下一次循环。 +> * ② 假设外层循环次数为 m 次,内层循环次数为 n 次,则内层循环体实际上需要执行 m × n 次。 +> * ③ 从二维图形的角度看,外层循环控制`行数`,内层循环控制`列数`。 +> * ④ 实际开发中,我们最多见到的嵌套循环是两层,一般不会出现超过三层的嵌套循环。如果将要出现,一定要停下来重新梳理业务逻辑,重新思考算法的实现,控制在三层以内;否则,可读性会很差。 + + + +### 5.5.2 应用示例 + +* 需求:打印 5 行 `*` ,要求每行 6 个 `*` 。 + + + +* 示例: + +```c +#include + +int main() { + + for (int i = 1; i <= 5; ++i) { + for (int j = 1; j < 6; ++j) { + printf("* "); + } + printf("\n"); + } + + return 0; +} + +``` + +### 5.5.3 应用示例 + +* 需求:打印 5 行直角三角形。 + + + +* 示例: + +```c +#include + +int main() { + + for (int i = 1; i <= 5; ++i) { + for (int j = 1; j <= i; ++j) { + printf("* "); + } + printf("\n"); + } + + return 0; +} +``` + +### 5.5.4 应用示例 + +* 需求:打印 5 行倒直角三角形。 + + + +* 示例: + +```c +#include + +int main() { + + for (int i = 1; i <= 5; ++i) { + for (int j = 1; j <= 6 - i; ++j) { + printf("* "); + } + printf("\n"); + } + + return 0; +} +``` + +### 5.5.5 应用示例 + +* 需求:打印 9 `×` 9 乘法表。 + + + +* 示例: + +```c +#include + +int main() { + + for (int i = 1; i <= 9; ++i) { + for (int j = 1; j <= i; ++j) { + printf("%d × %d = %d ", i, j, i * j); + } + printf("\n"); + } + + return 0; +} +``` + +## 5.6 无限循环 + +* 语法: + +```c +while(1){ + ... +} +``` + +```c +for(;;){ + ... +} +``` + +> [!NOTE] +> +> * ① 在开发中,有的时候并不确定需要循环多少次,就需要根据循环体内部的某些条件,来控制循环的结束(break)。 +> * ② 如果上述的循环结构不能终止,就会构成死循环;所以,在实际开发中,要避免出现死循环!!! + + + +* 示例:从键盘读入个数不确定的整数,并判断读入的正数和负数的个数,输入为 0 时结束程序 + +```c +#include + +int main() { + + // 记录输入的整数 + int num = 0; + // 记录正数个数 + int positiveCount = 0; + // 记录负数个数 + int negativeCount = 0; + + while (true) { + printf("请输入一个整数:"); + scanf("%d", &num); + if (num > 0) { + positiveCount++; + } else if (num < 0) { + negativeCount++; + } else { + printf("程序结束!\n"); + break; + } + } + + printf("正数的个数:%d\n", positiveCount); + printf("负数的个数:%d\n", negativeCount); + + return 0; +} + +``` + +## 5.7 跳转控制语句 + +### 5.7.1 break + +* break 的使用场景:break 语句用于终止某个语句块的执行,用在switch语句或者循环语句中。 + +> [!NOTE] +> +> break 一旦执行,就结束(或跳出)当前循环结构;并且,此关键字的后面,不能声明其它语句。 + +* 流程图,如下所示: + +![](./assets/11.png) + + + +* 示例:打印 0 ~ 10 ,如果遇到 `3` ,就停止打印 + +```c +#include + +int main() { + + for (int i = 0; i < 10; ++i) { + if (i == 3) { + break; + } + printf("%d \n", i); + } + + printf("程序结束!\n"); + + return 0; +} +``` + + + +* 示例:编写程序,要求输入一个数字,判断该数字是否是质数 + +```c +#include + +int main() { + + bool isFlag = false; + int num = 0; + do { + + printf("请输入一个整数(必须大于 1 ):"); + scanf("%d", &num); + + if (num <= 1) { + printf("输入的数字不是合法,请重新输入!!!\n"); + isFlag = true; + } else { + isFlag = false; + } + + } while (isFlag); + + bool isPrime = true; + for (int i = 2; i < num; i++) { + if (num % i == 0) { + isPrime = false; + break; + } + } + if (isPrime) { + printf("%d 是一个质数\n", num); + } else { + printf("%d 不是一个质数\n", num); + } + + printf("程序结束!\n"); + + return 0; +} +``` + +### 5.7.2 continue + +* continue 的使用场景:continue 语句用于结束本次循环,继续执行下一次循环。 + +> [!NOTE] +> +> continue 一旦执行,就结束(或跳出)当次循环结构;并且,此关键字的后面,不能声明其它语句。 + + + +* 流程图,如下所示: + +![](./assets/12.png) + + + +* 示例:打印 0 ~ 10 ,如果遇到 `3` ,就继续下一次打印 + +```c +#include + +int main() { + + for (int i = 0; i < 10; ++i) { + if (i == 3) { + continue; + } + printf("%d \n", i); + } + + printf("程序结束!\n"); + + return 0; +} +``` + + + +* 示例:输出 100 以内(包括 100)的数字,跳过那些 7 的倍数或包含 7 的数字 + +```c +#include + +int main() { + + for (int i = 1; i <= 100; i++) { + if (i % 7 == 0 || i % 10 == 7 || i / 10 == 7) { + continue; + } + printf("%d ", i); + } + + printf("程序结束!\n"); + + return 0; +} +``` + +### 5.7.3 return + +* return :并非专门用于结束循环的,它的功能是结束一个方法。当一个方法执行到一个 return 语句的时候,这个方法将被结束。 + +> [!NOTE] +> +> 和 break 和 continue 不同的是,return 直接结束整个方法,不管这个 return 处于多少层循环之内。 + + + +* 示例: + +```c +#include + +int main() { + + for (int i = 1; i <= 100; i++) { + if (i % 7 == 0 || i % 10 == 7 || i / 10 == 7) { + return 0; // 结束整个函数或方法 + } + printf("%d ", i); + } + + printf("程序结束!\n"); + + return 0; +} +``` -![](./assets/27.gif) diff --git a/docs/notes/01_c-basic/07_xdx/assets/1.jpeg b/docs/notes/01_c-basic/08_xdx/assets/1.jpeg similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/1.jpeg rename to docs/notes/01_c-basic/08_xdx/assets/1.jpeg diff --git a/docs/notes/01_c-basic/08_xdx/assets/1.png b/docs/notes/01_c-basic/08_xdx/assets/1.png deleted file mode 100644 index ee71223..0000000 Binary files a/docs/notes/01_c-basic/08_xdx/assets/1.png and /dev/null differ diff --git a/docs/notes/01_c-basic/07_xdx/assets/10.gif b/docs/notes/01_c-basic/08_xdx/assets/10.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/10.gif rename to docs/notes/01_c-basic/08_xdx/assets/10.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/11.gif b/docs/notes/01_c-basic/08_xdx/assets/11.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/11.gif rename to docs/notes/01_c-basic/08_xdx/assets/11.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/12.gif b/docs/notes/01_c-basic/08_xdx/assets/12.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/12.gif rename to docs/notes/01_c-basic/08_xdx/assets/12.gif diff --git a/docs/notes/01_c-basic/08_xdx/assets/13.png b/docs/notes/01_c-basic/08_xdx/assets/13.png index 97a42fd..9e43182 100644 Binary files a/docs/notes/01_c-basic/08_xdx/assets/13.png and b/docs/notes/01_c-basic/08_xdx/assets/13.png differ diff --git a/docs/notes/01_c-basic/08_xdx/assets/14.jpg b/docs/notes/01_c-basic/08_xdx/assets/14.jpg deleted file mode 100644 index 01e4ab4..0000000 Binary files a/docs/notes/01_c-basic/08_xdx/assets/14.jpg and /dev/null differ diff --git a/docs/notes/01_c-basic/07_xdx/assets/14.png b/docs/notes/01_c-basic/08_xdx/assets/14.png similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/14.png rename to docs/notes/01_c-basic/08_xdx/assets/14.png diff --git a/docs/notes/01_c-basic/07_xdx/assets/15.gif b/docs/notes/01_c-basic/08_xdx/assets/15.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/15.gif rename to docs/notes/01_c-basic/08_xdx/assets/15.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/16.gif b/docs/notes/01_c-basic/08_xdx/assets/16.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/16.gif rename to docs/notes/01_c-basic/08_xdx/assets/16.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/167.gif b/docs/notes/01_c-basic/08_xdx/assets/167.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/167.gif rename to docs/notes/01_c-basic/08_xdx/assets/167.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/17.gif b/docs/notes/01_c-basic/08_xdx/assets/17.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/17.gif rename to docs/notes/01_c-basic/08_xdx/assets/17.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/18.gif b/docs/notes/01_c-basic/08_xdx/assets/18.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/18.gif rename to docs/notes/01_c-basic/08_xdx/assets/18.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/19.gif b/docs/notes/01_c-basic/08_xdx/assets/19.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/19.gif rename to docs/notes/01_c-basic/08_xdx/assets/19.gif diff --git a/docs/notes/01_c-basic/08_xdx/assets/19.png b/docs/notes/01_c-basic/08_xdx/assets/19.png deleted file mode 100644 index e1999a2..0000000 Binary files a/docs/notes/01_c-basic/08_xdx/assets/19.png and /dev/null differ diff --git a/docs/notes/01_c-basic/07_xdx/assets/2.jpg b/docs/notes/01_c-basic/08_xdx/assets/2.jpg similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/2.jpg rename to docs/notes/01_c-basic/08_xdx/assets/2.jpg diff --git a/docs/notes/01_c-basic/08_xdx/assets/2.png b/docs/notes/01_c-basic/08_xdx/assets/2.png deleted file mode 100644 index e4c8b48..0000000 Binary files a/docs/notes/01_c-basic/08_xdx/assets/2.png and /dev/null differ diff --git a/docs/notes/01_c-basic/07_xdx/assets/20.gif b/docs/notes/01_c-basic/08_xdx/assets/20.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/20.gif rename to docs/notes/01_c-basic/08_xdx/assets/20.gif diff --git a/docs/notes/01_c-basic/08_xdx/assets/20.png b/docs/notes/01_c-basic/08_xdx/assets/20.png deleted file mode 100644 index 144a112..0000000 Binary files a/docs/notes/01_c-basic/08_xdx/assets/20.png and /dev/null differ diff --git a/docs/notes/01_c-basic/07_xdx/assets/21.gif b/docs/notes/01_c-basic/08_xdx/assets/21.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/21.gif rename to docs/notes/01_c-basic/08_xdx/assets/21.gif diff --git a/docs/notes/01_c-basic/08_xdx/assets/21.png b/docs/notes/01_c-basic/08_xdx/assets/21.png deleted file mode 100644 index 6447946..0000000 Binary files a/docs/notes/01_c-basic/08_xdx/assets/21.png and /dev/null differ diff --git a/docs/notes/01_c-basic/07_xdx/assets/22.gif b/docs/notes/01_c-basic/08_xdx/assets/22.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/22.gif rename to docs/notes/01_c-basic/08_xdx/assets/22.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/23.gif b/docs/notes/01_c-basic/08_xdx/assets/23.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/23.gif rename to docs/notes/01_c-basic/08_xdx/assets/23.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/24.gif b/docs/notes/01_c-basic/08_xdx/assets/24.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/24.gif rename to docs/notes/01_c-basic/08_xdx/assets/24.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/25.gif b/docs/notes/01_c-basic/08_xdx/assets/25.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/25.gif rename to docs/notes/01_c-basic/08_xdx/assets/25.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/26.png b/docs/notes/01_c-basic/08_xdx/assets/26.png similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/26.png rename to docs/notes/01_c-basic/08_xdx/assets/26.png diff --git a/docs/notes/01_c-basic/07_xdx/assets/27.gif b/docs/notes/01_c-basic/08_xdx/assets/27.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/27.gif rename to docs/notes/01_c-basic/08_xdx/assets/27.gif diff --git a/docs/notes/01_c-basic/07_xdx/assets/3.jpg b/docs/notes/01_c-basic/08_xdx/assets/3.jpg similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/3.jpg rename to docs/notes/01_c-basic/08_xdx/assets/3.jpg diff --git a/docs/notes/01_c-basic/08_xdx/assets/3.png b/docs/notes/01_c-basic/08_xdx/assets/3.png deleted file mode 100644 index 37855ed..0000000 Binary files a/docs/notes/01_c-basic/08_xdx/assets/3.png and /dev/null differ diff --git a/docs/notes/01_c-basic/07_xdx/assets/4.jpg b/docs/notes/01_c-basic/08_xdx/assets/4.jpg similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/4.jpg rename to docs/notes/01_c-basic/08_xdx/assets/4.jpg diff --git a/docs/notes/01_c-basic/07_xdx/assets/5.jpg b/docs/notes/01_c-basic/08_xdx/assets/5.jpg similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/5.jpg rename to docs/notes/01_c-basic/08_xdx/assets/5.jpg diff --git a/docs/notes/01_c-basic/07_xdx/assets/6.gif b/docs/notes/01_c-basic/08_xdx/assets/6.gif similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/6.gif rename to docs/notes/01_c-basic/08_xdx/assets/6.gif diff --git a/docs/notes/01_c-basic/08_xdx/assets/7.png b/docs/notes/01_c-basic/08_xdx/assets/7.png index ffda4ca..ab88f98 100644 Binary files a/docs/notes/01_c-basic/08_xdx/assets/7.png and b/docs/notes/01_c-basic/08_xdx/assets/7.png differ diff --git a/docs/notes/01_c-basic/07_xdx/assets/8.jpg b/docs/notes/01_c-basic/08_xdx/assets/8.jpg similarity index 100% rename from docs/notes/01_c-basic/07_xdx/assets/8.jpg rename to docs/notes/01_c-basic/08_xdx/assets/8.jpg diff --git a/docs/notes/01_c-basic/08_xdx/assets/9.png b/docs/notes/01_c-basic/08_xdx/assets/9.png index f61e018..03969dd 100644 Binary files a/docs/notes/01_c-basic/08_xdx/assets/9.png and b/docs/notes/01_c-basic/08_xdx/assets/9.png differ diff --git a/docs/notes/01_c-basic/08_xdx/index.md b/docs/notes/01_c-basic/08_xdx/index.md index 2eda323..79a6812 100644 --- a/docs/notes/01_c-basic/08_xdx/index.md +++ b/docs/notes/01_c-basic/08_xdx/index.md @@ -1,1357 +1,510 @@ -# 第一章:数组的概念 +# 第一章:内存泄漏(Memory Leak) -## 1.1 为什么需要数组? +## 1.1 概述 -### 1.1.1 需求分析 1 +* 有没有过这样的日子,总感觉我们的电脑,不是一个尖端的设备,而像一只疲惫的蜗牛。它在缓慢的爬行,并试图背着重重的楼房去跑马拉松,如下所示: -* 需要统计某公司 50 个员工的工资情况,例如:计算平均工资、最高工资等。如果使用之前的知识,我们需要声明 50 个变量来分别记录每位员工的工资,即: +![](./assets/1.jpeg) + +> [!NOTE] +> +> 儿歌《蜗牛与黄鹂鸟》的歌词是这样的,如下所示: +> +> * 阿门阿前一棵葡萄树。 +> * 阿嫩阿嫩绿地刚发芽。 +> * 蜗牛背着那重重的壳呀。 +> * 一步一步地往上爬。 +> * 阿树阿上两只黄鹂鸟。 +> * 阿嘻阿嘻哈哈在笑它。 +> * 葡萄成熟还早得很哪。 +> * 现在上来干什么。 +> * 阿黄阿黄鹂儿不要笑。 +> * 等我爬上它就成熟了。 +> +> 虽然歌曲的主旨是想通过蜗牛与黄鹂鸟的对话,表达了努力和坚持的重要性,即使速度慢,只要坚定地往前走,总会达到目标。但是,也从侧面说明了蜗牛的速度真的很慢。 + +* 亦或者,我们的电脑就像一个蹒跚学步的孩子在发脾气,我们多么希望她们耐心点,并配合我们。可是,她们总是拒绝和我们合作,如下所示: + +![](./assets/2.jpg) + +* 如果这些场景,你都感觉很熟悉,那么你很有可能就是`内存泄漏`的受害者。 + +> [!NOTE] +> +> * ① `内存泄漏`虽然不可见,但是它会悄悄的蚕食计算机的性能,让曾经快速的系统变成一台陈旧的机器。 +> * ② 最为糟糕的时,和留下明显迹象的`漏水`不同,`内存泄漏`是不可见的,这使得它们难以识别,甚至难以修复。也正是因为这个特点,让开发人员和计算机用户都感觉头疼。 + +## 1.2 什么是内存泄漏? + +* 我们可以将我们的计算机想象成一个繁华的城市,城市的`道路`就代表着计算器的`内存`(计算机的内存是有限的,普遍的家用个人台式机电脑最多只支持 `4` 根内存条。如果是 `DDR4` 的话,最多也就支持 `128` GB。就算是服务器,也不是无穷无尽的),在其上运行的`程序`就像`车辆`一样,每辆车都执行各自的任务,如下所示: + +> [!NOTE] +> +> * ① 操作系统或计算机允许程序自己分配内存,并自由使用。并且,当程序执行完自己的任务之后,还可以释放掉内存,将内存还给操作系统或计算机。 +> * ② 需要说明的是,并不是程序结束运行,才会释放掉内存:在 C/C++ 等语言中,是可以在程序执行完任务之后,由程序员手动释放之前申请的内存,即:调用释放内存的函数。而 Java 等 GC 的编程语言,会由 GC 帮助程序员释放内存,当然从理论上讲会有稍许停顿。但是,像 Java 语言中的 ZGC 现在已经可以控制在 10ms 了,人几乎感觉不到!!! +> * ③ 所谓的`分配内存`,就是程序向计算机或操作系统,申请一块内存空间,然后自己使用。 +> * ④ 所谓的`释放内存`,就是程序告诉计算机或操作系统,不再需要使用之前申请的内存空间,那么就可以将之前申请的内存空间,归还给操作系统或计算机,让其它的程序使用。 +> * ⑤ 上面例子中的`程序`就像`车辆`一样,每辆车都执行各自的任务,类似于程序在执行的时候,向操作系统申请自己的内存空间,并完成自己的任务。 + +![](./assets/3.jpg) + +* 但是,如果有些车辆在完成自己的任务之后,就决定无限期的停在路上,而不是离开。那么,可以想象到的是,随着时间的推移,这些停放的汽车就会开始阻塞城市的道路,减慢交通速度,如下所示: + +![](./assets/4.jpg) + +> [!NOTE] +> +> * ① 需要说明的是,道路或网络的利用率并非越高越好。 +> * ② 如果使用 D0 表示道路或网络空闲时的时延(数据包(或车辆)几乎没有排队,时延 D0 只是基本的传输或行驶时间),而 D 表示道路或网络当前的时延(数据包(或车辆)可能需要排队,这导致了额外的时延,时延 D 是包含了排队时间的总时延),那么在理想的条件下,可以使用如下的表达式来表示 D、D0 以及道路或网络利用率 U 之间的关系,即:$U = \frac{D - D_0}{D}$,经过换算一下,其结果就是:$D = \frac{D_0}{1 - U}$。 +> * ③ 显而易见,道路或网络利用率并不是越大越好,过高的道路或网络利用率会产生非常大的时延。 + +* 由此可见,在极端情况下,这座城市甚至可能陷入停顿。 + +> [!NOTE] +> +> 这实际上就是`内存泄漏`对计算机的影响,即: +> +> * ① 程序可能会变慢,甚至崩溃,特别是在长时间运行的程序中。 +> * ② `内存泄漏`会逐渐耗尽系统内存,造成资源浪费,并导致系统性能下降。 + +* 再或者,在生活中,我们必然需要用水,如果规定每个人一个月的用水量不能超过 `10t`,那么三口之间每个月的用水量就不能超过 `30t`。假设,由于水管老化或小动物(老鼠)的影响,而导致家中的水管产生轻微的破损,产生漏水的现象,如下所示: + +![](./assets/5.jpg) + +* 那么,家中隐藏的漏水问题在很长一段时间内是不会被注意到的。亦或者,假设每个人的用水量都没有限制,那么如果要用到 `30t` ,必然会比之前没有漏水的时候,产生的水费也要多很多。 + +> [!IMPORTANT] +> +> 官方定义:`内存泄漏`是指计算机程序无意中消耗的一种特定类型的内存,其中程序无法释放不再需要或使用的内存(这种内存虽然不再被程序使用,但仍然占据着系统资源),进而导致这些内存无法被系统或其他程序再次使用,随着时间的推荐,会逐渐耗尽系统内存,并最终导致系统性能下降。 + +## 1.3 什么会触发内存泄漏? + +* 导致`内存泄漏`的原因很多,具体取决于编程语言、平台和特定的应用程序场景。以下是一些最常见的原因: + * ① **未关闭的资源**:未能关闭文件、数据库连接或网络套接字等资源可能会导致`内存泄漏`。如果这些资源保持打开状态,可能会随着时间的推移而累积并消耗大量内存。 + * ② **未释放的对象引用**:保留不再需要的对象引用可以防止垃圾回收器(在具有它们的语言中)回收内存。 + * ③ **循环引用**:在某些语言中,两个相互引用的对象可能会导致两个对象都无法被垃圾回收的情况,即使程序的其他部分没有引用它们。 + * ④ **静态集合**:使用随时间增长而从未清除的静态数据结构可能会导致`内存泄漏`。例如:将元素添加到静态列表而不删除它们可能会导致列表无限增长。 + * ⑤ **事件侦听器**:不分离事件侦听器或回调可能会导致`内存泄漏`,尤其是在 Web 浏览器等环境中。如果对象已附加到事件但不再使用,则不会对其进行垃圾回收,因为该事件仍包含对它的引用。 + * ⑥ **中间件和第三方库**:有时,`内存泄漏`的原因可能不在于应用程序代码,而在于它使用的中间件或第三方库。这些组件中的错误或低效代码可能会导致`内存泄漏`。 + * ⑦ **内存管理不当**:在开发人员手动管理内存的语言,如: C、C++ 中,使用后未能释放内存或使用 “悬空指针” 可能会导致泄漏。 + * ⑧ **内存碎片**:虽然不是传统意义上的泄漏,但碎片会导致内存使用效率低下。随着时间的推移,内存分配之间的小间隙会累积,从而难以分配更大的内存块。 + * ⑨ **孤立线程**:生成但未正确终止的线程可能会消耗内存资源。这些孤立线程会随着时间的推移而累积,尤其是在长时间运行的应用程序中。 + * ⑩ **缓存过度使用**:在没有适当驱逐策略的情况下实施缓存机制可能会导致内存无限消耗,尤其是在缓存无限增长的情况下。 + +* 在 C 语言中,可以使用 `while` 循环并结合 `malloc` 函数来实现一个内存泄漏的例子,即: ```c -#include +#include +#include -int main(){ - - double num1 = 0; - double num2 = 0; - double num3 = 0; - ... - printf("请输入第 1 个员工的工资:"); - scanf("%lf",&num1); - printf("请输入第 2 个员工的工资:"); - scanf("%lf",&num2); - printf("请输入第 3 个员工的工资:"); - scanf("%lf",&num3); - ... - return 0; -} -``` - -* 这样会感觉特别机械和麻烦(全是复制(Ctrl + c)和粘贴(Ctrl + v),CV 大法);此时,我们就可以将所有的`数据`全部存储到一个`容器(数组)`中进行统一管理,并进行其它的操作,如:求最值、求平均值等,如下所示: - -```c -#include - -int main(){ - // 声明数组 - double nums[50]; - // 数组的长度 - int length = sizeof(nums) / sizeof(double); - // 使用 for 循环向数组中添加值 - for(int i = 0;i < length;i++){ - printf("请输入第 &d 个员工的工资:",i); - scanf("%lf",&num[i]); +int main() { + while (true) { // 死循环 + malloc(1024); // 分配1024个字节的内存 } - // 其它操作,如:求最值,求平均值等 - ... return 0; } ``` -### 1.1.2 需求分析 2 +* 如果我们在 Windows 上运行该程序,就可以打开 Windows 的任务管理器(快捷键是`Ctrl + Shift + ESC`),将会发现内存的使用率在飙升。当然,稍等片刻后程序会被终止,是因为 Windows 的内存管理机制,发现我们的程序占用内存太多,会让它崩溃,防止系统卡死(其它的操作系统也有相应的措施)。 -* 在现实生活中,我们会使用很多 APP 或微信小程序等,即: +![](./assets/6.gif) -![](./assets/1.png) +## 1.4 内存泄漏会导致什么后果? -* 同样的道理,如果我们使用变量来存储每个商品信息,那么就需要非常多的变量;但是,如果我们将这些`商品信息`都存储到一个`容器(数组)`中,进行统一管理;那么,之后的数据处理将会非常方便。 +* ① **内存使用量增加**:随着泄漏和释放的内存越来越多,整体系统内存使用量会增加。这会减少可用于其他进程和应用程序的内存,从而降低系统速度。 +* ② **增加分页**:随着`内存泄漏`的累积,系统可能会开始将内存内容交换到磁盘以释放 RAM,从而导致更多的磁盘 I/O。这会导致性能降低,因为磁盘操作比内存操作慢得多。 +* ③ **内存不足错误**:如果`内存泄漏`足够多,系统最终可能会完全耗尽可用内存。这可能会导致崩溃、内存分配失败和程序终止。 +* ④ **资源争用**:较高的内存使用率还会导致对缓存和资源(如:CPU 时间等)的更多争用,因为系统尝试管理有限的资源。这会进一步降低性能。 +* ⑤ **应用程序不稳定**:随着内存使用量随着时间的推移而增长,存在`内存泄漏`的应用程序可能会遇到崩溃、意外行为和间歇性故障。这会导致不稳定和可靠性问题。 +* ⑥ **安全风险**:`内存泄漏`会使数据在内存中的延迟时间超过预期。此数据可能包含密码、密钥或其他敏感信息,如果恶意软件或攻击者访问这些信息,则会带来安全风险。 -### 1.1.3 容器的概念 +## 1.5 检测内存泄漏的工具或技术 -* `生活中的容器`:水杯(装水、饮料的容器)、衣柜(装衣服等物品的容器)、集装箱(装货物等物品的容器)。 -* `程序中的容器`:将多个数据存储到一起,并且每个数据称为该容器中的元素。 +* ① **分析工具**: + * ① Valgrind:用于构建动态分析工具的检测框架,最有名的 Memcheck 的套件,可以检测 C 和 C++ 程序中的内存泄漏。 + * ② Java VisualVM:适用于 Java 应用程序的监控、故障排除和分析工具。 + * ③ .NET Memory Profiler:用于查找内存泄漏并优化 .NET 应用程序中的内存使用的工具。 + * ④ Golang pprof:该工具可让您收集 Go 程序的 CPU 配置文件、跟踪和堆配置文件。 -## 1.2 什么是数组? +* ② **浏览器开发工具**:Chrome、Firefox 和 Edge 等现代 Web 浏览器附带内置的开发人员工具,可帮助识别 Web 应用程序中的内存泄漏,尤其是 JavaScript 中的内存泄漏。 -* 数组(Array)是将多个`相同数据类型`的`数据`按照一定的顺序排序的`集合`,并使用一个`标识符`命名,以及通过`编号(索引,亦称为下标)`的方式对这些数据进行统一管理。 +* ③ **静态分析**:Lint、SonarQube 或 Clang Static Analyzer 等工具可以扫描代码以识别可能导致内存泄漏的模式。 -![](./assets/2.png) +* ④ **自动化测试**:将内存泄漏检测整合到自动化测试中有助于在开发周期的早期捕获泄漏,如:JUnit(适用于 Java)或 pytest(适用于 Python)等工具可以与内存分析工具集成,以自动执行此过程。 -## 1.3 数组的相关概念 +* ⑤ **堆分析**:检查应用程序的堆转储,可以深入了解正在消耗内存的对象,如:Eclipse MAT(内存分析器工具)或 Java 堆分析工具 (jhat)等工具可以协助进行此分析。 -* `数组名`:本质上是一个标识符常量,命名需要符合标识符规则和规范。 -* `元素`:同一个数组中的元素必须是相同的数据类型。 -* `索引(下标)`:从 0 开始的连续数字。 -* `数组的长度`:就是元素的个数。 +* ⑥ **指标**:实施指标来监控一段时间内的内存使用情况,有助于识别导致内存消耗增加的模式或特定操作,如:Prometheus 和 Grafana 等。 -## 1.4 数组的特点 +* ⑦ **第三方库和中间件**:一些第三方解决方案提供内置的内存泄漏检测功能。如果我们怀疑这些组件可能是泄漏源,则必须查看与这些组件相关的文档或论坛。 +* ⑧ **手动代码审查**:有时,识别内存泄漏的最佳方法是对代码进行彻底的手动审查,尤其是在分配和释放内存的区域中。 +* ⑨ **压力测试**:在高负载或长时间运行应用程序,有助于暴露在正常情况下可能不明显的内存泄漏。 -* ① 创建数组的时候,会在内存中开辟一整块`连续的空间`,占据空间的大小,取决于数组的长度和数组中元素的类型。 -* ② 数组中的元素在内存中是依次紧密排列且有序的。 -* ③ 数组一旦初始化完成,且长度就确定的,并且`数组的长度一旦确定,就不能更改`。 -* ④ 我们可以直接通过索引(下标)来获取指定位置的元素,速度很快。 -* ⑤ 数组名中引用的是这块连续空间的首地址。 +## 1.6 如何避免内存泄漏? +* ① **及时释放内存**:在程序中,确保在不再需要使用内存时及时释放它。 +* ② **智能指针**:使用智能指针来帮助在 C++ 等编程语言中进行自动内存管理。 +* ③ **将编程语言与垃圾回收器一起使用**:内存分配和释放由 Python 和 Java 等编程语言自动处理,这些语言包含内置的垃圾收集系统。 +* ④ **利用内存管理策略:** 有效的内存管理可以防止内存泄漏。这包括始终监控我们的软件使用了多少内存,并了解何时分配和取消分配内存,即:检测内存泄漏的工具或技术。 -# 第二章:数组的操作(⭐) +## 1.7 总结 -## 2.1 数组的定义 +* **内存泄漏**是由于未释放不再使用的内存,导致内存资源逐渐减少,但不会立即导致程序崩溃,而是`长时间`运行后可能出现性能问题或最终崩溃。 -### 2.1.1 动态初始化 -* 语法: -```c -数据类型 数组名[元素个数|长度]; -``` +# 第二章:内存溢出(Out Of Memory,OOM) -> [!NOTE] -> -> * ① 数据类型:表示的是数组中每一个元素的数据类型。 -> * ② 数组名:必须符合标识符规则和规范。 -> * ③ 元素个数或长度:表示的是数组中最多可以容纳多少个元素(不能是负数、也不能是 0 )。 +## 2.1 概述 - - -* 示例: - -```c -#include - -int main() { - - // 先指定元素的个数和类型,再进行初始化 - - // 定义数组 - int arr[3]; - - // 给数组元素赋值 - arr[0] = 10; - arr[1] = 20; - arr[2] = 30; - - return 0; -} -``` - -### 2.1.2 静态初始化 1 - -* 语法: - -```c -数据类型 数组名[元素个数|长度] = {元素1,元素2,...} -``` - -> [!NOTE] -> -> * ① 静态部分初始化:如果数组初始化的元素个数`小于`数组声明的长度,那么就会从数组开始位置依次赋值,不够的就补 0 。 -> * ② 静态全部初始化:数组初始化的元素个数`等于`数组的长度。 - -> [!TIP] -> -> 在 CLion 中开启`嵌入提示(形参名称-->显示数组索引的提示)`功能,即: -> -> ![](./assets/3.png) -> -> 这样,在 CLion 中,将会显示数组初始化时每个元素对应的索引,即: -> -> ![](./assets/4.png) - - - -* 示例:静态部分初始化 - -```c -#include - -int main() { - - // 定义数组和部分初始化: - // 会将给定的值从数组的开始位置一个个的赋值,没有赋值的地方,用 0 填充 - int arr[5] = {1, 2}; - - return 0; -} -``` - - - -* 示例:静态全部初始化 - -```c -#include - -int main() { - - // 定义数组和全部初始化:数组初始化的元素个数等于数组的长度。 - int arr[5] = {1, 2, 3, 4, 5}; - - return 0; -} -``` - -### 2.1.3 静态初始化 2 - -* 语法: - -```c -数据类型 数组名[] = {元素1,元素2,...} -``` - -> [!NOTE] -> -> 没有给出数组中元素的个数,将由系统根据初始化的元素,自动推断出数组中元素的个数。 - - - -* 示例: - -```c -#include - -int main() { - - // 指定元素的类型,不指定元素个数,同时进行初始化 - int arr[] = {1, 2, 3, 4, 5}; - - return 0; -} -``` - -### 2.1.4 静态初始化 3 - -* 在 C 语言中,也可以只给部分元素赋值。当 {} 中的值少于元素的个数的时候,只会给前面的部分元素赋值,至于剩下的元素就会自动初始化为 0 。 - -```c -int arr[10] = {1,2,3,4,5}; -``` - -> [!NOTE] -> -> * ① 数组 `arr` 在内存中开辟了 `10` 个连续的内存空间,但是只会给前 `5` 个内存空间赋值初始化值,即:`arr[0] ~ arr[4]` 分别是 `1`、`2`、`3`、`4`、`5`,而 `arr[5] ~ arr[9]` 就会被自动初始化为 `0` 。 -> * ② 当赋值的元素少于数组总体元素的时候,剩余的元素自动初始化为 `0`,其规则如下: -> * 对于 `short`、`int`、`long`,就是整数 `0`。 -> * 对于 `char`,就是字符 `'\0'`。需要注意的是,`'\0'` 的十进制数就是 `0` 。 -> * 对于 `float`、`double`,就是小数 `0.0`。 - - - -* 示例: - -```c -#include -int main() { - int arr[10] = {1, 2, 3, 4, 5}; - - printf("arr[0] = %d \n", arr[0]); // arr[0] = 1 - printf("arr[1] = %d \n", arr[1]); // arr[1] = 2 - printf("arr[2] = %d \n", arr[2]); // arr[2] = 3 - printf("arr[3] = %d \n", arr[3]); // arr[3] = 4 - printf("arr[4] = %d \n", arr[4]); // arr[4] = 5 - printf("arr[5] = %d \n", arr[5]); // arr[5] = 0 - printf("arr[6] = %d \n", arr[6]); // arr[6] = 0 - printf("arr[7] = %d \n", arr[7]); // arr[7] = 0 - printf("arr[8] = %d \n", arr[8]); // arr[8] = 0 - printf("arr[9] = %d \n", arr[9]); // arr[9] = 0 - - return 0; -} -``` - - - -## 2.2 访问数组元素 - -* 语法: - -```c -数组名[索引|下标]; -``` - -> [!NOTE] -> -> 假设数组 `arr` 有 n 个元素,如果使用的数组的下标 `< 0` 或 `> n-1` ,那么将会产生数组越界访问,即超出了数组合法空间的访问;那么,数组的索引范围是 `[0,arr.length - 1]`。 - - - -* 示例: - -```c -#include - -int main() { - - // 先指定元素的个数和类型,再进行初始化 - - // 定义数组 - int arr[3]; - - // 给数组元素赋值 - arr[0] = 10; - arr[1] = 20; - arr[2] = 30; - - // 访问数组元素 - printf("arr[0] = %d\n", arr[0]); // arr[0] = 10 - printf("arr[1] = %d\n", arr[1]); // arr[1] = 20 - printf("arr[2] = %d\n", arr[2]); // arr[2] = 30 - - return 0; -} -``` - - - -* 示例: - -```c -#include - -int main() { - - // 定义数组和部分初始化: - // 会将给定的值从数组的开始位置一个个的赋值,没有赋值的地方,用 0 填充 - int arr[5] = {1, 2}; - - // 访问数组元素 - printf("arr[0] = %d\n", arr[0]); // arr[0] = 1 - printf("arr[1] = %d\n", arr[1]); // arr[1] = 2 - printf("arr[2] = %d\n", arr[2]); // arr[2] = 0 - printf("arr[3] = %d\n", arr[3]); // arr[3] = 0 - printf("arr[4] = %d\n", arr[4]); // arr[4] = 0 - - return 0; -} -``` - - - -* 示例: - -```c -#include - -int main() { - - // 指定元素的类型,不指定元素个数,同时进行初始化 - int arr[] = {1, 2, 3, 4, 5}; - - // 访问数组元素 - printf("arr[0] = %d\n", arr[0]); // arr[0] = 1 - printf("arr[1] = %d\n", arr[1]); // arr[1] = 2 - printf("arr[2] = %d\n", arr[2]); // arr[2] = 3 - printf("arr[3] = %d\n", arr[3]); // arr[3] = 4 - printf("arr[4] = %d\n", arr[4]); // arr[4] = 5 - - return 0; -} -``` - - - -* 示例: - -```c -#include - -int main() { - - // 定义数组和全部初始化:数组初始化的元素个数等于数组的长度。 - int arr[5] = {1, 2, 3, 4, 5}; - - // 访问数组元素 - printf("arr[0] = %d\n", arr[0]); // arr[0] = 1 - printf("arr[1] = %d\n", arr[1]); // arr[1] = 2 - printf("arr[2] = %d\n", arr[2]); // arr[2] = 3 - printf("arr[3] = %d\n", arr[3]); // arr[3] = 4 - printf("arr[4] = %d\n", arr[4]); // arr[4] = 5 - - return 0; -} -``` - -## 2.3 数组越界 - -* 数组下标必须在指定范围内使用,超出范围视为越界。 - -![](./assets/5.png) - -> [!NOTE] -> -> * ① C 语言是不会做数组下标越界的检查,并且编译器也不会报错;但是,编译器不报错,并不意味着程序就是正确! -> * ② 在其它高级编程语言,如:Java、JavaScript、Rust 等中,如果数组越界访问,编译器是会直接报错的!!! - - - -* 示例: - -```c -#include - -int main() { - - // 定义数组和全部初始化:数组初始化的元素个数等于数组的长度。 - int arr[] = {1, 2, 3, 4, 5}; - - // 访问数组元素 - printf("arr[0] = %d\n", arr[0]); // arr[0] = 1 - printf("arr[1] = %d\n", arr[1]); // arr[1] = 2 - printf("arr[2] = %d\n", arr[2]); // arr[2] = 3 - printf("arr[3] = %d\n", arr[3]); // arr[3] = 4 - printf("arr[4] = %d\n", arr[4]); // arr[4] = 5 - printf("arr[-1] = %d\n", arr[-1]); // 得到的是不确定的结果 - printf("arr[5] = %d\n", arr[5]); // 得到的是不确定的结果 - - return 0; -} -``` - -## 2.4 计算数组的长度 - -* 数组长度(元素个数)是在数组定义的时候明确指定且固定的,我们不能在运行的时候直接获取数组长度;但是,我们可以通过 sizeof 运算符间接计算出数组的长度。 -* 计算步骤,如下所示: - * ① 使用 sizeof 运算符计算出整个数组的字节长度。 - * ② 由于数组成员是同一数据类型;那么,每个元素的字节长度一定相等,那么`数组的长度 = 整个数组的字节长度 ÷ 单个元素的字节长度 `。 - -![](./assets/6.png) - -> [!NOTE] -> -> * ① 在很多编程语言中,都内置了获取数组的长度的属性或方法,如:Java 中的 arr.length 或 Rust 的 arr.len()。 -> * ② 但是,C 语言没有内置的获取数组长度的属性或方法,只能通过 sizeof 运算符间接来计算得到。 -> * ③ 数组一旦`声明`或`定义`,其`长度`就`固定`了,`不能动态变化`。 - - - -* 示例: - -```c -#include - -int main() { - - // 定义数组和全部初始化:数组初始化的元素个数等于数组的长度。 - int arr[] = {1, 2, 3, 4, 5}; - - // 计算数组的长度 - size_t length = sizeof(arr) / sizeof(arr[0]); - - // 遍历数组 - for (int i = 0; i < length; i++) { - printf("%d \n", arr[i]); - } - - return 0; -} -``` - -## 2.5 遍历数组 - -* 遍历数组是指按顺序访问数组中的每个元素,以便读取或修改它们,编程中一般使用循环结构对数组进行遍历。 - - - -* 示例:声明一个存储有 12、2、31、24、15、36、67、108、29、51 的数组,并遍历数组所有元素 - -```c -#include - -int main() { - - // 定义数组并初始化 - int arr[] = {12, 2, 31, 24, 15, 36, 67, 108, 29, 51}; - - // 计算数组的长度 - size_t length = sizeof(arr) / sizeof(int); - - // 遍历数组 - for (int i = 0; i < length; i++) { - printf("%d\n", arr[i]); - } - - return 0; -} -``` - - - -* 示例:声明长度为 10 的 int 类型数组,给数组元素依次赋值为 0 ~ 9 ,并遍历数组所有元素 - -```c -#include - -int main() { - - // 定义数组 - int arr[10]; - - // 计算数组的长度 - size_t length = sizeof(arr) / sizeof(int); - - // 给数组的每个元素赋值 - for (int i = 0; i < length; i++) { - arr[i] = i; - } - - // 遍历数组 - for (int i = 0; i < length; i++) { - printf("%d\n", arr[i]); - } - - return 0; -} -``` - -## 2.6 一维数组的内存分析 - -### 2.6.1 数组内存图 - -* 假设数组是如下的定义: - -```c -int arr[] = {1,2,3,4,5}; -``` - -* 那么,对应的内存结构,如下所示: +* 首先,说明一点,在国内的很多文章中,都将 `Out Of Memory(OOM)`翻译为 `内存溢出`,但是本人认为翻译为`内存不足`更为贴切。 +* 在生活中,我们在使用计算机的时候,可能会遇到打开视频网站的时候,视频网站崩溃了,并且在浏览器上显示报错信息`Error Code Out Of Memory`,如下所示: ![](./assets/7.png) -> [!NOTE] -> -> * ① 数组名 `arr` 就是记录该数组的首地址,即 `arr[0]` 的地址。 -> * ② 数组中的各个元素是连续分布的,假设 `arr[0]` 的地址是 `0xdea7bff880`,则 `arr[1] 的地址 = arr[0] 的地址 + int 字节数(4) = 0xdea7bff880 + 4 = 0xdea7bff884` ,依次类推... +* 当然,我们在使用微软办公套件,如:Outlook 的时候,可能也会遇到系统提示 `Out Of Memory`,如下所示: -* 在 C 语言中,我们可以通过 `&arr` 或 `&arr[0]` 等形式获取数组或数组元素的地址,即: +![](./assets/8.jpg) -```c -#include +* 亦或者,我们在打游戏的时候,会遇到系统提示 `Out Of Memory`,如下所示: -int main() { +![](./assets/9.png) - // 定义数组 - int arr[10]; - - // 计算数组的长度 - size_t length = sizeof(arr) / sizeof(int); - - // 给数组的每个元素赋值 - for (int i = 0; i < length; i++) { - arr[i] = i; - } - - printf("数组的地址是 = %p\n", arr); - - // 遍历数组 - for (int i = 0; i < length; i++) { - printf("数组元素 %d 的地址是 = %p\n", arr[i], &arr[i]); - } - - return 0; -} -``` - -### 2.6.2 数组的注意事项 - -* `C 语言规定,数组一旦声明,数组名指向的地址将不可更改`。因为在声明数组的时候,编译器会自动会数组分配内存地址,这个地址和数组名是绑定的,不可更改。 - -> [!WARNING] -> -> 如果之后试图更改数组名对应的地址,编译器就会报错。 - - - -* 示例:错误演示 - -```c -int num[5]; // 声明数组 - -// 使用大括号重新赋值是不允许的,必须在数组声明的时候赋值,否则编译将会报错 -num = {1,2,3,4,5} ; // [!code error] -``` - - - -* 示例:错误演示 - -```c -int num[] = {1,2,3,4,5}; - -// 使用大括号重新赋值是不允许的,必须在数组声明的时候赋值,否则编译将会报错 -num = {2,3,4,5,6}; // [!code error] -``` - - - -* 示例:错误演示 - -```c -int num[5]; - -// 报错,需要和 Java 区别一下,在 C 中不可以 -num = NULL; // [!code error] -``` - - - -* 示例:错误演示 - -```c -int a[] = {1,2,3,4,5} - -// 报错,需要和 Java 区别一下,在 C 中不可以 -int b[5] = a ; // [!code error] -``` - -## 2.7 数组应用案例 - -### 2.7.1 应用示例 - -* 需求:计算数组中所有元素的和以及平均数。 - - - -* 示例: - -```c -#include - -int main() { - - // 定义数组并初始化 - int arr[] = {12, 2, 31, 24, 15, 36, 67, 108, 29, 51}; - - // 计算数组的长度 - size_t length = sizeof(arr) / sizeof(int); - - // 变量保存总和 - int sum = 0; - - // 遍历数组 - for (int i = 0; i < length; i++) { - sum += arr[i]; - } - - double avg = (double)sum / length; - printf("数组的和为:%d\n", sum); // 数组的和为:375 - printf("数组的平均值为:%.2lf\n", avg); //数组的平均值为:37.50 - - return 0; -} -``` - -### 2.7.2 应用示例 - -* 需求:计算数组的最值(最大值和最小值)。 +* 上述的种种情景,都表明了内存溢出(内存不足,OOM)是`立即显现`的问题,尤其是当系统无法分配足够内存时,会直接导致程序崩溃或异常。 > [!NOTE] > -> 思路: +> * ① 内存泄漏是一种`逐渐积累`的问题,会耗尽系统内存,可能最终导致内存不足(理解:站着茅坑不拉稀,最终可能导致可用的茅坑越来越少,后面的人就只能等着o(╥﹏╥)o)。 +> * ② 内存溢出(不足)是一种`立即显现`的问题,当系统无法分配足够内存时,会`直接`导致程序崩溃或异常(理解:大象塞进冰箱,冰箱不是无限大,最终可能导致大象身体的一部分露出来,这不就`溢出`吗?换言之,就是冰箱(内存)的容量有限啊,`不`能满`足`实际需要)。 + +> [!IMPORTANT] > -> * ① 假设数组中的第一个元素是最大值或最小值,并使用变量 max 或 min 保存。 -> * ② 遍历数组中的每个元素: -> * 如果有元素比最大值还要大,就让变量 max 保存最大值。 -> * 如果有元素比最小值还要小,就让变量 min 保存最小值。 +> 官方定义:当计算机没有足够的内存来执行操作或运行应用程序时,会发生内存不足 (OOM) 错误。此内存可以是`物理 RAM`(随机存取内存) 或`虚拟内存`,它使用磁盘空间扩展物理内存。当系统耗尽可用内存时,它无法再满足`内存分配`请求,从而导致 OOM 错误。此错误表示除非释放或添加内存,否则系统无法处理进一步的需求。 +## 2.2 什么会触发内存溢出? +* 导致`内存溢出`的原因很多,具体取决于编程语言、平台和特定的应用程序场景。以下是一些最常见的原因: + * ① **无限循环或递归**:如果程序中的循环或递归没有正确终止条件,可能会一直运行,消耗掉所有可用内存。 + * ② **内存泄漏**:程序不断分配内存而不释放,最终导致可用内存耗尽。这通常是因为程序在使用完某些数据后,没有正确地释放相关的内存。 + * ③ **处理大数据集**:如果程序试图一次性加载或处理一个超大的数据集,而该数据集的大小超过了系统的可用内存,这可能会导致内存溢出。 + * ④ **资源过度分配**:一些程序在运行时,可能会为某些资源(如缓存、临时数据)分配过多的内存,导致整体系统内存不足。 + * ⑤ **错误的内存管理**:在手动管理内存的编程语言中(如:C 或 C++),如果程序错误地管理内存(如:重复释放、未释放或非法访问内存),也可能引发内存泄漏,进而导致内存溢出。 + * ⑥ **并发操作**:如果多个进程或线程并发地进行大量内存分配操作,且这些操作没有得到有效控制,也可能导致系统内存被耗尽。 + * ⑦ **外部库或工具的 Bug**:使用的第三方库或工具中存在内存管理相关的 bug,也可能导致内存溢出。 -* 示例: +## 2.3 如何避免内存溢出? -```c -#include - -int main() { - - // 定义数组并初始化 - int arr[] = {12, 2, 31, 24, 15, -36, 67, 108, 29, 51}; - - // 计算数组的长度 - size_t length = sizeof(arr) / sizeof(int); - - // 定义最大值 - int max = arr[0]; - // 定义最小值 - int min = arr[0]; - - // 遍历数组 - for (int i = 0; i < length; i++) { - if (arr[i] >= max) { - max = arr[i]; - } - if (arr[i] <= min) { - min = arr[i]; - } - } - - printf("数组的最大值为:%d\n", max); // 数组的最大值为:108 - printf("数组的最小值为:%d\n", min); // 数组的最小值为:-36 - - return 0; -} -``` - -### 2.7.3 应用示例 - -* 需求:统计数组中某个元素出现的次数,要求:使用无限循环,如果输入的数字是 0 ,就退出。 - - - -* 示例: - -```c -#include - -int main() { - - // 定义数组并初始化 - int arr[] = {12, 2, 31, 24, 2, -36, 67, 108, 29, 51}; - - // 计算数组的长度 - size_t length = sizeof(arr) / sizeof(int); - - // 遍历数组 - printf("当前数组中的元素是:"); - for (int i = 0; i < length; i++) { - printf("%d ", arr[i]); - } - - printf("\n"); - - // 无限循环 - while (true) { - // 统计的数字 - int num; - // 统计数字出现的次数 - int count = 0; - // 输入数字 - printf("请输入要统计的数字:"); - scanf("%d", &num); - - // 0 作为结束条件 - if (num == 0) { - break; - } - - // 遍历数组,并计数 - for (int i = 0; i < length; i++) { - if (arr[i] == num) { - count++; - } - } - - printf("您输入的数字 %d 在数组中出现了 %d 次\n", num, count); - } - - return 0; -} -``` - -### 2.7.4 应用示例 - -* 需求:将数组 a 中的全部元素复制到数组 b 中。 - - - -* 示例: - -```c -#include - -#define SIZE 10 - -int main() { - - // 定义数组并初始化 - int a[] = {12, 2, 31, 24, 15, -36, 67, 108, 29, 51}; - int b[SIZE]; - - // 复制数组 - for (int i = 0; i < SIZE; i++) { - b[i] = a[i]; - } - - // 打印数组 b 中的全部元素 - for (int i = 0; i < SIZE; i++) { - printf("%d ", b[i]); - } - - return 0; -} -``` - -### 2.7.5 应用示例 - -* 需求:数组对称位置的元素互换。 +* ① **优化数据处理**: + * 分块处理大数据集:如果需要处理大数据集,可以将数据分块处理,而不是一次性加载整个数据集到内存中。例如:处理大型文件时,可以逐行读取或分批读取。 + * 使用流式处理:对于需要处理大量数据的操作,可以采用流式处理(streaming),这样只保留当前处理的部分数据在内存中,而非全部数据。 +* ② **管理对象生命周期**: + * 及时释放不再使用的对象:在使用动态分配内存的编程语言(如:C++、C#、Java 等)时,确保在对象不再需要时及时释放内存。即使在使用垃圾回收机制的语言(如:Java、Python),也要尽量避免保留对不必要对象的引用,以便垃圾回收器可以及时清理它们。 + * 使用智能指针或自动内存管理:在手动管理内存的编程语言中,使用智能指针(如:C++中的`std::unique_ptr`或`std::shared_ptr`)来自动管理内存,减少内存泄漏的风险。 +* ③ **优化算法**: + * 选择更高效的算法:对于需要大量计算或数据处理的任务,选择内存占用更少的算法。例如:尽量使用原地(in-place)算法,它们不需要额外的内存空间。 + * 减少冗余数据:避免在内存中存储冗余数据,尽可能在计算过程中利用已有的数据结构,避免重复分配相同的数据。 +* ④ **监控和调试**: + * 使用内存分析工具:在开发过程中,使用内存分析工具(如:Valgrind、VisualVM、Py-Spy等)来监控程序的内存使用情况,查找和修复内存泄漏或不必要的内存分配。 + * 设置内存使用限制:在某些环境中,可以设置程序的最大内存使用量,这样当程序达到内存限制时,可以捕捉并处理内存溢出的情况。 +* ⑤ **避免无限循环和递归** + - 设置循环或递归的终止条件:确保所有循环和递归都有明确的终止条件,避免因逻辑错误导致无限执行,从而耗尽内存。 + - 使用尾递归优化:在支持尾递归优化的语言中,尽量使用尾递归,以减少递归调用带来的内存消耗。 +* ⑥ **并发编程中的内存管理**: + * 控制并发操作的内存分配:在并发编程中,尽量避免多个线程或进程同时大量分配内存。可以通过任务分配、锁机制等方式合理控制并发操作的内存使用。 + * 避免死锁:确保在并发编程中避免死锁情况,因为死锁可能会导致内存资源无法被释放,从而引发内存溢出。 +* ⑦ **使用适当的数据结构**: + * 选择合适的数据结构:根据需要选择内存效率更高的数据结构。例如,使用数组而不是链表来存储连续的数据,使用哈希表来提高查找效率等。 + * 避免不必要的缓存:在程序中使用缓存时,确保缓存的大小是合理的,并且有清理机制,防止缓存占用过多内存。 > [!NOTE] > -> 思路:假设数组一共有 10 个元素,那么: -> -> * a[0] 和 a[9] 互换。 -> * a[1] 和 a[8] 互换。 -> * ... -> -> 规律就是 `a[i] <--互换--> arr[arr.length -1 -i]` +> 避免内存溢出通常需要良好的内存管理实践,如:优化数据处理算法、合理控制资源分配、以及定期检查和释放不再使用的内存。 +## 2.4 总结 +* `内存溢出`则是由于内存资源耗尽,程序试图分配新内存时失败,通常会导致程序的`立即`崩溃或异常终止。 -* 示例: -```c -#include -int main() { - - // 原始数组 - int arr[] = {12, 2, 31, 24, 15, -36, 67, 108, 29, 51}; - - // 计算数组的长度 - size_t SIZE = sizeof(arr) / sizeof(arr[0]); - - // 打印原始数组中的全部元素 - printf("原始数组:"); - for (int i = 0; i < SIZE; i++) { - printf("%d ", arr[i]); - } - printf("\n"); - - // 交换数组 - for (int i = 0; i < SIZE / 2; i++) { - int temp = arr[i]; - arr[i] = arr[SIZE - 1 - i]; - arr[SIZE - 1 - i] = temp; - } - - // 打印交换后的数组 - printf("交换后数组:"); - for (int i = 0; i < SIZE; i++) { - printf("%d ", arr[i]); - } - printf("\n"); - - return 0; -} -``` - - - -* 示例: - -```c -#include - -int main() { - - // 原始数组 - int arr[] = {12, 2, 31, 24, 15, -36, 67, 108, 29, 51}; - - // 计算数组的长度 - size_t SIZE = sizeof(arr) / sizeof(arr[0]); - - // 打印原始数组中的全部元素 - printf("原始数组:"); - for (int i = 0; i < SIZE; i++) { - printf("%d ", arr[i]); - } - printf("\n"); - - // 交换数组 - for (int i = 0, j = SIZE - 1 - i; i < SIZE / 2; i++, j--) { - int temp = arr[i]; - arr[i] = arr[j]; - arr[j] = temp; - } - - // 打印交换后的数组 - printf("交换后数组:"); - for (int i = 0; i < SIZE; i++) { - printf("%d ", arr[i]); - } - printf("\n"); - - return 0; -} -``` - -### 2.7.6 应用示例 - -* 需求:将数组中的最大值移动到数组的最末尾。 - -> [!NOTE] -> -> 思路:从数组的下标 `0` 开始依次遍历到 `length - 1` ,如果 `i` 下标当前的值比 `i+1` 下标的值大,则交换;否则,就不交换。 - - - -* 示例: - -```c -#include - -int main() { - - // 原始数组 - int arr[] = {12, 2, 31, -24, 15, -36, 67, 891, 29, 51}; - - // 计算数组的长度 - size_t length = sizeof(arr) / sizeof(arr[0]); - - // 打印原始数组中的全部元素 - printf("原始数组:"); - for (int i = 0; i < length; i++) { - printf("%d ", arr[i]); - } - printf("\n"); - - // 移动最大值到数组的最后一个位置 - for (int i = 0; i < length - 1; i++) { - if (arr[i] > arr[i + 1]) { - int temp = arr[i]; - arr[i] = arr[i + 1]; - arr[i + 1] = temp; - } - } - - // 打印移动之后的数组 - printf("移动之后的数组:"); - for (int i = 0; i < length; i++) { - printf("%d ", arr[i]); - } - printf("\n"); - - return 0; -} -``` - -### 2.7.7 应用示例 - -* 需求:实现冒泡排序,即将数组的元素从小到大排列。 - -> [!NOTE] -> -> 思路:一层循环,能实现最大值移动到数组的最后;那么,二层循环(控制内部循环数组的长度)就能实现将数组的元素从小到大排序。 - - - - -* 示例: - -```c -#include - -int main() { - - // 原始数组 - int arr[] = {12, 2, 31, -24, 15, -36, 67, 891, 29, 51}; - - // 计算数组的长度 - size_t length = sizeof(arr) / sizeof(arr[0]); - - // 打印原始数组中的全部元素 - printf("原始数组:"); - for (int i = 0; i < length; i++) { - printf("%d ", arr[i]); - } - printf("\n"); - - for (int j = 0; j < length - 1; j++) { - for (int i = 0; i < length - 1 - j; i++) { - if (arr[i] > arr[i + 1]) { - int temp = arr[i]; - arr[i] = arr[i + 1]; - arr[i + 1] = temp; - } - } - } - - // 打印移动之后的数组 - printf("移动之后的数组:"); - for (int i = 0; i < length; i++) { - printf("%d ", arr[i]); - } - printf("\n"); - - return 0; -} -``` - -### 2.7.8 应用示例 - -* 需求:数组中的元素是从小到大排列的,现在要求根据指定的元素获取其在数组中的位置。 - -> [!NOTE] -> -> 二分查找(折半查找)的前提条件是:数组中的元素必须是`有序`的(从小到大或从大到小)。其基本步骤,如下所示: -> -> * ① 确定初始范围:定义数组的起始索引 `min = 0` 和结束索引 `max = len - 1` 。 -> * ② 计算中间索引:在每次迭代中,计算中间位置 `mid = (min + right) / 2`。 -> * ③ 比较中间值: -> * 如果`目标值`比 `arr[mid]` 小,则继续在`左`半部分查找,那么 `min` 不变,而`max = mid - 1` 。 -> * 如果`目标值`比 `arr[mid]` 大,则继续在`右`半部分查找,那么 `max` 不变,而`min = mid + 1` 。 -> * 如果`目标值`和 `arr[mid]` 相等,则找到了目标,返回该索引。 -> * ④ 结束条件:当 `min > max` 的时候,表示查找范围为空,即:元素不存在,返回 `-1`。 - - - -* 示例: - -```c -#include - -/** - * 二分查找 - * - * @param arr 数组 - * @param len 数组长度 - * @param num 要查找的数据 - * @return 返回数据的下标,没有找到返回-1 - */ -int search(int arr[], int len, int num) { - int min = 0; - int max = len - 1; - while (min <= max) { - int mid = (min + max) / 2; - if (num < arr[mid]) { // 说明要查找的数据在左半边 - max = mid - 1; - } else if (num > arr[mid]) { // 说明要查找的数据在右半边 - min = mid + 1; - } else { // 说明找到了 - return mid; - } - } - return -1; -} - -int main() { - - int arr[] = {1, 2, 3, 4, 5, 6}; - - int len = sizeof(arr) / sizeof(arr[0]); - - int index = search(arr, len, -1); - - printf("index = %d\n", index); - - return 0; -} -``` - - - -# 第三章:多维数组(⭐) +# 第三章:内存泄漏 VS 内存溢出 ## 3.1 概述 -### 3.1.1 引入 - -* 我们在数学、物理和计算机科学等学科中学习过`一维坐标`、`二维坐标`以及`三维坐标`。 - -* 其中,`一维坐标`通常用于描述在线段或直线上的点的位置,主要应用有: - - * **数轴**:一维坐标可以用来表示数轴上的数值位置,这在基础数学和初等代数中非常常见。 - - ![](./assets/8.png) - - * **时间轴**:时间可以看作是一维的,它可以用一维坐标表示,例如:秒、分钟、小时等。 - - ![](./assets/9.png) - - * **统计数据**:一维坐标常用于表示单变量的数据集,如:测量身高、体重、温度等。 - - ![](./assets/10.jpg) - -* 其中,`二维坐标`用于描述平面上的点的位置。主要应用包括: - - * **几何学**:在几何学中,二维坐标用于表示平面图形的顶点、边和面积等。 - - ![](./assets/11.png) - - * **地图和导航**:地理坐标系统(经纬度)使用二维坐标来表示地球表面的任意位置。 - - ![image-20240724112326592](./assets/12.png) - - * **图形设计和计算机图形学**:二维坐标在绘制图形、设计图案和用户界面中非常重要。 - - ![](./assets/13.png) - - * **物理学**:二维运动和场,例如:在描述物体在平面上的运动轨迹时使用二维坐标。 - - ![](./assets/14.jpg) - -* 其中,三维坐标用于描述空间中点的位置。主要应用包括: - - * **几何学**:三维坐标在空间几何中用于表示立体图形的顶点、边、面和体积。 - - ![](./assets/15.png) - - * **计算机图形学**:三维建模和动画需要使用三维坐标来创建和操控虚拟对象。 - - ![](./assets/16.png) - - * **工程和建筑设计**:在设计建筑物、机械部件和其他工程项目时,使用三维坐标来精确定位和规划。 - - ![](./assets/17.png) - - * **物理学**:三维空间中的力、运动和场,例如:描述物体在空间中的位置和运动轨迹。 - - ![](./assets/18.png) - -* 总而言之,一维、二维和三维坐标系统在不同的领域中各有其重要的应用,从基础数学到高级科学和工程技术,它们帮助我们更好地理解和描述世界的结构和行为。 - -### 3.1.2 多维数组 - -* 在 C 语言中,多维数组就是数组嵌套,即:在数组中包含数组,数组中的每一个元素还是一个数组类型,如下所示: - -![](./assets/19.png) +* `内存泄漏`是由于未释放不再使用的内存导致内存资源逐渐减少,但不会立即导致程序崩溃,而是长时间运行后可能出现性能问题或最终崩溃。 +* `内存溢出`则是由于内存资源耗尽,程序试图分配新内存时失败,通常会导致程序的立即崩溃或异常终止。 > [!NOTE] > -> * ① 如果数组中嵌套的每一个元素是一个常量值,那么该数组就是一维数组。 -> * ② 如果数组中嵌套的每一个元素是一个一维数组,那么该数组就是二维数组。 -> * ③ 如果数组中嵌套的每一个元素是一个二维数组,那么该数组就是三维数组. -> * ④ 依次类推... +> * ① `内存泄漏`和`内存溢出`都与内存管理不当有关,但它们发生的机制和直接影响是不同的。 +> * ② 避免`内存泄漏`和`内存溢出`都是编写高效、可靠软件的重要方面。 -* 一维数组和多维数组的理解: - * 从内存角度看:一维数组或多维数组都是占用的一整块连续的内存空间。 - * 从数据操作角度看: - * 一维数组可以直接通过`下标`访问到数组中的某个元素,即:0、1、... - * 二维数组要想访问某个元素,先要获取某个一维数组,然后在一维数组中获取对应的数据。 +## 3.2 内存泄漏和内存溢出的联系和区别 + +> [!IMPORTANT] +> +> `内存泄漏`和`内存溢出`之间并不是必然的因果关系,而是两者可能会相互影响。 +* ① `内存泄漏`导致`内存溢出`的可能性: + * 如果一个程序长期运行并且持续发生`内存泄漏`,未被释放的内存会慢慢积累,最终占用系统的大部分内存资源。如果`内存泄漏`严重到占用了所有可用内存,那么程序就会因为无法再分配新的内存,而出现`内存溢出`(Out of Memory)的情况。 + * 因此,`内存泄漏`可以**间接**地导致`内存溢出`,特别是在长时间运行的程序或系统中。 +* ② `内存泄漏`和`内存溢出`的区别: + * `内存泄漏`是指程序持续占用内存却不释放,导致可用内存逐渐减少。这种情况可能会在`长时间`内不显现问题,特别是如果程序只泄漏了少量内存。 + * `内存溢出`则是一个更`急剧`的问题,它通常在程序尝试分配超过系统可用内存的大块内存时`立刻`发生,导致程序崩溃或异常终止。 +* ③ 不必然性: + * 一个程序可能会发生`内存泄漏`,但因为泄漏的内存量很小,系统资源丰富,所以在短时间内不会出现`内存溢出`。 + * `内存溢出`也可以在没有`内存泄漏`的情况下发生,如:一个程序需要处理非常大的数据集,直接导致内存不足。 +> [!IMPORTANT] +> +> * ① `内存泄漏`有可能会在长时间积累后导致`内存溢出`,但这并不是必然的。 +> * ② `内存溢出`可以在多种情况下发生,而`内存泄漏`只是其中可能的一个诱因。 +> * ③ 因此,虽然`内存泄漏`可能最终引发`内存溢出`,但两者之间并非每次都是直接关联的。 + + + +# 第四章:内存泄漏检测和性能分析(⭐) + +## 4.1 内存泄漏检测 + +### 4.1.1 概述 + +* C 语言中的指针是否使用是个颇具争议的话题,现代化的高级编程语言通过各种策略和机制,在编译期就能解决指针危险的问题。但是,遗憾的是,C 语言的指针很大程度上,在运行期才会暴露问题。 +* 幸运的是,我们可以使用 `Valgrind` 项目来进行`内存泄漏检测`和`性能分析`,而 `Valgrind` 只支持 Linux 。 + +### 4.1.2 安装 + +* 在 WSL2 上安装 Valgrind : + +```shell +dnf -y upgrade && dnf -y install valgrind # AlmaLinux +``` + +```shell +apt -y update && apt -y upgrade && apt -y install valgrind # Ubuntu +``` + +![](./assets/10.gif) + +* 查看 valgrind 可执行文件的安装位置: + +```shell +which valgrind +``` + +![](./assets/11.gif) + +### 4.1.3 整合 + +* CLion 中将工具链设置为 WSL2 : + +![](./assets/12.gif) + +* CLion 中配置 valgrind 的路径: + +![](./assets/13.png) + +* 查看 WSL2 中 cmake 的版本: + +```shell +cmake --version +``` + +![](./assets/14.png) + +* 修改项目中 CMakeLists.txt 中 cmake 的版本: + +```{1} txt +cmake_minimum_required(VERSION 3.26.5) # 3.26.5 + +# 项目名称和版本号 +project(c-study VERSION 1.0 LANGUAGES C) + +# 设置 C 标准 +set(CMAKE_C_STANDARD 23) +set(CMAKE_C_STANDARD_REQUIRED True) + +# 辅助函数,用于递归查找所有源文件 +function(collect_sources result dir) + file(GLOB_RECURSE new_sources "${dir}/*.c") + set(${result} ${${result}} ${new_sources} PARENT_SCOPE) +endfunction() + +# 查找顶层 include 目录(如果存在) +if (EXISTS "${CMAKE_SOURCE_DIR}/include") + include_directories(${CMAKE_SOURCE_DIR}/include) +endif () + +# 查找所有源文件 +set(SOURCES) +collect_sources(SOURCES ${CMAKE_SOURCE_DIR}) + +# 用于存储已经处理过的可执行文件名,防止重复 +set(EXECUTABLE_NAMES) + +# 创建可执行文件 +foreach (SOURCE ${SOURCES}) + # 获取文件的相对路径 + file(RELATIVE_PATH REL_PATH ${CMAKE_SOURCE_DIR} ${SOURCE}) + # 将路径中的斜杠替换为下划线,生成唯一的可执行文件名 + string(REPLACE "/" "_" EXECUTABLE_NAME ${REL_PATH}) + string(REPLACE "\\" "_" EXECUTABLE_NAME ${EXECUTABLE_NAME}) + string(REPLACE "." "_" EXECUTABLE_NAME ${EXECUTABLE_NAME}) + + # 处理与 CMakeLists.txt 文件同名的问题 + if (${EXECUTABLE_NAME} STREQUAL "CMakeLists_txt") + set(EXECUTABLE_NAME "${EXECUTABLE_NAME}_exec") + endif () + + # 检查是否已经创建过同名的可执行文件 + if (NOT EXECUTABLE_NAME IN_LIST EXECUTABLE_NAMES) + list(APPEND EXECUTABLE_NAMES ${EXECUTABLE_NAME}) + + # 链接 math 库 + LINK_LIBRARIES(m) + + # 创建可执行文件 + add_executable(${EXECUTABLE_NAME} ${SOURCE}) + + # 查找源文件所在的目录,并添加为包含目录(头文件可能在同一目录下) + get_filename_component(DIR ${SOURCE} DIRECTORY) + target_include_directories(${EXECUTABLE_NAME} PRIVATE ${DIR}) + + # 检查并添加子目录中的 include 目录(如果存在) + if (EXISTS "${DIR}/include") + target_include_directories(${EXECUTABLE_NAME} PRIVATE ${DIR}/include) + endif () + + # 检查并添加 module 目录中的所有 C 文件(如果存在) + if (EXISTS "${DIR}/module") + file(GLOB_RECURSE MODULE_SOURCES "${DIR}/module/*.c") + target_sources(${EXECUTABLE_NAME} PRIVATE ${MODULE_SOURCES}) + endif () + endif () +endforeach () +``` + +* 在 CLion 中正常运行代码: + +![](./assets/15.gif) + +* 在 CLion 中通过 valgrind 运行代码: + +![](./assets/16.gif) + +## 4.2 性能分析 + +### 4.2.1 概述 + +* `perf` 是一个 Linux 下的性能分析工具,主要用于监控和分析系统性能。它可以帮助开发者和系统管理员了解系统中哪些部分在消耗资源、识别性能瓶颈以及分析程序的运行效率。 + +### 4.2.2 安装 + +#### 4.2.2.1 AlmaLinux9 + +* 在 WSL2 中的 AlmaLinux 安装 perf : + +```shell +dnf -y install perf +``` + +![](./assets/17.gif) + +#### 4.2.2.2 Ubuntu 22.04 + +* 在 WSL2 中的 Ubuntu 安装 perf : + +```shell +apt -y update \ + && apt -y install linux-tools-common \ + linux-tools-generic linux-tools-$(uname -r) +``` + +![](./assets/18.gif) > [!NOTE] > -> * ① C 语言中的一维数组或多维数组都是占用的一整块连续的内存空间,其它编程语言可不是这样的,如:Java 等。 -> * ② 在实际开发中,最为常用的就是二维数组或三维数组了,以二维数组居多!!! +> 之所以报错的原因,在于 WSL2 中的 Ubuntu 的内核是定制化的(微软自己维护的),并非 Ubuntu 的母公司 Canonical 发布的标准内核,所以需要我们手动编译安装。 -## 3.2 二维数组的定义 +* 查看内核版本: -### 3.2.1 动态初始化 - -* 语法: - -```c -数据类型 数组名[几个⼀维数组元素][每个⼀维数组中有几个具体的数据元素]; +```shell +uname -sr ``` -> [!NOTE] -> -> * ① 二维数组在实际开发中,最为常见的应用场景就是表格或矩阵了。 -> * ② 几个一维数组元素 = 行数。 -> * ③ 每个⼀维数组中有几个具体的数据元素 = 列数。 +![](./assets/19.gif) +* 设置环境变量,方便后续引用: - -* 示例: - -```c -#include - -int main() { - - // 定义二维数组并初始化 - int arr[3][4] = {{1, 2, 3, 4}, {5, 6, 7, 8}, {9, 10, 11, 12}}; - - // 输出二维数组中的元素 - printf("%d ", arr[0][0]); - printf("%d ", arr[0][1]); - printf("%d ", arr[0][2]); - printf("%d \n", arr[0][3]); - printf("%d ", arr[1][0]); - printf("%d ", arr[1][1]); - printf("%d ", arr[1][2]); - printf("%d \n", arr[1][3]); - printf("%d ", arr[2][0]); - printf("%d ", arr[2][1]); - printf("%d ", arr[2][2]); - printf("%d ", arr[2][3]); - - return 0; -} +```shell +export KERNEL_VERSION=$(uname -r | cut -d'-' -f1) ``` -### 3.2.2 静态初始化 1 +![](./assets/20.gif) -* 语法: +* 安装依赖库: -```c -数据类型 数组名[行数][列数] = {{元素1,元素2,...},{元素3,...},...} +```shell +apt -y update && \ + apt -y install binutils-dev debuginfod default-jdk \ + default-jre libaio-dev libbabeltrace-dev libcap-dev \ + libdw-dev libdwarf-dev libelf-dev libiberty-dev \ + liblzma-dev libnuma-dev libperl-dev libpfm4-dev \ + libslang2-dev libssl-dev libtraceevent-dev libunwind-dev \ + libzstd-dev libzstd1 python3-setuptools python3 \ + python3-dev systemtap-sdt-dev zlib1g-dev bc dwarves \ + bison flex libnewt-dev libdwarf++0 \ + libelf++0 libbfb0-dev python-dev-is-python3 ``` -> [!NOTE] -> -> * ① 行数 = 几个一维数组元素。 -> * ② 列数 = 每个⼀维数组中有几个具体的数据元素。 +![](./assets/21.gif) +* 下载源码: - -* 示例: - -```c -#include - -int main() { - - // 定义二维数组并初始化 - int arr[3][4] = {{1, 2, 3, 4}, {5, 6, 7, 8}, {9, 10, 11, 12}}; - - // 输出二维数组中的元素 - printf("%d ", arr[0][0]); - printf("%d ", arr[0][1]); - printf("%d ", arr[0][2]); - printf("%d \n", arr[0][3]); - printf("%d ", arr[1][0]); - printf("%d ", arr[1][1]); - printf("%d ", arr[1][2]); - printf("%d \n", arr[1][3]); - printf("%d ", arr[2][0]); - printf("%d ", arr[2][1]); - printf("%d ", arr[2][2]); - printf("%d ", arr[2][3]); - - return 0; -} +```shell +git clone \ + --depth 1 \ + --single-branch --branch=linux-msft-wsl-${KERNEL_VERSION} \ + https://github.com/microsoft/WSL2-Linux-Kernel.git ``` -### 3.2.3 静态初始化 2 +![](./assets/22.gif) -* 语法: +* 编译内核代码: -```c -数据类型 数组名[][列数] = {{元素1,元素2,...},{元素3,...},...} +```shell +cd WSL2-Linux-Kernel ``` -> [!NOTE] -> -> * ① 列数 = 每个⼀维数组中有几个具体的数据元素。 -> * ② 可以`不`指定`行数`,`必须`指定`列`数,编译器会根据元素的个数和列的个数,自动推断出行数!!! - - - -* 示例: - -```c -#include - -int main() { - - // 定义二维数组 - int arr[][4] = {{1, 2, 3, 4}, {5, 6}, {9, 10, 11, 12}}; - - // 输出二维数组中的元素 - printf("%d ", arr[0][0]); - printf("%d ", arr[0][1]); - printf("%d ", arr[0][2]); - printf("%d \n", arr[0][3]); - printf("%d ", arr[1][0]); - printf("%d \n", arr[1][1]); - printf("%d ", arr[2][0]); - printf("%d ", arr[2][1]); - printf("%d ", arr[2][2]); - printf("%d ", arr[2][3]); - - return 0; -} +```shell +make -j $(nproc) KCONFIG_CONFIG=Microsoft/config-wsl ``` -## 3.3 二维数组的理解 +![](./assets/23.gif) -* 如果二维数组是这么定义的,即: +* 编译 perf 工具: -```c -int arr[3][4]; +```shell +cd tools/perf ``` -* 那么,这个二维数组 `arr` 可以看做是 `3` 个一维数组组成,它们分别是 `arr[0]`、`arr[1]`、`arr[2]`。这 `3` 个一维数组都各有 4 个元素,如:一维数组 `arr[0]` 中的元素是 `arr[0][0]`、`arr[0][1]`、`arr[0][2]`、`arr[0][3]`,即: - -![](./assets/20.png) - -## 3.4 二维数组的遍历 - -* 访问二维数组的元素,需要使用两个下标(索引),一个用于访问行(第一维),另一个用于访问列(第二维),我们通常称为行下标(行索引)或列下标(列索引)。 -* 所以,遍历二维数组,需要使用双层循环结构。 - -> [!NOTE] -> -> 如果一个二维数组是这么定义的,即:`int arr[3][4]`,那么: -> -> * `行的长度 = sizeof(arr) / sizeof(arr[0])` ,因为 `arr` 是二维数组的`总`的内存空间;而 `arr[0]` 、`arr[1]`、`arr[2]` 是二维数组中一维数组的内存空间 。 -> * `列的长度 = sizeof(arr[0]) / sizeof(arr[0][0])`,因为`arr[0]` 、`arr[1]`、`arr[2]` 是二维数组中一维数组的内存空间 ,而 `arr[0][0]`、`arr[0][1]`、... 是一维数组中元素的内存空间。 - - - -* 示例: - -```c -#include - -int main() { - - // 定义二维数组 - int arr[][4] = {{1, 2, 3, 4}, {5, 6}, {9, 10, 11, 12}}; - - // 获取行列数 - int row = sizeof(arr) / sizeof(arr[0]); - int col = sizeof(arr[0]) / sizeof(arr[0][0]); - - // 打印二维数组元素 - for (int i = 0; i < row; i++) { - for (int j = 0; j < col; j++) { - printf("%d ", arr[i][j]); - } - printf("\n"); - } - - return 0; -} +```shell +make clean && make ``` -## 3.5 二维数组的内存分析 +![](./assets/24.gif) -* 用`矩阵形式`(如:3 行 4 列形式)表示二维数组,是`逻辑`上的概念,能形象地表示出行列关系。而在`内存`中,各元素是连续存放的,不是二维的,是`线性`的。 +* 复制到 PATH 变量所指向的路径中: -* C 语言中,二维数组中元素排列的顺序是`按行存放`的。即:先顺序存放第一行的元素,再存放第二行的元素。例如:数组`a[3][4] `在内存中的存放,如下所示: - -![](./assets/21.png) - -> [!NOTE] -> -> * ① 这就是 `C` 语言的二维数组在进行静态初始化的时候,`可以`忽略`行数`的原因所在(底层的`内存结构`是`线性`的),因为可以根据 `元素的总数 ÷ 每列元素的个数 = 行数`的公式计算出`行数`。 -> * ② 如果你学过 `Java` 语言,可能会感觉困惑,Java 语言中的二维数组在进行静态初始化,是`不能`忽略`行数`的,是因为 Java 编译器会根据`行数`去堆内存空间先开辟出一维数组,然后再继续...,所以当然`不能`忽略`行数`。 - -## 3.6 二维数组的应用案例 - -* 需求:现在有三个班,每个班五名同学,用二维数组保存他们的成绩,并求出每个班级平均分、以及所有班级平均分,数据要求从控制台输入。 - - - -* 示例: - -```c -#include - -int main() { - - // 定义二维数组,用于保存成绩 - double arr[3][5]; - - // 获取二维数组的行数和列数 - int row = sizeof(arr) / sizeof(arr[0]); - int col = sizeof(arr[0]) / sizeof(arr[0][0]); - - // 从控制台输入成绩 - for (int i = 0; i < row; i++) { - for (int j = 0; j < col; j++) { - printf("请输入第%d个班级的第%d个学生的成绩:", i + 1, j + 1); - scanf("%lf", &arr[i][j]); - } - } - - // 总分 - double totalSum = 0; - - // 遍历数组,求总分和各个班级的平均分 - for (int i = 0; i < row; i++) { - double sum = 0; - for (int j = 0; j < col; j++) { - totalSum += arr[i][j]; - sum += arr[i][j]; - } - printf("第%d个班级的总分为:%.2lf\n", i + 1, sum); - printf("第%d个班级的平均分为:%.2lf\n", i + 1, sum / col); - } - - printf("所有班级的总分为:%.2lf\n", totalSum); - printf("所有班级的平均分为:%.2lf\n", totalSum / (row * col)); - - return 0; -} +```shell +cp perf /usr/bin/ ``` +![](./assets/25.gif) +### 4.2.3 整合 + +* CLion 中配置 perf 的路径: + +![](./assets/26.png) + +* 在 CLion 中通过 perf 运行代码: + +![](./assets/27.gif) diff --git a/docs/notes/01_c-basic/09_xdx/assets/1.png b/docs/notes/01_c-basic/09_xdx/assets/1.png index 140c3e5..ee71223 100644 Binary files a/docs/notes/01_c-basic/09_xdx/assets/1.png and b/docs/notes/01_c-basic/09_xdx/assets/1.png differ diff --git a/docs/notes/01_c-basic/08_xdx/assets/10.jpg b/docs/notes/01_c-basic/09_xdx/assets/10.jpg similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/10.jpg rename to docs/notes/01_c-basic/09_xdx/assets/10.jpg diff --git a/docs/notes/01_c-basic/08_xdx/assets/11.png b/docs/notes/01_c-basic/09_xdx/assets/11.png similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/11.png rename to docs/notes/01_c-basic/09_xdx/assets/11.png diff --git a/docs/notes/01_c-basic/08_xdx/assets/12.png b/docs/notes/01_c-basic/09_xdx/assets/12.png similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/12.png rename to docs/notes/01_c-basic/09_xdx/assets/12.png diff --git a/docs/notes/01_c-basic/09_xdx/assets/13.png b/docs/notes/01_c-basic/09_xdx/assets/13.png new file mode 100644 index 0000000..97a42fd Binary files /dev/null and b/docs/notes/01_c-basic/09_xdx/assets/13.png differ diff --git a/docs/notes/01_c-basic/09_xdx/assets/14.jpg b/docs/notes/01_c-basic/09_xdx/assets/14.jpg index 3f5b674..01e4ab4 100644 Binary files a/docs/notes/01_c-basic/09_xdx/assets/14.jpg and b/docs/notes/01_c-basic/09_xdx/assets/14.jpg differ diff --git a/docs/notes/01_c-basic/08_xdx/assets/15.png b/docs/notes/01_c-basic/09_xdx/assets/15.png similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/15.png rename to docs/notes/01_c-basic/09_xdx/assets/15.png diff --git a/docs/notes/01_c-basic/08_xdx/assets/16.png b/docs/notes/01_c-basic/09_xdx/assets/16.png similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/16.png rename to docs/notes/01_c-basic/09_xdx/assets/16.png diff --git a/docs/notes/01_c-basic/08_xdx/assets/17.png b/docs/notes/01_c-basic/09_xdx/assets/17.png similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/17.png rename to docs/notes/01_c-basic/09_xdx/assets/17.png diff --git a/docs/notes/01_c-basic/08_xdx/assets/18.png b/docs/notes/01_c-basic/09_xdx/assets/18.png similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/18.png rename to docs/notes/01_c-basic/09_xdx/assets/18.png diff --git a/docs/notes/01_c-basic/09_xdx/assets/19.png b/docs/notes/01_c-basic/09_xdx/assets/19.png index c68c880..e1999a2 100644 Binary files a/docs/notes/01_c-basic/09_xdx/assets/19.png and b/docs/notes/01_c-basic/09_xdx/assets/19.png differ diff --git a/docs/notes/01_c-basic/09_xdx/assets/2.png b/docs/notes/01_c-basic/09_xdx/assets/2.png index ba1e8e2..e4c8b48 100644 Binary files a/docs/notes/01_c-basic/09_xdx/assets/2.png and b/docs/notes/01_c-basic/09_xdx/assets/2.png differ diff --git a/docs/notes/01_c-basic/08_xdx/assets/2.svg+xml b/docs/notes/01_c-basic/09_xdx/assets/2.svg+xml similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/2.svg+xml rename to docs/notes/01_c-basic/09_xdx/assets/2.svg+xml diff --git a/docs/notes/01_c-basic/09_xdx/assets/20.png b/docs/notes/01_c-basic/09_xdx/assets/20.png index aa7d603..144a112 100644 Binary files a/docs/notes/01_c-basic/09_xdx/assets/20.png and b/docs/notes/01_c-basic/09_xdx/assets/20.png differ diff --git a/docs/notes/01_c-basic/09_xdx/assets/21.png b/docs/notes/01_c-basic/09_xdx/assets/21.png index c4e9fb4..6447946 100644 Binary files a/docs/notes/01_c-basic/09_xdx/assets/21.png and b/docs/notes/01_c-basic/09_xdx/assets/21.png differ diff --git a/docs/notes/01_c-basic/09_xdx/assets/3.png b/docs/notes/01_c-basic/09_xdx/assets/3.png index e867783..37855ed 100644 Binary files a/docs/notes/01_c-basic/09_xdx/assets/3.png and b/docs/notes/01_c-basic/09_xdx/assets/3.png differ diff --git a/docs/notes/01_c-basic/08_xdx/assets/4.png b/docs/notes/01_c-basic/09_xdx/assets/4.png similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/4.png rename to docs/notes/01_c-basic/09_xdx/assets/4.png diff --git a/docs/notes/01_c-basic/08_xdx/assets/5.png b/docs/notes/01_c-basic/09_xdx/assets/5.png similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/5.png rename to docs/notes/01_c-basic/09_xdx/assets/5.png diff --git a/docs/notes/01_c-basic/08_xdx/assets/6.png b/docs/notes/01_c-basic/09_xdx/assets/6.png similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/6.png rename to docs/notes/01_c-basic/09_xdx/assets/6.png diff --git a/docs/notes/01_c-basic/09_xdx/assets/7.png b/docs/notes/01_c-basic/09_xdx/assets/7.png index a2d113f..ffda4ca 100644 Binary files a/docs/notes/01_c-basic/09_xdx/assets/7.png and b/docs/notes/01_c-basic/09_xdx/assets/7.png differ diff --git a/docs/notes/01_c-basic/08_xdx/assets/8.png b/docs/notes/01_c-basic/09_xdx/assets/8.png similarity index 100% rename from docs/notes/01_c-basic/08_xdx/assets/8.png rename to docs/notes/01_c-basic/09_xdx/assets/8.png diff --git a/docs/notes/01_c-basic/09_xdx/assets/9.png b/docs/notes/01_c-basic/09_xdx/assets/9.png new file mode 100644 index 0000000..f61e018 Binary files /dev/null and b/docs/notes/01_c-basic/09_xdx/assets/9.png differ diff --git a/docs/notes/01_c-basic/09_xdx/index.md b/docs/notes/01_c-basic/09_xdx/index.md index 2976e03..2eda323 100644 --- a/docs/notes/01_c-basic/09_xdx/index.md +++ b/docs/notes/01_c-basic/09_xdx/index.md @@ -1,43 +1,104 @@ -# 第一章:字符串(⭐) +# 第一章:数组的概念 -## 1.1 概述 +## 1.1 为什么需要数组? -* 在实际开发中,我们除了经常处理整数、浮点数、字符等,还经常和字符串打交道,如:`"Hello World"`、`"Hi"` 等。 +### 1.1.1 需求分析 1 -> [!NOTE] -> -> 像这类`"Hello World"`、`"Hi"`等格式 ,使用`双引号`引起来的一串字符称为字符串字面值,简称字符串。 - -* 对于整数、浮点数和字符,C 语言中都提供了对应的数据类型。但是,对于字符串,C 语言并没有提供对应的数据类型,而是用`字符数组`来存储这类文本类型的数据,即字符串: +* 需要统计某公司 50 个员工的工资情况,例如:计算平均工资、最高工资等。如果使用之前的知识,我们需要声明 50 个变量来分别记录每位员工的工资,即: ```c -char str[32]; +#include + +int main(){ + + double num1 = 0; + double num2 = 0; + double num3 = 0; + ... + printf("请输入第 1 个员工的工资:"); + scanf("%lf",&num1); + printf("请输入第 2 个员工的工资:"); + scanf("%lf",&num2); + printf("请输入第 3 个员工的工资:"); + scanf("%lf",&num3); + ... + return 0; +} ``` -* 字符串不像整数、浮点数以及字符那样有固定的大小,字符串是不定长的,如:`"Hello World"`、`"Hi"` 等的长度就是不一样的。在 C 语言中,规定了字符串的结尾必须是 `'\0'` ,这种字符串也被称为 `C 风格的字符串`,如: +* 这样会感觉特别机械和麻烦(全是复制(Ctrl + c)和粘贴(Ctrl + v),CV 大法);此时,我们就可以将所有的`数据`全部存储到一个`容器(数组)`中进行统一管理,并进行其它的操作,如:求最值、求平均值等,如下所示: ```c -"Hello World!" // 在 C 语言中,底层存储就是 Hello World!\0 +#include + +int main(){ + // 声明数组 + double nums[50]; + // 数组的长度 + int length = sizeof(nums) / sizeof(double); + // 使用 for 循环向数组中添加值 + for(int i = 0;i < length;i++){ + printf("请输入第 &d 个员工的工资:",i); + scanf("%lf",&num[i]); + } + // 其它操作,如:求最值,求平均值等 + ... + return 0; +} ``` -* 其对应的图示,如下所示: +### 1.1.2 需求分析 2 + +* 在现实生活中,我们会使用很多 APP 或微信小程序等,即: ![](./assets/1.png) -* `'\0'` 在 ASCII 码表中是第 `0` 个字符,用 `NUL` 表示,称为空字符,该字符既不能显示,也不是控制字符,输出该字符不会有任何效果,它在 C 语言中仅作为字符串的结束标志。 -* C 语言在处理字符串时,会从前往后逐个扫描字符,一旦遇到`'\0'`就认为到达了字符串的末尾,就结束处理。`'\0'`至关重要,没有`'\0'`就意味着永远也到达不了字符串的结尾。 +* 同样的道理,如果我们使用变量来存储每个商品信息,那么就需要非常多的变量;但是,如果我们将这些`商品信息`都存储到一个`容器(数组)`中,进行统一管理;那么,之后的数据处理将会非常方便。 + +### 1.1.3 容器的概念 + +* `生活中的容器`:水杯(装水、饮料的容器)、衣柜(装衣服等物品的容器)、集装箱(装货物等物品的容器)。 +* `程序中的容器`:将多个数据存储到一起,并且每个数据称为该容器中的元素。 + +## 1.2 什么是数组? + +* 数组(Array)是将多个`相同数据类型`的`数据`按照一定的顺序排序的`集合`,并使用一个`标识符`命名,以及通过`编号(索引,亦称为下标)`的方式对这些数据进行统一管理。 ![](./assets/2.png) +## 1.3 数组的相关概念 + +* `数组名`:本质上是一个标识符常量,命名需要符合标识符规则和规范。 +* `元素`:同一个数组中的元素必须是相同的数据类型。 +* `索引(下标)`:从 0 开始的连续数字。 +* `数组的长度`:就是元素的个数。 + +## 1.4 数组的特点 + +* ① 创建数组的时候,会在内存中开辟一整块`连续的空间`,占据空间的大小,取决于数组的长度和数组中元素的类型。 +* ② 数组中的元素在内存中是依次紧密排列且有序的。 +* ③ 数组一旦初始化完成,且长度就确定的,并且`数组的长度一旦确定,就不能更改`。 +* ④ 我们可以直接通过索引(下标)来获取指定位置的元素,速度很快。 +* ⑤ 数组名中引用的是这块连续空间的首地址。 + + +# 第二章:数组的操作(⭐) + +## 2.1 数组的定义 + +### 2.1.1 动态初始化 + +* 语法: + +```c +数据类型 数组名[元素个数|长度]; +``` + > [!NOTE] > -> 在现代化的高级编程语言中,都提供了字符串对应的类型,如:Java 中的 String(JDK 11 之前,底层也是通过 `char[]` 数组来实现的) 。 - -## 1.2 字符数组(字符串)的定义 - -### 1.2.1 标准写法 - -* 手动在字符串的结尾添加 `'\0'`作为字符串的结束标识。 +> * ① 数据类型:表示的是数组中每一个元素的数据类型。 +> * ② 数组名:必须符合标识符规则和规范。 +> * ③ 元素个数或长度:表示的是数组中最多可以容纳多少个元素(不能是负数、也不能是 0 )。 @@ -47,655 +108,64 @@ char str[32]; #include int main() { - // 禁用 stdout 缓冲区 - setbuf(stdout, NULL); - // 字符数组,不是字符串 - char c1[] = {'H', 'e', 'l', 'l', 'o', ' ', 'W', 'o', 'r', 'l', 'd'}; - // C 风格的字符串 - char c2[] = {'H', 'e', 'l', 'l', 'o', ' ', 'W', 'o', 'r', 'l', 'd', '\0'}; + // 先指定元素的个数和类型,再进行初始化 + + // 定义数组 + int arr[3]; + + // 给数组元素赋值 + arr[0] = 10; + arr[1] = 20; + arr[2] = 30; return 0; } ``` -### 1.2.2 简化写法(推荐) +### 2.1.2 静态初始化 1 -* 字符串写成数组的形式,非常麻烦。C 语言中提供了一种简化写法,即:双引号中的字符,会自动视为字符数组。 - -> [!NOTE] -> -> 简化写法会自动在末尾添加 `'\0'` 字符,强烈推荐使用!!! - - - -* 示例: +* 语法: ```c -#include - -int main() { - // 禁用 stdout 缓冲区 - setbuf(stdout, NULL); - - char c1[] = {"Hello World"}; // 注意使用双引号,非单引号 - char c2[] = "Hello World"; // //可以省略一对 {} 来初始化数组元素 - - - return 0; -} +数据类型 数组名[元素个数|长度] = {元素1,元素2,...} ``` -## 1.3 字符串的输入和输出 - -### 1.3.1 字符串的输出 - -* 在 C 语言中,有两个函数可以在控制台上输出字符串,它们分别是: - * ① `puts()`:输出字符串并自动换行,并且该函数只能输出字符串。 - * ② `printf()` :通过格式占位符 `%s`,就可以输出字符串,不能自动换行。 - > [!NOTE] > -> * ① `printf()` 函数除了输出字符串之外,还可以输出`其它类型`的数据。 -> * ② 在实际开发中,`printf()` 函数用的居多!!! +> * ① 静态部分初始化:如果数组初始化的元素个数`小于`数组声明的长度,那么就会从数组开始位置依次赋值,不够的就补 0 。 +> * ② 静态全部初始化:数组初始化的元素个数`等于`数组的长度。 - - -* 示例: - -```c -#include - -int main() { - // 禁用 stdout 缓冲区 - setbuf(stdout, NULL); - - char c1[] = {"Hello World"}; // 注意使用双引号,非单引号 - char c2[] = "Hello World"; // //可以省略一对 {} 来初始化数组元素 - - puts(c1); // Hello World - puts(c2); // Hello World - - return 0; -} -``` - - - -* 示例: - -```c -#include - -int main() { - // 禁用 stdout 缓冲区 - setbuf(stdout, NULL); - - char c1[] = {"Hello World"}; // 注意使用双引号,非单引号 - char c2[] = "Hello World"; // //可以省略一对 {} 来初始化数组元素 - - printf("c1 = %s\n", c1); // c1 = Hello World - printf("c2 = %s\n", c2); // c2 = Hello World - - return 0; -} -``` - -### 1.3.2 字符串的输入 - -* 在 C 语言中,有两个函数可以让用户从键盘输入字符串,它们分别是: - * ① ~~`gets()`:直接输入字符串,并且只能输入字符串~~。 - * ② `scanf()`:通过格式占位符 `%s`,就可以输入字符串了。 - -> [!NOTE] +> [!TIP] > -> * ① `scanf()` 在通过格式占位符 `%s`,读取字符串时以`空格`或 `Enter` 键为分隔,遇到`空格`或 `Enter` 键就认为当前字符串结束了,所以无法读取含有空格的字符串。但是,我们可以将格式占位符,使用 `%[^\n]`来代替 `%s` ,这样就能解决 `scanf()` 函数默认的缺陷。 -> * ② `gets()` 认为空格也是字符串的一部分,只有遇到回车键时才认为字符串输入结束。换言之,不管输入了多少个空格,只要不按下回车键,对 `gets()` 来说就是一个完整的字符串。 -> * ③ 需要注意的是,`gets()` 函数在 [C11](https://zh.cppreference.com/w/c/11) 标准中,已经被移除了,推荐使用 `fgets` 来代替它,因为有严重的安全漏洞,即:`gets()` 函数读取用户输入直到换行符,但它不会检查缓冲区的大小。这意味着如果用户输入超过了缓冲区的大小,`gets()` 将会导致缓冲区溢出。这种缓冲区溢出很容易被恶意利用,导致程序崩溃或执行恶意代码。 - -* 示例: - -```c -#include - -int main() { - // 禁用 stdout 缓冲区 - setbuf(stdout, NULL); - - char str[32] = {'\0'}; - - printf("请输入字符串:"); - gets(str); - - printf("字符串是:%s\n", str); - - return 0; -} -``` - - - -* 示例: - -```c {13} -#include - -int main() { - // 禁用 stdout 缓冲区 - setbuf(stdout, NULL); - - char str[32] = {'\0'}; - - printf("请输入字符串:"); - // scanf() 在读取数据时需要的是数据的地址,这一点是恒定不变的。 - // 对于 int、char、float 等类型的变量都要在前边添加 & 以获取它们的地址。 - // 而数组或者字符串用于 scanf() 时不用添加 &,它们本身就会转换为地址。 - scanf("%[^\n]", str); - - printf("字符串是:%s\n", str); - - return 0; -} -``` - -## 1.4 字符串结束不是 `'\0'` 的后果 - -* 有的时候,程序的逻辑要求我们必须逐个字符为数组赋值,这个时候就很容易遗忘字符串结束标识 `'\0'`,如下所示: - -```c {3} -#include -int main() { - char str[30]; - char c; - int i; - for (c = 65, i = 0; c <= 90; c++, i++) { - str[i] = c; - } - printf("%s\n", str); - - return 0; -} -``` - -* 该程序的执行结果,如下所示: - -![](./assets/3.png) - -* 因为`大写字符`在 `ASCII` 码表是连续的,编码值从 `65` 开始,直到 `90` 结束;并且,为了方便,我们使用了循环。但是,我们却发现结果和我们想要的大不一样,为什么? - -> [!NOTE] +> 在 CLion 中开启`嵌入提示(形参名称-->显示数组索引的提示)`功能,即: > -> * ① 在函数内部定义的变量、数组、结构体、共用体等都称为局部数据。 +> ![](./assets/3.png) > -> * ② 在很多编译器下,局部数据的初始值都是随机的、无意义的,而不是我们通常认为的“零”值。 - -* 我们在定义 `str` 数组的时候,并没有立即初始化,所以它包含的值都是随机的,只有很小的概率是“零”。循环结束后,`str` 的前 `26` 个元素被赋值了,剩下的 `4` 个元素的值依然是随机的,我们并不清楚到底是什么。 -* `printf()` 输出字符串时,会从第 `0` 个元素开始往后检索,直到遇见`'\0'`才停止,然后把`'\0'`前面的字符全部输出,这就是 `printf()` 输出字符串的原理。 -* 但是,对于上面的例子,由于我们并没有对最后 `4` 个元素赋值,所以第 `26` 元素可能是 `'\0'`,也有可能第 `27` 个元素是 `'\0'`,也有可能第 `28` 个元素是 `'\0'`;不过,不要问`我`,`我`也不清楚,可能只有`上帝`才会知道,到底第`几`个元素才是 `'\0'`。而且,我们在定义数组的时候,设置数组的长度是 `30` ,但是貌似输出的字符串的长度是 `32` ,这早已超出了数组的范围,`printf()` 在输出字符串的时候,如果没有遇见 `'\0'` 是不会罢休的,它才不会管`数组访问`是不是`越界`。 - -> [!NOTE] +> 这样,在 CLion 中,将会显示数组初始化时每个元素对应的索引,即: > -> * ① 由此可见,不注意`'\0'`的后果有多严重,不但不能正确处理字符串,甚至还会毁坏其它数据!!! -> * ② C 语言为了提高效率,保证操作的灵活性,并不会对越界行为进行检查,即使越界了,也能够正常编译,只有在运行期间才可能发现问题,所以对程序员的要求很高。但是,现代化的高级编程语言,如:Java 等,为了降低开发难度以及提高开发效率,像数组这种越界行为,在编译期间就会由编译器提前捕获,并直接报错!!! +> ![](./assets/4.png) -* 如果要避免这些问题也很简单,在字符串后面手动添加 `'\0'` 就可以了,即: -```c {9} -#include -int main() { - char str[30]; - char c; - int i; - for (c = 65, i = 0; c <= 90; c++, i++) { - str[i] = c; - } - str[i] = '\0'; - printf("%s\n", str); - return 0; -} -``` - -* 但是,上述的写法实在麻烦,为什么不在定义数组的时候,给数组中的每个元素都初始化,这样才能从根本上避免上述问题,即: - -```c {3} -#include -int main() { - char str[30] = {'\0'}; - char c; - int i; - for (c = 65, i = 0; c <= 90; c++, i++) { - str[i] = c; - } - printf("%s\n", str); - - return 0; -} -``` - -## 1.5 字符串的长度 - -* 所谓字符串的长度,就是字符串包含了多少个字符(不包括最后的结束符`'\0'`),如:`"abc"` 的长度是 `3` ,而不是 `4` 。 -* 在 C 语言中的 `string.h` 中提供了 `strlen()` 函数,能够帮助我们获取字符串的长度,如下所示: - -```c -size_t strlen (const char *__s) -``` - - - -* 示例: - -```c {13} -#include -#include -int main() { - char str[30] = {'\0'}; - char c; - int i; - for (c = 65, i = 0; c <= 90; c++, i++) { - str[i] = c; - } - // ABCDEFGHIJKLMNOPQRSTUVWXYZ - printf("%s\n", str); - // ABCDEFGHIJKLMNOPQRSTUVWXYZ 的长度是 26 - printf("%s 的长度是 %zu\n", str, strlen(str)); - - return 0; -} -``` - - - -# 第二章:内存中的变量和数组(⭐) - -## 2.1 内存和内存地址 - -### 2.1.1 内存 - -* `内存`是一种`计算机硬件`,是`软件`在`运行过程`中,用来`临时存储数据`的。在生活中,最为常见的`内存`就是`随机存取存储器(RAM,内存条`),其特点如下所示: - * ① 生活中最常见的内存类型,用于存储当前运行的程序和数据。 - * ② 内存是易失性存储器,这意味着断电后数据会丢失。 - * ③ 它具有高速读写特性,适用于需要快速访问的操作。 - -* 内存条的外观,如下所示: - -![](./assets/4.jpeg) - -* 像我们平常使用`记事本`软件一样,当我们输入一些文字的时候,其实是将数据`临时`保存在内存中的,如下所示: - -> [!NOTE] -> -> * ① 目前,很多软件都很智能,如果用户没有将数据到保存文件中,将显示红色,以警告用户还没有保存数据,提醒用户需要尽快保存数据!!! -> * ② 但是,也有很多软件提供了自动保存数据的功能,其原理就是定时(1s、3s、5s)将内存中的数据刷新到文件中,以防止数据丢失!!! -> * ③ 将数据从内存存储到文件中,专业的说法是落盘(落在磁盘上)。 - -![](./assets/5.gif) - -* 此时,如果我们在没有保存的过程下,将`记事本`软件关闭,那么刚才输入的文字将丢失;下次,再打开同样的文件(将数据从磁盘加载进内存,再交给 CPU),之前输入的文字将不复存在,如下所示: - -> [!NOTE] -> -> * ① 目前,很多软件都很智能,如果你没有保存,将提醒你是否保存或丢失刚才输入的文字。 -> * ② 但是,也有很多软件提供了自动保存数据的功能,其原理就是定时(1s、3s、5s)将内存中的数据刷新到文件中,以防止数据丢失!!! -> * ③ 将数据从内存存储到文件中,专业的说法是落盘(落在磁盘上)。 - -![](./assets/6.gif) - -> [!IMPORTANT] -> -> 内存就是软件在运行过程中,用来临时存储数据的,最为重要的两个步骤就是: -> -> * ① 将数据`保存`到内存中。 -> * ② 从内存中的`对应位置`将数据`取出来`。 - -### 2.1.2 内存地址 - -* 在这个计算机的内存条,动不动就 32GB、64GB 、128GB 或更高的年代,如下所示: - -![](./assets/7.png) - -* 如果有一个 int (4 个字节)类型的数据 `2` ,如何将这个数据保存到内存中?(对应上述的步骤 ①) - -![](./assets/8.svg) - -* 就算数据 `2` 已经保存到内存中,那么内存中那么多的数据,我们又该如何取出呢?(对应上述的步骤 ②) - -![](./assets/9.svg) - -> [!IMPORTANT] -> -> 答案就是`内存地址`。 - -* 操作系统为了更快的去管理内存中的数据,会将`内存条`按照`字节`划分为一个个的`单元格`,如下所示: - -![](./assets/10.svg) - -> [!NOTE] -> -> 计算机中存储单位的换算,如下所示: -> -> - 1 B = 8 bit。 -> - 1 KB = 1024 B。 -> - 1 MB = 1024 KB。 -> - 1 GB = 1024 MB。 -> - 1 TB = 1024 GB 。 -> - …… - -* 为了方便管理,每个独立的小单元格,都有自己唯一的编号(内存地址),如下所示: - -![](./assets/11.svg) - -* 之所以,加了`内存地址`,就能`加快`数据的存取速度,可以类比生活中的`字典`: - - * 如果没有使用`拼音查找法`或`部首查找法`,我们需要一页一页,一行一行的,在整个字典中去搜索我们想要了解的汉字,效率非常低(如果要搜索的汉字在最后一页,可能需要将整个字典从头到尾翻一遍,这辈子真有可能翻得完?)。 - - ![](./assets/12.gif) - - * 如果使用`拼音查找法`或`部首查找法`,我们可以很快的定位到所要了解汉字所在的页数,加快了搜索的效率。 - - ![](./assets/13.jpg) - - ![](./assets/14.jpg) - -* 同样的道理,如果`没有`内存地址,我们只能一个个的去寻找想要的数据,效率非常低下,如下所示: - -![](./assets/15.gif) - -* 如果`使用`内存地址,我们就可以直接定位到指定的数据,效率非常高,如下所示: - -![](./assets/16.gif) - -> [!IMPORTANT] -> -> * ① 内存地址是计算机中用于标识内存中某个特定位置的数值。 -> * ② 每个内存单元都有一个唯一的地址,这些地址可以用于访问和操作存储在内存中的数据。 - - - -* 实际中的内存地址,并不是像上面的 `001` 、`002` 、... 之类的数字,而是有自己的规则,即:内存地址规则。 - -> [!NOTE] -> -> * ① 32 位的操作系统中,内存地址以 32 位的二进制表示。 -> * ② 64 位的操作系统中,内存地址以 64 位的二进制表示。 - -* 在 32 位的操作系统中,内存地址的范围是:`0000 0000 0000 0000 0000 0000 0000 0000` ~ `1111 1111 1111 1111 1111 1111 1111 1111` (2 ^ 32 次方)。 - -> [!NOTE] -> -> 在 32 位的操作系统中,一共有 4,294,967,296 个内存地址,其最大支持的内存大小是 4,294,967,296 字节,即 4 GB 。 - -* 在 64 位的操作系统中,内存地址的范围是:`0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000` ~ `1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111` (2 ^ 64 次方)。 - -> [!NOTE] -> -> * ① 在 64 位的操作系统中,一共有 18,446,744,073,709,551,616 个内存地址,其最大支持的内存大小是 18,446,744,073,709,551,616 字节,即 17,179 TB 。 -> * ② 虽然,从理论上 64 位的操作系统支持的内存最大容量是 17,179 TB;但是,实际操作系统会有所限制,如:win11 的 64 位支持的最大内存是 128 GB ~ 6 TB,Linux 64 位支持的最大内存通常是 256 TB。 - -* 在实际开发中,64 位操作系统的内存地址表现形式,如:`0000 0000 0000 0000 0001 0000 1111 1010 0000 0000 0010 0000 0000 0010 0000 1000`,实在是太长了,我们通常转换为十六进制,以方便阅读,如:`0x000010FA00200208` 。 - -> [!IMPORTANT] -> -> * ① 内存地址是内存中每个单元的编号。 ->* ② 内存地址的作用是操作系统用来快速管理内存空间的。 -> * ③ 在 32 位操作系统上,内存地址以 32 位的二进制数字表示,最大支持的的内存是 4 GB,所以 32 位操作系统已经被淘汰。 -> * ④ 在 64 位操作系统上,内存地址以 64 位的二进制数字表示,由于表示形式太长,我们通常会转为十六进制,以方便阅读。 - -## 2.2 内存中的变量 - -* 在 C 语言中,数据类型的种类很多,如:short、int、long、float、double、char 等。以 int 类型为例,在 32 位或 64 位操作系统中的,int 类型的变量都是占 4 个字节,当我们在代码中这么定义变量,如: - -```c -#include - -int main(){ - - // 定义一个变量并初始化 - int a = 10; - - return 0; -} -``` - -* 那么,编译器就会这么处理,如下所示: - -![](./assets/17.svg) - -* 在代码中,我们可以使用 `&变量名` 来获取一个变量的内存首地址,如下所示: +* 示例:静态部分初始化 ```c #include int main() { - // 定义一个变量并初始化 - int a = 10; - - printf("变量 a 的首地址是: %p\n", &a); // 变量 a 的首地址是: 0000002bf1dffd0c - printf("变量 a 的中保存的值是: %d\n", a); // 变量 a 的中保存的值是: 10 + // 定义数组和部分初始化: + // 会将给定的值从数组的开始位置一个个的赋值,没有赋值的地方,用 0 填充 + int arr[5] = {1, 2}; return 0; } ``` -> [!NOTE] -> -> * ① `变量`是对程序中`数据`在内存中存储空间的抽象,如果不涉及到指针变量,那我们在编码的时候,就只需要将变量等价于内存中存储空间里面存储的数据,而不需要再去考虑编译器底层是如何转换,提高了开发效率(机器语言和汇编可不是这样的,需要关注每个细节)。 -> * ② 数据类型只在`定义`变量的时候`指定`,而且必须指定;`使用`变量的时候`无需`再声明,因为此时的数据类型已经确定了。 -## 2.3 内存中的数组 -* 如果我们在代码中这么定义数组,如下所示: - -```c -#include - -int main(){ - - // 定义一个数组并初始化 - int arr[] = {1,2,3}; - - return 0; -} -``` - -* 那么,编译器就会这么处理,如下所示: - -![](./assets/18.svg) - -* 在代码中,我们可以直接打印数组名的内存地址,如下所示: - -```c -#include - -int main() { - - int arr[] = {1, 2, 3}; - - printf("arr 的首地址是: %p \n", arr); // arr 的首地址是: 0000003a6f7ffcd4 - printf("arr 的首地址是: %p \n", &arr); // &arr 的地址是: 0000003a6f7ffcd4 - printf("arr[0] 的地址是: %p \n", &arr[0]); // arr[0] 的地址是: 0000003a6f7ffcd4 - printf("arr[1] 的地址是: %p \n", &arr[1]); // arr[1] 的地址是: 0000003a6f7ffcd8 - printf("arr[2] 的地址是: %p \n", &arr[2]); // arr[2] 的地址是: 0000003a6f7ffcdc - - return 0; -} -``` - -> [!WARNING] -> -> 在上述示例中,`arr` 和 `&arr` 的值是一样的,但是对应的含义是不同的。 -> -> * ① `arr` 是数组名,在大多数情况下会转换为数组第一个元素的地址,即:`arr` 等价于 `&arr[0]`,其数据类型是 `int *`。 -> * ② `&arr`是数组名的地址,即整个数组的地址,它指向数组本身,并不是数组第一个元素的地址,`&arr` 的数据类型是 `int(*)[3]`。 - - - -# 第三章:数组越界和数组溢出(⭐) - -## 3.1 数组越界 - -* C 语言的数组是静态的,当我们定义的时候,就不能自动扩容。当我们试图访问数组的`负索引`或`超出`数组长度的索引时,就会产生`数组越界`。 - -> [!NOTE] -> -> * ① C 语言为了提高效率,保证操作的灵活性,并不会对越界行为进行检查,即使越界了,也能够正常编译,只有在运行期间才可能发现问题,所以对程序员的要求很高。 -> * ② 但是,现代化的高级编程语言,如:Java 等,为了降低开发难度以及提高开发效率,像数组这种越界行为,在编译期间就会由编译器提前捕获,并直接报错!!! - -* 请看下面的代码: - -```c {9-10,15} -#include - -int main() { - // 禁用 stdout 缓冲区 - setbuf(stdout, NULL); - - int arr[3] = {10, 20, 30}; - - printf("arr[-1] = %d\n", arr[-1]); // arr[-1] = -23718968 - printf("arr[-2] = %d\n", arr[-2]); // arr[-2] = 0 - printf("arr[0] = %d\n", arr[0]); // arr[0] = 10 - printf("arr[1] = %d\n", arr[1]); // arr[1] = 20 - printf("arr[2] = %d\n", arr[2]); // arr[2] = 30 - printf("arr[3] = %d\n", arr[3]); // arr[3] = -23718976 - printf("arr[4] = %d\n", arr[4]); // arr[4] = 605 - - return 0; -} -``` - -* 越界访问数组元素的值都是不确定的,没有实际的含义,因为在数组之外的内存,我们并不知道到底是什么,可能是其它变量的值,可能是函数参数,也可能是一个地址,这些都是不可控的。 - -> [!NOTE] -> -> 由于 C 语言的”放任“,我们访问数组时必须非常小心,要确保不会发生越界。 - -* 当发生数组越界时,如果我们对该内存有使用权限,那么程序将正常运行,但会出现不可控的结果,即:如果我们对该内存没有使用权限,或者该内存压根就没有就分配,那么程序就会崩溃,如下所示: - -```c -#include - -int main() { - int arr[3] = {0}; - printf("%d", arr[10000]); - return 0; -} -``` - -* 其结果,如下所示: - -![](./assets/19.png) - -> [!NOTE] -> -> * ① 每个程序能使用的内存都是有限的,该程序要访问 `4*10000` 字节处的内存,显然太远了,超出了程序的访问范围。 -> * ② 这个地方的内存可能没有被分配,可能是系统本身占用的内存,可能是其它数据的内存,如果放任这种行为,将带来非常危险的后果,操作系统只能让程序停止运行。 - -* 当然,我们在实际开发中,也不会这么访问,而是会使用 `sizeof` 运算符来获取数组的长度,进而遍历数组中的元素,即: - -```c {7} -#include - -int main() { - int arr[3] = {0}; - - // 获取数组的元素 - size_t length = sizeof(arr) / sizeof(int); - - for (size_t i = 0; i < length; i++) { - printf("%d\n", arr[i]); - } - return 0; -} -``` - -## 3.2 数组溢出 - -* 数组溢出通常是指将数据存储到一个数组中,超出了数组所能容纳的空间,那么多余的元素就会被丢弃。对于一般的数组,貌似没什么问题,如下所示: - -```c -#include - -int main() { - int arr[3] = {0, 1, 2, 3, 4}; - - size_t length = sizeof(arr) / sizeof(int); - - for (size_t i = 0; i < length; i++) { - printf("%d\n", arr[i]); - } - return 0; -} -``` - -* 其结果,如下所示: - -![](./assets/20.png) - -* 但是,对于字符串而言,就会出现不可控的情况,如下所示: - -```c {4} -#include -int main() -{ - char str[10] = "Hello World,Hello World,Hello World,"; - puts(str); - return 0; -} -``` - -* 其结果,如下所示: - -![](./assets/21.png) - -* 因为字符串的长度大于数组的长度,数组只能容纳字符串前面的一部分,即使编译器在字符串最后保存了 `'\0'`,也无济于事,因为超过数组长度的元素都会被丢弃。而 `printf()` 输出字符串时,会从第 `0` 个元素开始往后检索,直到遇见`'\0'`才停止,然后把`'\0'`前面的字符全部输出,至于何时遇到 `'\0'`,就只有上帝才能知道。 - -> [!NOTE] -> -> * ① 在用字符串给字符数组赋值时,要保证数组长度大于字符串长度,以容纳结束符`'\0'`。 -> * ② `数组溢出`通常发生在动态分配内存或者通过不安全的函数(如: `strcpy`)进行字符串操作。 - - - -# 第四章:C 语言中的数组 VS Java 语言中的数组(⭐) - -## 4.1 Linux 下 32 位环境的用户空间内存分布情况 - -* 对于 32 位的环境而言,理论上程序是可以拥有 4GB 的虚拟地址空间的,在 C 语言中使用到的变量、函数、字符串等都会对应内存中的一块区域。 -* 但是,在这 4GB 的地址空间中,要拿出一部分给操作系统内核使用,应用程序无法直接访问这一段内存,这一部分内存地址被称为`内核空间`(Kernel Space)。 - -> [!NOTE] -> -> - ① Windows 在默认情况下会将高地址的 2GB 空间分配给内核(也可以配置为 1GB)。 -> - ② 而 Linux 默认情况下会将高地址的 1GB 空间分配给内核。 - -* 也就是说,应用程序只能使用剩下的 2GB 或 3GB 的地址空间,称为`用户空间`(User Space)。 -* Linux 下 32 位环境的经典内存模型,如下所示: - -![](./assets/22.svg) - -* 各个内存分区的说明,如下所示: - -| 内存分区 | 说明 | -| :------------------------ | :----------------------------------------------------------- | -| 程序代码区(code) | 存储程序的执行代码,通常为只读区,包含程序的指令。 程序启动时,这部分内存被加载到内存中,并不会在程序执行期间改变。 | -| 常量区(constant) | 存放程序中定义的常量值,通常也是只读的,这些常量在程序运行期间不可修改。 | -| 全局数据区(global data) | 存储程序中定义的全局变量和静态变量。 这些变量在程序的整个生命周期内存在,且可以被修改。 | -| 堆区(heap) | 用于动态分配内存,例如:通过 `malloc` 或 `new` 分配的内存块。 堆区的内存由程序员手动管理,负责分配和释放。 如果程序员不释放,程序运行结束时由操作系统回收。 | -| 动态链接库 | 动态链接库(如: `.dll` 或 `.so` 文件)被加载到内存中特定的区域,供程序运行时使用。 | -| 栈区(stack) | 用于存储函数调用的局部变量、函数参数和返回地址。 栈是自动管理的,随着函数的调用和返回,栈上的内存会自动分配和释放。 | - -> [!NOTE] -> -> - ① 程序代码区、常量区、全局数据区在程序加载到内存后就分配好了,并且在程序运行期间一直存在,不能销毁也不能增加(大小已被固定),只能等到程序运行结束后由操作系统收回,所以全局变量、字符串常量等在程序的任何地方都能访问,因为它们的内存一直都在。 -> - ② 函数被调用时,会将参数、局部变量、返回地址等与函数相关的信息压入栈中,函数执行结束后,这些信息都将被销毁。所以局部变量、参数只在当前函数中有效,不能传递到函数外部,因为它们的内存不在了。 -> - ③ 常量区、全局数据区、栈上的内存由系统自动分配和释放,不能由程序员控制。程序员唯一能控制的内存区域就是`堆`(Heap):它是一块巨大的内存空间,常常占据整个虚拟空间的绝大部分,在这片空间中,程序可以申请一块内存,并自由地使用(放入任何数据)。堆内存在程序主动释放之前会一直存在,不随函数的结束而失效。在函数内部产生的数据只要放到堆中,就可以在函数外部使用。 - -## 4.2 C 语言中的数组 - -* 之前,我们都是这么使用数组的,如下所示: +* 示例:静态全部初始化 ```c #include @@ -709,64 +179,1179 @@ int main() { } ``` -* 其实,这样定义的数组是在`栈`中的,而栈的内存空间是有限的,如果数组中的元素过多,将会出现 `Stack Overflow` 的现象,即:栈溢出。 +### 2.1.3 静态初始化 2 + +* 语法: + +```c +数据类型 数组名[] = {元素1,元素2,...} +``` > [!NOTE] > -> * ① 栈内存的大小和编译器有关,编译器会为栈内存制定一个最大值。 -> * ② 在 VS 中,默认是 1 MB;在 GCC 下,默认是 8 MB。 -> * ③ 虽然可以通过参数来修改栈内存的大小;但是,在实际开发中,我们一般也不会这么做。 +> 没有给出数组中元素的个数,将由系统根据初始化的元素,自动推断出数组中元素的个数。 -* 所以,在实际开发中,如果我们要使用数组,就需要在`堆`中开辟内存空间,因为堆中的内存空间是可以动态扩容和缩容的,只不多在 C 语言中对于堆中申请的内存空间,需要程序员在用完之后,手动释放掉;否则,将会造成内存泄漏现象。 + + +* 示例: ```c #include -#include int main() { - int n; // 数组的大小 - printf("请输入数组的大小: "); - scanf("%d", &n); - // 使用 malloc 申请内存,申请 n 个 int 类型的空间 - int *array = (int *)malloc(n * sizeof(int)); - - // 检查 malloc 是否成功 - if (array == NULL) { - printf("内存分配失败!\n"); - return 1; // 程序退出 - } - - // 初始化数组并输出 - for (int i = 0; i < n; i++) { - array[i] = i + 1; // 简单赋值操作 - printf("array[%d] = %d\n", i, array[i]); - } - - // 使用完毕后,释放内存 - free(array); + // 指定元素的类型,不指定元素个数,同时进行初始化 + int arr[] = {1, 2, 3, 4, 5}; return 0; } ``` -## 4.3 Java 语言中的数组 +### 2.1.4 静态初始化 3 -* Java 语言和 C 语言不同,Java 语言从语法层面就将数组在内存中的分配放到了`堆`中。 +* 在 C 语言中,也可以只给部分元素赋值。当 {} 中的值少于元素的个数的时候,只会给前面的部分元素赋值,至于剩下的元素就会自动初始化为 0 。 ```c -public class Test { - - public static void main(String[] args){ - // 在堆内存开辟数组,使用完毕后,不需要手动回收对应的内存空间 - int[] arr = new int[4] ; - } -} +int arr[10] = {1,2,3,4,5}; ``` > [!NOTE] > -> * ① 在 Java 语言中,数组的内存分配是由 JVM(Java Virtual Machine,Java 虚拟机)自动管理的,开发者不需要像在 C 语言中那样手动调用 `malloc` 来申请内存。Java 提供了更加高级的内存管理机制,所有数组在堆中动态分配。 -> * ② 在 Java 中,声明和初始化数组的过程本质上就是在堆内存中分配数组内存的过程。每个数组在创建时都会被分配到堆中,并且由垃圾回收机制(Garbage Collector,GC)自动负责内存的回收。 -> * ③ 我们甚至可以理解为:Java 语言是 C 语言在实际开发过程中的最佳实践版本。 +> * ① 数组 `arr` 在内存中开辟了 `10` 个连续的内存空间,但是只会给前 `5` 个内存空间赋值初始化值,即:`arr[0] ~ arr[4]` 分别是 `1`、`2`、`3`、`4`、`5`,而 `arr[5] ~ arr[9]` 就会被自动初始化为 `0` 。 +> * ② 当赋值的元素少于数组总体元素的时候,剩余的元素自动初始化为 `0`,其规则如下: +> * 对于 `short`、`int`、`long`,就是整数 `0`。 +> * 对于 `char`,就是字符 `'\0'`。需要注意的是,`'\0'` 的十进制数就是 `0` 。 +> * 对于 `float`、`double`,就是小数 `0.0`。 + + + +* 示例: + +```c +#include +int main() { + int arr[10] = {1, 2, 3, 4, 5}; + + printf("arr[0] = %d \n", arr[0]); // arr[0] = 1 + printf("arr[1] = %d \n", arr[1]); // arr[1] = 2 + printf("arr[2] = %d \n", arr[2]); // arr[2] = 3 + printf("arr[3] = %d \n", arr[3]); // arr[3] = 4 + printf("arr[4] = %d \n", arr[4]); // arr[4] = 5 + printf("arr[5] = %d \n", arr[5]); // arr[5] = 0 + printf("arr[6] = %d \n", arr[6]); // arr[6] = 0 + printf("arr[7] = %d \n", arr[7]); // arr[7] = 0 + printf("arr[8] = %d \n", arr[8]); // arr[8] = 0 + printf("arr[9] = %d \n", arr[9]); // arr[9] = 0 + + return 0; +} +``` + + + +## 2.2 访问数组元素 + +* 语法: + +```c +数组名[索引|下标]; +``` + +> [!NOTE] +> +> 假设数组 `arr` 有 n 个元素,如果使用的数组的下标 `< 0` 或 `> n-1` ,那么将会产生数组越界访问,即超出了数组合法空间的访问;那么,数组的索引范围是 `[0,arr.length - 1]`。 + + + +* 示例: + +```c +#include + +int main() { + + // 先指定元素的个数和类型,再进行初始化 + + // 定义数组 + int arr[3]; + + // 给数组元素赋值 + arr[0] = 10; + arr[1] = 20; + arr[2] = 30; + + // 访问数组元素 + printf("arr[0] = %d\n", arr[0]); // arr[0] = 10 + printf("arr[1] = %d\n", arr[1]); // arr[1] = 20 + printf("arr[2] = %d\n", arr[2]); // arr[2] = 30 + + return 0; +} +``` + + + +* 示例: + +```c +#include + +int main() { + + // 定义数组和部分初始化: + // 会将给定的值从数组的开始位置一个个的赋值,没有赋值的地方,用 0 填充 + int arr[5] = {1, 2}; + + // 访问数组元素 + printf("arr[0] = %d\n", arr[0]); // arr[0] = 1 + printf("arr[1] = %d\n", arr[1]); // arr[1] = 2 + printf("arr[2] = %d\n", arr[2]); // arr[2] = 0 + printf("arr[3] = %d\n", arr[3]); // arr[3] = 0 + printf("arr[4] = %d\n", arr[4]); // arr[4] = 0 + + return 0; +} +``` + + + +* 示例: + +```c +#include + +int main() { + + // 指定元素的类型,不指定元素个数,同时进行初始化 + int arr[] = {1, 2, 3, 4, 5}; + + // 访问数组元素 + printf("arr[0] = %d\n", arr[0]); // arr[0] = 1 + printf("arr[1] = %d\n", arr[1]); // arr[1] = 2 + printf("arr[2] = %d\n", arr[2]); // arr[2] = 3 + printf("arr[3] = %d\n", arr[3]); // arr[3] = 4 + printf("arr[4] = %d\n", arr[4]); // arr[4] = 5 + + return 0; +} +``` + + + +* 示例: + +```c +#include + +int main() { + + // 定义数组和全部初始化:数组初始化的元素个数等于数组的长度。 + int arr[5] = {1, 2, 3, 4, 5}; + + // 访问数组元素 + printf("arr[0] = %d\n", arr[0]); // arr[0] = 1 + printf("arr[1] = %d\n", arr[1]); // arr[1] = 2 + printf("arr[2] = %d\n", arr[2]); // arr[2] = 3 + printf("arr[3] = %d\n", arr[3]); // arr[3] = 4 + printf("arr[4] = %d\n", arr[4]); // arr[4] = 5 + + return 0; +} +``` + +## 2.3 数组越界 + +* 数组下标必须在指定范围内使用,超出范围视为越界。 + +![](./assets/5.png) + +> [!NOTE] +> +> * ① C 语言是不会做数组下标越界的检查,并且编译器也不会报错;但是,编译器不报错,并不意味着程序就是正确! +> * ② 在其它高级编程语言,如:Java、JavaScript、Rust 等中,如果数组越界访问,编译器是会直接报错的!!! + + + +* 示例: + +```c +#include + +int main() { + + // 定义数组和全部初始化:数组初始化的元素个数等于数组的长度。 + int arr[] = {1, 2, 3, 4, 5}; + + // 访问数组元素 + printf("arr[0] = %d\n", arr[0]); // arr[0] = 1 + printf("arr[1] = %d\n", arr[1]); // arr[1] = 2 + printf("arr[2] = %d\n", arr[2]); // arr[2] = 3 + printf("arr[3] = %d\n", arr[3]); // arr[3] = 4 + printf("arr[4] = %d\n", arr[4]); // arr[4] = 5 + printf("arr[-1] = %d\n", arr[-1]); // 得到的是不确定的结果 + printf("arr[5] = %d\n", arr[5]); // 得到的是不确定的结果 + + return 0; +} +``` + +## 2.4 计算数组的长度 + +* 数组长度(元素个数)是在数组定义的时候明确指定且固定的,我们不能在运行的时候直接获取数组长度;但是,我们可以通过 sizeof 运算符间接计算出数组的长度。 +* 计算步骤,如下所示: + * ① 使用 sizeof 运算符计算出整个数组的字节长度。 + * ② 由于数组成员是同一数据类型;那么,每个元素的字节长度一定相等,那么`数组的长度 = 整个数组的字节长度 ÷ 单个元素的字节长度 `。 + +![](./assets/6.png) + +> [!NOTE] +> +> * ① 在很多编程语言中,都内置了获取数组的长度的属性或方法,如:Java 中的 arr.length 或 Rust 的 arr.len()。 +> * ② 但是,C 语言没有内置的获取数组长度的属性或方法,只能通过 sizeof 运算符间接来计算得到。 +> * ③ 数组一旦`声明`或`定义`,其`长度`就`固定`了,`不能动态变化`。 + + + +* 示例: + +```c +#include + +int main() { + + // 定义数组和全部初始化:数组初始化的元素个数等于数组的长度。 + int arr[] = {1, 2, 3, 4, 5}; + + // 计算数组的长度 + size_t length = sizeof(arr) / sizeof(arr[0]); + + // 遍历数组 + for (int i = 0; i < length; i++) { + printf("%d \n", arr[i]); + } + + return 0; +} +``` + +## 2.5 遍历数组 + +* 遍历数组是指按顺序访问数组中的每个元素,以便读取或修改它们,编程中一般使用循环结构对数组进行遍历。 + + + +* 示例:声明一个存储有 12、2、31、24、15、36、67、108、29、51 的数组,并遍历数组所有元素 + +```c +#include + +int main() { + + // 定义数组并初始化 + int arr[] = {12, 2, 31, 24, 15, 36, 67, 108, 29, 51}; + + // 计算数组的长度 + size_t length = sizeof(arr) / sizeof(int); + + // 遍历数组 + for (int i = 0; i < length; i++) { + printf("%d\n", arr[i]); + } + + return 0; +} +``` + + + +* 示例:声明长度为 10 的 int 类型数组,给数组元素依次赋值为 0 ~ 9 ,并遍历数组所有元素 + +```c +#include + +int main() { + + // 定义数组 + int arr[10]; + + // 计算数组的长度 + size_t length = sizeof(arr) / sizeof(int); + + // 给数组的每个元素赋值 + for (int i = 0; i < length; i++) { + arr[i] = i; + } + + // 遍历数组 + for (int i = 0; i < length; i++) { + printf("%d\n", arr[i]); + } + + return 0; +} +``` + +## 2.6 一维数组的内存分析 + +### 2.6.1 数组内存图 + +* 假设数组是如下的定义: + +```c +int arr[] = {1,2,3,4,5}; +``` + +* 那么,对应的内存结构,如下所示: + +![](./assets/7.png) + +> [!NOTE] +> +> * ① 数组名 `arr` 就是记录该数组的首地址,即 `arr[0]` 的地址。 +> * ② 数组中的各个元素是连续分布的,假设 `arr[0]` 的地址是 `0xdea7bff880`,则 `arr[1] 的地址 = arr[0] 的地址 + int 字节数(4) = 0xdea7bff880 + 4 = 0xdea7bff884` ,依次类推... + +* 在 C 语言中,我们可以通过 `&arr` 或 `&arr[0]` 等形式获取数组或数组元素的地址,即: + +```c +#include + +int main() { + + // 定义数组 + int arr[10]; + + // 计算数组的长度 + size_t length = sizeof(arr) / sizeof(int); + + // 给数组的每个元素赋值 + for (int i = 0; i < length; i++) { + arr[i] = i; + } + + printf("数组的地址是 = %p\n", arr); + + // 遍历数组 + for (int i = 0; i < length; i++) { + printf("数组元素 %d 的地址是 = %p\n", arr[i], &arr[i]); + } + + return 0; +} +``` + +### 2.6.2 数组的注意事项 + +* `C 语言规定,数组一旦声明,数组名指向的地址将不可更改`。因为在声明数组的时候,编译器会自动会数组分配内存地址,这个地址和数组名是绑定的,不可更改。 + +> [!WARNING] +> +> 如果之后试图更改数组名对应的地址,编译器就会报错。 + + + +* 示例:错误演示 + +```c +int num[5]; // 声明数组 + +// 使用大括号重新赋值是不允许的,必须在数组声明的时候赋值,否则编译将会报错 +num = {1,2,3,4,5} ; // [!code error] +``` + + + +* 示例:错误演示 + +```c +int num[] = {1,2,3,4,5}; + +// 使用大括号重新赋值是不允许的,必须在数组声明的时候赋值,否则编译将会报错 +num = {2,3,4,5,6}; // [!code error] +``` + + + +* 示例:错误演示 + +```c +int num[5]; + +// 报错,需要和 Java 区别一下,在 C 中不可以 +num = NULL; // [!code error] +``` + + + +* 示例:错误演示 + +```c +int a[] = {1,2,3,4,5} + +// 报错,需要和 Java 区别一下,在 C 中不可以 +int b[5] = a ; // [!code error] +``` + +## 2.7 数组应用案例 + +### 2.7.1 应用示例 + +* 需求:计算数组中所有元素的和以及平均数。 + + + +* 示例: + +```c +#include + +int main() { + + // 定义数组并初始化 + int arr[] = {12, 2, 31, 24, 15, 36, 67, 108, 29, 51}; + + // 计算数组的长度 + size_t length = sizeof(arr) / sizeof(int); + + // 变量保存总和 + int sum = 0; + + // 遍历数组 + for (int i = 0; i < length; i++) { + sum += arr[i]; + } + + double avg = (double)sum / length; + printf("数组的和为:%d\n", sum); // 数组的和为:375 + printf("数组的平均值为:%.2lf\n", avg); //数组的平均值为:37.50 + + return 0; +} +``` + +### 2.7.2 应用示例 + +* 需求:计算数组的最值(最大值和最小值)。 + +> [!NOTE] +> +> 思路: +> +> * ① 假设数组中的第一个元素是最大值或最小值,并使用变量 max 或 min 保存。 +> * ② 遍历数组中的每个元素: +> * 如果有元素比最大值还要大,就让变量 max 保存最大值。 +> * 如果有元素比最小值还要小,就让变量 min 保存最小值。 + + + +* 示例: + +```c +#include + +int main() { + + // 定义数组并初始化 + int arr[] = {12, 2, 31, 24, 15, -36, 67, 108, 29, 51}; + + // 计算数组的长度 + size_t length = sizeof(arr) / sizeof(int); + + // 定义最大值 + int max = arr[0]; + // 定义最小值 + int min = arr[0]; + + // 遍历数组 + for (int i = 0; i < length; i++) { + if (arr[i] >= max) { + max = arr[i]; + } + if (arr[i] <= min) { + min = arr[i]; + } + } + + printf("数组的最大值为:%d\n", max); // 数组的最大值为:108 + printf("数组的最小值为:%d\n", min); // 数组的最小值为:-36 + + return 0; +} +``` + +### 2.7.3 应用示例 + +* 需求:统计数组中某个元素出现的次数,要求:使用无限循环,如果输入的数字是 0 ,就退出。 + + + +* 示例: + +```c +#include + +int main() { + + // 定义数组并初始化 + int arr[] = {12, 2, 31, 24, 2, -36, 67, 108, 29, 51}; + + // 计算数组的长度 + size_t length = sizeof(arr) / sizeof(int); + + // 遍历数组 + printf("当前数组中的元素是:"); + for (int i = 0; i < length; i++) { + printf("%d ", arr[i]); + } + + printf("\n"); + + // 无限循环 + while (true) { + // 统计的数字 + int num; + // 统计数字出现的次数 + int count = 0; + // 输入数字 + printf("请输入要统计的数字:"); + scanf("%d", &num); + + // 0 作为结束条件 + if (num == 0) { + break; + } + + // 遍历数组,并计数 + for (int i = 0; i < length; i++) { + if (arr[i] == num) { + count++; + } + } + + printf("您输入的数字 %d 在数组中出现了 %d 次\n", num, count); + } + + return 0; +} +``` + +### 2.7.4 应用示例 + +* 需求:将数组 a 中的全部元素复制到数组 b 中。 + + + +* 示例: + +```c +#include + +#define SIZE 10 + +int main() { + + // 定义数组并初始化 + int a[] = {12, 2, 31, 24, 15, -36, 67, 108, 29, 51}; + int b[SIZE]; + + // 复制数组 + for (int i = 0; i < SIZE; i++) { + b[i] = a[i]; + } + + // 打印数组 b 中的全部元素 + for (int i = 0; i < SIZE; i++) { + printf("%d ", b[i]); + } + + return 0; +} +``` + +### 2.7.5 应用示例 + +* 需求:数组对称位置的元素互换。 + +> [!NOTE] +> +> 思路:假设数组一共有 10 个元素,那么: +> +> * a[0] 和 a[9] 互换。 +> * a[1] 和 a[8] 互换。 +> * ... +> +> 规律就是 `a[i] <--互换--> arr[arr.length -1 -i]` + + + +* 示例: + +```c +#include + +int main() { + + // 原始数组 + int arr[] = {12, 2, 31, 24, 15, -36, 67, 108, 29, 51}; + + // 计算数组的长度 + size_t SIZE = sizeof(arr) / sizeof(arr[0]); + + // 打印原始数组中的全部元素 + printf("原始数组:"); + for (int i = 0; i < SIZE; i++) { + printf("%d ", arr[i]); + } + printf("\n"); + + // 交换数组 + for (int i = 0; i < SIZE / 2; i++) { + int temp = arr[i]; + arr[i] = arr[SIZE - 1 - i]; + arr[SIZE - 1 - i] = temp; + } + + // 打印交换后的数组 + printf("交换后数组:"); + for (int i = 0; i < SIZE; i++) { + printf("%d ", arr[i]); + } + printf("\n"); + + return 0; +} +``` + + + +* 示例: + +```c +#include + +int main() { + + // 原始数组 + int arr[] = {12, 2, 31, 24, 15, -36, 67, 108, 29, 51}; + + // 计算数组的长度 + size_t SIZE = sizeof(arr) / sizeof(arr[0]); + + // 打印原始数组中的全部元素 + printf("原始数组:"); + for (int i = 0; i < SIZE; i++) { + printf("%d ", arr[i]); + } + printf("\n"); + + // 交换数组 + for (int i = 0, j = SIZE - 1 - i; i < SIZE / 2; i++, j--) { + int temp = arr[i]; + arr[i] = arr[j]; + arr[j] = temp; + } + + // 打印交换后的数组 + printf("交换后数组:"); + for (int i = 0; i < SIZE; i++) { + printf("%d ", arr[i]); + } + printf("\n"); + + return 0; +} +``` + +### 2.7.6 应用示例 + +* 需求:将数组中的最大值移动到数组的最末尾。 + +> [!NOTE] +> +> 思路:从数组的下标 `0` 开始依次遍历到 `length - 1` ,如果 `i` 下标当前的值比 `i+1` 下标的值大,则交换;否则,就不交换。 + + + +* 示例: + +```c +#include + +int main() { + + // 原始数组 + int arr[] = {12, 2, 31, -24, 15, -36, 67, 891, 29, 51}; + + // 计算数组的长度 + size_t length = sizeof(arr) / sizeof(arr[0]); + + // 打印原始数组中的全部元素 + printf("原始数组:"); + for (int i = 0; i < length; i++) { + printf("%d ", arr[i]); + } + printf("\n"); + + // 移动最大值到数组的最后一个位置 + for (int i = 0; i < length - 1; i++) { + if (arr[i] > arr[i + 1]) { + int temp = arr[i]; + arr[i] = arr[i + 1]; + arr[i + 1] = temp; + } + } + + // 打印移动之后的数组 + printf("移动之后的数组:"); + for (int i = 0; i < length; i++) { + printf("%d ", arr[i]); + } + printf("\n"); + + return 0; +} +``` + +### 2.7.7 应用示例 + +* 需求:实现冒泡排序,即将数组的元素从小到大排列。 + +> [!NOTE] +> +> 思路:一层循环,能实现最大值移动到数组的最后;那么,二层循环(控制内部循环数组的长度)就能实现将数组的元素从小到大排序。 + + + + +* 示例: + +```c +#include + +int main() { + + // 原始数组 + int arr[] = {12, 2, 31, -24, 15, -36, 67, 891, 29, 51}; + + // 计算数组的长度 + size_t length = sizeof(arr) / sizeof(arr[0]); + + // 打印原始数组中的全部元素 + printf("原始数组:"); + for (int i = 0; i < length; i++) { + printf("%d ", arr[i]); + } + printf("\n"); + + for (int j = 0; j < length - 1; j++) { + for (int i = 0; i < length - 1 - j; i++) { + if (arr[i] > arr[i + 1]) { + int temp = arr[i]; + arr[i] = arr[i + 1]; + arr[i + 1] = temp; + } + } + } + + // 打印移动之后的数组 + printf("移动之后的数组:"); + for (int i = 0; i < length; i++) { + printf("%d ", arr[i]); + } + printf("\n"); + + return 0; +} +``` + +### 2.7.8 应用示例 + +* 需求:数组中的元素是从小到大排列的,现在要求根据指定的元素获取其在数组中的位置。 + +> [!NOTE] +> +> 二分查找(折半查找)的前提条件是:数组中的元素必须是`有序`的(从小到大或从大到小)。其基本步骤,如下所示: +> +> * ① 确定初始范围:定义数组的起始索引 `min = 0` 和结束索引 `max = len - 1` 。 +> * ② 计算中间索引:在每次迭代中,计算中间位置 `mid = (min + right) / 2`。 +> * ③ 比较中间值: +> * 如果`目标值`比 `arr[mid]` 小,则继续在`左`半部分查找,那么 `min` 不变,而`max = mid - 1` 。 +> * 如果`目标值`比 `arr[mid]` 大,则继续在`右`半部分查找,那么 `max` 不变,而`min = mid + 1` 。 +> * 如果`目标值`和 `arr[mid]` 相等,则找到了目标,返回该索引。 +> * ④ 结束条件:当 `min > max` 的时候,表示查找范围为空,即:元素不存在,返回 `-1`。 + + + +* 示例: + +```c +#include + +/** + * 二分查找 + * + * @param arr 数组 + * @param len 数组长度 + * @param num 要查找的数据 + * @return 返回数据的下标,没有找到返回-1 + */ +int search(int arr[], int len, int num) { + int min = 0; + int max = len - 1; + while (min <= max) { + int mid = (min + max) / 2; + if (num < arr[mid]) { // 说明要查找的数据在左半边 + max = mid - 1; + } else if (num > arr[mid]) { // 说明要查找的数据在右半边 + min = mid + 1; + } else { // 说明找到了 + return mid; + } + } + return -1; +} + +int main() { + + int arr[] = {1, 2, 3, 4, 5, 6}; + + int len = sizeof(arr) / sizeof(arr[0]); + + int index = search(arr, len, -1); + + printf("index = %d\n", index); + + return 0; +} +``` + + + +# 第三章:多维数组(⭐) + +## 3.1 概述 + +### 3.1.1 引入 + +* 我们在数学、物理和计算机科学等学科中学习过`一维坐标`、`二维坐标`以及`三维坐标`。 + +* 其中,`一维坐标`通常用于描述在线段或直线上的点的位置,主要应用有: + + * **数轴**:一维坐标可以用来表示数轴上的数值位置,这在基础数学和初等代数中非常常见。 + + ![](./assets/8.png) + + * **时间轴**:时间可以看作是一维的,它可以用一维坐标表示,例如:秒、分钟、小时等。 + + ![](./assets/9.png) + + * **统计数据**:一维坐标常用于表示单变量的数据集,如:测量身高、体重、温度等。 + + ![](./assets/10.jpg) + +* 其中,`二维坐标`用于描述平面上的点的位置。主要应用包括: + + * **几何学**:在几何学中,二维坐标用于表示平面图形的顶点、边和面积等。 + + ![](./assets/11.png) + + * **地图和导航**:地理坐标系统(经纬度)使用二维坐标来表示地球表面的任意位置。 + + ![image-20240724112326592](./assets/12.png) + + * **图形设计和计算机图形学**:二维坐标在绘制图形、设计图案和用户界面中非常重要。 + + ![](./assets/13.png) + + * **物理学**:二维运动和场,例如:在描述物体在平面上的运动轨迹时使用二维坐标。 + + ![](./assets/14.jpg) + +* 其中,三维坐标用于描述空间中点的位置。主要应用包括: + + * **几何学**:三维坐标在空间几何中用于表示立体图形的顶点、边、面和体积。 + + ![](./assets/15.png) + + * **计算机图形学**:三维建模和动画需要使用三维坐标来创建和操控虚拟对象。 + + ![](./assets/16.png) + + * **工程和建筑设计**:在设计建筑物、机械部件和其他工程项目时,使用三维坐标来精确定位和规划。 + + ![](./assets/17.png) + + * **物理学**:三维空间中的力、运动和场,例如:描述物体在空间中的位置和运动轨迹。 + + ![](./assets/18.png) + +* 总而言之,一维、二维和三维坐标系统在不同的领域中各有其重要的应用,从基础数学到高级科学和工程技术,它们帮助我们更好地理解和描述世界的结构和行为。 + +### 3.1.2 多维数组 + +* 在 C 语言中,多维数组就是数组嵌套,即:在数组中包含数组,数组中的每一个元素还是一个数组类型,如下所示: + +![](./assets/19.png) + +> [!NOTE] +> +> * ① 如果数组中嵌套的每一个元素是一个常量值,那么该数组就是一维数组。 +> * ② 如果数组中嵌套的每一个元素是一个一维数组,那么该数组就是二维数组。 +> * ③ 如果数组中嵌套的每一个元素是一个二维数组,那么该数组就是三维数组. +> * ④ 依次类推... + +* 一维数组和多维数组的理解: + * 从内存角度看:一维数组或多维数组都是占用的一整块连续的内存空间。 + * 从数据操作角度看: + * 一维数组可以直接通过`下标`访问到数组中的某个元素,即:0、1、... + * 二维数组要想访问某个元素,先要获取某个一维数组,然后在一维数组中获取对应的数据。 + +> [!NOTE] +> +> * ① C 语言中的一维数组或多维数组都是占用的一整块连续的内存空间,其它编程语言可不是这样的,如:Java 等。 +> * ② 在实际开发中,最为常用的就是二维数组或三维数组了,以二维数组居多!!! + +## 3.2 二维数组的定义 + +### 3.2.1 动态初始化 + +* 语法: + +```c +数据类型 数组名[几个⼀维数组元素][每个⼀维数组中有几个具体的数据元素]; +``` + +> [!NOTE] +> +> * ① 二维数组在实际开发中,最为常见的应用场景就是表格或矩阵了。 +> * ② 几个一维数组元素 = 行数。 +> * ③ 每个⼀维数组中有几个具体的数据元素 = 列数。 + + + +* 示例: + +```c +#include + +int main() { + + // 定义二维数组并初始化 + int arr[3][4] = {{1, 2, 3, 4}, {5, 6, 7, 8}, {9, 10, 11, 12}}; + + // 输出二维数组中的元素 + printf("%d ", arr[0][0]); + printf("%d ", arr[0][1]); + printf("%d ", arr[0][2]); + printf("%d \n", arr[0][3]); + printf("%d ", arr[1][0]); + printf("%d ", arr[1][1]); + printf("%d ", arr[1][2]); + printf("%d \n", arr[1][3]); + printf("%d ", arr[2][0]); + printf("%d ", arr[2][1]); + printf("%d ", arr[2][2]); + printf("%d ", arr[2][3]); + + return 0; +} +``` + +### 3.2.2 静态初始化 1 + +* 语法: + +```c +数据类型 数组名[行数][列数] = {{元素1,元素2,...},{元素3,...},...} +``` + +> [!NOTE] +> +> * ① 行数 = 几个一维数组元素。 +> * ② 列数 = 每个⼀维数组中有几个具体的数据元素。 + + + +* 示例: + +```c +#include + +int main() { + + // 定义二维数组并初始化 + int arr[3][4] = {{1, 2, 3, 4}, {5, 6, 7, 8}, {9, 10, 11, 12}}; + + // 输出二维数组中的元素 + printf("%d ", arr[0][0]); + printf("%d ", arr[0][1]); + printf("%d ", arr[0][2]); + printf("%d \n", arr[0][3]); + printf("%d ", arr[1][0]); + printf("%d ", arr[1][1]); + printf("%d ", arr[1][2]); + printf("%d \n", arr[1][3]); + printf("%d ", arr[2][0]); + printf("%d ", arr[2][1]); + printf("%d ", arr[2][2]); + printf("%d ", arr[2][3]); + + return 0; +} +``` + +### 3.2.3 静态初始化 2 + +* 语法: + +```c +数据类型 数组名[][列数] = {{元素1,元素2,...},{元素3,...},...} +``` + +> [!NOTE] +> +> * ① 列数 = 每个⼀维数组中有几个具体的数据元素。 +> * ② 可以`不`指定`行数`,`必须`指定`列`数,编译器会根据元素的个数和列的个数,自动推断出行数!!! + + + +* 示例: + +```c +#include + +int main() { + + // 定义二维数组 + int arr[][4] = {{1, 2, 3, 4}, {5, 6}, {9, 10, 11, 12}}; + + // 输出二维数组中的元素 + printf("%d ", arr[0][0]); + printf("%d ", arr[0][1]); + printf("%d ", arr[0][2]); + printf("%d \n", arr[0][3]); + printf("%d ", arr[1][0]); + printf("%d \n", arr[1][1]); + printf("%d ", arr[2][0]); + printf("%d ", arr[2][1]); + printf("%d ", arr[2][2]); + printf("%d ", arr[2][3]); + + return 0; +} +``` + +## 3.3 二维数组的理解 + +* 如果二维数组是这么定义的,即: + +```c +int arr[3][4]; +``` + +* 那么,这个二维数组 `arr` 可以看做是 `3` 个一维数组组成,它们分别是 `arr[0]`、`arr[1]`、`arr[2]`。这 `3` 个一维数组都各有 4 个元素,如:一维数组 `arr[0]` 中的元素是 `arr[0][0]`、`arr[0][1]`、`arr[0][2]`、`arr[0][3]`,即: + +![](./assets/20.png) + +## 3.4 二维数组的遍历 + +* 访问二维数组的元素,需要使用两个下标(索引),一个用于访问行(第一维),另一个用于访问列(第二维),我们通常称为行下标(行索引)或列下标(列索引)。 +* 所以,遍历二维数组,需要使用双层循环结构。 + +> [!NOTE] +> +> 如果一个二维数组是这么定义的,即:`int arr[3][4]`,那么: +> +> * `行的长度 = sizeof(arr) / sizeof(arr[0])` ,因为 `arr` 是二维数组的`总`的内存空间;而 `arr[0]` 、`arr[1]`、`arr[2]` 是二维数组中一维数组的内存空间 。 +> * `列的长度 = sizeof(arr[0]) / sizeof(arr[0][0])`,因为`arr[0]` 、`arr[1]`、`arr[2]` 是二维数组中一维数组的内存空间 ,而 `arr[0][0]`、`arr[0][1]`、... 是一维数组中元素的内存空间。 + + + +* 示例: + +```c +#include + +int main() { + + // 定义二维数组 + int arr[][4] = {{1, 2, 3, 4}, {5, 6}, {9, 10, 11, 12}}; + + // 获取行列数 + int row = sizeof(arr) / sizeof(arr[0]); + int col = sizeof(arr[0]) / sizeof(arr[0][0]); + + // 打印二维数组元素 + for (int i = 0; i < row; i++) { + for (int j = 0; j < col; j++) { + printf("%d ", arr[i][j]); + } + printf("\n"); + } + + return 0; +} +``` + +## 3.5 二维数组的内存分析 + +* 用`矩阵形式`(如:3 行 4 列形式)表示二维数组,是`逻辑`上的概念,能形象地表示出行列关系。而在`内存`中,各元素是连续存放的,不是二维的,是`线性`的。 + +* C 语言中,二维数组中元素排列的顺序是`按行存放`的。即:先顺序存放第一行的元素,再存放第二行的元素。例如:数组`a[3][4] `在内存中的存放,如下所示: + +![](./assets/21.png) + +> [!NOTE] +> +> * ① 这就是 `C` 语言的二维数组在进行静态初始化的时候,`可以`忽略`行数`的原因所在(底层的`内存结构`是`线性`的),因为可以根据 `元素的总数 ÷ 每列元素的个数 = 行数`的公式计算出`行数`。 +> * ② 如果你学过 `Java` 语言,可能会感觉困惑,Java 语言中的二维数组在进行静态初始化,是`不能`忽略`行数`的,是因为 Java 编译器会根据`行数`去堆内存空间先开辟出一维数组,然后再继续...,所以当然`不能`忽略`行数`。 + +## 3.6 二维数组的应用案例 + +* 需求:现在有三个班,每个班五名同学,用二维数组保存他们的成绩,并求出每个班级平均分、以及所有班级平均分,数据要求从控制台输入。 + + + +* 示例: + +```c +#include + +int main() { + + // 定义二维数组,用于保存成绩 + double arr[3][5]; + + // 获取二维数组的行数和列数 + int row = sizeof(arr) / sizeof(arr[0]); + int col = sizeof(arr[0]) / sizeof(arr[0][0]); + + // 从控制台输入成绩 + for (int i = 0; i < row; i++) { + for (int j = 0; j < col; j++) { + printf("请输入第%d个班级的第%d个学生的成绩:", i + 1, j + 1); + scanf("%lf", &arr[i][j]); + } + } + + // 总分 + double totalSum = 0; + + // 遍历数组,求总分和各个班级的平均分 + for (int i = 0; i < row; i++) { + double sum = 0; + for (int j = 0; j < col; j++) { + totalSum += arr[i][j]; + sum += arr[i][j]; + } + printf("第%d个班级的总分为:%.2lf\n", i + 1, sum); + printf("第%d个班级的平均分为:%.2lf\n", i + 1, sum / col); + } + + printf("所有班级的总分为:%.2lf\n", totalSum); + printf("所有班级的平均分为:%.2lf\n", totalSum / (row * col)); + + return 0; +} +``` + diff --git a/docs/notes/01_c-basic/10_xdx/assets/1.png b/docs/notes/01_c-basic/10_xdx/assets/1.png new file mode 100644 index 0000000..140c3e5 Binary files /dev/null and b/docs/notes/01_c-basic/10_xdx/assets/1.png differ diff --git a/docs/notes/01_c-basic/09_xdx/assets/10.svg b/docs/notes/01_c-basic/10_xdx/assets/10.svg similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/10.svg rename to docs/notes/01_c-basic/10_xdx/assets/10.svg diff --git a/docs/notes/01_c-basic/09_xdx/assets/11.svg b/docs/notes/01_c-basic/10_xdx/assets/11.svg similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/11.svg rename to docs/notes/01_c-basic/10_xdx/assets/11.svg diff --git a/docs/notes/01_c-basic/09_xdx/assets/12.gif b/docs/notes/01_c-basic/10_xdx/assets/12.gif similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/12.gif rename to docs/notes/01_c-basic/10_xdx/assets/12.gif diff --git a/docs/notes/01_c-basic/09_xdx/assets/13.jpg b/docs/notes/01_c-basic/10_xdx/assets/13.jpg similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/13.jpg rename to docs/notes/01_c-basic/10_xdx/assets/13.jpg diff --git a/docs/notes/01_c-basic/10_xdx/assets/14.jpg b/docs/notes/01_c-basic/10_xdx/assets/14.jpg new file mode 100644 index 0000000..3f5b674 Binary files /dev/null and b/docs/notes/01_c-basic/10_xdx/assets/14.jpg differ diff --git a/docs/notes/01_c-basic/09_xdx/assets/15.gif b/docs/notes/01_c-basic/10_xdx/assets/15.gif similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/15.gif rename to docs/notes/01_c-basic/10_xdx/assets/15.gif diff --git a/docs/notes/01_c-basic/09_xdx/assets/16.gif b/docs/notes/01_c-basic/10_xdx/assets/16.gif similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/16.gif rename to docs/notes/01_c-basic/10_xdx/assets/16.gif diff --git a/docs/notes/01_c-basic/09_xdx/assets/17.svg b/docs/notes/01_c-basic/10_xdx/assets/17.svg similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/17.svg rename to docs/notes/01_c-basic/10_xdx/assets/17.svg diff --git a/docs/notes/01_c-basic/09_xdx/assets/18.svg b/docs/notes/01_c-basic/10_xdx/assets/18.svg similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/18.svg rename to docs/notes/01_c-basic/10_xdx/assets/18.svg diff --git a/docs/notes/01_c-basic/10_xdx/assets/19.png b/docs/notes/01_c-basic/10_xdx/assets/19.png new file mode 100644 index 0000000..c68c880 Binary files /dev/null and b/docs/notes/01_c-basic/10_xdx/assets/19.png differ diff --git a/docs/notes/01_c-basic/10_xdx/assets/2.png b/docs/notes/01_c-basic/10_xdx/assets/2.png new file mode 100644 index 0000000..ba1e8e2 Binary files /dev/null and b/docs/notes/01_c-basic/10_xdx/assets/2.png differ diff --git a/docs/notes/01_c-basic/10_xdx/assets/20.png b/docs/notes/01_c-basic/10_xdx/assets/20.png new file mode 100644 index 0000000..aa7d603 Binary files /dev/null and b/docs/notes/01_c-basic/10_xdx/assets/20.png differ diff --git a/docs/notes/01_c-basic/10_xdx/assets/21.png b/docs/notes/01_c-basic/10_xdx/assets/21.png new file mode 100644 index 0000000..c4e9fb4 Binary files /dev/null and b/docs/notes/01_c-basic/10_xdx/assets/21.png differ diff --git a/docs/notes/01_c-basic/09_xdx/assets/22.svg b/docs/notes/01_c-basic/10_xdx/assets/22.svg similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/22.svg rename to docs/notes/01_c-basic/10_xdx/assets/22.svg diff --git a/docs/notes/01_c-basic/10_xdx/assets/3.png b/docs/notes/01_c-basic/10_xdx/assets/3.png new file mode 100644 index 0000000..e867783 Binary files /dev/null and b/docs/notes/01_c-basic/10_xdx/assets/3.png differ diff --git a/docs/notes/01_c-basic/09_xdx/assets/4.jpeg b/docs/notes/01_c-basic/10_xdx/assets/4.jpeg similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/4.jpeg rename to docs/notes/01_c-basic/10_xdx/assets/4.jpeg diff --git a/docs/notes/01_c-basic/09_xdx/assets/5.gif b/docs/notes/01_c-basic/10_xdx/assets/5.gif similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/5.gif rename to docs/notes/01_c-basic/10_xdx/assets/5.gif diff --git a/docs/notes/01_c-basic/09_xdx/assets/6.gif b/docs/notes/01_c-basic/10_xdx/assets/6.gif similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/6.gif rename to docs/notes/01_c-basic/10_xdx/assets/6.gif diff --git a/docs/notes/01_c-basic/10_xdx/assets/7.png b/docs/notes/01_c-basic/10_xdx/assets/7.png new file mode 100644 index 0000000..a2d113f Binary files /dev/null and b/docs/notes/01_c-basic/10_xdx/assets/7.png differ diff --git a/docs/notes/01_c-basic/09_xdx/assets/8.svg b/docs/notes/01_c-basic/10_xdx/assets/8.svg similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/8.svg rename to docs/notes/01_c-basic/10_xdx/assets/8.svg diff --git a/docs/notes/01_c-basic/09_xdx/assets/9.svg b/docs/notes/01_c-basic/10_xdx/assets/9.svg similarity index 100% rename from docs/notes/01_c-basic/09_xdx/assets/9.svg rename to docs/notes/01_c-basic/10_xdx/assets/9.svg diff --git a/docs/notes/01_c-basic/10_xdx/index.md b/docs/notes/01_c-basic/10_xdx/index.md new file mode 100644 index 0000000..2976e03 --- /dev/null +++ b/docs/notes/01_c-basic/10_xdx/index.md @@ -0,0 +1,772 @@ +# 第一章:字符串(⭐) + +## 1.1 概述 + +* 在实际开发中,我们除了经常处理整数、浮点数、字符等,还经常和字符串打交道,如:`"Hello World"`、`"Hi"` 等。 + +> [!NOTE] +> +> 像这类`"Hello World"`、`"Hi"`等格式 ,使用`双引号`引起来的一串字符称为字符串字面值,简称字符串。 + +* 对于整数、浮点数和字符,C 语言中都提供了对应的数据类型。但是,对于字符串,C 语言并没有提供对应的数据类型,而是用`字符数组`来存储这类文本类型的数据,即字符串: + +```c +char str[32]; +``` + +* 字符串不像整数、浮点数以及字符那样有固定的大小,字符串是不定长的,如:`"Hello World"`、`"Hi"` 等的长度就是不一样的。在 C 语言中,规定了字符串的结尾必须是 `'\0'` ,这种字符串也被称为 `C 风格的字符串`,如: + +```c +"Hello World!" // 在 C 语言中,底层存储就是 Hello World!\0 +``` + +* 其对应的图示,如下所示: + +![](./assets/1.png) + +* `'\0'` 在 ASCII 码表中是第 `0` 个字符,用 `NUL` 表示,称为空字符,该字符既不能显示,也不是控制字符,输出该字符不会有任何效果,它在 C 语言中仅作为字符串的结束标志。 +* C 语言在处理字符串时,会从前往后逐个扫描字符,一旦遇到`'\0'`就认为到达了字符串的末尾,就结束处理。`'\0'`至关重要,没有`'\0'`就意味着永远也到达不了字符串的结尾。 + +![](./assets/2.png) + +> [!NOTE] +> +> 在现代化的高级编程语言中,都提供了字符串对应的类型,如:Java 中的 String(JDK 11 之前,底层也是通过 `char[]` 数组来实现的) 。 + +## 1.2 字符数组(字符串)的定义 + +### 1.2.1 标准写法 + +* 手动在字符串的结尾添加 `'\0'`作为字符串的结束标识。 + + + +* 示例: + +```c +#include + +int main() { + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + // 字符数组,不是字符串 + char c1[] = {'H', 'e', 'l', 'l', 'o', ' ', 'W', 'o', 'r', 'l', 'd'}; + // C 风格的字符串 + char c2[] = {'H', 'e', 'l', 'l', 'o', ' ', 'W', 'o', 'r', 'l', 'd', '\0'}; + + return 0; +} +``` + +### 1.2.2 简化写法(推荐) + +* 字符串写成数组的形式,非常麻烦。C 语言中提供了一种简化写法,即:双引号中的字符,会自动视为字符数组。 + +> [!NOTE] +> +> 简化写法会自动在末尾添加 `'\0'` 字符,强烈推荐使用!!! + + + +* 示例: + +```c +#include + +int main() { + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + char c1[] = {"Hello World"}; // 注意使用双引号,非单引号 + char c2[] = "Hello World"; // //可以省略一对 {} 来初始化数组元素 + + + return 0; +} +``` + +## 1.3 字符串的输入和输出 + +### 1.3.1 字符串的输出 + +* 在 C 语言中,有两个函数可以在控制台上输出字符串,它们分别是: + * ① `puts()`:输出字符串并自动换行,并且该函数只能输出字符串。 + * ② `printf()` :通过格式占位符 `%s`,就可以输出字符串,不能自动换行。 + +> [!NOTE] +> +> * ① `printf()` 函数除了输出字符串之外,还可以输出`其它类型`的数据。 +> * ② 在实际开发中,`printf()` 函数用的居多!!! + + + +* 示例: + +```c +#include + +int main() { + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + char c1[] = {"Hello World"}; // 注意使用双引号,非单引号 + char c2[] = "Hello World"; // //可以省略一对 {} 来初始化数组元素 + + puts(c1); // Hello World + puts(c2); // Hello World + + return 0; +} +``` + + + +* 示例: + +```c +#include + +int main() { + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + char c1[] = {"Hello World"}; // 注意使用双引号,非单引号 + char c2[] = "Hello World"; // //可以省略一对 {} 来初始化数组元素 + + printf("c1 = %s\n", c1); // c1 = Hello World + printf("c2 = %s\n", c2); // c2 = Hello World + + return 0; +} +``` + +### 1.3.2 字符串的输入 + +* 在 C 语言中,有两个函数可以让用户从键盘输入字符串,它们分别是: + * ① ~~`gets()`:直接输入字符串,并且只能输入字符串~~。 + * ② `scanf()`:通过格式占位符 `%s`,就可以输入字符串了。 + +> [!NOTE] +> +> * ① `scanf()` 在通过格式占位符 `%s`,读取字符串时以`空格`或 `Enter` 键为分隔,遇到`空格`或 `Enter` 键就认为当前字符串结束了,所以无法读取含有空格的字符串。但是,我们可以将格式占位符,使用 `%[^\n]`来代替 `%s` ,这样就能解决 `scanf()` 函数默认的缺陷。 +> * ② `gets()` 认为空格也是字符串的一部分,只有遇到回车键时才认为字符串输入结束。换言之,不管输入了多少个空格,只要不按下回车键,对 `gets()` 来说就是一个完整的字符串。 +> * ③ 需要注意的是,`gets()` 函数在 [C11](https://zh.cppreference.com/w/c/11) 标准中,已经被移除了,推荐使用 `fgets` 来代替它,因为有严重的安全漏洞,即:`gets()` 函数读取用户输入直到换行符,但它不会检查缓冲区的大小。这意味着如果用户输入超过了缓冲区的大小,`gets()` 将会导致缓冲区溢出。这种缓冲区溢出很容易被恶意利用,导致程序崩溃或执行恶意代码。 + +* 示例: + +```c +#include + +int main() { + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + char str[32] = {'\0'}; + + printf("请输入字符串:"); + gets(str); + + printf("字符串是:%s\n", str); + + return 0; +} +``` + + + +* 示例: + +```c {13} +#include + +int main() { + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + char str[32] = {'\0'}; + + printf("请输入字符串:"); + // scanf() 在读取数据时需要的是数据的地址,这一点是恒定不变的。 + // 对于 int、char、float 等类型的变量都要在前边添加 & 以获取它们的地址。 + // 而数组或者字符串用于 scanf() 时不用添加 &,它们本身就会转换为地址。 + scanf("%[^\n]", str); + + printf("字符串是:%s\n", str); + + return 0; +} +``` + +## 1.4 字符串结束不是 `'\0'` 的后果 + +* 有的时候,程序的逻辑要求我们必须逐个字符为数组赋值,这个时候就很容易遗忘字符串结束标识 `'\0'`,如下所示: + +```c {3} +#include +int main() { + char str[30]; + char c; + int i; + for (c = 65, i = 0; c <= 90; c++, i++) { + str[i] = c; + } + printf("%s\n", str); + + return 0; +} +``` + +* 该程序的执行结果,如下所示: + +![](./assets/3.png) + +* 因为`大写字符`在 `ASCII` 码表是连续的,编码值从 `65` 开始,直到 `90` 结束;并且,为了方便,我们使用了循环。但是,我们却发现结果和我们想要的大不一样,为什么? + +> [!NOTE] +> +> * ① 在函数内部定义的变量、数组、结构体、共用体等都称为局部数据。 +> +> * ② 在很多编译器下,局部数据的初始值都是随机的、无意义的,而不是我们通常认为的“零”值。 + +* 我们在定义 `str` 数组的时候,并没有立即初始化,所以它包含的值都是随机的,只有很小的概率是“零”。循环结束后,`str` 的前 `26` 个元素被赋值了,剩下的 `4` 个元素的值依然是随机的,我们并不清楚到底是什么。 +* `printf()` 输出字符串时,会从第 `0` 个元素开始往后检索,直到遇见`'\0'`才停止,然后把`'\0'`前面的字符全部输出,这就是 `printf()` 输出字符串的原理。 +* 但是,对于上面的例子,由于我们并没有对最后 `4` 个元素赋值,所以第 `26` 元素可能是 `'\0'`,也有可能第 `27` 个元素是 `'\0'`,也有可能第 `28` 个元素是 `'\0'`;不过,不要问`我`,`我`也不清楚,可能只有`上帝`才会知道,到底第`几`个元素才是 `'\0'`。而且,我们在定义数组的时候,设置数组的长度是 `30` ,但是貌似输出的字符串的长度是 `32` ,这早已超出了数组的范围,`printf()` 在输出字符串的时候,如果没有遇见 `'\0'` 是不会罢休的,它才不会管`数组访问`是不是`越界`。 + +> [!NOTE] +> +> * ① 由此可见,不注意`'\0'`的后果有多严重,不但不能正确处理字符串,甚至还会毁坏其它数据!!! +> * ② C 语言为了提高效率,保证操作的灵活性,并不会对越界行为进行检查,即使越界了,也能够正常编译,只有在运行期间才可能发现问题,所以对程序员的要求很高。但是,现代化的高级编程语言,如:Java 等,为了降低开发难度以及提高开发效率,像数组这种越界行为,在编译期间就会由编译器提前捕获,并直接报错!!! + +* 如果要避免这些问题也很简单,在字符串后面手动添加 `'\0'` 就可以了,即: + +```c {9} +#include +int main() { + char str[30]; + char c; + int i; + for (c = 65, i = 0; c <= 90; c++, i++) { + str[i] = c; + } + str[i] = '\0'; + printf("%s\n", str); + + return 0; +} +``` + +* 但是,上述的写法实在麻烦,为什么不在定义数组的时候,给数组中的每个元素都初始化,这样才能从根本上避免上述问题,即: + +```c {3} +#include +int main() { + char str[30] = {'\0'}; + char c; + int i; + for (c = 65, i = 0; c <= 90; c++, i++) { + str[i] = c; + } + printf("%s\n", str); + + return 0; +} +``` + +## 1.5 字符串的长度 + +* 所谓字符串的长度,就是字符串包含了多少个字符(不包括最后的结束符`'\0'`),如:`"abc"` 的长度是 `3` ,而不是 `4` 。 +* 在 C 语言中的 `string.h` 中提供了 `strlen()` 函数,能够帮助我们获取字符串的长度,如下所示: + +```c +size_t strlen (const char *__s) +``` + + + +* 示例: + +```c {13} +#include +#include +int main() { + char str[30] = {'\0'}; + char c; + int i; + for (c = 65, i = 0; c <= 90; c++, i++) { + str[i] = c; + } + // ABCDEFGHIJKLMNOPQRSTUVWXYZ + printf("%s\n", str); + // ABCDEFGHIJKLMNOPQRSTUVWXYZ 的长度是 26 + printf("%s 的长度是 %zu\n", str, strlen(str)); + + return 0; +} +``` + + + +# 第二章:内存中的变量和数组(⭐) + +## 2.1 内存和内存地址 + +### 2.1.1 内存 + +* `内存`是一种`计算机硬件`,是`软件`在`运行过程`中,用来`临时存储数据`的。在生活中,最为常见的`内存`就是`随机存取存储器(RAM,内存条`),其特点如下所示: + * ① 生活中最常见的内存类型,用于存储当前运行的程序和数据。 + * ② 内存是易失性存储器,这意味着断电后数据会丢失。 + * ③ 它具有高速读写特性,适用于需要快速访问的操作。 + +* 内存条的外观,如下所示: + +![](./assets/4.jpeg) + +* 像我们平常使用`记事本`软件一样,当我们输入一些文字的时候,其实是将数据`临时`保存在内存中的,如下所示: + +> [!NOTE] +> +> * ① 目前,很多软件都很智能,如果用户没有将数据到保存文件中,将显示红色,以警告用户还没有保存数据,提醒用户需要尽快保存数据!!! +> * ② 但是,也有很多软件提供了自动保存数据的功能,其原理就是定时(1s、3s、5s)将内存中的数据刷新到文件中,以防止数据丢失!!! +> * ③ 将数据从内存存储到文件中,专业的说法是落盘(落在磁盘上)。 + +![](./assets/5.gif) + +* 此时,如果我们在没有保存的过程下,将`记事本`软件关闭,那么刚才输入的文字将丢失;下次,再打开同样的文件(将数据从磁盘加载进内存,再交给 CPU),之前输入的文字将不复存在,如下所示: + +> [!NOTE] +> +> * ① 目前,很多软件都很智能,如果你没有保存,将提醒你是否保存或丢失刚才输入的文字。 +> * ② 但是,也有很多软件提供了自动保存数据的功能,其原理就是定时(1s、3s、5s)将内存中的数据刷新到文件中,以防止数据丢失!!! +> * ③ 将数据从内存存储到文件中,专业的说法是落盘(落在磁盘上)。 + +![](./assets/6.gif) + +> [!IMPORTANT] +> +> 内存就是软件在运行过程中,用来临时存储数据的,最为重要的两个步骤就是: +> +> * ① 将数据`保存`到内存中。 +> * ② 从内存中的`对应位置`将数据`取出来`。 + +### 2.1.2 内存地址 + +* 在这个计算机的内存条,动不动就 32GB、64GB 、128GB 或更高的年代,如下所示: + +![](./assets/7.png) + +* 如果有一个 int (4 个字节)类型的数据 `2` ,如何将这个数据保存到内存中?(对应上述的步骤 ①) + +![](./assets/8.svg) + +* 就算数据 `2` 已经保存到内存中,那么内存中那么多的数据,我们又该如何取出呢?(对应上述的步骤 ②) + +![](./assets/9.svg) + +> [!IMPORTANT] +> +> 答案就是`内存地址`。 + +* 操作系统为了更快的去管理内存中的数据,会将`内存条`按照`字节`划分为一个个的`单元格`,如下所示: + +![](./assets/10.svg) + +> [!NOTE] +> +> 计算机中存储单位的换算,如下所示: +> +> - 1 B = 8 bit。 +> - 1 KB = 1024 B。 +> - 1 MB = 1024 KB。 +> - 1 GB = 1024 MB。 +> - 1 TB = 1024 GB 。 +> - …… + +* 为了方便管理,每个独立的小单元格,都有自己唯一的编号(内存地址),如下所示: + +![](./assets/11.svg) + +* 之所以,加了`内存地址`,就能`加快`数据的存取速度,可以类比生活中的`字典`: + + * 如果没有使用`拼音查找法`或`部首查找法`,我们需要一页一页,一行一行的,在整个字典中去搜索我们想要了解的汉字,效率非常低(如果要搜索的汉字在最后一页,可能需要将整个字典从头到尾翻一遍,这辈子真有可能翻得完?)。 + + ![](./assets/12.gif) + + * 如果使用`拼音查找法`或`部首查找法`,我们可以很快的定位到所要了解汉字所在的页数,加快了搜索的效率。 + + ![](./assets/13.jpg) + + ![](./assets/14.jpg) + +* 同样的道理,如果`没有`内存地址,我们只能一个个的去寻找想要的数据,效率非常低下,如下所示: + +![](./assets/15.gif) + +* 如果`使用`内存地址,我们就可以直接定位到指定的数据,效率非常高,如下所示: + +![](./assets/16.gif) + +> [!IMPORTANT] +> +> * ① 内存地址是计算机中用于标识内存中某个特定位置的数值。 +> * ② 每个内存单元都有一个唯一的地址,这些地址可以用于访问和操作存储在内存中的数据。 + + + +* 实际中的内存地址,并不是像上面的 `001` 、`002` 、... 之类的数字,而是有自己的规则,即:内存地址规则。 + +> [!NOTE] +> +> * ① 32 位的操作系统中,内存地址以 32 位的二进制表示。 +> * ② 64 位的操作系统中,内存地址以 64 位的二进制表示。 + +* 在 32 位的操作系统中,内存地址的范围是:`0000 0000 0000 0000 0000 0000 0000 0000` ~ `1111 1111 1111 1111 1111 1111 1111 1111` (2 ^ 32 次方)。 + +> [!NOTE] +> +> 在 32 位的操作系统中,一共有 4,294,967,296 个内存地址,其最大支持的内存大小是 4,294,967,296 字节,即 4 GB 。 + +* 在 64 位的操作系统中,内存地址的范围是:`0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000` ~ `1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111` (2 ^ 64 次方)。 + +> [!NOTE] +> +> * ① 在 64 位的操作系统中,一共有 18,446,744,073,709,551,616 个内存地址,其最大支持的内存大小是 18,446,744,073,709,551,616 字节,即 17,179 TB 。 +> * ② 虽然,从理论上 64 位的操作系统支持的内存最大容量是 17,179 TB;但是,实际操作系统会有所限制,如:win11 的 64 位支持的最大内存是 128 GB ~ 6 TB,Linux 64 位支持的最大内存通常是 256 TB。 + +* 在实际开发中,64 位操作系统的内存地址表现形式,如:`0000 0000 0000 0000 0001 0000 1111 1010 0000 0000 0010 0000 0000 0010 0000 1000`,实在是太长了,我们通常转换为十六进制,以方便阅读,如:`0x000010FA00200208` 。 + +> [!IMPORTANT] +> +> * ① 内存地址是内存中每个单元的编号。 +>* ② 内存地址的作用是操作系统用来快速管理内存空间的。 +> * ③ 在 32 位操作系统上,内存地址以 32 位的二进制数字表示,最大支持的的内存是 4 GB,所以 32 位操作系统已经被淘汰。 +> * ④ 在 64 位操作系统上,内存地址以 64 位的二进制数字表示,由于表示形式太长,我们通常会转为十六进制,以方便阅读。 + +## 2.2 内存中的变量 + +* 在 C 语言中,数据类型的种类很多,如:short、int、long、float、double、char 等。以 int 类型为例,在 32 位或 64 位操作系统中的,int 类型的变量都是占 4 个字节,当我们在代码中这么定义变量,如: + +```c +#include + +int main(){ + + // 定义一个变量并初始化 + int a = 10; + + return 0; +} +``` + +* 那么,编译器就会这么处理,如下所示: + +![](./assets/17.svg) + +* 在代码中,我们可以使用 `&变量名` 来获取一个变量的内存首地址,如下所示: + +```c +#include + +int main() { + + // 定义一个变量并初始化 + int a = 10; + + printf("变量 a 的首地址是: %p\n", &a); // 变量 a 的首地址是: 0000002bf1dffd0c + printf("变量 a 的中保存的值是: %d\n", a); // 变量 a 的中保存的值是: 10 + + return 0; +} +``` + +> [!NOTE] +> +> * ① `变量`是对程序中`数据`在内存中存储空间的抽象,如果不涉及到指针变量,那我们在编码的时候,就只需要将变量等价于内存中存储空间里面存储的数据,而不需要再去考虑编译器底层是如何转换,提高了开发效率(机器语言和汇编可不是这样的,需要关注每个细节)。 +> * ② 数据类型只在`定义`变量的时候`指定`,而且必须指定;`使用`变量的时候`无需`再声明,因为此时的数据类型已经确定了。 + +## 2.3 内存中的数组 + +* 如果我们在代码中这么定义数组,如下所示: + +```c +#include + +int main(){ + + // 定义一个数组并初始化 + int arr[] = {1,2,3}; + + return 0; +} +``` + +* 那么,编译器就会这么处理,如下所示: + +![](./assets/18.svg) + +* 在代码中,我们可以直接打印数组名的内存地址,如下所示: + +```c +#include + +int main() { + + int arr[] = {1, 2, 3}; + + printf("arr 的首地址是: %p \n", arr); // arr 的首地址是: 0000003a6f7ffcd4 + printf("arr 的首地址是: %p \n", &arr); // &arr 的地址是: 0000003a6f7ffcd4 + printf("arr[0] 的地址是: %p \n", &arr[0]); // arr[0] 的地址是: 0000003a6f7ffcd4 + printf("arr[1] 的地址是: %p \n", &arr[1]); // arr[1] 的地址是: 0000003a6f7ffcd8 + printf("arr[2] 的地址是: %p \n", &arr[2]); // arr[2] 的地址是: 0000003a6f7ffcdc + + return 0; +} +``` + +> [!WARNING] +> +> 在上述示例中,`arr` 和 `&arr` 的值是一样的,但是对应的含义是不同的。 +> +> * ① `arr` 是数组名,在大多数情况下会转换为数组第一个元素的地址,即:`arr` 等价于 `&arr[0]`,其数据类型是 `int *`。 +> * ② `&arr`是数组名的地址,即整个数组的地址,它指向数组本身,并不是数组第一个元素的地址,`&arr` 的数据类型是 `int(*)[3]`。 + + + +# 第三章:数组越界和数组溢出(⭐) + +## 3.1 数组越界 + +* C 语言的数组是静态的,当我们定义的时候,就不能自动扩容。当我们试图访问数组的`负索引`或`超出`数组长度的索引时,就会产生`数组越界`。 + +> [!NOTE] +> +> * ① C 语言为了提高效率,保证操作的灵活性,并不会对越界行为进行检查,即使越界了,也能够正常编译,只有在运行期间才可能发现问题,所以对程序员的要求很高。 +> * ② 但是,现代化的高级编程语言,如:Java 等,为了降低开发难度以及提高开发效率,像数组这种越界行为,在编译期间就会由编译器提前捕获,并直接报错!!! + +* 请看下面的代码: + +```c {9-10,15} +#include + +int main() { + // 禁用 stdout 缓冲区 + setbuf(stdout, NULL); + + int arr[3] = {10, 20, 30}; + + printf("arr[-1] = %d\n", arr[-1]); // arr[-1] = -23718968 + printf("arr[-2] = %d\n", arr[-2]); // arr[-2] = 0 + printf("arr[0] = %d\n", arr[0]); // arr[0] = 10 + printf("arr[1] = %d\n", arr[1]); // arr[1] = 20 + printf("arr[2] = %d\n", arr[2]); // arr[2] = 30 + printf("arr[3] = %d\n", arr[3]); // arr[3] = -23718976 + printf("arr[4] = %d\n", arr[4]); // arr[4] = 605 + + return 0; +} +``` + +* 越界访问数组元素的值都是不确定的,没有实际的含义,因为在数组之外的内存,我们并不知道到底是什么,可能是其它变量的值,可能是函数参数,也可能是一个地址,这些都是不可控的。 + +> [!NOTE] +> +> 由于 C 语言的”放任“,我们访问数组时必须非常小心,要确保不会发生越界。 + +* 当发生数组越界时,如果我们对该内存有使用权限,那么程序将正常运行,但会出现不可控的结果,即:如果我们对该内存没有使用权限,或者该内存压根就没有就分配,那么程序就会崩溃,如下所示: + +```c +#include + +int main() { + int arr[3] = {0}; + printf("%d", arr[10000]); + return 0; +} +``` + +* 其结果,如下所示: + +![](./assets/19.png) + +> [!NOTE] +> +> * ① 每个程序能使用的内存都是有限的,该程序要访问 `4*10000` 字节处的内存,显然太远了,超出了程序的访问范围。 +> * ② 这个地方的内存可能没有被分配,可能是系统本身占用的内存,可能是其它数据的内存,如果放任这种行为,将带来非常危险的后果,操作系统只能让程序停止运行。 + +* 当然,我们在实际开发中,也不会这么访问,而是会使用 `sizeof` 运算符来获取数组的长度,进而遍历数组中的元素,即: + +```c {7} +#include + +int main() { + int arr[3] = {0}; + + // 获取数组的元素 + size_t length = sizeof(arr) / sizeof(int); + + for (size_t i = 0; i < length; i++) { + printf("%d\n", arr[i]); + } + return 0; +} +``` + +## 3.2 数组溢出 + +* 数组溢出通常是指将数据存储到一个数组中,超出了数组所能容纳的空间,那么多余的元素就会被丢弃。对于一般的数组,貌似没什么问题,如下所示: + +```c +#include + +int main() { + int arr[3] = {0, 1, 2, 3, 4}; + + size_t length = sizeof(arr) / sizeof(int); + + for (size_t i = 0; i < length; i++) { + printf("%d\n", arr[i]); + } + return 0; +} +``` + +* 其结果,如下所示: + +![](./assets/20.png) + +* 但是,对于字符串而言,就会出现不可控的情况,如下所示: + +```c {4} +#include +int main() +{ + char str[10] = "Hello World,Hello World,Hello World,"; + puts(str); + return 0; +} +``` + +* 其结果,如下所示: + +![](./assets/21.png) + +* 因为字符串的长度大于数组的长度,数组只能容纳字符串前面的一部分,即使编译器在字符串最后保存了 `'\0'`,也无济于事,因为超过数组长度的元素都会被丢弃。而 `printf()` 输出字符串时,会从第 `0` 个元素开始往后检索,直到遇见`'\0'`才停止,然后把`'\0'`前面的字符全部输出,至于何时遇到 `'\0'`,就只有上帝才能知道。 + +> [!NOTE] +> +> * ① 在用字符串给字符数组赋值时,要保证数组长度大于字符串长度,以容纳结束符`'\0'`。 +> * ② `数组溢出`通常发生在动态分配内存或者通过不安全的函数(如: `strcpy`)进行字符串操作。 + + + +# 第四章:C 语言中的数组 VS Java 语言中的数组(⭐) + +## 4.1 Linux 下 32 位环境的用户空间内存分布情况 + +* 对于 32 位的环境而言,理论上程序是可以拥有 4GB 的虚拟地址空间的,在 C 语言中使用到的变量、函数、字符串等都会对应内存中的一块区域。 +* 但是,在这 4GB 的地址空间中,要拿出一部分给操作系统内核使用,应用程序无法直接访问这一段内存,这一部分内存地址被称为`内核空间`(Kernel Space)。 + +> [!NOTE] +> +> - ① Windows 在默认情况下会将高地址的 2GB 空间分配给内核(也可以配置为 1GB)。 +> - ② 而 Linux 默认情况下会将高地址的 1GB 空间分配给内核。 + +* 也就是说,应用程序只能使用剩下的 2GB 或 3GB 的地址空间,称为`用户空间`(User Space)。 +* Linux 下 32 位环境的经典内存模型,如下所示: + +![](./assets/22.svg) + +* 各个内存分区的说明,如下所示: + +| 内存分区 | 说明 | +| :------------------------ | :----------------------------------------------------------- | +| 程序代码区(code) | 存储程序的执行代码,通常为只读区,包含程序的指令。 程序启动时,这部分内存被加载到内存中,并不会在程序执行期间改变。 | +| 常量区(constant) | 存放程序中定义的常量值,通常也是只读的,这些常量在程序运行期间不可修改。 | +| 全局数据区(global data) | 存储程序中定义的全局变量和静态变量。 这些变量在程序的整个生命周期内存在,且可以被修改。 | +| 堆区(heap) | 用于动态分配内存,例如:通过 `malloc` 或 `new` 分配的内存块。 堆区的内存由程序员手动管理,负责分配和释放。 如果程序员不释放,程序运行结束时由操作系统回收。 | +| 动态链接库 | 动态链接库(如: `.dll` 或 `.so` 文件)被加载到内存中特定的区域,供程序运行时使用。 | +| 栈区(stack) | 用于存储函数调用的局部变量、函数参数和返回地址。 栈是自动管理的,随着函数的调用和返回,栈上的内存会自动分配和释放。 | + +> [!NOTE] +> +> - ① 程序代码区、常量区、全局数据区在程序加载到内存后就分配好了,并且在程序运行期间一直存在,不能销毁也不能增加(大小已被固定),只能等到程序运行结束后由操作系统收回,所以全局变量、字符串常量等在程序的任何地方都能访问,因为它们的内存一直都在。 +> - ② 函数被调用时,会将参数、局部变量、返回地址等与函数相关的信息压入栈中,函数执行结束后,这些信息都将被销毁。所以局部变量、参数只在当前函数中有效,不能传递到函数外部,因为它们的内存不在了。 +> - ③ 常量区、全局数据区、栈上的内存由系统自动分配和释放,不能由程序员控制。程序员唯一能控制的内存区域就是`堆`(Heap):它是一块巨大的内存空间,常常占据整个虚拟空间的绝大部分,在这片空间中,程序可以申请一块内存,并自由地使用(放入任何数据)。堆内存在程序主动释放之前会一直存在,不随函数的结束而失效。在函数内部产生的数据只要放到堆中,就可以在函数外部使用。 + +## 4.2 C 语言中的数组 + +* 之前,我们都是这么使用数组的,如下所示: + +```c +#include + +int main() { + + // 定义数组和全部初始化:数组初始化的元素个数等于数组的长度。 + int arr[5] = {1, 2, 3, 4, 5}; + + return 0; +} +``` + +* 其实,这样定义的数组是在`栈`中的,而栈的内存空间是有限的,如果数组中的元素过多,将会出现 `Stack Overflow` 的现象,即:栈溢出。 + +> [!NOTE] +> +> * ① 栈内存的大小和编译器有关,编译器会为栈内存制定一个最大值。 +> * ② 在 VS 中,默认是 1 MB;在 GCC 下,默认是 8 MB。 +> * ③ 虽然可以通过参数来修改栈内存的大小;但是,在实际开发中,我们一般也不会这么做。 + +* 所以,在实际开发中,如果我们要使用数组,就需要在`堆`中开辟内存空间,因为堆中的内存空间是可以动态扩容和缩容的,只不多在 C 语言中对于堆中申请的内存空间,需要程序员在用完之后,手动释放掉;否则,将会造成内存泄漏现象。 + +```c +#include +#include + +int main() { + int n; // 数组的大小 + printf("请输入数组的大小: "); + scanf("%d", &n); + + // 使用 malloc 申请内存,申请 n 个 int 类型的空间 + int *array = (int *)malloc(n * sizeof(int)); + + // 检查 malloc 是否成功 + if (array == NULL) { + printf("内存分配失败!\n"); + return 1; // 程序退出 + } + + // 初始化数组并输出 + for (int i = 0; i < n; i++) { + array[i] = i + 1; // 简单赋值操作 + printf("array[%d] = %d\n", i, array[i]); + } + + // 使用完毕后,释放内存 + free(array); + + return 0; +} +``` + +## 4.3 Java 语言中的数组 + +* Java 语言和 C 语言不同,Java 语言从语法层面就将数组在内存中的分配放到了`堆`中。 + +```c +public class Test { + + public static void main(String[] args){ + // 在堆内存开辟数组,使用完毕后,不需要手动回收对应的内存空间 + int[] arr = new int[4] ; + } +} +``` + +> [!NOTE] +> +> * ① 在 Java 语言中,数组的内存分配是由 JVM(Java Virtual Machine,Java 虚拟机)自动管理的,开发者不需要像在 C 语言中那样手动调用 `malloc` 来申请内存。Java 提供了更加高级的内存管理机制,所有数组在堆中动态分配。 +> * ② 在 Java 中,声明和初始化数组的过程本质上就是在堆内存中分配数组内存的过程。每个数组在创建时都会被分配到堆中,并且由垃圾回收机制(Garbage Collector,GC)自动负责内存的回收。 +> * ③ 我们甚至可以理解为:Java 语言是 C 语言在实际开发过程中的最佳实践版本。 +