《大话数据结构》笔记
Akari[TOC]
- 目前先这样记着吧,以后再搞“笔记本”的功能······
- 目前大概想法是结合郝斌老师的笔记、GPT
第1章 数据结构绪论
数据结构:是相互之间存在一种或多种特定关系的数据结构元素的集合
1.3 数据结构起源
早期人们都把计算机理解为数值计算工具,就是感觉计算机当然是用来计算的,所以计算机解决问题,应该是先从具体问题中抽象出一个适当的数据模型,设计出一个解决此数据模型的算法,然后再编写程序,得到一个实际的软件。
可现实中更多的不是解决数值计算的问题,而是需要一些更科学有效的手段(比如表、树、和图等数据结构)的帮助,才能更好地处理问题。所以:
数据结构是一门研究非数值计算的程序设计中的操作对象,以及它们之间的关系和操作系统等相关问题的学科。
之后,人门越来越重视“数据结构”,认为程序设计的实质是对确定的问题选择一种好的结构,加上一种好的算法。可见,数据结构在程序设计当中占据了重要的地位。
1.4 基本概念和术语
说到数据结构是什么,我们先得来谈谈什么叫数据。
1.4.1 数据
数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别到,并输入给计算机处理的符号集合。 数据不仅仅包括整型、实型等数值类型,还包括字符及声音、图像、视频等非数值类型。
也就是说,我们这里说的数据,其实就是符号,而且这些符号必须具备两个前提:
- 可以输入到计算机中
- 能被计算机程序处理。
对于整型、实型等数值类型,可以就行数值计算。
对于字符数据结构,就需要进行非数值的处理。而声音、图像、视频等其实是通过编码的手段变成字符数据来处理的。
1.4.2 数据元素
数据元素:是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理,也被称为记录。
如:
- 人类中:🤵;
- 畜禽中:🐂、🐎、🐏、🐖、🦆······
1.4.3 数据项
数据项:一个数据元素可以由若干个数据项组成。
如:
数据项:是性质相同的数据元素的集合,是数据的子集。
什么叫性质相同呢?是指数据元素具有相同数量和类型的数据项
比如:人都有 姓名、生日、性别等相同的数据项。
既然数据对象是数据的子集,在实际应用中,处理的数据元素通常具有相同的性质,在不产生混淆的情况下,我们都将数据对象简称为数据。
1.4.5 数据结构
结构,简单理解就是关系——比如 分子结构,就是说组成分子的原子之间的排列方式。严格点说,结构是指各个组成部分相互搭配和排列的方式。在现实世界中,不同数据元素之间不是独立的,而是存在特定的关系,我们将这些关系称为结构。 那数据结构是什么?
数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。
在计算机中,数据元素并不是孤立、杂乱无章的,而是具有内在联系的数据集合。数据元素之间存在的一种或多种特定关系,也就是数据的组织形式。
为编写出一个“好”的程序,必须分析待处理对象的特性及各处理对象之间存在的关系。这也就是研究数据结构的意义所在。
1.5 逻辑结构和物理结构
按照视点的不同,我们把数据结构分为 逻辑结构 和 物理结构。
1.5.1 逻辑结构
逻辑结构:是指数据对象中数据元素之间的相互关系。 这其实也是我们今后最需要关注的问题。逻辑结构分为以下四种。
1. 集合结构
集合结构:集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系。 各个数据元素是“平等的”,它们的共同属性是“同属于一个集合”,类似于数学中的集合,如右图所示。
(图片)
2. 线性结构
线性结构:线性结构中的数据元素之间是一对一的关系。 如右图所示。
(图片)
3. 树形结构
树形结构:树形结构中的数据元素之间存在一种一对多的层次关系。如右图所示。
(图片)
4. 图形结构
图形结构:图形结构中的数据元素是多对多的关系。 如右图所示。
我们在用示意图表示数据的逻辑结构时,要注意两点:
- 将每一个数据元素看作一个结点,用圆圈表示。
- 数据元素之间的逻辑关系用结点之间的连线表示,如果这个关系是有方向的,那么用带箭头的连线表示。
从之前的例子也能看出,逻辑结构是针对具体问题的,是为了解决某个问题,在对问题理解的基础上,选择一个合适的数据结构表示数据元素之间的逻辑关系。
1.5.2 物理结构
再来说说数据的物理结构——很多书中也叫做存储结构,你只要在理解上把它们当成一回事就可以了。
物理结构:是指数据的逻辑结构在计算机中的存储形式。
数据是数据元素的集合,那么根据物理结构的定义,实际上就是如何把数据元素存储到计算机的存储器中。存储器主要是针对内存而言的,像硬盘、软盘、光盘等外部存储器的数据组织通常用文件结构来描述。
数据的存储结构应正确反映数据元素之间的逻辑关系,这才是最为关键的,如何存
储数据元素之间的逻辑关系,是实现物理结构的重点和难点。
数据元素的存储结构形式有两种:顺序存储和链式存储。
1. 顺序存储结构
顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
这种存储结构其实很简单,说白了,就是排队占位。大家都按顺序
排好,每个人占一小段空间,大家谁也别插谁的队。我们之前学计算机语言时,数组就是这样的顺序存储结构。当你告诉计算机,你要建立一个有9个整型数据的数组时,计算机就在内存中找了片空地,按照一个整型所占位置的大小乘以9,开辟一段连续的空间,干是第一个数组数据就放在第一个位置,第二个数据放在第二个位置,这样依次摆放。如下图所示。
(图片)
2, 链式存储结构
如果就是这么简单和有规律,一切就好办了。可实际上,总会有人插队,也会有人要上厕所、有人会放弃排队。所以这个队伍当中会添加新成员。也有可能会去掉老元素,整个结构时刻都处干变化中。显然,面对这样时常要变化的结构,顺顶序存储是不科学的。那怎么办呢?
现在如银行、医院等地方,设置了排队系统,也就是每个人去了,先领一个号,等着叫号,叫到时去办理业务或看病。在等待的时候,你爱在哪在哪,可以坐着、站着或者走动,甚至出去逛一圈,只要及时回来就行。你关注的是前一个号也没有被叫到,叫到了,下一个就轮到你了。
链式存储结构:是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。 数据元素的存储关系并不能反映其逻辑关系,因此需要用一个指针存放数据元素的地址,这样通过地址就可以找到相关联数据元素的位置。如右图所示。
(图片,插右边)
显然,链式存储就灵活多了,数据存在哪里不重要只要有一个指针存放了相应的地址就能找到它了。
逻辑结构是面向问题的,而物理结构就是面向计算机的,其基本的目标就是将数据及其逻辑关系存储到计算机的内存中。
1.6 数据类型
数据类型:是指一组性质相同的值的集合及定义在此集合上的一些操作的总称。
1.6.1 数据类型定义
数据类型是按照值的不同进行划分的。在高级语言中,每个变量、常量和表达式都有各自的取值范围。类型就用来说明变量或表达式的取值范围和所能进行的操作。
比如,大家都需要不同的房子住,有钱的、没钱的,各种各样的需求,所以有了各种各样的房子——同理,在计算机中,内存不是无限大的,比如计算 1+1=2,显然不需要开辟很大的适合小数甚至字符串的内存空间。于是就对数据进行分类,分出来多种数据类型。
在C语言中,按照取值的不同,数据类型可以分为两类:
原子类型
- 是不可以再分解的基本类型,包括整型、实型、字符型等。
结构类型
*