相关推荐recommended
初级数据结构(七)——二叉树
作者:mmseoamin日期:2024-03-04

     文中代码源文件已上传:数据结构源码

<-上一篇 初级数据结构(六)——堆        |        NULL 下一篇->

1、写在前面

        二叉树的基本概念在《初级数据结构(五)——树和二叉树的概念》中已经介绍得足够详细了。上一篇也演示了利用顺序表模拟二叉树。但链表形式的二叉树在逻辑上相对于顺序表尤其复杂,当然也比顺序表更为灵活。

        链表形式的二叉树任何操作,本质都是有条件地遍历各个节点。而熟练掌握递归算法对遍历链表形式二叉树尤为重要。如果你对递归还犯迷糊可先翻阅《轻松搞懂递归算法》一文,其中对递归有较为详细的介绍。

2、建立

        链表形式的二叉树的创建操作已经属于遍历操作了,本部分将通过边创建边说明的方式演示如何遍历二叉树。

2.1、前期工作

        老样子,先建文件。

初级数据结构(七)——二叉树,第1张

        binaryTree.h :用于创建项目的结构体类型以及声明函数;

        binaryTree.c :用于创建二叉树各种操作功能的函数;

        main.c :仅创建 main 函数,用作测试。

        这次演示是通过字符串创建二叉树,空节点以“ ? ”表示,所以在 binaryTree.h 中先写下如下代码:

#include 
#include 
typedef char DATATYPE;
#define NULL_SYMBOL '?'
#define DATA_END '\0'
#define DATAPRT "%c"
//创建二叉树节点
typedef struct Node
{
	DATATYPE data;
	struct Node* left;
	struct Node* right;
}Node;
//函数声明-------------------------------------
//创建二叉树
extern Node* BinaryTreeCreate(DATATYPE*);
//销毁二叉树
extern void BinaryTreeDestroy(Node*);

         然后在 binaryTree.c 中 include 一下:

#include "binaryTree.h"

        在 main.c 中创建个 main 函数的空客:

#include "binaryTree.h"
int main()
{
	return 0;
}

2.2、常规遍历

        二叉树有三种常用遍历顺序,称为前序、中序和后序。前中后序指的是访问节点中数据的次序。

        前序:先访问根节点,之后问左树,最后访问右树。

        中序:先访问左树,之后问根节点,最后访问右树。

        后序:先访问左树,之后问右树,最后访问根节点。

        先看图:

初级数据结构(七)——二叉树,第2张

        用前序访问上图第一棵树顺序是 A→B→C ,中序是 B→A→C ,后序则是 B→C→A 。而这是相对于子树而言的。如果访问上图第二棵树需要将树根据当前访问的节点拆分为子树。如用前序访问,先访问 D ,之后定位到 D 的左节子点 E , 但此时是先将 E 节点当作子树,访问的是该子树的根节点。 之后访问 G 也是如此。用前序访问的顺序是 D→E→G→F→H→I 。而实际访问顺序如下图:

初级数据结构(七)——二叉树,第3张

        D→E→G→NULL→NULL→NULL→F→H→NULL→NULL→I→NULL→NULL 。

        用前序来说明可能不太明显。如果用中序,先定位到 D 节点,此时先不访问 D 的数据,而是访问 D 的左子节点 E 。而 E 作为子树,它还存在自己的左子节点,因此也不访问 E 的数据,而是它的子节点 G 。此时以 G 为根节点的子树不存在左子节点,因此访问 G 的数据,然后访问 G 的右子节点。但 G 不存在右子节点,所以访问完 G 的数据也就是访问完以 G 为根节点的子树,相当于 E 的左树访问完毕,此时才访问 E 的数据。下一步访问 E 的右子节点,但 E 不存在右子节点,所以 以 E 为根的子树访问完成,相当于 D 的左子树访问完毕,所以访问 D 的数据,然后访问 D 的右子树 F ……因此,以中序访问这棵树顺序是 G→E→D→H→F→I 。实际访问顺序:

初级数据结构(七)——二叉树,第4张

        NULL→G→NULL→E→NULL→D→H→NULL→NULL→F→I→NULL→NULL 。

        后序的逻辑可以类比中序,访问顺序是 G→E→H→I→F→D 。实际访问顺序:

初级数据结构(七)——二叉树,第5张

        NULL→NULL→G→NULL→E→NULL→NULL→H→NULL→NULL→I→F→D 。

2.3、操作函数

2.3.1、创建二叉树

        创建二叉树的过程也是在遍历二叉树。而创建过程中,必须先有根节点,才能创建子树,所以建立二叉树是以前序边创建边访问建立的。

        需要解决的问题是在创建节点的结构体时,并没有创建指向父节点的指针成员变量。当创建完左树之后,要如何回到根节点。这里先往回思考,在前中后序的说明中不难看出,这就是一种递归。树拆成子树,子树又拆成子树的子树……而不论拆分成哪一级子树,访问方式都是统一的顺序。而递归是具有回溯属性的,也就是说,用递归的方式创建二叉树再合适不过了。函数的代码便呼之欲出:

//创建二叉树
Node* BinaryTreeCreate(DATATYPE** ptr2_data)
{
	//参数有效性判定
	if (!ptr2_data || !*ptr2_data)
	{
		fprintf(stderr, "Data Address NULL\n");
		return NULL;
	}
	//数据为空节点符号或末位尾符号则返回
	if (**ptr2_data == NULL_SYMBOL || **ptr2_data == DATA_END)
	{
		return NULL;
	}
	//创建节点
	Node* node = NULL;
	while (!node)
	{
		node = (Node*)malloc(sizeof(Node));
	}
	//前序递归
	node->data = **ptr2_data;
	*ptr2_data += !(**ptr2_data == DATA_END);
	node->left = BinaryTreeCreate(ptr2_data);
	*ptr2_data += !(**ptr2_data == DATA_END);
	node->right = BinaryTreeCreate(ptr2_data);
	return node;
}

        在 main 函数中用以下代码进行测试:

DATATYPE data[] = "abc??d??f?g?h";
DATATYPE* ptr_data = data;
Node* root = BinaryTreeCreate(&ptr_data);

         树并不像线性表那么直观,检查测试结果时最好自己先画图,然后在监视窗口中检查。对于以上测试结果应当如下图:

初级数据结构(七)——二叉树,第6张

        调试起来,将调试窗口中逐层展开,对其中的信息对比上图。或者另外画图, 将两张图作对比进行检查。

初级数据结构(七)——二叉树,第7张

        结果正确。顺带写出前中后三种顺序访问二叉树的函数。这里为了方便观察遍历顺序,多加一个参数用于控制是否显示空节点。先在 binaryTree.h 中加个枚举类型以完善传参时代码的可读性:

enum NULL_VISIBLE
{
	HIDE_NULL,    //空节点不可见 = 0
	SHOW_NULL     //空节点可见 = 1
};

        然后加声明:

//前序访问二叉树
extern void PreOrderTraversal(Node*, int);
//中序访问二叉树
extern void InOrderTraversal(Node*, int);
//后序访问二叉树
extern void PostOrderTraversal(Node*, int);

        函数具体内容: 

//前序访问二叉树
void PreOrderTraversal(Node* root, int NULLvisible)
{
	//空树返回
	if (!root)
	{
		if (NULLvisible == SHOW_NULL)
		{
			printf("NULL ");
		}
		return;
	}
	printf(DATAPRT" ", root->data);
	PreOrderTraversal(root->left, NULLvisible);
	PreOrderTraversal(root->right, NULLvisible);
}
//中序访问二叉树
void InOrderTraversal(Node* root, int NULLvisible)
{
	//空树返回
	if (!root)
	{
		if (NULLvisible == SHOW_NULL)
		{
			printf("NULL ");
		}
		return;
	}
	InOrderTraversal(root->left, NULLvisible);
	printf(DATAPRT" ", root->data);
	InOrderTraversal(root->right, NULLvisible);
}
//后序访问二叉树
void PostOrderTraversal(Node* root, int NULLvisible)
{
	//空树返回
	if (!root)
	{
		if (NULLvisible == SHOW_NULL)
		{
			printf("NULL ");
		}
		return;
	}
	PostOrderTraversal(root->left, NULLvisible);
	PostOrderTraversal(root->right, NULLvisible);
	printf(DATAPRT" ", root->data);
}

        这里可以观察到,所谓前中后序不过是调整了一下访问 root->data 语句的位置,其余完全一样。 

        然后开始测试。

int main()
{
	DATATYPE data[] = "abc??d??f?g?h";
	DATATYPE* ptr_data = data;
	Node* root = BinaryTreeCreate(&ptr_data);
	//前序:
	printf("前序 --------------------\n");
	PreOrderTraversal(root, SHOW_NULL);
	printf("\n");
	PreOrderTraversal(root, HIDE_NULL);
	printf("\n");
	//中序
	printf("中序 --------------------\n");
	InOrderTraversal(root, SHOW_NULL);
	printf("\n");
	InOrderTraversal(root, HIDE_NULL);
	printf("\n");
	//后序
	printf("后序 --------------------\n");
	PostOrderTraversal(root, SHOW_NULL);
	printf("\n");
	PostOrderTraversal(root, HIDE_NULL);
	printf("\n");
	return 0;
}

初级数据结构(七)——二叉树,第8张

        对比上面的图,说明代码正确。 

2.3.2、销毁二叉树

        销毁跟创建是同样的逻辑,必须从底层开始销毁。当然也可以从根部销毁,但如果不先销毁子节点,一旦销毁根节点之后便无法再找到子节点的地址,因此还得对子节点地址进行记录后再销毁,显得过于麻烦。因此采用后序遍历销毁最为简便。

//销毁二叉树
void BinaryTreeDestroy(Node* root)
{
	//空树直接返回
	if (!root) return;
	//后序递归销毁节点
	BinaryTreeDestroy(root->left);
	BinaryTreeDestroy(root->right);
	free(root);
}

        这个函数测试过程需要一步一步调试观察。 实际上跟之前后序访问的函数是一个道理,这里也没必要再多作测试。但使用完该函数记得把根节点指针置空。

2.3.3、搜索

        搜索也是通过遍历比对节点中的数据,再返回节点地址。

        必不可少的声明:

//二叉树搜索
extern Node* BinaryTreeSearch(Node*, DATATYPE);

        代码:

//二叉树搜索
Node* BinaryTreeSearch(Node* root, DATATYPE data)
{
	//空树直接返回
	if (!root) return NULL;
	//创建节点地址指针
	Node* node = NULL;
	//前序搜索
	node = (root->data == data ? root : NULL);
	node = (node ? node : BinaryTreeSearch(root->left, data));
	node = (node ? node : BinaryTreeSearch(root->right, data));
	return node;
}

        在刚才创建的二叉树基础上测试:

	Node* node = NULL;
	node = BinaryTreeSearch(root, 'f');
	if (node)
		printf("Found Data '"DATAPRT"' In 0x%p\n", node->data, node);
	else
		printf("Not Found\n");
	node = BinaryTreeSearch(root, 'j');
	if (node)
		printf("Found Data '"DATAPRT"' In %p\n", node->data, node);
	else
		printf("Not Found\n");

初级数据结构(七)——二叉树,第9张

         测试通过。此外,搜索既然实现了,修改就不必说了,这里不再演示。 

3、层序

        除了之前提到的前中后序遍历二叉树以外,还有层序遍历。顾名思义,就是逐层遍历二叉树中每个节点。层序遍历是最复杂的一种遍历方式。由于二叉树节点中并不包含兄弟节点和堂兄弟节点的指针,因此层序遍历需要其他变量来记录各层节点的左右子节点,并按照一定顺序排序。

3.1、队列

        这里可以利用队列的特性,访问完根节点后,对左右子节点地址进行入队,并将根节点出队,从而实现遍历。因此,这里先在 binaryTree.h 中创建个队列。

//队列类型
typedef struct Queue
{
	int top;
	int bottom;
	size_t capacity;
	Node* data[];
}Queue;

        之后是在 binaryTree.c 中创建操作队列的各个函数。

//创建队列并初始化
static Queue* QueueCreate()
{
	Queue* queue = NULL;
	//创建队列
	while (!queue)
	{
		queue = (Queue*)malloc(sizeof(Queue) + sizeof(Node*) * 4);
	}
	queue->top = -1;
	queue->bottom = -1;
	queue->capacity = 4;
	//返回队列
	return queue;
}
//数据入队
static void QueuePush(Queue** queue, Node* node)
{
	//若队列空间不足,扩容
	if ((*queue)->top + 1 >= (*queue)->capacity)
	{
		Queue* tempQueue = NULL;
		while (!tempQueue)
		{
			tempQueue = (Queue*)realloc(*queue, sizeof(Queue) + sizeof(Node*) * (*queue)->capacity * 2);
		}
		(*queue) = tempQueue;
		(*queue)->capacity *= 2;
	}
	//节点入队
	(*queue)->bottom = ((*queue)->bottom == -1 ? 0 : (*queue)->bottom);
	(*queue)->top++;
	(*queue)->data[(*queue)->top] = node;
}
//数据出队
static void QueuePop(Queue* queue)
{
	//空队列返回
	if (queue->top == -1)return;
	//出队
	queue->bottom++;
	//出队后若为空队列
	if (queue->bottom > queue->top)
	{
		queue->bottom = -1;
		queue->top = -1;
	}
}

3.2、层序访问

        由于二叉树是有序树,每一层节点从左到右必然是有序的。仍以这棵树作演示:

初级数据结构(七)——二叉树,第10张

        首先将根节点 D 入队,访问完根节点后,将左右子节点 E、F 依次入队,排在 D 之后,然后弹出 D 。之后访问 E,再将 E 的左右子节点 G 和 NULL 入队,弹出 E 。继续访问 F ,H、I 入队后再弹出 F 。如果当前根节点为 NULL ,则不再将子节点入队,仅仅弹出 NULL 。最后当队列为空时,树也遍历完毕。

        根据以上描述,可以知道层序访问顺序为 D→E→F→G→H→I,实际访问顺序:

初级数据结构(七)——二叉树,第11张

        D→E→F→G→NULL→H→I→NULL→NULL→NULL→NULL→NULL→NULL 。

3.3、代码部分

        思路已经有了,代码也就顺理成章了。

//层序打印
static void LevelOrderPrint(Queue** queue)
{
	//空队列返回
	if ((*queue)->top == -1) return;
	//非空节点的左右子节点入队
	if ((*queue)->data[(*queue)->bottom])
	{
		QueuePush(queue, ((*queue)->data[(*queue)->bottom])->left);
		QueuePush(queue, ((*queue)->data[(*queue)->bottom])->right);
	}
	//打印非空节点
	if ((*queue)->data[(*queue)->bottom] != NULL)
	{
		printf(DATAPRT" ", ((*queue)->data[(*queue)->bottom])->data);
	}
	//根节点出队
	QueuePop(*queue);
	LevelOrderPrint(queue);
}
//层序遍历二叉树
void LevelOrderTraversal(Node* root)
{
	//创建队列
	Queue* queue = QueueCreate();
	//根节点入队
	QueuePush(&queue, root);
	//层序打印
	LevelOrderPrint(&queue);
	//销毁队列
	free(queue);
}

        仍沿用开头的测试案例,然后在 main 函数最后加入以下语句进行测试:

    //层序
	printf("层序 --------------------\n");
	LevelOrderTraversal(root);
	printf("\n");

初级数据结构(七)——二叉树,第12张

        至此完成。