文中代码源文件已上传:数据结构源码 <-上一篇 初级数据结构(六)——堆 | NULL 下一篇-> |
二叉树的基本概念在《初级数据结构(五)——树和二叉树的概念》中已经介绍得足够详细了。上一篇也演示了利用顺序表模拟二叉树。但链表形式的二叉树在逻辑上相对于顺序表尤其复杂,当然也比顺序表更为灵活。
链表形式的二叉树任何操作,本质都是有条件地遍历各个节点。而熟练掌握递归算法对遍历链表形式二叉树尤为重要。如果你对递归还犯迷糊可先翻阅《轻松搞懂递归算法》一文,其中对递归有较为详细的介绍。
链表形式的二叉树的创建操作已经属于遍历操作了,本部分将通过边创建边说明的方式演示如何遍历二叉树。
老样子,先建文件。
binaryTree.h :用于创建项目的结构体类型以及声明函数;
binaryTree.c :用于创建二叉树各种操作功能的函数;
main.c :仅创建 main 函数,用作测试。
这次演示是通过字符串创建二叉树,空节点以“ ? ”表示,所以在 binaryTree.h 中先写下如下代码:
#include#include typedef char DATATYPE; #define NULL_SYMBOL '?' #define DATA_END '\0' #define DATAPRT "%c" //创建二叉树节点 typedef struct Node { DATATYPE data; struct Node* left; struct Node* right; }Node; //函数声明------------------------------------- //创建二叉树 extern Node* BinaryTreeCreate(DATATYPE*); //销毁二叉树 extern void BinaryTreeDestroy(Node*);
然后在 binaryTree.c 中 include 一下:
#include "binaryTree.h"
在 main.c 中创建个 main 函数的空客:
#include "binaryTree.h" int main() { return 0; }
二叉树有三种常用遍历顺序,称为前序、中序和后序。前中后序指的是访问节点中数据的次序。
前序:先访问根节点,之后问左树,最后访问右树。
中序:先访问左树,之后问根节点,最后访问右树。
后序:先访问左树,之后问右树,最后访问根节点。
先看图:
用前序访问上图第一棵树顺序是 A→B→C ,中序是 B→A→C ,后序则是 B→C→A 。而这是相对于子树而言的。如果访问上图第二棵树需要将树根据当前访问的节点拆分为子树。如用前序访问,先访问 D ,之后定位到 D 的左节子点 E , 但此时是先将 E 节点当作子树,访问的是该子树的根节点。 之后访问 G 也是如此。用前序访问的顺序是 D→E→G→F→H→I 。而实际访问顺序如下图:
D→E→G→NULL→NULL→NULL→F→H→NULL→NULL→I→NULL→NULL 。
用前序来说明可能不太明显。如果用中序,先定位到 D 节点,此时先不访问 D 的数据,而是访问 D 的左子节点 E 。而 E 作为子树,它还存在自己的左子节点,因此也不访问 E 的数据,而是它的子节点 G 。此时以 G 为根节点的子树不存在左子节点,因此访问 G 的数据,然后访问 G 的右子节点。但 G 不存在右子节点,所以访问完 G 的数据也就是访问完以 G 为根节点的子树,相当于 E 的左树访问完毕,此时才访问 E 的数据。下一步访问 E 的右子节点,但 E 不存在右子节点,所以 以 E 为根的子树访问完成,相当于 D 的左子树访问完毕,所以访问 D 的数据,然后访问 D 的右子树 F ……因此,以中序访问这棵树顺序是 G→E→D→H→F→I 。实际访问顺序:
NULL→G→NULL→E→NULL→D→H→NULL→NULL→F→I→NULL→NULL 。
后序的逻辑可以类比中序,访问顺序是 G→E→H→I→F→D 。实际访问顺序:
NULL→NULL→G→NULL→E→NULL→NULL→H→NULL→NULL→I→F→D 。
创建二叉树的过程也是在遍历二叉树。而创建过程中,必须先有根节点,才能创建子树,所以建立二叉树是以前序边创建边访问建立的。
需要解决的问题是在创建节点的结构体时,并没有创建指向父节点的指针成员变量。当创建完左树之后,要如何回到根节点。这里先往回思考,在前中后序的说明中不难看出,这就是一种递归。树拆成子树,子树又拆成子树的子树……而不论拆分成哪一级子树,访问方式都是统一的顺序。而递归是具有回溯属性的,也就是说,用递归的方式创建二叉树再合适不过了。函数的代码便呼之欲出:
//创建二叉树 Node* BinaryTreeCreate(DATATYPE** ptr2_data) { //参数有效性判定 if (!ptr2_data || !*ptr2_data) { fprintf(stderr, "Data Address NULL\n"); return NULL; } //数据为空节点符号或末位尾符号则返回 if (**ptr2_data == NULL_SYMBOL || **ptr2_data == DATA_END) { return NULL; } //创建节点 Node* node = NULL; while (!node) { node = (Node*)malloc(sizeof(Node)); } //前序递归 node->data = **ptr2_data; *ptr2_data += !(**ptr2_data == DATA_END); node->left = BinaryTreeCreate(ptr2_data); *ptr2_data += !(**ptr2_data == DATA_END); node->right = BinaryTreeCreate(ptr2_data); return node; }
在 main 函数中用以下代码进行测试:
DATATYPE data[] = "abc??d??f?g?h"; DATATYPE* ptr_data = data; Node* root = BinaryTreeCreate(&ptr_data);
树并不像线性表那么直观,检查测试结果时最好自己先画图,然后在监视窗口中检查。对于以上测试结果应当如下图:
调试起来,将调试窗口中逐层展开,对其中的信息对比上图。或者另外画图, 将两张图作对比进行检查。
结果正确。顺带写出前中后三种顺序访问二叉树的函数。这里为了方便观察遍历顺序,多加一个参数用于控制是否显示空节点。先在 binaryTree.h 中加个枚举类型以完善传参时代码的可读性:
enum NULL_VISIBLE { HIDE_NULL, //空节点不可见 = 0 SHOW_NULL //空节点可见 = 1 };
然后加声明:
//前序访问二叉树 extern void PreOrderTraversal(Node*, int); //中序访问二叉树 extern void InOrderTraversal(Node*, int); //后序访问二叉树 extern void PostOrderTraversal(Node*, int);
函数具体内容:
//前序访问二叉树 void PreOrderTraversal(Node* root, int NULLvisible) { //空树返回 if (!root) { if (NULLvisible == SHOW_NULL) { printf("NULL "); } return; } printf(DATAPRT" ", root->data); PreOrderTraversal(root->left, NULLvisible); PreOrderTraversal(root->right, NULLvisible); } //中序访问二叉树 void InOrderTraversal(Node* root, int NULLvisible) { //空树返回 if (!root) { if (NULLvisible == SHOW_NULL) { printf("NULL "); } return; } InOrderTraversal(root->left, NULLvisible); printf(DATAPRT" ", root->data); InOrderTraversal(root->right, NULLvisible); } //后序访问二叉树 void PostOrderTraversal(Node* root, int NULLvisible) { //空树返回 if (!root) { if (NULLvisible == SHOW_NULL) { printf("NULL "); } return; } PostOrderTraversal(root->left, NULLvisible); PostOrderTraversal(root->right, NULLvisible); printf(DATAPRT" ", root->data); }
这里可以观察到,所谓前中后序不过是调整了一下访问 root->data 语句的位置,其余完全一样。
然后开始测试。
int main() { DATATYPE data[] = "abc??d??f?g?h"; DATATYPE* ptr_data = data; Node* root = BinaryTreeCreate(&ptr_data); //前序: printf("前序 --------------------\n"); PreOrderTraversal(root, SHOW_NULL); printf("\n"); PreOrderTraversal(root, HIDE_NULL); printf("\n"); //中序 printf("中序 --------------------\n"); InOrderTraversal(root, SHOW_NULL); printf("\n"); InOrderTraversal(root, HIDE_NULL); printf("\n"); //后序 printf("后序 --------------------\n"); PostOrderTraversal(root, SHOW_NULL); printf("\n"); PostOrderTraversal(root, HIDE_NULL); printf("\n"); return 0; }
对比上面的图,说明代码正确。
销毁跟创建是同样的逻辑,必须从底层开始销毁。当然也可以从根部销毁,但如果不先销毁子节点,一旦销毁根节点之后便无法再找到子节点的地址,因此还得对子节点地址进行记录后再销毁,显得过于麻烦。因此采用后序遍历销毁最为简便。
//销毁二叉树 void BinaryTreeDestroy(Node* root) { //空树直接返回 if (!root) return; //后序递归销毁节点 BinaryTreeDestroy(root->left); BinaryTreeDestroy(root->right); free(root); }
这个函数测试过程需要一步一步调试观察。 实际上跟之前后序访问的函数是一个道理,这里也没必要再多作测试。但使用完该函数记得把根节点指针置空。
搜索也是通过遍历比对节点中的数据,再返回节点地址。
必不可少的声明:
//二叉树搜索 extern Node* BinaryTreeSearch(Node*, DATATYPE);
代码:
//二叉树搜索 Node* BinaryTreeSearch(Node* root, DATATYPE data) { //空树直接返回 if (!root) return NULL; //创建节点地址指针 Node* node = NULL; //前序搜索 node = (root->data == data ? root : NULL); node = (node ? node : BinaryTreeSearch(root->left, data)); node = (node ? node : BinaryTreeSearch(root->right, data)); return node; }
在刚才创建的二叉树基础上测试:
Node* node = NULL; node = BinaryTreeSearch(root, 'f'); if (node) printf("Found Data '"DATAPRT"' In 0x%p\n", node->data, node); else printf("Not Found\n"); node = BinaryTreeSearch(root, 'j'); if (node) printf("Found Data '"DATAPRT"' In %p\n", node->data, node); else printf("Not Found\n");
测试通过。此外,搜索既然实现了,修改就不必说了,这里不再演示。
除了之前提到的前中后序遍历二叉树以外,还有层序遍历。顾名思义,就是逐层遍历二叉树中每个节点。层序遍历是最复杂的一种遍历方式。由于二叉树节点中并不包含兄弟节点和堂兄弟节点的指针,因此层序遍历需要其他变量来记录各层节点的左右子节点,并按照一定顺序排序。
这里可以利用队列的特性,访问完根节点后,对左右子节点地址进行入队,并将根节点出队,从而实现遍历。因此,这里先在 binaryTree.h 中创建个队列。
//队列类型 typedef struct Queue { int top; int bottom; size_t capacity; Node* data[]; }Queue;
之后是在 binaryTree.c 中创建操作队列的各个函数。
//创建队列并初始化 static Queue* QueueCreate() { Queue* queue = NULL; //创建队列 while (!queue) { queue = (Queue*)malloc(sizeof(Queue) + sizeof(Node*) * 4); } queue->top = -1; queue->bottom = -1; queue->capacity = 4; //返回队列 return queue; } //数据入队 static void QueuePush(Queue** queue, Node* node) { //若队列空间不足,扩容 if ((*queue)->top + 1 >= (*queue)->capacity) { Queue* tempQueue = NULL; while (!tempQueue) { tempQueue = (Queue*)realloc(*queue, sizeof(Queue) + sizeof(Node*) * (*queue)->capacity * 2); } (*queue) = tempQueue; (*queue)->capacity *= 2; } //节点入队 (*queue)->bottom = ((*queue)->bottom == -1 ? 0 : (*queue)->bottom); (*queue)->top++; (*queue)->data[(*queue)->top] = node; } //数据出队 static void QueuePop(Queue* queue) { //空队列返回 if (queue->top == -1)return; //出队 queue->bottom++; //出队后若为空队列 if (queue->bottom > queue->top) { queue->bottom = -1; queue->top = -1; } }
由于二叉树是有序树,每一层节点从左到右必然是有序的。仍以这棵树作演示:
首先将根节点 D 入队,访问完根节点后,将左右子节点 E、F 依次入队,排在 D 之后,然后弹出 D 。之后访问 E,再将 E 的左右子节点 G 和 NULL 入队,弹出 E 。继续访问 F ,H、I 入队后再弹出 F 。如果当前根节点为 NULL ,则不再将子节点入队,仅仅弹出 NULL 。最后当队列为空时,树也遍历完毕。
根据以上描述,可以知道层序访问顺序为 D→E→F→G→H→I,实际访问顺序:
D→E→F→G→NULL→H→I→NULL→NULL→NULL→NULL→NULL→NULL 。
思路已经有了,代码也就顺理成章了。
//层序打印 static void LevelOrderPrint(Queue** queue) { //空队列返回 if ((*queue)->top == -1) return; //非空节点的左右子节点入队 if ((*queue)->data[(*queue)->bottom]) { QueuePush(queue, ((*queue)->data[(*queue)->bottom])->left); QueuePush(queue, ((*queue)->data[(*queue)->bottom])->right); } //打印非空节点 if ((*queue)->data[(*queue)->bottom] != NULL) { printf(DATAPRT" ", ((*queue)->data[(*queue)->bottom])->data); } //根节点出队 QueuePop(*queue); LevelOrderPrint(queue); } //层序遍历二叉树 void LevelOrderTraversal(Node* root) { //创建队列 Queue* queue = QueueCreate(); //根节点入队 QueuePush(&queue, root); //层序打印 LevelOrderPrint(&queue); //销毁队列 free(queue); }
仍沿用开头的测试案例,然后在 main 函数最后加入以下语句进行测试:
//层序 printf("层序 --------------------\n"); LevelOrderTraversal(root); printf("\n");
至此完成。