30天拿下Rust之引用
作者:mmseoamin日期:2024-03-20

概述

        在Rust语言中,引用机制是其所有权系统的重要组成部分,它为开发者提供了一种既高效又安全的方式来访问和共享数据。引用可以被视为一个指向内存地址的指针,它允许我们间接地访问和操作存储在内存中的数据。与其他语言中的指针不同,Rust中的引用是类型安全的,并且会在编译时进行严格检查,以确保不会出现悬挂引用或野指针。Rust提供了两种类型的引用:不可变引用(&)和可变引用(&mut)。

不可变引用

        在Rust中,不可变引用使用&符号表示,是一种指向数据但不允许修改该数据的引用。通过使用不可变引用,Rust能够确保数据在引用期间保持不变,从而提供了内存安全性和并发安全性。

        不可变引用具有以下三个特点。

        安全性:不可变引用保证了在引用存在期间,所引用的数据不会被意外地修改,这有助于避免数据竞争和潜在的并发问题。

        共享性:多个不可变引用可以指向同一个数据项,因为它们都不会修改数据,这允许多个线程或函数安全地共享数据。

        零成本:由于不可变引用不会修改数据,因此编译器可以优化掉一些不必要的检查,从而提高了程序的性能。

        在下面的示例代码中,text作为不可变引用传递到print_text函数中。在print_text函数内部,由于s是不可变引用,我们不能修改s。print_text函数执行完成后,text仍然有效,因为text没有将所有权转移给函数,函数的参数s只是text的一个不可变引用。

fn print_text(s: &str) {
    // s是不可变引用,不能被修改
    println!("text is: {}", s);
}
fn main() {
    let text: String = String::from("Hello CSDN");
    // 传递不可变引用给函数
    print_text(&text);
    // text仍然有效
    println!("{}", text);
}

        注意:给一个变量指定不可变引用后,不能再转移变量的所有权。

fn main() {
    let str1 = String::from("CSDN");
    let str2: &String = &str1;
    // 编译错误:move out of `str1` occurs here
    let str3 = str1;
    println!("{}", str2);
}

        在上面的示例代码中,str2是str1的不可变引用。但接下来,又将str1赋值给了str3,这就导致str1的所有权转移给了str3。Rust能检测到这种错误的情况,从而导致编译通不过。正确的代码应当是重新给str2指定不可变引用的对象,因为str1已经失效了,具体可参见下面的示例代码。

fn main() {
    let str1 = String::from("CSDN");
    let mut str2: &String = &str1;
    let str3 = str1;
    str2 = &str3;
    println!("{}", str2);
}

可变引用

        在Rust中,可变引用使用&mut符号表示,是一种允许修改所指向数据的引用。与不可变引用不同,可变引用提供了一种在运行时修改数据的能力。但同时,也带来了更严格的借用规则和所有权要求,以确保内存安全性和数据一致性。

        可变引用具有以下三个特点。

        修改能力:可变引用允许你修改所指向的数据。这是通过解引用操作符(*)来实现的,它允许你直接访问和修改引用的值。

        唯一性:在同一时间,只能有一个可变引用指向某个特定的数据项。这是Rust的借用检查器强制执行的规则,以防止数据竞争和不一致的状态。

        借用规则:可变引用必须遵循严格的借用规则。在借用检查器的控制下,一个数据项在同一时间只能被一个可变引用所借用,或者可以被多个不可变引用所借用。这确保了数据在修改时,不会被其他代码意外地访问或修改。

        在下面的示例代码中,我们首先创建了一个可变引用mut_text指向text。接着,尝试创建另一个可变引用 mut_text2指向同一个 text,这会导致编译错误,因为Rust只允许有一个可变引用。同样,如果尝试创建一个不可变引用text2指向text,这也会导致编译错误,因为text已经被mut_text借用为可变引用了。最后,我们通过mut_text可变引用修改了text的值,并在println!语句中输出了修改后的text。

fn main() {
    let mut text = String::from("Hello");
    
    // 创建一个可变引用到text
    let mut_text: &mut String = &mut text;
    // 不能同时存在多个可变引用,编译报错
    // let mut_text2 = &mut text;
    // 不可以同时存在可变引用和不可变引用,编译报错
    // let text2 = &text;
    
    // 通过可变引用修改值
    mut_text.push_str(", CSDN");
    
    // 原字符串text被修改,输出:"Hello, CSDN"
    println!("{}", text);
}

        可变引用也称为借用,它允许我们临时获取数据项的所有权,而不需要将数据项的所有权转移到另一个变量上。当我们借用数据时,我们实际上是借用了数据的所有权,而不是拥有它。这种借用是有生命周期限制的,并且必须遵守Rust的借用规则。借用的生命周期是隐式的,必须在其所有者(即被借用的数据项)的生命周期内,并与借用发生时的上下文相关。

悬垂引用

        在Rust中,悬垂引用是指一个引用指向的内存区域已经被释放,或者不再有效。这种现象在其他一些语言中可能导致未定义行为或程序崩溃,因为尝试访问已被释放的内存是不安全的。

        Rust通过其所有权和生命周期系统,严格防止了悬垂引用的发生。当一个值的所有权离开作用域时,Rust会自动清理该值所占用的内存空间。如果存在对该值的引用,由于Rust的借用规则,这些引用在所有者被销毁前不能存在,从而避免了悬垂引用的情况。

        在下面的示例代码中,我们试图从函数内部返回一个局部变量的引用。这会导致编译错误,因为在函数执行完毕后,text这个局部变量会被销毁,返回的引用将是无效的(即:悬垂引用)。Rust的编译器会检查代码,以确保不存在悬垂引用。如果你尝试编写可能导致悬垂引用的代码,编译器会报错。这是Rust语言的一个重要特性,它允许程序员在编译时捕获这类错误,而不是等到运行时才出现错误。

fn test() -> &String {
    let text = String::from("Hello, CSDN");
    // 返回对局部变量的引用,该局部变量会在函数结束时被释放,故会编译报错
    return &text; 
}
fn main() {
    let result = test();
    println!("{}", result);
}

总结

        引用在Rust中非常重要,因为它是实现Rust所有权系统和内存安全性的关键部分。通过引入不可变引用和可变引用,Rust允许程序以更安全的方式操作数据,同时避免了多线程环境下的数据竞争问题。此外,Rust的引用还具有生命周期的概念,这确保了引用的有效性,防止了悬垂引用等问题的发生。