重构以提高模块化和错误处理 -- Rust教程|Rust中文文档|Rust编程|Rust官方文档

我们仍然将命令行参数收集到一个 vector 中，但不是将索引 1 处的参数值分配给变量query和变量索引 2 处的 argument valuefile_path在main函数中，我们将整个 vector 传递给parse_config功能。这parse_configfunction 然后保存确定哪个参数的 logic 放入哪个变量中，并将值传递回main.我们仍在创造这query和file_path变量main但main不再具有确定命令行参数和变量通信。

对于我们的小程序来说，这种返工似乎有点矫枉过正，但我们正在重构以小的、渐进的步骤进行。进行此更改后，再次运行程序以验证参数解析是否仍然有效。检查您的进度是件好事通常，在问题发生时帮助确定问题的原因。

对配置值进行分组

我们可以再迈出一小步来改进parse_config功能进一步。目前，我们返回了一个 Tuples，但随后我们立即中断了它 tuple 转换为单独的部分。这是一个迹象，也许我们没有这是正确的抽象。

另一个表明有改进空间的指标是config部分之parse_config，这意味着我们返回的两个值是相关的，并且都是 Configuration 值的一部分。我们目前没有传达此内容在数据结构中的含义，而不是通过将两个值分组为一个元组;我们将这两个值放入一个结构体中，并为每个 struct 字段设置有意义的名称。这样做将使未来更容易此代码的维护者，以了解不同的值与每个值之间的关系其他以及它们的目的是什么。

示例 12-6 显示了对parse_config功能。

文件名： src/main.rs

use std::env;
use std::fs;

fn main() {
    let args: Vec<String> = env::args().collect();

    let config = parse_config(&args);

    println!("Searching for {}", config.query);
    println!("In file {}", config.file_path);

    let contents = fs::read_to_string(config.file_path)
        .expect("Should have been able to read the file");

    // --snip--

    println!("With text:\n{contents}");
}

struct Config {
    query: String,
    file_path: String,
}

fn parse_config(args: &[String]) -> Config {
    let query = args[1].clone();
    let file_path = args[2].clone();

    Config { query, file_path }
}

示例 12-6：重构parse_config返回Config结构

我们添加了一个名为Config定义为具有名为query和file_path.的签名parse_confignow 表示它返回一个Config价值。在 bodyparse_config，我们过去经常返回的地方 string 切片，该String的值args，我们现在定义Config包含 ownedString值。这args变量main是参数值，并且只让parse_config函数借用 them，这意味着如果Config尝试拿中值的所有权args.

我们可以通过多种方式来管理String数据;最容易的，虽然效率有些低下，但 route 是将clonemethod 的值。这将为Configinstance 来拥有，其中比存储对字符串数据的引用需要更多的时间和内存。但是，克隆数据也使我们的代码非常简单，因为我们不必管理引用的生命周期;在这种情况下，为了获得简单性而放弃一点性能是一个值得的权衡。

使用`clone`

许多 Rustacean 倾向于避免使用clone修复所有权问题。在第 13 章中，您将学习如何更高效地使用方法。但就目前而言，复制一些是可以的 strings 继续进行，因为您只会制作这些副本 once，并且您的文件路径和查询字符串非常小。最好有一个比尝试超优化代码效率低下的工作程序在你的第一次通过时。随着您对 Rust 的经验越来越丰富，它会从最有效的解决方案开始更容易，但就目前而言，它是完全可以接受clone.

我们更新了main因此，它将Config返回者parse_config转换为名为config，我们更新了以前使用单独的query和file_path变量，因此它现在使用的Configstruct 代替。

现在，我们的代码更清楚地传达了这一点query和file_path是相关的，并且他们的目的是配置程序的工作方式。任何使用这些值知道在config字段中的实例以他们的目的命名。

为创建 Constructor`Config`

到目前为止，我们已经提取了负责解析命令行的 logic arguments frommain并将其放置在parse_config功能。这样做帮助我们看到query和file_path值是相关的，并且关系应该在我们的代码中传达。然后，我们添加了一个Configstruct 设置为 name 的相关用途query和file_path并能够返回 values 的名称作为 struct 字段名称的parse_config功能。

所以现在parse_config函数是创建一个Config实例中，我们可以更改parse_config从普通函数到函数叫new与Config结构。进行此更改将使代码更加地道。我们可以在标准库，例如String，通过调用String::new.同样，通过改变parse_config转换为new函数关联Config，我们将能够创建Config通过调用Config::new.示例 12-7 显示了我们需要进行的更改。

文件名： src/main.rs

use std::env;
use std::fs;

fn main() {
    let args: Vec<String> = env::args().collect();

    let config = Config::new(&args);

    println!("Searching for {}", config.query);
    println!("In file {}", config.file_path);

    let contents = fs::read_to_string(config.file_path)
        .expect("Should have been able to read the file");

    println!("With text:\n{contents}");

    // --snip--
}

// --snip--

struct Config {
    query: String,
    file_path: String,
}

impl Config {
    fn new(args: &[String]) -> Config {
        let query = args[1].clone();
        let file_path = args[2].clone();

        Config { query, file_path }
    }
}

示例 12-7：更改parse_config到Config::new

我们更新了main我们打电话的地方parse_config改为调用Config::new.我们更改了parse_config自new并移动了它在impl块，它将new函数替换为Config.尝试再次编译此代码以确保其正常工作。

修复错误处理

现在，我们将着手修复我们的错误处理。回想一下，尝试访问的argsvector 的 intent 值将导致程序 panic 如果向量包含的项目少于 3 个。尝试运行该程序没有任何参数;它看起来像这样：

$ cargo run
   Compiling minigrep v0.1.0 (file:///projects/minigrep)
    Finished `dev` profile [unoptimized + debuginfo] target(s) in 0.0s
     Running `target/debug/minigrep`
thread 'main' panicked at src/main.rs:27:21:
index out of bounds: the len is 1 but the index is 1
note: run with `RUST_BACKTRACE=1` environment variable to display a backtrace

生产线index out of bounds: the len is 1 but the index is 1是错误消息。它不会帮助我们的最终用户了解什么他们应该这样做。现在让我们解决这个问题。

改进错误消息

在示例 12-8 中，我们在new函数验证 slice 在访问索引 1 和索引 2 之前足够长。如果切片不是足够长的时间，程序会 panic 并显示更好的错误消息。

文件名： src/main.rs

use std::env;
use std::fs;

fn main() {
    let args: Vec<String> = env::args().collect();

    let config = Config::new(&args);

    println!("Searching for {}", config.query);
    println!("In file {}", config.file_path);

    let contents = fs::read_to_string(config.file_path)
        .expect("Should have been able to read the file");

    println!("With text:\n{contents}");
}

struct Config {
    query: String,
    file_path: String,
}

impl Config {
    // --snip--
    fn new(args: &[String]) -> Config {
        if args.len() < 3 {
            panic!("not enough arguments");
        }
        // --snip--

        let query = args[1].clone();
        let file_path = args[2].clone();

        Config { query, file_path }
    }
}

示例 12-8：添加参数数量的检查

此代码类似于这Guess::new我们在清单中编写的函数 9-13，我们调用panic!当value参数超出有效值的范围。而不是检查一个值范围，我们检查args至少是3函数的其余部分可以在假设 this 条件已得到满足。如果args的项目少于 3 项，则此条件将是true，我们调用panic!宏立即结束程序。

有了这额外的几行代码new，让我们运行程序，不要 arguments 再次查看错误现在是什么样子的：

$ cargo run
   Compiling minigrep v0.1.0 (file:///projects/minigrep)
    Finished `dev` profile [unoptimized + debuginfo] target(s) in 0.0s
     Running `target/debug/minigrep`
thread 'main' panicked at src/main.rs:26:13:
not enough arguments
note: run with `RUST_BACKTRACE=1` environment variable to display a backtrace

这个输出更好：我们现在有一个合理的错误消息。但是，我们也包含我们不想提供给用户的无关信息。也许我们在示例 9-13 中使用的技术并不是最好在这里使用的技术：对panic!更适合于编程问题而不是使用问题，如第 9 章所述。相反我们将使用您在第 9 章中学到的另一种技术—返回一个Result，这表示成功或错误。

返回`Result`而不是调用`panic!`

我们可以改为返回一个Result值，它将包含Config实例成功案例，并将描述 Error Case 中的问题。我们也是将函数名称从new自build因为许多程序员期望new函数永远不会失败。什么时候Config::build是通信对象main，我们可以使用Result键入以表示存在问题。然后我们可以改变main要将Err变体转换为更多实际错误对于我们的用户来说，没有周围的文本关于thread 'main'和RUST_BACKTRACE对panic!原因。

示例 12-9 显示了我们需要对函数Config::build以及所需函数的主体要返回Result.请注意，在我们更新main如好吧，我们将在下一个列表中进行。

文件名： src/main.rs

use std::env;
use std::fs;

fn main() {
    let args: Vec<String> = env::args().collect();

    let config = Config::new(&args);

    println!("Searching for {}", config.query);
    println!("In file {}", config.file_path);

    let contents = fs::read_to_string(config.file_path)
        .expect("Should have been able to read the file");

    println!("With text:\n{contents}");
}

struct Config {
    query: String,
    file_path: String,
}

impl Config {
    fn build(args: &[String]) -> Result<Config, &'static str> {
        if args.len() < 3 {
            return Err("not enough arguments");
        }

        let query = args[1].clone();
        let file_path = args[2].clone();

        Ok(Config { query, file_path })
    }
}

示例 12-9：返回一个Result从Config::build

我们build函数返回一个Result替换为Config实例 case 和 Error case 中的 String 文本。我们的 error 值将始终为字符串文本，这些文本具有'static辈子。

我们对函数的主体进行了两项更改：而不是调用panic!当用户没有传递足够的参数时，我们现在返回一个Errvalue 和我们已经包装了Config返回值在Ok.这些更改使函数的 JSON JSON 中的调用。

返回Err值来自Config::build允许main函数设置为处理Result从build函数并退出在错误情况下更干净地处理。

叫`Config::build`和处理错误

要处理错误情况并打印用户友好的消息，我们需要更新main来处理Result被退回Config::build，如示例 12-10.我们还将负责退出命令行错误代码远离panic!而是通过以下方式实现它手。非零退出状态是向进程发出信号的约定调用我们的程序，该程序退出时出现错误状态。

文件名： src/main.rs

use std::env;
use std::fs;
use std::process;

fn main() {
    let args: Vec<String> = env::args().collect();

    let config = Config::build(&args).unwrap_or_else(|err| {
        println!("Problem parsing arguments: {err}");
        process::exit(1);
    });

    // --snip--

    println!("Searching for {}", config.query);
    println!("In file {}", config.file_path);

    let contents = fs::read_to_string(config.file_path)
        .expect("Should have been able to read the file");

    println!("With text:\n{contents}");
}

struct Config {
    query: String,
    file_path: String,
}

impl Config {
    fn build(args: &[String]) -> Result<Config, &'static str> {
        if args.len() < 3 {
            return Err("not enough arguments");
        }

        let query = args[1].clone();
        let file_path = args[2].clone();

        Ok(Config { query, file_path })
    }
}

示例 12-10：如果构建Config失败

在此清单中，我们使用了一种尚未详细介绍的方法：unwrap_or_else，该Result<T, E>由 Standard 库。用unwrap_or_else允许我们定义一些自定义的、非panic!错误处理。如果Result是一个Okvalue 时，此方法的行为类似自unwrap：它返回Ok正在包装。但是，如果 value 是一个Err值，此方法调用 Closure 中的代码，即我们定义并作为参数传递给unwrap_or_else. 我们将在第 13 章中更详细地介绍闭包。为现在，您只需要知道unwrap_or_else将传递这Err，在本例中为静态字符串"not enough arguments"我们在示例 12-9 中添加到参数中的闭包err那显示在垂直管道之间。然后，闭包中的代码可以使用err值。

我们添加了一个新的useline 带来process从 Standard 库到范围。在错误情况下将运行的闭包中的代码只有 2 lines：我们打印err值，然后调用process::exit.这process::exit函数将立即停止程序并返回作为退出状态代码传递的号码。这类似于panic!-，但我们不再获取所有 extra 输出。让我们试一试：

$ cargo run
   Compiling minigrep v0.1.0 (file:///projects/minigrep)
    Finished `dev` profile [unoptimized + debuginfo] target(s) in 0.48s
     Running `target/debug/minigrep`
Problem parsing arguments: not enough arguments

伟大！此输出对我们的用户更友好。

提取逻辑`main`

现在我们已经完成了配置解析的重构，让我们转向程序的 logic。正如我们在“Separation of Concerns for Binary” 中所说 Projects“，我们将提取名为run，它将保存当前在main不涉及设置配置或处理的函数错误。完成后，main将简洁易用检查，我们将能够为所有其他 logic编写测试。

示例 12-11 显示了提取的run功能。目前，我们只是在制作提取函数的小型增量改进。我们仍然在 src/main.rs 中定义函数。

文件名： src/main.rs

use std::env;
use std::fs;
use std::process;

fn main() {
    // --snip--

    let args: Vec<String> = env::args().collect();

    let config = Config::build(&args).unwrap_or_else(|err| {
        println!("Problem parsing arguments: {err}");
        process::exit(1);
    });

    println!("Searching for {}", config.query);
    println!("In file {}", config.file_path);

    run(config);
}

fn run(config: Config) {
    let contents = fs::read_to_string(config.file_path)
        .expect("Should have been able to read the file");

    println!("With text:\n{contents}");
}

// --snip--

struct Config {
    query: String,
    file_path: String,
}

impl Config {
    fn build(args: &[String]) -> Result<Config, &'static str> {
        if args.len() < 3 {
            return Err("not enough arguments");
        }

        let query = args[1].clone();
        let file_path = args[2].clone();

        Ok(Config { query, file_path })
    }
}

示例 12-11：提取run包含其余程序逻辑的函数

这run函数现在包含main开始从读取文件。这run函数采用Configinstance 作为论点。

从`run`功能

将剩余的程序逻辑分离到run函数，我们可以改进错误处理，就像我们对Config::build在示例 12-9 中。而不是通过调用expect这run函数将返回一个Result<T, E>当出现问题时。这将允许我们进一步将处理错误的逻辑整合为main在用户友好的方式。示例 12-12 显示了我们需要对签名和正文run.

文件名： src/main.rs

use std::env;
use std::fs;
use std::process;
use std::error::Error;

// --snip--


fn main() {
    let args: Vec<String> = env::args().collect();

    let config = Config::build(&args).unwrap_or_else(|err| {
        println!("Problem parsing arguments: {err}");
        process::exit(1);
    });

    println!("Searching for {}", config.query);
    println!("In file {}", config.file_path);

    run(config);
}

fn run(config: Config) -> Result<(), Box<dyn Error>> {
    let contents = fs::read_to_string(config.file_path)?;

    println!("With text:\n{contents}");

    Ok(())
}

struct Config {
    query: String,
    file_path: String,
}

impl Config {
    fn build(args: &[String]) -> Result<Config, &'static str> {
        if args.len() < 3 {
            return Err("not enough arguments");
        }

        let query = args[1].clone();
        let file_path = args[2].clone();

        Ok(Config { query, file_path })
    }
}

示例 12-12：将run函数返回Result

我们在此处进行了三项重大更改。首先，我们将这run函数设置为Result<(), Box<dyn Error>>.此函数以前返回了 Unit 类型，并将其保留为()Ok箱。

对于 error 类型，我们使用了 trait 对象 Box<dyn Error>（我们已经带std::error::Errorinto 范围替换为use声明）。我们将在第 17 章中介绍 trait 对象。目前，只需知道Box<dyn Error>表示该函数将返回一个类型，该实现Errortrait 的 trait 中，但我们不必指定什么特定的类型返回值将为。这使我们能够灵活地返回 error 值在不同的错误情况下可能属于不同的类型。这dyn关键字简短用于动态。

其次，我们删除了对expect赞成?运算符，因为我们在第 9 章中讨论过。而不是panic!在错误时，?将返回当前函数的错误值供调用方处理。

第三，run函数现在返回一个Ok值。我们已经宣布了run函数的成功类型，如签名中所示，这意味着我们需要将 Unit type 值包装在()Ok价值。这Ok(())语法乍一看可能有点奇怪，但像这样使用表示我们正在调用()run的副作用只;它不会返回我们需要的值。

当您运行此代码时，它将编译，但将显示警告：

$ cargo run -- the poem.txt
   Compiling minigrep v0.1.0 (file:///projects/minigrep)
warning: unused `Result` that must be used
  --> src/main.rs:19:5
   |
19 |     run(config);
   |     ^^^^^^^^^^^
   |
   = note: this `Result` may be an `Err` variant, which should be handled
   = note: `#[warn(unused_must_use)]` on by default
help: use `let _ = ...` to ignore the resulting value
   |
19 |     let _ = run(config);
   |     +++++++

warning: `minigrep` (bin "minigrep") generated 1 warning
    Finished `dev` profile [unoptimized + debuginfo] target(s) in 0.71s
     Running `target/debug/minigrep the poem.txt`
Searching for the
In file poem.txt
With text:
I'm nobody! Who are you?
Are you nobody, too?
Then there's a pair of us - don't tell!
They'd banish us, you know.

How dreary to be somebody!
How public, like a frog
To tell your name the livelong day
To an admiring bog!

Rust 告诉我们，我们的代码忽略了Resultvalue 和Result价值可能表示发生了错误。但是，我们不会检查是否或没有出现错误，编译器提醒我们，我们可能是故意的这里有一些错误处理代码！现在让我们纠正这个问题。

处理从`run`在`main`

我们将检查错误并使用类似于我们使用的技术来处理它们跟Config::build在示例 12-10 中，但略有不同：

文件名： src/main.rs

use std::env;
use std::error::Error;
use std::fs;
use std::process;

fn main() {
    // --snip--

    let args: Vec<String> = env::args().collect();

    let config = Config::build(&args).unwrap_or_else(|err| {
        println!("Problem parsing arguments: {err}");
        process::exit(1);
    });

    println!("Searching for {}", config.query);
    println!("In file {}", config.file_path);

    if let Err(e) = run(config) {
        println!("Application error: {e}");
        process::exit(1);
    }
}

fn run(config: Config) -> Result<(), Box<dyn Error>> {
    let contents = fs::read_to_string(config.file_path)?;

    println!("With text:\n{contents}");

    Ok(())
}

struct Config {
    query: String,
    file_path: String,
}

impl Config {
    fn build(args: &[String]) -> Result<Config, &'static str> {
        if args.len() < 3 {
            return Err("not enough arguments");
        }

        let query = args[1].clone();
        let file_path = args[2].clone();

        Ok(Config { query, file_path })
    }
}

我们使用if let而不是unwrap_or_else检查是否run返回一个Err值并调用process::exit(1)如果是的话。这run功能不会返回我们想要的值unwrap以同样的方式Config::build返回Config实例。因为run返回成功案例中，我们只关心检测一个错误，所以我们不需要()unwrap_or_else返回 unwrapped 值，该值仅为 .()

的if let和unwrap_or_else函数在两种情况：我们打印错误并退出。

将代码拆分到库 crate 中

我们minigrep到目前为止，项目看起来不错！现在我们将拆分 src/main.rs 文件并将一些代码放入 src/lib.rs 文件中。这样，我们可以测试代码并拥有职责较少的 src/main.rs 文件。

让我们移动所有不在main从 src/main.rs 到 src/lib.rs 的函数：

这run功能定义
相关的use语句
的定义Config
这Config::build功能定义

src/lib.rs 的内容应该有示例 12-13 中所示的签名（为简洁起见，我们省略了函数的主体）。请注意，这不会编译，直到我们修改示例 12-14 中的 src/main.rs。

文件名： src/lib.rs

use std::error::Error;
use std::fs;

pub struct Config {
    pub query: String,
    pub file_path: String,
}

impl Config {
    pub fn build(args: &[String]) -> Result<Config, &'static str> {
        // --snip--
        if args.len() < 3 {
            return Err("not enough arguments");
        }

        let query = args[1].clone();
        let file_path = args[2].clone();

        Ok(Config { query, file_path })
    }
}

pub fn run(config: Config) -> Result<(), Box<dyn Error>> {
    // --snip--
    let contents = fs::read_to_string(config.file_path)?;

    println!("With text:\n{contents}");

    Ok(())
}

示例 12-13：移动Config和run到 src/lib.rs 中

我们自由地使用了pub关键词： onConfig、其字段及其build方法，在run功能。我们现在有一个 library crate，它有我们可以测试的公共 API！

现在我们需要将移动到 src/lib.rs 的代码放入 binary crate 的 src/main.rs 中，如示例 12-14 所示。

文件名： src/main.rs

use std::env;
use std::process;

use minigrep::Config;

fn main() {
    // --snip--
    let args: Vec<String> = env::args().collect();

    let config = Config::build(&args).unwrap_or_else(|err| {
        println!("Problem parsing arguments: {err}");
        process::exit(1);
    });

    println!("Searching for {}", config.query);
    println!("In file {}", config.file_path);

    if let Err(e) = minigrep::run(config) {
        // --snip--
        println!("Application error: {e}");
        process::exit(1);
    }
}

示例 12-14：使用minigrepsrc/main.rs 中的库 crate

我们添加了一个use minigrep::Config行将Configtype 从 library crate 添加到二进制 crate 的范围内，并在run功能替换为我们的 crate 名称。现在所有功能都应该已连接，并且应该工作。使用运行程序cargo run并确保一切正常。

呼！这需要做很多工作，但我们已经为前途。现在，处理错误要容易得多，并且我们使代码更加模块化。从现在开始，我们几乎所有的工作都将在 src/lib.rs 中完成。

让我们通过做一些可以使用旧代码很困难，但使用新代码很容易：我们将编写一些测试！

Rust 编程语言