Linux C遍历文件夹，如何高效递归获取所有子目录的文件路径？-好主机测评网

在Linux操作系统中，使用C语言遍历文件夹是文件系统操作的基础技能之一，无论是开发系统工具、批量处理文件，还是实现文件检索功能，掌握目录遍历方法都至关重要，本文将详细介绍Linux环境下使用C语言遍历文件夹的核心概念、关键函数、实现方式及注意事项。

Linux C遍历文件夹，如何高效递归获取所有子目录的文件路径？

Linux文件夹遍历的基础概念

Linux文件系统中，一切皆文件，目录也不例外，目录本质上是一种特殊文件，它存储了文件名与对应inode索引节点的映射关系，遍历文件夹的过程，即读取目录文件中的目录项（dirent），获取每个文件的名称、类型、inode号等信息,并根据需要递归或非递归地访问子目录。

在C语言中，目录遍历主要通过标准I/O库和系统调用实现，核心数据结构是dirent，定义在<dirent.h>头文件中，它包含文件名（d_name）、文件类型（d_type）、inode号（d_ino）等关键信息，而目录流（DIR）则类似于文件流（FILE），用于管理当前打开的目录，通过opendir()、readdir()、closedir()等函数进行操作。

核心API详解

打开与关闭目录

opendir(const char *name)：打开指定路径的目录，返回DIR*结构体指针，若目录不存在或无权限访问，则返回NULL，需通过perror()或strerror(errno)打印错误信息。
closedir(DIR *dirp)：关闭已打开的目录流，释放相关资源，即使遍历过程中发生错误，也必须确保调用closedir()避免资源泄漏。

读取目录项

struct dirent *readdir(DIR *dirp)：读取目录流中的下一个目录项，返回dirent*指针，当到达目录末尾时返回NULL，此时需结合errno判断是错误还是正常结束（errno为0表示正常结束）。
dirent结构体的关键成员：
- d_name：文件名（不包含路径），长度上限为NAME_MAX（通常为255）。
- d_type：文件类型，常用值包括DT_DIR（目录）、DT_REG（普通文件）、DT_LNK（符号链接）等。
- d_ino：文件的inode号，可用于唯一标识文件（同一文件系统内inode号唯一）。

重置目录流位置

void rewinddir(DIR *dirp)：将目录流的读写位置重置到开头,便于重新遍历目录。

非递归遍历：单层目录访问

非递归遍历适用于仅需处理当前目录下文件（不含子目录）的场景，核心流程为：打开目录→循环读取目录项→处理文件→关闭目录,以下是一个示例代码：

#include <stdio.h>
#include <dirent.h>
#include <errno.h>
void list_files(const char *dir_path) {
    DIR *dir = opendir(dir_path);
    if (dir == NULL) {
        perror("opendir failed");
        return;
    }
    struct dirent *entry;
    while ((entry = readdir(dir)) != NULL) {
        // 跳过当前目录(.)和上级目录(..)
        if (strcmp(entry->d_name, ".") == 0 || strcmp(entry->d_name, "..") == 0) {
            continue;
        }
        printf("%s\n", entry->d_name);
    }
    if (errno != 0) {
        perror("readdir failed");
    }
    closedir(dir);
}

上述代码中，readdir()循环读取目录项，通过d_name跳过和，避免无效操作，若readdir()返回NULL且errno非0，说明遍历过程中发生错误（如权限不足）。

Linux C遍历文件夹，如何高效递归获取所有子目录的文件路径？

递归遍历：深度优先搜索

若需遍历目录及其所有子目录，递归是最直观的实现方式，核心逻辑为：打开目录→遍历目录项→若为子目录则递归调用→处理文件，需注意两点：避免递归进入和导致的无限循环，以及处理符号链接时的潜在风险（如符号链接指向的目录形成循环）。

#include <stdio.h>
#include <dirent.h>
#include <errno.h>
#include <string.h>
void traverse_recursive(const char *dir_path, int depth) {
    DIR *dir = opendir(dir_path);
    if (dir == NULL) {
        perror("opendir failed");
        return;
    }
    struct dirent *entry;
    while ((entry = readdir(dir)) != NULL) {
        if (strcmp(entry->d_name, ".") == 0 || strcmp(entry->d_name, "..") == 0) {
            continue;
        }
        // 打印缩进表示层级
        for (int i = 0; i < depth; i++) {
            printf("  ");
        }
        printf("%s\n", entry->d_name);
        // 若为目录，递归遍历
        if (entry->d_type == DT_DIR) {
            char sub_path[PATH_MAX];
            snprintf(sub_path, sizeof(sub_path), "%s/%s", dir_path, entry->d_name);
            traverse_recursive(sub_path, depth + 1);
        }
    }
    if (errno != 0) {
        perror("readdir failed");
    }
    closedir(dir);
}

递归遍历的缺点是可能因目录层级过深导致栈溢出（stack overflow），对于极端情况（如文件系统深度超过1000层），可改用非递归的深度优先搜索（通过栈数据结构模拟递归调用）。

文件信息获取与筛选

遍历目录时，常需获取文件的详细属性（如大小、修改时间、权限等），此时需结合<sys/stat.h>中的stat()函数，通过文件路径填充stat结构体：

#include <sys/stat.h>
#include <unistd.h>
void print_file_info(const char *path) {
    struct stat file_stat;
    if (stat(path, &file_stat) == -1) {
        perror("stat failed");
        return;
    }
    printf("Size: %ld bytes\n", file_stat.st_size);
    printf("Mode: %o\n", file_stat.st_mode & 0777);  // 文件权限
    printf("Modified time: %ld\n", file_stat.st_mtime);  // 最后修改时间
}

在遍历过程中，可通过stat()或lstat()（不跟随符号链接）筛选文件,仅处理普通文件且大小超过1MB的文件：

Linux C遍历文件夹，如何高效递归获取所有子目录的文件路径？

if (entry->d_type == DT_REG) {
    char file_path[PATH_MAX];
    snprintf(file_path, sizeof(file_path), "%s/%s", dir_path, entry->d_name);
    struct stat file_stat;
    if (stat(file_path, &file_stat) == 0 && file_stat.st_size > 1024 * 1024) {
        printf("Large file: %s (%ld bytes)\n", file_path, file_stat.st_size);
    }
}

错误处理与最佳实践

资源管理：始终确保closedir()被调用，即使在遍历过程中发生错误（可通过goto或do-while(0)模式确保清理）。
符号链接处理：使用lstat()而非stat()可避免跟随符号链接，防止进入循环目录（如/tmp/link -> /tmp）。
路径拼接：使用snprintf()安全拼接路径，避免缓冲区溢出（硬编码路径长度可能导致问题）。
权限与错误码：检查opendir()和readdir()的返回值，通过errno区分错误类型（如EACCES表示权限不足，ENOENT表示目录不存在）。
线程安全：readdir()不是线程安全的，多线程环境下需使用readdir_r()（已废弃）或基于opendir64()+getdents()的替代方案。

Linux C语言遍历文件夹的核心是dirent结构和目录流操作函数，非递归遍历适合单层目录，代码简洁；递归遍历适合深度遍历，但需注意栈溢出风险，结合stat()函数可扩展文件筛选功能，而完善的错误处理和资源管理是健壮程序的关键，实际开发中，可根据需求选择遍历方式，并注意符号链接、路径拼接等细节问题,确保程序在复杂文件系统环境下稳定运行。

Linux C遍历文件夹，如何高效递归获取所有子目录的文件路径？

Linux文件夹遍历的基础概念

核心API详解

打开与关闭目录

读取目录项

重置目录流位置

非递归遍历：单层目录访问

递归遍历：深度优先搜索

文件信息获取与筛选

错误处理与最佳实践

相关推荐

互动交流中心

置顶推荐

最新文章

热门标签

网站统计

热门标签