Python 自动化之批量处理文件(一)
作者:mmseoamin日期:2023-12-14

批量新建目录、文档Pro版本


文章目录

  • 批量新建目录、文档Pro版本
  • 前言
  • 一、做成什么样子
  • 二、基本思路
    • 1.引入库
    • 2.基本架构
    • 三、用户输入模块
    • 四、数据处理模块
      • 1.excel表格数据获取
      • 2.批量数据的生成
      • 总结

        前言

        我来写一个不一样的批量新建吧。在工作中,有些同学应该会遇到需要以某个excel表格为切入点,去批量的新建目录或者文档啊什么的,希望对大家有所帮助吧。


        一、做成什么样子

        通过读取excel文档的指定数据信息,在指定目录下、有序的、以相应的单元格的数据,进行批量新建目录、txt、docx、xlsx等。

        用户需要输入的东西有:excel文档、文档里第几个sheet、从哪行那列开始、保存路径、新建数据类型(目录、txt、docx、xlsx)。

        二、基本思路

        1.引入库

        代码如下:

        from openpyxl import load_workbook
        from openpyxl import Workbook
        from docx import Document
        import os
        

        这是后面需要用到的一些库。


        2.基本架构

        代码如下:

        .........        #用户输入
        for ........:    #主循环结构
            ......       #获取excel表格里的信息
            if ......:  
                ......   #排除表格的单元格为空的情况
            else:
                .....    #生成数据类型选择
        

        首先是输入模块,根据使用者输入的信息,为下面提供数据筛选规则。

        其次是主循环结构,刚开始是先要获取excel表格里的信息。

        然后if—else结构根据表格的信息:if下面的用来排除表格的单元格为空的情况。else用来生成数据类型选择(比如前面用户输入的是目录,这里就批量新建目录)

        下面开始代码的编写。


        三、用户输入模块

        代码如下:

        print('请输入excel文档完整路径(例子:E:\BaiduNetdiskDownload\你好.xlsx):', end='')
        excel_path = input()
        # 加载工作簿(这里要加载一下,创建一个实例,后面的主循环结构里会用到)
        wb = load_workbook(excel_path)
        print('在文档的第几个工作表:', end='')
        sheet = int(input())
        # 选择工作表
        ws = wb.worksheets[sheet-1]
        print(f'在第{sheet}个工作表的第几列:', end='')
        lie_num = int(input())
        print(f'在第{sheet}个工作表的第几行开始:', end='')
        hang_num = int(input())
        print('打算在哪个目录下批量生成(例子:D:\dsest):', end='')
        parent_directory = input()
        print('打算在这个目录下批量生成什么(1 目录  2 txt  3 docx  4 xlsx ):', end='')
        creat_type = input()
        

        这里就对应了刚开头第一章节我所提到的东西,精确定位精确匹配。

        注释写的很清楚,我就不多解释了。


        四、数据处理模块

        1.excel表格数据获取

        代码如下:

        i = 0    #这个是用来对批量新建的东西做排序
        for row in ws.iter_rows(min_row=hang_num):   # 遍历从所选行往后的行的数据(包括所选行)
            i += 1
            value = row[lie_num-1].value        # 获取当前行所对应的列的单元格的值
            order_value = f'{i}-{value}'       #后面批量新建东西的名称就用这个,开头为数字电脑会自动排序你懂得
        

        可能会有一些绕,多看看。简单来说就是获取用户所选范围的每个单元格的值。


        2.批量数据的生成

        代码如下:

            if str(value) == 'None':
                pass
            else:
                if creat_type == '1':
                    directory_name = str(order_value)         # 获取当前行的值并转换为字符串
                    full_path = os.path.join(parent_directory, directory_name)
                    os.makedirs(full_path, exist_ok=True)     # 创建目录,如果已经存在,则不抛出异常
                    directory_name = f'{str(order_value)}.xlsx'  # 获取当前行的值并转换为字符串
                    xls = Workbook()     # 新建一个 xlsx 文档     
                    xls.save(full_path)  #保存
                elif creat_type == '2':
                    directory_name = f'{str(order_value)}.txt'  # 获取当前行的值并转换为字符串
                    full_path = os.path.join(parent_directory, directory_name)
                    with open(full_path, 'a'):
                        os.utime(full_path, None)  
                elif creat_type == '3':
                    directory_name = f'{str(order_value)}.docx'  # 获取当前行的值并转换为字符串
                    full_path = os.path.join(parent_directory, directory_name)
                    doc = Document()     # 新建一个 Word 文档
                    doc.save(full_path)  #保存
        

        这段代码也是在主循环for结构的运行的,可以看出有两个if结构进行了嵌套。

        最外层的if作用是:难免其中有些单元格为空,遇到了就排除了它们。

        最里层的if作用是:刚开始用户选的哪个程序就执行哪个操作。同时,这里四块代码是有规律的,都是先确定了批量生成的东西的名字,然后是确定了要在哪个目录下生成,最后是生成保存。


        总结

        批量新建这玩意儿目前想到的就这些了,后续我想到其它新的点子再往这篇博客上编辑添加。批量删除的就暂时不写了,工作生产上应该很少删除东西,毕竟说不定哪天会用到。

        Python 自动化之批量处理文件(一),在这里插入图片描述,第1张