python用openpyxl操作excel-合并格式相同的excel文件-智慧文博士

python用openpyxl操作excel-合并指定路径下格式相同的excel文件，参见如下实列代码

import logging import com.pro001.log.pro_log_config as pro_log_config #参见另一篇博文 from openpyxl import Workbook, load_workbook from openpyxl.styles import Font, Alignment, Side, PatternFill, Border import os import datetime import random import pandas as pd def merge_all_excel(base_dir, output_excel_name): """ 合并指定路径下所有格式即列名名相同的 Excel文件（仅含一或多个sheet）的内容到新的Excel文件中 """ try: if not os.path.exists(base_dir): logger.error(f'路径{base_dir}不存在！') return None suffix = '.xlsx' # 获取当前路径下所有开头为excelFile或myExcel，后缀为 .xlsx 的文件放到列表中 excel_list = [f for f in os.listdir(base_dir) if f.lower().endswith(suffix) \ and (f.startswith('excelFile') or f.startswith('myExcel'))] if not excel_list: logger.error(f'路径{base_dir}下不存在{suffix}的Excel文件！') return None # 创建一个空的列表用于存储所有的DataFrame对象 df_list = [] # 遍历所有Excel文件，读取内容到DataFrame对象中 for excel_file in excel_list: file_path = os.path.join(base_dir, excel_file) '''------每个excel文件仅有一个sheet的情况------''' ''' df = pd.read_excel(file_path) # 合并前增加一列展示数据来源哪个文件 df['来源文件'] = os.path.basename(excel_file) # 合并前删除无效列 df = df.drop(columns=['某列名01','某列名02']) # 删除某多列 #df = df.drop(columns=['某列名01'], axis=1) # 仅删除某列 axis=0为按行，1为按列 # 合并前删除重复行 df = df.drop_duplicates() # 合并前删除空行 df = df.dropna(how='all') # 合并前删除空列,axis=0表示按行删除, axis=1表示按列删除, how='all'表示删除所有空行 df = df.dropna(how='all', axis=1) # 合并前删除重复列 df = df.loc[:, ~df.columns.duplicated()] if df: df_list.append(df) logger.info(f'文件{file_path}读取成功，包含{len(df)}行数据！') else: logger.error(f'文件{file_path}读取返回无效数据') ''' ''' -----每个 excel 文件有一或多个数据格式相同 sheet 的情况，兼容上面仅有一个sheet的情况-----''' xlsx_file = pd.ExcelFile(file_path) for sheet_name in xlsx_file.sheet_names: tmp_df = xlsx_file.parse(sheet_name) tmp_df['来源文件'] = os.path.basename(excel_file) tmp_df['来源sheet'] = sheet_name # 合并前删除无效列，删除空行，去重等操作 tmp_df = tmp_df.drop(columns=['某列名01','某列名02']) # 删除某多列 #tmp_df = tmp_df.drop(columns=['某列名01'], axis=1) # 仅删除某列 axis=0为按行，1为按列 tmp_df = tmp_df.drop_duplicates() tmp_df = tmp_df.dropna(how='all') tmp_df = tmp_df.dropna(how='all', axis=1) tmp_df = tmp_df.loc[:, ~tmp_df.columns.duplicated()] if tmp_df: df_list.append(tmp_df) logger.info(f'文件{file_path}的{sheet_name}工作表读取成功，包含{len(tmp_df)}行数据！') else: logger.error(f'文件{file_path}的{sheet_name}工作表读取返回无效数据') # 判断是否有有效的合并sheet数据文件 if not df_list: logger.error(f'没有有效的合并sheet数据文件！') return None # 生成新的Excel文件名称 new_excel_name ='' if not output_excel_name or not output_excel_name.lower().endswith(suffix): new_excel_name = datetime.datetime.now().strftime('%Y%m%d_%H%M%S') + suffix new_excel_name = 'F' + new_excel_name new_excel_name = os.path.join(base_dir, new_excel_name) # 合并所有 df 对象,忽略前面的索引列 merged_df = pd.concat(df_list, ignore_index=True) # 合并后的内容写入到新的 Excel 文件中 merged_df.to_excel(new_excel_name, index=False) # 保存合并后的结果到新的Excel文件中 logger.info(f'合并后的Excel文件见：{new_excel_name}') return new_excel_name except Exception as e: logger.error(f'合并excel异常文件，info: \n{e}') return None def main(): """主函数""" base_dir = r'F:\appData\tempExcel' merge_all_excel(base_dir, 'mergeExcelFile01.xlsx') if __name__ == '__main__': print('-' * 60) main()

C++笔记：流式异步日志库

综合我之前学过的异步日志库，流的缓冲区以及TensorRT里sample的日志设计。总结出了一套流式异步日志。参考文章： C笔记：实现小型日志系统-CSDN博客 TensorRT笔记（2）：解析样例中Logger日志类的设计-CSDN…

李华

代码随想录 463.岛屿的周长

思路：1.网格问题：网格问题是这样的一类搜索问题：由mn个小方格组成一个网格，每个小方格与其上下左右的四个方格被认为是相邻的，要在这样的网格上进行某种搜索。这种题目用DFS实现会非常简单。2.如何构造方格类DFS的代码…

李华

SPOOLing 是 Simultaneous Peripheral Operations On-Line 的缩写，中文为“外部设备同时联机操作”

设备调度算法 SSTF（最短查找时间优先）：选择离当前磁头位置最近的请求进行处理。该算法能有效减少寻道时间，提高整体响应速度，但由于总是优先服务近处请求，可能导致远离磁头位置的请求长时间得不到响应&…

李华

快速验证：用浏览器直接查询电脑开机时间

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 设计一个HTML页面，使用JavaScript尝试通过performance.timingAPI估算网页打开时间作为开机时间参考。页面应包含说明文字和实时显示区域，注明这种方法的局限…

李华

Gradle依赖缓存损坏：传统方法与AI工具的对比

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 开发一个对比工具，展示传统手动修复Gradle依赖缓存损坏与使用AI工具的效率和效果差异。工具应能模拟两种修复方式，记录耗时、成功率和用户操作步骤&#xff…

李华

AI自动生成CSS：文字超出隐藏省略代码

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 请生成一个完整的CSS代码示例，实现当文本内容超出容器宽度时自动隐藏并显示省略号（...）。要求支持单行和多行文本截断，包含必要的浏览…

李华