多个xlsx的提取及去重,保存
发布日期:2021-05-07 05:54:21 浏览次数:20 分类:精选文章

本文共 1097 字,大约阅读时间需要 3 分钟。

"""使用openpyxl对xlsx进行操作,目的是读取多个xlsx保存成一个,每个xlsx只有一个sheet。sheet中第一行为标题,只保留一个,后面重复的行也只保留一个,保存为xlsx。如果需要读取一个xlsx的所有表格sheets = wb.get_sheet_names(),再for"""import os#Workbook新建一个xlsxfrom openpyxl import Workbookwb2 = Workbook()ws2 = wb2.activepath='C:\\Users\\lenovo\\Documents\\Tencent Files'lists=os.listdir(path)""""""#提取所有xlsx文件名称temp=[]for x in lists:    prefix,suffix=os.path.splitext(x)    if(suffix=='.xlsx'):        temp.append(x)#load_workbook打开xlsxfrom openpyxl import load_workbook#把共有的第一行加入ws2wb = load_workbook(path+'\\'+temp[0])sheet = wb["Sheet2"]for row in sheet.iter_rows():    ws2.append([cell.value for cell in row])    break#se存储第3列(主键),不重复的加入ws2se=set()for x in temp:    wb = load_workbook(path+'\\'+x)    sheet = wb["Sheet2"]        i=1    for row in sheet.iter_rows():        if(i==1):            i+=1            continue        if row[0].value!=None:            if row[2].value not in se:                se.add(row[2].value)                ws2.append((cell.value for cell in row))        wb.close()    print()  ws2.title="Sheet2"wb2.save("C:\\Users\\lenovo\\Desktop\\3.31.xlsx")
上一篇:粘代码出现的错误解决
下一篇:旅行商问题的本地查找启发法——2选

发表评论

最新留言

逛到本站,mark一下
[***.202.152.39]2025年04月06日 15时54分04秒