在Python中进行Excel和Word操作,常用的库包括:
对于Excel操作:
- openpyxl:用于读写Excel文件,支持Excel 2010及更高版本的文件格式 。
- xlrd和xlwt:用于读取和写入Excel文件 , 支持Excel 97-2003版本的文件格式 。
- pandas:用于数据处理和分析 , 可以读写多种文件格式,包括Excel文件 。
- pyexcel和pyexcel-xls:用于读写Excel文件,支持多种文件格式 。
对于Word操作:
- python-docx:用于读写Word文件,支持docx文件格式 。
- pywin32:用于访问Windows API,可以实现Word自动化操作 。
- docx2pdf:用于将Word文件转换为PDF文件 。
python操作Excel实例
- 读取Excel表格
from openpyxl import load_workbook# 加载Excel文件workbook = load_workbook(filename='example.xlsx')# 获取当前工作表worksheet = workbook.active# 获取指定工作表worksheet = workbook.sheet_by_name('Sheet1')
2.获取单元格数据
使用openpyxl获取单元格数据,可以使用cell()函数或者value属性
# 获取单元格数据cell = worksheet.cell(row=1, column=1)print(cell.value)# 获取单元格数据value = https://www.itzhengshu.com/excel/worksheet['A1'].valueprint(value)
3.写入单元格数据
# 写入单元格数据worksheet.cell(row=1, column=1, value='https://www.itzhengshu.com/excel/Hello')# 写入单元格数据worksheet['A1'] = 'World'
4.读取整列或整行数据
使用openpyxl读取整列或整行数据,可以使用iter_rows()函数或者iter_cols()函数 。
# 读取整列数据for col in worksheet.iter_cols(min_row=1, max_row=10, min_col=1, max_col=1):for cell in col:print(cell.value)# 读取整行数据for row in worksheet.iter_rows(min_row=1, max_row=1, min_col=1, max_col=10):for cell in row:print(cell.value)
5.保存Excel文件
使用openpyxl保存Excel文件,可以使用save()函数
# 保存Excel文件workbook.save(filename='example.xlsx')
6.处理Excel数据
使用openpyxl处理Excel数据 , 可以使用pandas库
import pandas as pd# 读取Excel文件df = pd.read_excel('example.xlsx')# 处理数据df = df.dropna(how='any')df = df[df['Score'] > 60]# 保存Excel文件df.to_excel('new_example.xlsx', index=False)
上面的代码中,首先使用pandas库读取Excel文件 , 然后对数据进行清洗和过滤,最后保存到新的Excel文件中 。通过pandas库可以快速方便地对Excel数据进行处理和分析