书名: 对比excel, 轻松学习python数据分析
Pandas数据结构
Series数据结构
DataFrame表格型数据结构
数值操作
数值排序
# 单列排序
df.sort_values(by = ['column_name'], ascending = True) # 升序
# 多列排序
df.sort_values(by = ['clm_a','clm_b'], ascending = [True,False]) # a列升序, b列降序
数据库
从excel读取数据写入mysql
import pandas as pd
from sqlalchemy import create_engine
# ┍--------------------------------------------------------------------------------┑
# | 从excel中提取数据并导入mysql数据库
# ┕--------------------------------------------------------------------------------┙
engine = create_engine('mysql+mysqlconnector://root:123456@localhost:3306/huacai')
con = engine.connect()
cols = [x for x in range(16)] # 列的顺序要和sql中的字段对应
df = pd.read_excel('D:\\git\\lottery\\yazhi_20avg_live.xlsx',
sheet_name = '数据源',
header = 0,
usecols = cols)
df.to_sql(name = '表名', con=con, if_exists='append',index=False)
# 直接导入目标表格如果报错,可能违反了某些字段的规则或约束, 可以先导入一个新的表中,然后对生成的新表进行字段设置;排除问题!!!
# to_sql的几个参数:
# name:表名
# con:连接
# if_exists:表如果存在怎么处理
# append:追加
# replace:删除原表,建立新表再添加
# fail:什么都不干
# index=False 不插入索引index