跳到主要内容

数据分析师的 AI Coding 指南

机制专题

如果你要把数据分析角色中的规则文件、能力编排和入口选择拆开看,继续进入这些子页:

想直接复制更稳的分析结构,再回头读原理:去 数据分析训练包模板

典型 AI Coding 场景

1. 数据清洗与预处理

2. SQL 查询优化

3. 数据可视化

4. 数据分析脚本

5. 报表自动化

  • 生成定期报表脚本
  • 自动化数据导出
  • 生成数据质量报告
  • 相关教程:工作流目录

推荐工具与工作流

主入口选择

推荐工作流

  1. Terminal-First Repo Pairing - 终端数据分析
  2. Bugfix / Refactor / Test - 脚本优化
  3. Workflow Playbook - 按任务找流程

默认训练包

当前阶段建议先复制什么目的
分析刚启动分析 Brief 模板先把问题、口径和输出要求锁住
还没写脚本数据质量检查模板先把质量风险和限制条件写清
进入脚本 / notebook 阶段命令与复现模板保证查询、脚本和导出可复现
要交结果报告 Handoff 模板把结论、图表和限制条件一起交付

想直接看一份填好的成品:去 示例:次周留存分析训练包

可复用资产

规则文件模板

## Data Analysis Rules

- Document all data transformations
- Validate data quality before analysis
- Use version control for analysis scripts
- Write reproducible analysis code
- Document data sources and assumptions
- Include data quality checks in pipelines

Prompt 模板

数据清洗 Prompt

生成数据清洗脚本:
- 数据源:[CSV/JSON/数据库]
- 数据问题:[缺失值/重复值/异常值]
- 清洗规则:[处理策略]
- 输出格式:[目标格式]
- 验证规则:[数据质量检查]

SQL 查询生成 Prompt

生成 SQL 查询:
- 数据表:[表名和字段]
- 查询需求:[业务需求描述]
- 聚合维度:[分组字段]
- 过滤条件:[WHERE 条件]
- 性能要求:[优化建议]

数据可视化 Prompt

生成数据可视化代码:
- 图表类型:[折线图/柱状图/散点图]
- 数据源:[数据格式]
- X轴/Y轴:[字段定义]
- 样式要求:[颜色、标题、图例]
- 交互功能:[tooltip/zoom/filter]

验证脚本

# 数据分析验证脚本
python -m pytest tests/
python scripts/data_quality_check.py
python scripts/validate_output.py

跨团队交付物

给产品经理

  • 数据分析报告
  • 用户行为洞察
  • 业务指标dashboard
  • 数据驱动建议

给开发工程师

  • 数据接口需求
  • 数据埋点需求
  • 数据格式规范
  • 数据质量要求

给运营团队

  • 运营数据报表
  • 用户画像分析
  • 转化漏斗分析
  • A/B 测试结果

给管理层

  • 业务指标报告
  • 趋势分析
  • 预测模型结果
  • 决策支持数据

下一步