Skip to content

[WeeklyReport] ZhijunLStudio 2026.4.27~2026.5.10#616

Open
ZhijunLStudio wants to merge 1 commit into
PFCCLab:mainfrom
ZhijunLStudio:weekly-report-2026.4.27-2026.5.10
Open

[WeeklyReport] ZhijunLStudio 2026.4.27~2026.5.10#616
ZhijunLStudio wants to merge 1 commit into
PFCCLab:mainfrom
ZhijunLStudio:weekly-report-2026.4.27-2026.5.10

Conversation

@ZhijunLStudio
Copy link
Copy Markdown

姓名

ZhijunLStudio

实习项目

AutoTrainer 自动化训练工具

本周工作

  1. 架构 v2 重构:拆分 PipelineOrchestrator God Class(887行 → 80行),拆分为 7 个独立的 PhaseHandler(ablation / data_prepare / env_check / evaluation / full_training / report / task_confirm),每个 handler 职责单一、可独立测试

  2. 状态管理升级:将原先散布在 4 个 JSON 文件中的状态统一迁移到 SQLite 存储(4 张表),支持事务性读写和断点恢复

  3. 任务注册机制:将 hardcoded 的 paddleocr-vl 配置改为 manifest.yaml 插件注册方式,新增 TaskSpec 接口定义,ConfigBuilder 改为基于 TaskSpec 驱动,移除了 71 行硬编码默认配置

  4. 实验管理统一:抽取重复的 CRUD 逻辑为 ExperimentService,新增 CheckpointService,统一实验全生命周期管理

  5. 新增 train_cmd.py CLI 入口,串联 data → train 完整工作流

  6. 修复 ValidationResult 缺少 warnings 参数导致的运行时异常

  7. 新增 46 个测试用例(总计 74 个测试,全部通过),覆盖 phases / pipeline / registry / services / store 各模块

  8. README 双语化:拆分为 README.md(英文)和 README-zh.md(中文),添加语言切换链接

导师点评

下周工作

  1. 持续完善 manifest.yaml 的任务参数定义,补充超参搜索空间配置
  2. 在实际 OCR 数据上测试 v2 架构端到端流程稳定性
  3. 补充 architecture v2 的架构文档和模块说明

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant