核心思想
将训练过程分为清醒期(学习)和睡眠期(巩固),模拟大脑的昼夜节律。
训练周期
# 清醒期:快速学习新信息 wake_phase(batch): loss = fast_network.train_step(batch) # 高可塑性 if loss > threshold: mark_for_consolidation(batch) # 睡眠期:离线巩固 sleep_phase(): important_samples = retrieve_marked_samples() consolidate(fast_network → slow_network) # 高稳定性 fast_network.reset_short_term_memory()