Commit Graph

  • b260f5581d fix(benchmark): 优化 KV 缓存初始化并更正基准测试类型标识 ViperEkura 2025-11-05 15:44:29 +0800
  • 0a754e3341 feat(scripts): 调整文本生成参数以提升多样性 ViperEkura 2025-11-05 13:56:58 +0800
  • 144b9598ad feat(model): 添加 Linear 和 Embedding 模块的自定义参数初始化支持 ViperEkura 2025-10-31 22:43:12 +0800
  • 877669b799 feat(inference): 添加generate_loop方法并优化KVCacheManager初始化 ViperEkura 2025-10-31 21:15:15 +0800
  • cdb47a62dc test: 统一重构数据集和调度器测试模块 ViperEkura 2025-10-31 20:24:01 +0800
  • e86328b753 fix(tokenizer): 修复stop_ids属性返回错误的token ID列表 ViperEkura 2025-10-31 19:19:38 +0800
  • 5d3799b715 refactor(data): 修改变量命名方式 ViperEkura 2025-10-30 16:32:25 +0800
  • 6a3135f401 fix(data_util): 修复数据集索引计算逻辑并提取通用方法 ViperEkura 2025-10-29 20:58:33 +0800
  • 12850d403c fix(config): 修改Checkpoint类中tokenizer和config字段的默认值初始化方式 ViperEkura 2025-10-29 13:24:20 +0800
  • bad6243b53 fix(train): 更新训练函数参数传递方式 ViperEkura 2025-10-29 13:23:53 +0800
  • f2448a5147 feat(benchmark): 优化KV缓存初始化逻辑 ViperEkura 2025-10-29 12:41:32 +0800
  • 46b2a0f86f feat(train): 添加 max_len 和 step_size 参数支持 ViperEkura 2025-10-29 12:32:17 +0800
  • d94fc5a87a feat(data, inference): 使用chatML格式 ViperEkura 2025-10-29 12:02:43 +0800
  • 38b2725cd1 feat(KVCacheManager): 优化KV缓存结构为元组形式以提升性能 ViperEkura 2025-10-29 12:01:28 +0800
  • bc5ef72001 fix(config): 修正 SGDRScheduleConfig 类名拼写错误 ViperEkura 2025-10-20 18:21:46 +0800
  • e051005334 test(test_module): 更新测试用例以使用新的generate_iterator接口 ViperEkura 2025-10-20 13:52:31 +0800
  • 0db046f8d9 feat(khaosz/trainer): 更新梯度裁剪回调 ViperEkura 2025-10-20 13:30:26 +0800
  • 05b012820b refactor(khaosz): 重构模块导出结构并重命名主模块文件 ViperEkura 2025-10-20 13:07:02 +0800
  • e72e244df6 feat(inference): 实现采样策略并优化生成器逻辑 ViperEkura 2025-10-20 13:00:41 +0800
  • 98efca7b9d feat(trainer): 添加训练起始轮次和批次配置支持 ViperEkura 2025-10-19 21:47:10 +0800
  • 613edd7a14 test(early_stopping, train_strategy): 更新测试配置以提高稳定性 ViperEkura 2025-10-18 22:07:11 +0800
  • 622982364b fix(trainer): 修复检查点加载逻辑 ViperEkura 2025-10-18 21:45:23 +0800
  • b67bc9865d refactor(trainer): 重构学习率调度器实现并分离配置与工厂逻辑 ViperEkura 2025-10-18 16:42:37 +0800
  • c51b203fde refactor(khaosz): 重构项目结构 ViperEkura 2025-10-18 13:56:59 +0800
  • 8434c19923 fix(khaosz/trainer): 修复数据获取中的索引范围错误和参数传递问题 ViperEkura 2025-10-09 19:53:52 +0800
  • 68a15005cb feat(train.py): 支持从检查点恢复训练并优化数据加载配置 ViperEkura 2025-10-07 22:02:50 +0800
  • efbe3de9d3 fix(khaosz/trainer/data_util): 修复数据集索引范围错误 v1.3.0 ViperEkura 2025-10-07 20:04:45 +0800
  • 12793bc2d3 feat(khaosz/trainer): 新增梯度统计工具函数并重构训练回调机制 ViperEkura 2025-10-07 13:03:32 +0800
  • 0764cb8296 fix(khaosz/trainer/train_callback): 修复基类函数命名错误 ViperEkura 2025-10-07 11:43:51 +0800
  • 57cd7b921e feat(khaosz/trainer): 改进训练循环中的损失归一化处理 ViperEkura 2025-10-06 20:17:47 +0800
  • c1bf22b6ec refactor(khaosz/trainer): 使用 TrainContext 替代 kwargs 传递训练上下文 ViperEkura 2025-10-06 20:12:08 +0800
  • f9b6331ad7 refactor(khaosz/core/parameter): 修改参数名称 ViperEkura 2025-10-06 20:11:46 +0800
  • 183f481692 build(khaosz): 更新版本号至1.3.0 ViperEkura 2025-10-06 17:12:12 +0800
  • ec0c054d26 test(early_stopping): 移除未使用的torch.utils.data导入 ViperEkura 2025-10-06 17:10:10 +0800
  • 4ffa7454f2 feat(strategy): 支持模型输入可调用对象并优化损失计算 ViperEkura 2025-10-06 17:08:56 +0800
  • 8c9e973179 fix(train.py): 修复数据集加载时的参数传递问题 ViperEkura 2025-10-06 16:44:02 +0800
  • fc98d9b7e6 refactor(khaosz/trainer): 移除未使用的导入模块 ViperEkura 2025-10-04 21:45:53 +0800
  • 9d5aa952e0 feat(tests): 重构测试环境, 便于pickle 序列化 ViperEkura 2025-10-04 21:31:39 +0800
  • 2ccd7bd583 refactor(khaosz/trainer): 重构训练器模块结构以提升可维护性 ViperEkura 2025-10-04 21:31:15 +0800
  • e7d29ca2d5 feat(tests): 改进测试环境配置与设备管理 ViperEkura 2025-10-04 12:12:42 +0800
  • 465a1a9373 refactor(khaosz/tainer): 修改设备参数传递发生阶段 ViperEkura 2025-10-04 12:12:21 +0800
  • 240ee00221 feat(khaosz/trainer): 引入 TrainContext 和 TrainContextBuilder 优化训练上下文管理 ViperEkura 2025-10-03 22:42:11 +0800
  • 6e1a497c04 test(sampler): 删除冗余的训练恢复测试用例 ViperEkura 2025-10-03 22:18:31 +0800
  • 85aeec9e55 test(conftest): 添加matplotlib后端设置以避免GUI问题 ViperEkura 2025-10-03 22:11:54 +0800
  • 9a452dd34e fix(khaosz/trainer/data_util.py): 修复 RandomSampler 中迭代计数器位置错误 ViperEkura 2025-10-03 22:08:28 +0800
  • 28b01220b6 test(trainer): 拆分测试文件 ViperEkura 2025-10-03 22:08:11 +0800
  • 0a03a15679 test(trainer): 调整测试参数以提高训练和断言的稳定性 v1.2.2 ViperEkura 2025-10-02 14:34:02 +0800
  • 83c08cfbb9 fix(trainer): 修复随机采样器迭代重置问题 ViperEkura 2025-10-02 14:22:38 +0800
  • e43a5b9b66 fix(khaosz/trainer/data_util.py): 修复 build_loss_mask 函数中使用错误的输入张量 ViperEkura 2025-10-02 11:55:51 +0800
  • cd4877e490 perf(benchmark): 添加基准性能测试 ViperEkura 2025-10-01 22:35:35 +0800
  • 64c4d2d2e3 refactor(scripts): 重命名聊天脚本文件 ViperEkura 2025-10-01 11:57:57 +0800
  • 753e493d6c docs(khaosz/trainer): 更新回调函数的文档字符串格式 ViperEkura 2025-09-30 20:55:24 +0800
  • 5a356d66e1 refactor(khaosz/trainer/data_util): 重构mask函数 ViperEkura 2025-09-30 20:22:12 +0800
  • 78e5dbb3be build(khaosz): 更新版本号至1.2.2 ViperEkura 2025-09-30 18:04:13 +0800
  • 288e2c3da6 fix(khaosz/trainer): 调整训练循环中回调调用顺序并增强异常日志记录 ViperEkura 2025-09-30 17:57:55 +0800
  • dd6a9e4ede fix(train.py): 修复参数传递错误 ViperEkura 2025-09-30 17:30:00 +0800
  • 17f1a12f27 test(trainer): 增强测试用例以支持随机配置和多轮对话训练 ViperEkura 2025-09-30 16:33:37 +0800
  • 315ce1990a feat(khaosz/trainer): 优化训练器回调机制与数据采样逻辑 ViperEkura 2025-09-30 16:33:18 +0800
  • e0e9942e4a feat(khaosz/core/parameter): 添加采样器状态的保存与加载功能 ViperEkura 2025-09-29 19:49:35 +0800
  • 198c1ac55c refactor(khaosz/trainer): 重构训练器模块的导入路径和文件命名 ViperEkura 2025-09-29 19:35:17 +0800
  • e467420475 fix(khaosz/trainer): 修正训练步数计算逻辑 ViperEkura 2025-09-29 19:05:26 +0800
  • c104a400e7 refactor(train.py): 重命名策略参数变量名 ViperEkura 2025-09-29 17:26:01 +0800
  • 6d5176a11c feat(khaosz/trainer): 改进调度器配置验证和加载逻辑 ViperEkura 2025-09-29 17:17:45 +0800
  • bdda1cc35a feat(khaosz/core/tokenizer): 添加 user_id 和 system_id 属性 ViperEkura 2025-09-29 13:47:37 +0800
  • 89211c16f6 fix(khaosz/trainer): 将保存检查点逻辑移至CheckpointCallback ViperEkura 2025-09-29 13:38:46 +0800
  • 648e4e177b feat(khaosz/trainer): 添加SchedulerCallback功能 ViperEkura 2025-09-29 13:18:44 +0800
  • 5163d3a47a fix(callback): 解决循环导入问题 ViperEkura 2025-09-29 13:08:41 +0800
  • b2f3fefa1b feat(callback): 为 TrainerCallback 及其子类添加文档字符串和未使用参数占位符 ViperEkura 2025-09-29 12:48:01 +0800
  • e52803ddc3 refactor(trainer): 将回调类移至独立文件并优化训练器结构 ViperEkura 2025-09-29 12:00:25 +0800
  • 8206c7855e fix(transformer): 调整注意力掩码处理逻辑 ViperEkura 2025-09-29 11:31:42 +0800
  • 816bc78894 feat(trainer): 引入训练器回调机制并重构训练流程 ViperEkura 2025-09-29 11:31:31 +0800
  • 92999fa9f6 fix(trainer): 修复训练器中配置引用错误的问题 ViperEkura 2025-09-28 22:20:25 +0800
  • 0ebf53008e refactor(test): 更新训练配置参数名称并优化测试逻辑 ViperEkura 2025-09-28 22:14:39 +0800
  • 1c9063fd3d refactor(trainer): 统一参数命名以提升可读性 ViperEkura 2025-09-28 22:14:24 +0800
  • fa43ed2943 feat(trainer): 重构训练配置与策略工厂引入 ViperEkura 2025-09-28 21:39:48 +0800
  • 2dc7b5bda8 build(.gitignore): 更新 gitignore 文件忽略规则 ViperEkura 2025-09-28 15:39:13 +0800
  • 30ac07418c feat(train): 添加多轮对话训练支持 ViperEkura 2025-09-28 15:38:53 +0800
  • 1169cfad82 fix(trainer): 修复多轮对话中的因果注意力掩码计算逻辑等 ViperEkura 2025-09-28 15:15:19 +0800
  • 0b96b11a6e test(trainer): 增加训练中断与检查点恢复测试 ViperEkura 2025-09-28 14:38:23 +0800
  • 25ec56a1f5 fix(trainer): 修复训练器恢复检查点时的学习率初始化问题 ViperEkura 2025-09-28 14:38:02 +0800
  • c8a38743a4 fix(tests): 更新测试代码以验证优化器状态的保存与加载 ViperEkura 2025-09-28 14:00:38 +0800
  • f25a249291 feat(khaosz): 优化模型参数保存与加载逻辑 ViperEkura 2025-09-28 14:00:21 +0800
  • 4fcdc87c95 feat(trainer): 重构数据集与策略模块以支持字典形式的数据返回 ViperEkura 2025-09-27 14:11:27 +0800
  • 9fbc9481b5 refactor(core): 修改注意力掩码处理函数并重命名参数 ViperEkura 2025-09-27 13:37:10 +0800
  • 053f4a4dad feat( StrategyFactory): 添加 SFT 策略初始化参数并完善工厂方法调用 ViperEkura 2025-09-27 13:24:16 +0800
  • 676fdd59d7 feat(strategy): 重构mask构建逻辑并优化策略工厂参数传递 ViperEkura 2025-09-27 13:12:57 +0800
  • a4443765ee Initial commit ViperEkura 2025-09-27 12:02:22 +0800