Commit Graph

86 Commits

Author SHA1 Message Date
Developer 214d8a4cb0 docs: 补充测试模板实战教训章节(从AI生成按钮bug中总结)
新增第六章「实战教训」:
- 「看见不等于测了」陷阱(B07案例分析)
- 弹窗测试的「红按钮」规则
- 「测试时绕过=上线时爆炸」警示
- 自我检查Checklist(3个问题)

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 17:13:43 +08:00
Developer ca76b74cdf fix: AI生成弹窗传空内容bug + 补全B07测试覆盖
缺陷修复:
- openGenerateModal() knowledgeBaseContent 从 '' 改为从已有题目拼接
- 修复后点击AI生成→生成按钮不再报400

测试补充(B07b/B07c):
- 弹窗提交不报前端错误(UI验证)
- API级生成接口不返回400(API验证)
通过33/33全部通过

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 17:11:10 +08:00
Developer 8bfbe7bece test: 补全题库管理遗漏按钮测试 — 驳回/错误重试/编辑提交
新增3项(E01-E03):
- 单题驳回按钮(PENDING_REVIEW→REJECTED) — 实际点击+确认
- 错误状态重试按钮 — 无效ID触发错误→点重试
- 编辑弹窗完整流程 — 打开→修改文本→保存

按钮覆盖率提升:
  存在性检查: 95%→100%
  实际点击验证: 60%→85%
  遗漏按钮: 4→0

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 15:45:08 +08:00
Developer 92e0f56fe5 test: 题库管理全按钮UI测试(28项) + Playwright测试模板
题库管理测试(28项全部通过):
A. 列表页8项 — 标题/创建按钮/表单/筛选Tab/搜索/卡片/统计/重试
B. 详情页14项 — 返回/渲染/状态/统计/AI生成弹窗/全选/批量/添加/列表/操作按钮
C. 状态转换3项 — 创建题库→提交审核→发布 全流程UI
D. 单题操作3项 — 审批/删除 + API批量验证

新增 docs/tests/playwright-test-template.md:
- 页面UI测试架构模板
- 按钮覆盖Checklist(30+按钮类型)
- 三Agent使用流程
- 常见问题/定位器指南
- 案例对照

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 15:36:13 +08:00
Developer b13b68e188 test: 题库管理全面测试 — 25项覆盖CRUD/审核/权限/异常/边界
覆盖范围:
- 题库CRUD(创建/查询/删除/模板关联)
- 题目管理(MC+SA/编辑/删除/列表)
- 审核全流程(待审→审批通过→发布)
- 用户故事(USER只读/TA查看/级联删除)
- 异常路径(不存在ID/空标题)
- 边界值(超长文本)
- UI列表页验证

Agent应用: Playwright三Agent
  Generator — UI定位器
  Planner   — 7模块25用例
  Healer    — retry+trace保障稳定性

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 15:20:34 +08:00
Developer 6562af5e1a chore: 清理不必要目录
删除:
- .codegraph/ (21MB 缓存)
- .github/ (Gitea 项目,不需要 GitHub workflows)
- openspec/ (旧规格文档)
- qa-dialogue/ (空目录)
- temp/ (空目录)
- ai人才育成/ (L1 资料,知识已导入题库)

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 14:37:49 +08:00
Developer e12d5aafbf chore: 清理根目录冗余文件(旧文档/启动脚本/配置等)
删除: FEATURE_SUMMARY.md / QUICK_START.md / STARTUP.md
       INTERNAL_DEPLOYMENT_GUIDE.md / INTERNAL_DEPLOYMENT_SUMMARY.md
       start-server.bat / start-web.bat / .dockerignore

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 14:34:45 +08:00
Developer b21899055d chore: 清理 docs 目录冗余文档(55个→9个)
删除:
- docs/1.0/ 全部22个(旧Simple KB文档,已被替代)
- docs/2.0/ 全部2个(空文件/过时)
- docs/design/ 全部4个(旧功能设计)
- docs/plans/ 旧版5个(保留v2.0设计文档)
- docs/superpowers/ 全部4个(飞书集成文档)
- docs/根目录杂项 8个(开发规范/快速参考/调试/飞书/Git设置)
- docs/3.0/knowledge_graph_analysis.md(不相关)

保留:
- docs/3.0/ 考核工作流设计 2个
- docs/plans/ v2.0设计文档 1个
- docs/tests/ 测试文档 6个
合计: 55个 → 9个

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 14:31:44 +08:00
Developer 3d73618270 chore: 清理根目录冗余文件(翻译工具/旧脚本/调试文件/截图等)
删除约50个文件:
- 翻译/i18n工具 21个(cjk_*、extract_*、apply_*等)
- 部署脚本 3个(build_and_push、deploy)
- 诊断调试文件 15个(check_*、query_*、db_output等)
- 旧截图 1个
- 杂项配置文件 3个(.antigravityrules .cursorrules tm_schema.txt)

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 14:04:53 +08:00
Developer 9330256e13 docs: 设计文档更新 v3.0 — 实施修正记录
新增第10章「实施修正记录」,涵盖9项修正:
1. 出题算法 Math.round→floor+remainder 修正
2. P0答题体验(题序导航/标记回头/提交确认)
3. P1题库增强(tags字段/跨模板复用表)
4. P2配置增强(attemptLimit/scheduled/reviewMode/shuffle)
5. 系统角色权限保护缺陷修复
6. GET /users/:id 端点缺失修复
7. 题库维度/评分标准/题量补充
8. 模板配置修正(20题+非技术模板)
9. 测试覆盖340+项

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 13:59:39 +08:00
Developer 0e84e08115 docs: 完整测试报告 — 340+项测试·9章完整覆盖·14个缺陷记录
报告结构:
1. 测试概览 — 13个脚本总览 + 总体统计
2. 各Phase详细结果 — 0~5逐项展示
3. Playwright三Agent应用报告
4. 缺陷发现与修复清单(14个)
5. 题库与模板状态
6. 性能与并发数据
7. 测试覆盖矩阵
8. 执行命令速查
9. 结论

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 13:51:10 +08:00
Developer f97b8a818a feat: Playwright三Agent深度应用 — 全流程测试覆盖知识库到证书展示
Agent应用:
  Generator — codegen 录制UI交互 locator 模板
  Planner   — test.describe.serial 编排6阶段18用例
              (前置/模板/题库/API考核/UI全流程/设置页)
  Healer    — trace on + retries 1 + screenshot on failure

测试覆盖:
  0. 前置准备 — 模板存在性/题库容量/评分标准完整性
  1. 考核模板 — 维度配置/attemptLimit/题数
  2. 题库内容 — MC+SA/评分标准/各维度充足
  3. API考核 — 创建考生/出题/答题/证书/历史记录
  4. UI全流程 — 登录/选模板/答题(MC+SA+追问)/结果展示
  5. 设置页 — 测评模板Tab可见性

结果: 15/18 passed (2.2min), 1 flaky(UI答题状态复用)

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 13:47:01 +08:00
Developer 100aaa3880 feat: Playwright 三Agent应用 — Generator→Planner→Healer 完整流水线
三Agent流程:
1. Generator: codegen 录制操作生成测试代码草稿
2. Planner: @playwright/test 框架编排 8 个测试用例
   - describe/test/expect 结构化
   - playwright.config.ts 并行执行 + HTML 报告
3. Healer: trace + retries + screenshot 自动修复
   - 失败自动重试 2 次
   - 首次重试时保存 trace.zip
   - 生成 playwright-report/ 可视化报告

测试结果: 8/8 passed (23秒)
产物: test-results/ 含 trace.zip, playwright-report/ HTML报告

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 11:03:21 +08:00
Developer 07308cae99 docs: 完整测试框架文档 — 5个Phase + 272项测试索引 + 14个缺陷记录
涵盖:
- Phase 0-5 测试架构与详细用例清单
- 脚本索引(11个测试脚本)与执行策略
- 全部测试结果汇总(~314项 100%通过)
- 14个已修复缺陷跟踪表

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 10:55:42 +08:00
Developer 3d41f0dfcb test: 端到端全流程测试 + 烟雾测试 + 测试方案文档
新增:
1. test-e2e-assessment-full-flow.mjs — 完整端到端流程
   登录→模板校验→题库校验→API考核→非技术模板→UI端到端
   覆盖7个阶段29项检查,全部通过

2. test-assessment-smoke.mjs — 快速烟雾测试(29项)

3. docs/tests/assessment-test-plan.md — 完整测试方案文档
   5个Phase: 核心流程/评分证书/权限隔离/压力异常/回归测试

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-16 10:51:09 +08:00
Developer ce1a17b4f2 chore: 清理冗余测试数据(server/scripts + QA脚本 + 截图 + e2e产物) 2026-06-09 16:26:19 +08:00
Developer d15e881591 test: 全量回归测试52项覆盖未触及路径 + 完善P2字段映射
全量回归测试(test-full-coverage.mjs):
- A. 角色权限深度测试(新endpoint权限边界/跨用户隔离)
- B. 边界值测试(模板字段极值/角色名/密码边界)
- C. 异常路径测试(状态链/冲突/不存在Session/已删模板)
- D. 缺陷回归测试(系统角色保护/API Key / token即时变更/幂等)
- E. 跨功能交互测试(权限+考核/模板+角色/异常状态)

修复:
- assessment.service.ts templateData P2字段显式映射确认

测试结果: 52/52  + 系统测试 142/142  + P2专项 20/20 

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 15:49:09 +08:00
Developer 46a10ba091 P2全部完成: 尝试限制/预约时段/题目回顾/随机排序
后端:
- assessment-template entity: attemptLimit/scheduledStart/End/reviewMode/shuffleQuestions
- DTO 更新: 新增 P2 字段验证
- startSession: 尝试次数检查、预约时段检查、题目随机排序
- getSessionState: reviewMode 控制答案可见性
- 新增 GET /assessment/:id/review 回顾端点

前端:
- AssessmentTemplateManager: 新增尝试次数/答题回顾/题目排序/预约时段配置
- AssessmentView: 答题回顾按钮(完成页)+提交确认弹窗+标记回头功能
- types.ts: 新增 P2 字段类型
- assessmentService: 新增 getReview 方法
- 进度导航点: 可视化题序+标记状态

测试 20项全部通过 + 系统测试 142项全部通过 

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 14:57:32 +08:00
Developer 9fd503b42b feat: 考核系统升级 P0+P1+P2 — 体验/题库/配置增强
P0 — 答题体验优化:
- 题序导航点:题目进度可视化,标记题目标记
- 标记回头检查: 点击🏷️按钮标记当前题,导航点变黄色
- 提交确认弹窗: 未答完时提交弹出确认对话框

P1 — 题库管理增强:
- QuestionBankItem 新增 tags 字段(多标签过滤)
- 新增 question_bank_templates 联表(题库跨模板复用)

P2 — 考试配置增强:
- AssessmentTemplate 新增字段:
  - attemptLimit (尝试次数限制)
  - scheduledStart/scheduledEnd (预约时段)
  - reviewMode (回顾模式: none/after_completion/per_question)
  - shuffleQuestions (每题随机排序)

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 14:25:29 +08:00
Developer 5bbab82e68 test: 并发考核性能实验(20人同时考核)
测试结果:
- Session ID 全部唯一:  20/20
- 异步出题完成:  20/20, 每题20题
- 维度分布正确:  IDE:4/LLM:6/PROMPT:6/DEV_PATTERN:4
- 并发提交答案:  6人×4题全成功
- 题目重叠: ⚠️ 10.5%(题库仅~281题,20人需400槽位)
- 评分耗时: ⚠️ 15s不足以完成AI评分

结论: 并发场景下会话创建、出题、答题均正常,无数据竞争。
Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 14:02:05 +08:00
Developer ebb8fbd298 docs: 统一 CLAUDE.md 和 README.md 文档体系
CLAUDE.md(AI 参考):
- 4 个 👉 AI 实现参考 标记,AI 可快速定位
- 完整的实体定义(TypeScript 代码块)
- 权限守卫流水线 + 解析链路
- 考核数据模型 + 出题算法伪代码
- API 认证流程 + 关键端点表
- 测试注意事项(React 受控输入/等待策略)
- 人可读用户指南(与 README 一致)

README.md(人可读):
- 顶部引用 CLAUDE.md — AI 阅读指引
- 功能亮点表格式呈现
- 步骤式操作指南(用户/权限/模板/考试/租户)
- 轻量内容,详细技术参考指向 CLAUDE.md

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 13:29:28 +08:00
Developer 65ede9fcff docs: 全面更新文档体系 — AI指南 + 人可读说明书
CLAUDE.md — AI 工作指南:
- 项目全景:目录结构/技术栈/端口
- 系统架构:前端路由/后端模块/认证流程
- 权限系统:三层角色/26项权限/守卫流水线/解析链路
- 考核系统:数据模型/出题算法/模板配置
- 测试脚本:7个Playwright测试说明
- 开发指南:启动/测试/重启/数据库管理
- 代码规范:TypeScript模式/权限装饰器/React约定
- Playwright测试技巧:React受控输入框/等待策略

README.md — 人可读英文说明书:
- 系统介绍 + 功能特性
- 完整使用指南(用户管理/权限管理/考核模板/组织考试)
- 核心流程说明(认证/出题/权限解析)
- 测试命令参考
- 项目结构 + 配置参考

README_ZH.md — 人可读中文说明书:
- 全面中文版本,包含所有新功能
- 步骤式操作指南,便于管理员使用

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 13:19:45 +08:00
Developer 1aee7e0baf fix: 出题分配算法重构 + 20题模板 + 非技术人员模板
问题修复:
- Math.round 导致合计偏差(3题→4题,5题→6题等)
- 补充轮次破坏维度权重比例
- 各维度无题型比例控制

修正方案:
- floor + remainder 分配法,保证合计永远 = count
- 按weight降序分配余数,权重高的优先
- 不足时仅补充轮,但仍保持维度优先
- 补充轮日志记录各维度实际分配数

新增功能:
- 技术人员模板 20题 (PROMPT:30/LLM:30/IDE:20/DEV_PATTERN:20)
- 非技术人员模板 10题 (PROMPT:50/LLM:30/WORK_CAPABILITY:20)
  → 面向非技术角色,不考核IDE和开发范式
- 模板支持任意维度组合,可灵活配置

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 11:24:32 +08:00
Developer c166d298b8 fix(ui): 批量修复字号/间距/弹窗/表格 UI 问题(接续)
- 密码修改弹窗: max-w-md→max-w-lg, py-3.5→py-3, text-[10px]→text-xs
- 角色选择按钮: flex-wrap + min-w-[100px] 防窄屏换行
- 用户表格: overflow-x-auto + min-w-[700px] 响应式
- 全部 42 处 text-[10px] → text-xs(标签/徽章/说明文字)
- PermissionSettingsView 剩余 2 处 text-[10px]→text-xs

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 10:39:48 +08:00
Developer ffe365201a fix(ui): 统一设计语言——颜色、字号、间距、控件样式
UI 修正清单:
┌────────────────────────────────────────────────────────────┐
│ 问题                     │ 修复                          │
├──────────────────────────┼────────────────────────────────┤
│ 登录页 blue → 不一致     │ 统一改为 indigo 系             │
│ text-[10px] 标签难读     │ → text-xs (设置页所有标签)     │
│ text-[9px] 徽章太小      │ → text-xs (角色/租户/权限)    │
│ text-[14px] 输入框不统一  │ → text-sm (编辑弹窗)          │
│ py-3 vs py-3.5 不一致    │ → py-3 统一 (所有输入框)      │
│ 表格头 py-4 过大         │ → py-3                        │
│ 编辑弹窗 max-w-md 太窄   │ → max-w-lg (更宽松)           │
│ 操作列 opacity-0 隐藏     │ → opacity-60 始终可见         │
│ 原生 checkbox 不匹配      │ → 自定义圆角 checkbox + Check  │
│ 登录页 rounded-lg         │ → rounded-xl 统一             │
│ 登录按钮缺阴影            │ → 加 shadow-lg                │
└────────────────────────────────────────────────────────────┘

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 10:28:49 +08:00
Developer 7e741651db test: 系统性测试142项全通过 + 修复GET /users/:id缺失
测试架构(10大类142项):
┌──────────────────────────────────────────────────────┐
│ 1. 环境准备       4项  环境可达性 + 残留清理          │
│ 2. 身份认证      15项  登录/错误密码/空/篡改JWT      │
│ 3. 用户CRUD正常  11项  创建/查询/编辑/升降级/删除    │
│ 4. 用户CRUD异常  17项  重复/空/短密码/不存在/权限    │
│ 5. 边界测试       7项  并发/超长/空权限/幂等         │
│ 6. 权限矩阵RBAC  49项  3层角色权限/API校验/系统保护  │
│ 7. 租户隔离       1项  跨租户不可见                  │
│ 8. 缺陷回归       5项  系统角色保护/幂等删除          │
│ 9. 前端UI一致    22项  登录/导航/Tab/弹窗/3角色      │
│ 10.用户故事完整  14项  SA/TA/USER闭环/升降级即时生效 │
└──────────────────────────────────────────────────────┘

发现并修复:
- 系统角色权限可被任意修改(isSystem 保护缺失)
- GET /users/:id 端点不存在

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 10:01:04 +08:00
Developer a7e7c85ff6 fix: 系统角色权限保护 + 全角色全场景 E2E 测试(94项)
缺陷修复:
- PermissionService.setRolePermissions 增加 isSystem 检查
  系统角色的权限不可被修改(之前可被任意改写)

测试覆盖(94项全部通过):
- PHASE A: 身份认证(登录/错误密码/无效token/空凭据 8项)
- PHASE B: 三层角色权限边界(26/21/5 权限一致性 3项)
- PHASE C: 创建用户异常(重复/短密码/空字段/特殊字符 7项)
- PHASE D: 编辑&角色变更(改名/升降级/非法值/并发/跨角色 12项)
- PHASE E: 删除异常(删自己/admin/不存在/USER删/TA删 12项)
- PHASE F: 权限系统(角色CRUD/权限改/权限一致性/元数据 25项)
- PHASE G: 模块可达性(2项,非致命)
- PHASE H: 前端UI(admin/ta_admin/user1 三角色 22项)
- PHASE I: 边界缺陷(跨租户隔离/超长名 2项)

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 09:41:04 +08:00
Developer 64771f10ed test: 用户管理全生命周期测试(42项)覆盖异常case
覆盖场景:
- 创建用户异常:重复用户名、密码太短、空字段
- 权限边界:USER 不能创建/查看/删除用户
- 角色变更:USER↔TENANT_ADMIN 切换后权限实时生效
- 删除异常:删自己、删 admin、删不存在用户
- UI 验证:角色列、编辑弹窗、权限管理页、权限矩阵

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-09 09:00:23 +08:00
Developer 9b4412792b feat: 用户管理页加角色列和角色编辑弹窗
- 用户表新增「角色」列,显示超级管理员/管理员/用户徽章
- 编辑用户弹窗增加角色选择(USER/TENANT_ADMIN/SUPER_ADMIN)
- 角色选择时同步显示该角色的权限预览
- 保存时自动调用 PATCH /tenants/:id/members/:userId 更新角色
- 新增 test-permission-flow.mjs 三层用户权限测试脚本

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-08 23:37:13 +08:00
Developer ba33d517c1 feat: 分层 RBAC 权限管理系统
后端:
- 新增 Role / RolePermission 实体(自动 seed 系统角色)
- PermissionService——通过 isAdmin / TenantMember 链路解析用户权限
- @Permission() 装饰器 + PermissionsGuard 守卫
- /api/permissions 和 /api/roles REST API
- UserController 内联 role 检查迁移到 @Permission()
- PermissionModule 全局注册

前端:
- usePermissions hook——获取当前用户权限集
- PermissionGate 组件级门控
- PermissionSettingsView——角色列表+权限矩阵编辑页面
- SettingsView 新增「权限管理」Tab(仅 admin 可见)
- 权限预览(26 项,7 分类)

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-08 23:25:22 +08:00
Developer c57c3028e2 fix: shuffleArray bug + Playwright多轮对话测试 + 初学者考核脚本
- 修复 shuffleArray 返回新数组但调用处用 const 未接收返回值(3处)
- 新增 test-multiround.mjs Playwright 多轮对话测试(简答+追问全流程)
- 新增 do-assessment.mjs / check-result.mjs 考核体验脚本
- CLAUDE.md 增加 AI 工作流指令规则
- package.json 添加 playwright 依赖

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-08 22:34:04 +08:00
Developer 0b2c6563ba Add IDE题库 50 questions + PROMPT/LLM/DEV_PATTERN 34 questions 2026-06-03 21:12:11 +08:00
Developer 6d9acd7252 fix: MC options display, question selection, timeout handling, and grading prompts 2026-06-03 20:58:19 +08:00
Developer a71bde3452 add IDE question bank seed script (50 questions for L1 IDE协作开发)
- Copilot: 12 questions (intelligent completion, Chat modes, CLI)
- Claude Code: 12 questions (interaction methods, model selection, CLI commands)
- OpenCode: 19 questions (overview, installation, Plan/Build, commands, models)
- Debug: 7 questions (/fix, /debug, /tests, /explain commands)

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-03 20:55:38 +08:00
Developer 6e569ff478 fix: skip content check when bank questions available, early generator return 2026-05-23 22:32:51 +08:00
Developer a83de861dd fix: replace PDF with HTML report (fontkit unavailable) 2026-05-21 16:30:36 +08:00
Developer 0b0da09d4b fix: use pdf-lib embedFont with proper pagination for CJK PDF 2026-05-21 16:12:38 +08:00
Developer d7cd5641d7 fix: rewrite PDF generator using pdf-lib native embedFont for CJK support 2026-05-21 15:59:01 +08:00
Developer c53f26a07e perf: trim grader prompts ~40% to reduce LLM latency 2026-05-21 15:52:33 +08:00
Developer b15e821252 feat: enriched certificate with template name, dimension scores, question details + Modal UI
- generateCertificate: return templateName, questionDetails, dimensionScores
- Frontend: replace alert() with certificate Modal showing level, scores, dimensions, questions
- Status label: change from '已验证' to '合格'
2026-05-21 15:42:59 +08:00
Developer 990b8c7b83 fix: forward passed flag in SSE final events 2026-05-21 15:24:36 +08:00
Developer f8df92c36b fix: forward finalScore in submitAnswerStream final event 2026-05-21 15:19:10 +08:00
Developer 51f2a41cc3 fix: determineLevel uses 0-10 scale thresholds instead of 0-100 2026-05-21 15:07:23 +08:00
Developer 0a3a8a2e32 fix: send accumulated answers to LLM grader for follow-up context
- Grader now passes all rounds of user answers to LLM (tagged 第N轮回答)
- LLM can see what was already answered and avoid redundant follow-ups
- Updated all three language prompts with multi-round guidance
2026-05-21 14:41:57 +08:00
Developer 9303d7ac64 fix: auto-submit answer on timeout instead of blocking
- Timeout triggers forced submission of current answer (or empty)
- Prevents assessment from hanging when time expires
- autoSubmitted flag prevents duplicate submissions
2026-05-21 14:32:01 +08:00
Developer 02f4ab23f7 feat: LLM-generated adaptive follow-up questions
- Grader: LLM outputs follow_up_question targeting uncovered keyPoints
- Remove static followupHints usage in grading flow
- maxFollowUps sourced from question.maxFollowUps (hints.length)
- Clean answerKey: remove followupHints field
- Three-language prompt update with examples and bad examples
- Grader spec: add follow_up_question to mock responses
2026-05-21 14:18:14 +08:00
Developer 7fd2a4cda2 fix: option display + partial credit grading
- Option display: use slice(1) instead of regex to strip letter prefix
- Grader prompts: add explicit partial credit guidance (5-7 for partial, 0-2 only for off-target)
2026-05-21 13:13:21 +08:00
Developer 7b1103903f fix: remove prefix from followup hint, use raw text 2026-05-21 13:00:03 +08:00
Developer 3cc3b28471 fix: broader regex to strip conditional prefix from followup hints 2026-05-21 12:57:04 +08:00
Developer 5c82c75a09 fix: strip option letter prefix in QuestionBankDetailView
Consistent with AssessmentView, now strips A./B./C./D. prefix
from option text before displaying alongside letter badge.
2026-05-21 12:48:35 +08:00