Story 9.7: 稳定性验证（10 次连续运行）

Status: ready-for-dev

Story

作为测试开发者，我想要验证所有测试的稳定性，以便确保测试可以可靠地运行。

Acceptance Criteria

Given 所有业务测试已完成并隔离 When 连续运行测试 10 次 Then 验收标准如下：

测试通过率 100%
- 10/10 次运行全部通过
- 无 flaky 失败
- 无超时失败
性能指标达标
- 平均执行时间 ≤ 10 分钟/次
- 无明显性能衰减
并行执行稳定
- 并行模式（4 workers）10 次运行 100% 通过
- 串行模式 10 次运行 100% 通过

Tasks / Subtasks

[ ] Task 1: 创建稳定性测试脚本 (AC: #1)
- Subtask 1.1: 编写 bash 脚本实现 10 次连续运行
- Subtask 1.2: 添加通过/失败统计
- Subtask 1.3: 添加执行时间记录和平均时间计算
[ ] Task 2: 执行并行模式稳定性测试 (AC: #1, #2, #3)
- Subtask 2.1: 使用 4 workers 运行 10 次测试
- Subtask 2.2: 记录每次运行的通过率和执行时间
- Subtask 2.3: 分析失败的测试（如有）
[ ] Task 3: 执行串行模式稳定性测试 (AC: #1, #2, #3)
- Subtask 3.1: 使用 1 worker 运行 10 次测试
- Subtask 3.2: 记录每次运行的通过率和执行时间
- Subtask 3.3: 对比并行和串行模式的性能差异
[ ] Task 4: 分析结果并生成报告 (AC: #1, #2, #3)
- Subtask 4.1: 统计总体通过率
- Subtask 4.2: 计算平均执行时间和性能衰减
- Subtask 4.3: 记录 flaky 失败（如有）并分析原因
- Subtask 4.4: 更新 Story 文档和 sprint-status

Dev Notes

Epic 9 背景与目标

Epic 9: 残疾人管理完整 E2E 测试覆盖（含并行隔离）

为残疾人管理功能编写完整的、真正验证业务功能的 E2E 测试，并确保测试可以与未来的区域管理测试并行运行。

Epic 9 Story 依赖关系：

Story 9.1：照片上传功能测试 ✅ Done
Story 9.2：银行卡管理功能测试 ✅ Done
Story 9.3：备注管理功能测试 ✅ Done
Story 9.4：回访记录管理测试 ✅ Done
Story 9.5：完整流程测试（CRUD）✅ Done
Story 9.6：测试隔离与并行执行验证 ✅ Done
Story 9.7（本故事）：稳定性验证（10次连续运行）🔄 当前

本 Story 的核心目标

稳定性验证的意义：

Flaky 测试检测：10 次连续运行可以暴露偶发性失败的测试
性能基准建立：建立测试执行时间的基准线
并行执行信心：验证并行模式在多次运行中的稳定性
Epic 9 完成条件：100% 通过率是 Epic 9 完成的必要条件

成功标准：

10/10 通过 = Epic 9 完成 ✅
< 10/10 通过 = 分析失败原因并修复

待验证的测试文件清单

Epic 9 已完成的所有测试文件：

测试文件	测试数量	预计时间	验证项
`disability-person-photo.spec.ts`	8	~1.1m	照片上传、格式支持、删除
`disability-person-bankcard.spec.ts`	5	~0.8m	银行卡 CRUD、多张管理
`disability-person-note.spec.ts`	4	~0.6m	备注 CRUD
`disability-person-visit.spec.ts`	4	~0.7m	回访记录 CRUD
`disability-person-crud.spec.ts`	16	~2.0m	完整 CRUD 流程

总计：37 个测试，预计执行时间 ~5.2 分钟（4 workers）

稳定性测试脚本

脚本位置： web/tests/e2e/scripts/run-stability-test.sh

#!/bin/bash
# Epic 9 稳定性测试脚本
# 运行所有残疾人管理测试 10 次，验证稳定性

set -e  # 遇到错误立即退出

# 配置
RUNS=10
PROJECT_ROOT="/mnt/code/188-179-template-6"
WEB_DIR="${PROJECT_ROOT}/web"
PASSED=0
FAILED=0
TIMES=()

# 切换到 web 目录
cd "${WEB_DIR}" || exit 1

echo "========================================="
echo "Epic 9 稳定性验证测试"
echo "========================================="
echo "运行次数: ${RUNS}"
echo "测试范围: 残疾人管理所有测试 (37 个测试)"
echo "开始时间: $(date)"
echo ""
echo "========================================="
echo ""

# 运行测试
for i in $(seq 1 ${RUNS}); do
  echo "=== 运行 #${i}/${RUNS} ==="
  START=$(date +%s)

  # 运行测试（4 workers 并行）
  if pnpm test:e2e:chromium --workers=4; then
    PASSED=$((PASSED + 1))
    echo "✅ 运行 #${i} 通过"
  else
    FAILED=$((FAILED + 1))
    echo "❌ 运行 #${i} 失败"
  fi

  END=$(date +%s)
  DURATION=$((END - START))
  TIMES+=($DURATION)
  echo "⏱️  耗时: ${DURATION}s"
  echo ""
done

# 计算统计数据
TOTAL=$((PASSED + FAILED))
PASS_RATE=$((PASSED * 100 / TOTAL))
AVG_TIME=$(awk '{sum+=$1} END {print sum/NR}' <<< "${TIMES[@]}")
MIN_TIME=$(printf "%s\n" "${TIMES[@]}" | sort -n | head -1)
MAX_TIME=$(printf "%s\n" "${TIMES[@]}" | sort -n | tail -1)

# 输出结果
echo "========================================="
echo "稳定性测试结果"
echo "========================================="
echo "通过: ${PASSED}/${TOTAL} (${PASS_RATE}%)"
echo "失败: ${FAILED}/${TOTAL}"
echo ""
echo "执行时间统计:"
echo "  平均: ${AVG_TIME}s"
echo "  最快: ${MIN_TIME}s"
echo "  最慢: ${MAX_TIME}s"
echo ""
echo "结束时间: $(date)"
echo "========================================="

# 判断结果
if [ $PASSED -eq $TOTAL ]; then
  echo ""
  echo "🎉 Epic 9 稳定性验证通过！100% 成功率！"
  echo "✅ Epic 9 可以标记为完成"
  exit 0
else
  echo ""
  echo "⚠️  稳定性不足，需要修复失败的测试"
  echo "❌ 请分析失败原因并修复后重新运行"
  exit 1
fi

串行模式稳定性测试脚本

#!/bin/bash
# Epic 9 串行模式稳定性测试脚本
# 用于对比并行和串行模式的性能差异

RUNS=10
PROJECT_ROOT="/mnt/code/188-179-template-6"
WEB_DIR="${PROJECT_ROOT}/web"
PASSED=0
FAILED=0
TIMES=()

cd "${WEB_DIR}" || exit 1

echo "========================================="
echo "Epic 9 串行模式稳定性验证"
echo "========================================="

for i in $(seq 1 ${RUNS}); do
  echo "=== 运行 #${i}/${RUNS} (串行模式) ==="
  START=$(date +%s)

  # 运行测试（1 worker 串行）
  if pnpm test:e2e:chromium --workers=1; then
    PASSED=$((PASSED + 1))
    echo "✅ 运行 #${i} 通过"
  else
    FAILED=$((FAILED + 1))
    echo "❌ 运行 #${i} 失败"
  fi

  END=$(date +%s)
  DURATION=$((END - START))
  TIMES+=($DURATION)
  echo "⏱️  耗时: ${DURATION}s"
  echo ""
done

# 输出结果（同上）
# ...

单文件稳定性测试（调试用）

#!/bin/bash
# 单文件稳定性测试 - 用于调试特定测试文件

TEST_FILE="${1:-disability-person-crud.spec.ts}"
RUNS=10

echo "测试文件: ${TEST_FILE}"
echo "运行次数: ${RUNS}"

for i in $(seq 1 ${RUNS}); do
  echo "=== 运行 #${i} ==="
  pnpm test:e2e:chromium "${TEST_FILE}" --workers=2
done

Flaky 失败分析指南

如果出现偶发性失败，按以下步骤分析：

查看失败截图

# 查看 test-results 目录
ls -la web/tests/e2e/test-results/

查看错误上下文

# 查看自动生成的错误上下文
cat web/tests/e2e/test-results/**/error-context.md

分析失败类型
- 超时失败：增加超时时间或优化测试逻辑
- 元素未找到：添加等待或改进选择器
- 数据冲突：检查唯一性策略
- 网络问题：重试或使用 mock 数据

修复后重新验证

# 单文件验证
cd web
pnpm test:e2e:chromium disability-person-xxx.spec.ts --workers=2 --repeat=10

Project Structure Notes

E2E 测试目录结构：

web/tests/e2e/
├── fixtures/          # 测试文件（图片、文档）
├── pages/            # Page Object
│   └── admin/
│       └── disability-person.page.ts
├── specs/            # 测试用例
│   └── admin/
│       ├── disability-person-photo.spec.ts
│       ├── disability-person-bankcard.spec.ts
│       ├── disability-person-note.spec.ts
│       ├── disability-person-visit.spec.ts
│       └── disability-person-crud.spec.ts
├── scripts/          # 测试脚本（新增）
│   ├── run-stability-test.sh
│   ├── run-stability-serial.sh
│   └── run-stability-single.sh
└── playwright.config.ts

Previous Story Intelligence

Story 9.6 (测试隔离与并行执行验证) 的经验：

主要改进：

✅ 所有测试移除了 test.describe.serial
✅ 添加了 TEST_TIMESTAMP/TEST_PREFIX 模式
✅ 实现了完整的 test.afterEach 清理机制
✅ 验证了并行执行稳定性（2 workers，8/8 通过）
✅ 性能提升：4 workers 下速度提升 3 倍（3.3m → 1.1m）

并行执行验证结果（来自 Story 9.6）：

photo.spec.ts:  8 passed (2.2m) with 2 workers  ✅
note.spec.ts:    8 passed (1.1m) with 2 workers  ✅
photo.spec.ts:   8 passed (3.3m) with 1 worker   ✅
photo.spec.ts:   8 passed (1.1m) with 4 workers  ✅ (速度提升 3x)

关键模式（Story 9.6 建立）：

TEST_TIMESTAMP 在 test.describe 级别声明
createdTestData 数组用于跟踪创建的记录
test.afterEach 统一清理机制
使用不同的省市组合避免并发冲突

Story 9.1-9.5 的模式总结：

✅ 所有测试使用时间戳生成唯一 ID（正确模式）
✅ 文件上传使用固定的测试文件路径
✅ 备注和回访记录使用唯一内容
⚠️ 需要验证 10 次运行的稳定性

Git Intelligence Summary

Recent Commits:

9e3c2dcb - test(e2e): 完成 Story 9.6 代码审查 - 测试隔离与并行执行
81ba705a - docs(e2e): 创建 Story 10.5 - 编辑订单测试
241c2491 - test(e2e): 完成 Story 10.4 - 创建订单测试

Epic 9 完成状态：

Story 9.1-9.5：所有业务测试已完成 ✅
Story 9.6：并行隔离验证已完成 ✅
Story 9.7：稳定性验证（当前）🔄

测试文件模式：

测试文件命名：disability-person-{feature}.spec.ts
Page Object 方法命名：动词+名词
选择器策略：data-testid 优先

References

源文档引用：

[Source: _bmad-output/planning-artifacts/epics.md#Epic-9-Story-9.7] - 完整业务需求
[Source: _bmad-output/planning-artifacts/architecture.md#Testing-Standards] - 测试稳定性标准
[Source: web/tests/e2e/playwright.config.ts] - Playwright 配置文件

前置 Story 参考：

[Source: _bmad-output/implementation-artifacts/9-1-photo-upload-tests.md] - 照片上传测试
[Source: _bmad-output/implementation-artifacts/9-2-bankcard-tests.md] - 银行卡测试
[Source: _bmad-output/implementation-artifacts/9-3-note-tests.md] - 备注测试
[Source: _bmad-output/implementation-artifacts/9-4-visit-tests.md] - 回访记录测试
[Source: _bmad-output/implementation-artifacts/9-5-crud-tests.md] - CRUD 测试
[Source: _bmad-output/implementation-artifacts/9-6-parallel-isolation.md] - 并行隔离验证

Playwright 文档：

Dev Agent Record

Agent Model Used

Created by create-story workflow based on epics.md and previous stories

Debug Log References

Completion Notes List

待开发完成后填写

File List

创建的文件：

_bmad-output/implementation-artifacts/9-7-stability-validation.md - 本 story 文档
web/tests/e2e/scripts/run-stability-test.sh - 稳定性测试脚本（待创建）
web/tests/e2e/scripts/run-stability-serial.sh - 串行模式脚本（待创建）
web/tests/e2e/scripts/run-stability-single.sh - 单文件测试脚本（待创建）

测试的文件：

web/tests/e2e/specs/admin/disability-person-photo.spec.ts
web/tests/e2e/specs/admin/disability-person-bankcard.spec.ts
web/tests/e2e/specs/admin/disability-person-note.spec.ts
web/tests/e2e/specs/admin/disability-person-visit.spec.ts
web/tests/e2e/specs/admin/disability-person-crud.spec.ts

9-7-stability-validation.md 12 KB Histórico Raw