常见问题与排障
文档目标
本文档用于汇总平台侧常见问题类型、排障入口和跳转规则,帮助读者在面对“登录不通、授权异常、租户隔离疑似失效、联邦或 SCIM 问题”时快速进入正确专题,而不是在多个页面之间盲目切换。
适用角色
- 系统管理员
- 平台运维
- 实施支持
适用场景
- 登录不可用或管理后台无法进入
- 授权异常、活动令牌异常或访问状态异常
- 租户隔离异常、越权疑似或禁用租户行为不符合预期
- 外部联邦、
SAML或SCIM异常
覆盖范围 / 不覆盖范围
覆盖:
- 平台级问题分类与优先入口
- 平台与租户边界的快速判断
- 各类异常对应的专题和
SOP分流方式
不覆盖:
- 研发代码修复方案
- 第三方产品控制台的详细操作
- 单租户日常用户、应用和角色配置手册
核心入口与系统落点
- 健康检查:
/health/live、/health/ready - 运维接口:
GET /api/system/ops_health_detail、POST /api/system/ops_detail - 系统后台:
Operations、Audit、Tenants、Federation、Tokens、Authorizations - 只读运维入口:IDS MCP 运维入口
建议处理顺序
- 先判断是平台级、租户级还是单个接入方问题。
- 先看健康检查和
Operations,确认是否为整体可用性或依赖问题。 - 若怀疑管理动作、越权或会话异常,再看
Audit、Tokens、Authorizations。 - 若问题发生在联邦、
SAML或SCIM,切到对应治理入口与专题文档。 - 若确认只影响单租户内对象维护,转到租户公开文档或平台接入参考继续处理。
常见判断原则
- 平台登录不可用:先查健康与平台认证入口,再决定是否进入 平台级认证与接入治理。
- 授权或令牌异常:先看
Authorizations与Tokens,再结合Audit判断是否是历史授权、活动会话或近期变更导致。 - 租户隔离异常:先看租户状态和上下文,再决定是否进入 租户治理 或 跨租户问题排查 SOP。
- 联邦 /
SAML/SCIM问题:先看相关治理页与最近失败,再结合接入文档确认是否是配置边界、协议限制或租户禁用语义触发。 - 只影响单租户内部维护:不要继续留在平台文档里,应转到 租户运营配置文档。
关联文档
- 上游导航:平台运营配置文档
- 关联专题:平台可观测性与健康检查、平台安全运营、租户治理
- 执行文档:跨租户问题排查 SOP、平台审计排查 SOP、平台安全事件处置 SOP
- 参考文档:租户运营配置文档、平台接入与联调参考