Knotest 平台
評估、監測並記錄 AI 系統。
Knotest 將模型測試、漂移監測、風險登記冊與可審計報告整合到同一流程,支援準備走向生產的 AI 團隊。
01 | 資料品質審查資料品質
審查資料品質
再核准模型
透過 ISO/IEC 5259。Knotest 檢查準確性、完整性、一致性、洩漏風險與代表性,協助團隊在生產前了解資料集限制。
品質概況
6 通過2 需處理
資料完整性通過
檢查資料集是否可讀取、可追溯,並能與預期檔案或紀錄匹配。
完整度通過
檢查必要欄位、標籤、目標或標註是否足以支援審查。
有效性需處理
檢查數值、檔案、幾何與格式是否可用於評估。
一致性需處理
檢查任務結構、標籤、結構描述與紀錄關係是否彼此一致。
唯一性通過
檢查可能扭曲評估結果的重複樣本或紀錄。
代表性通過
檢查類別、群組、解析度或目標對於預定審查是否足夠平衡。
洩漏風險通過
檢查由目標衍生的欄位或捷徑,避免評估結果被高估。
冗餘通過
檢查重複或高度相似訊號,避免增加雜訊或膨脹信心。
02 | 模型評估測試模型行為
測試模型行為
在真實條件下
透過 100+ 測試覆蓋表現、穩健性、公平性、可解釋性、對抗情境,以及概念或資料漂移。用結果判斷哪些已準備好、哪些有限制、哪些需要更多工作。
覆蓋每種支援任務類型與資料集的標準化及校準品質指標。
測試情境
基準
模型覆蓋
表格資料
分類迴歸ONNX
視覺
分類偵測分割OBBONNXPyTorch
審查指標
Accuracy
F1
AUROC / AUPR
mAP 50:95
mIoU
RMSE / R2
03 | 風險登記冊
用可審查台帳追蹤 AI 風險
圍繞以下標準建立 AI 治理紀錄: ISO/IEC 42001。Knotest 記錄風險、控制措施、責任人、目前狀態與剩餘暴露,讓審查基於可追溯證據。
AI 風險登記冊
| 風險 | 控制 | 狀態 | 等級 |
|---|---|---|---|
| R-42001-014 | AIMS 權責缺口 | 固有 | 高 |
| R-23894-021 | 公平性切片漂移 | 已緩解 | 中 |
| R-TS42119-006 | 評估證據缺口 | 剩餘 | 中 |
| R-QA-088 | 破壞敏感度 | 已緩解 | 低 |
R-42001-014
AIMS 權責缺口
等級: 高
R-23894-021
公平性切片漂移
等級: 中
R-TS42119-006
評估證據缺口
等級: 中
R-QA-088
破壞敏感度
等級: 低