人類蛋白質體的擴張：微蛋白與 peptidein

機制圖：ncORF 如何被判定為蛋白質基因或 peptidein

證據三來源 → 分層 → 加上演化約束與功能篩選 → 判定。

這篇 Nature 論文由國際 TransCODE 聯盟整合「質譜蛋白質體、HLA 免疫胜肽體、核糖體定序」三種證據，為 7,264 個非典型開放閱讀框（ncORF）建立蛋白質層級的證據地圖，並提出一個新的註解概念：**peptidein**。

核心問題：人類基因體是否編碼遠多於約 19,500 個典型蛋白質基因？過去十年發現數千個 ncORF 會被轉譯成「微蛋白（microprotein）」。
做法：建立兩個大型 PeptideAtlas — 非 HLA 版（35 億條質譜）與 HLA 版（2.4 億條質譜），以非常嚴格的 FDR（蛋白層級 <0.1%）搜尋這 7,264 個 ncORF。
主要發現：
約 25%（1,785 / 7,264）的 ncORF 在 HLA 免疫胜肽體資料中被偵測到。
傳統胰蛋白酶質譜只測到約 2.5%（183 個）——因為微蛋白太短，難以符合 HUPO-HPP 的兩條胜肽、涵蓋 18 個胺基酸的標準。
建立一套分層（tier）系統與標準化註解流程；GENCODE 已把其中數個 ncORF 正式註解為蛋白質基因。

把長期被忽略的「暗蛋白質體（dark proteome）」正式帶進基因註解體系（GENCODE / UniProt / HUPO-HPP）。
癌症免疫治療：許多 ncORF 胜肽以 HLA 呈現，可成為癌症專一的「隱性抗原」靶點。
代表案例：lncRNA OLMALINC 上的 c10riboseqorf92 是一個 pan-essential 的 peptidein，敲除會讓多種癌細胞失去活性，且與有絲分裂、DNA 損傷調控相關。

這是論文重點整理（資料來源：Nature，DOI 10.1038/s41586-026-10459-x），非醫療建議；細節請以原文為準。