TW202400252A

TW202400252A - 用於安全基因組整合之新位點及其使用方法

Info

Publication number: TW202400252A
Application number: TW112116119A
Authority: TW
Inventors: ＣＬ蘇; 馬克Ｊ富島; 康納Ｂ麥卡里福; 丹查理斯二世威爾金森; 班傑明班尼特
Original assignee: 美商藍岩醫療公司
Priority date: 2022-04-28
Filing date: 2023-04-28
Publication date: 2024-01-01
Also published as: WO2023212722A1

Abstract

本發明係關於基因改造細胞，其自用於安全基因組整合及穩定表現之位點以持續表現量表現一或多個轉殖基因。本發明亦提供製造該等細胞之方法及可用於製造該等細胞之核酸載體。

Description

用於安全基因組整合之新位點及其使用方法

在所謂的「基因組安全港」位點處將轉殖基因安全性地整合至基因組中已經做了許多的努力。基因組中之安全港位點為其中可引入核酸(例如外源基因)而不妨礙相鄰基因之表現或調節且因此不妨礙細胞之正常功能的彼等位點。三個基因組位點- AAVS1、 CCR5及 ROSA26-傳統上視為安全港位點且已用於大部分靶向轉殖基因整合中。 AAVS1為用於AAV基因組之罕見基因組整合的區域且已發現其允許穩固表現而不妨礙細胞功能。 CCR5係因為天然存在之CCR5-Δ32突變導致HIV抗性表現型而偶然鑑別出的；基因之可處置性使其成為理想整合位點。 ROSA26基因座最初經由慢病毒基因捕獲方法在小鼠胚胎幹細胞中鑑別出。

雖然此等基因組安全港位點允許在給定細胞環境下之穩固轉殖基因表現，但其可能不支援其他細胞譜系中或細胞狀態變化之後的如實轉殖基因表現。此係因為轉殖基因與宿主細胞基因組情形之間的互逆相互相用可影響轉殖基因之表現，導致轉殖基因表現之衰減或完全沉默(例如，經由DNA甲基化)。更嚴重地，基因組整合之此等位點亦可影響插入位點附近內源基因之表現，由此影響正常宿主細胞功能。

本發明至少部分地基於鑑別基因組中在不同細胞類型中及在不同細胞狀態(包括成熟期)下保持轉錄活性之基因間位點，使得整合於其中之相關外源核苷酸序列(例如編碼蛋白質或RNA之轉殖基因)隨著細胞經歷增殖及細胞狀態變化而保持表現及功能性。

因此，在一個態樣中，本發明提供基因改造細胞，例如哺乳動物(例如人類)細胞，其包含整合於細胞之基因組中之持續轉錄活性有效負載區(STAPLR)中的外源核苷酸序列，其中STAPLR選自由以下組成之群： RPL34基因與 OSTC基因之間的基因間區域； ACTB基因與 FSCN1基因之間的基因間區域； AKIRIN1基因與 NDUFS5基因之間的基因間區域； PRDX1基因與 AKR1A1基因之間的基因間區域； PTGES3基因與 NACA基因之間的基因間區域； MLF2基因與 PTMS基因之間的基因間區域； RAB13基因與 RPS27基因之間的基因間區域； JTB基因與 RAB13基因之間的基因間區域； AKR1A1基因與 NASP基因之間的基因間區域； NDUFS5基因與 MACF1基因之間的基因間區域； SRSF9基因與 DYNLL1基因之間的基因間區域； MYL6B基因與 MYL6基因之間的基因間區域； GPX1基因與 RHOA基因之間的基因間區域； HNRNPA2B1基因與 CBX3基因之間的基因間區域； ROMO基因與 RBM39基因之間的基因間區域； PA2G4基因與 RPL41基因之間的基因間區域；及 NDUFB10與 RPS2基因之間的基因間區域。

在一些實施例中， RPL34基因與 OSTC基因之間的基因間區域包含與SEQ ID NO: 1至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 1充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， ACTB基因與 FSCN1基因之間的基因間區域包含與SEQ ID NO: 2至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 2充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， AKIRIN1基因與 NDUFS5基因之間的基因間區域包含與SEQ ID NO: 3至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 3充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， PRDX1基因與 AKR1A1基因之間的基因間區域包含與SEQ ID NO: 4至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 4充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， PTGES3基因與 NACA基因之間的基因間區域包含與SEQ ID NO: 5至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 5充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， MLF2基因與 PTMS基因之間的基因間區域包含與SEQ ID NO: 6至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 6充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， RAB13基因與 RPS27基因之間的基因間區域包含與SEQ ID NO: 7至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 7充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， JTB基因與 RAB13基因之間的基因間區域包含與SEQ ID NO: 8至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 8充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， AKR1A1基因與 NASP基因之間的基因間區域包含與SEQ ID NO: 9至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 9充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， NDUFS5基因與 MACF1基因之間的基因間區域包含與SEQ ID NO: 10至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 10充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， SRSF9基因與 DYNLL1基因之間的基因間區域包含與SEQ ID NO: 11至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 11充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， MYL6B基因與 MYL6基因之間的基因間區域包含與SEQ ID NO: 12至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 12充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， GPX1基因與 RHOA基因之間的基因間區域包含與SEQ ID NO: 13至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 13充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， HNRNPA2B1基因與 CBX3基因之間的基因間區域包含與SEQ ID NO: 14至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 14充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， ROMO基因與 RBM39基因之間的基因間區域包含與SEQ ID NO: 15至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 15充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， PA2G4基因與 RPL41基因之間的基因間區域包含與SEQ ID NO: 16至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 16充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

在一些實施例中， NDUFB10基因與 RPS2基因之間的基因間區域包含與SEQ ID NO: 97至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 97充分類似之核苷酸序列，如序列功能保持完整(例如對細胞無不良作用)所需要。

本文亦提供產生此等基因改造哺乳動物細胞之方法，以及用於將相關核苷酸序列引入本文中之新基因組整合位點中的DNA構築體。因此，在一個態樣中，本發明提供用於修飾哺乳動物細胞之方法，包含將相關核苷酸序列(亦即外源核苷酸序列)整合至本文中所描述之STAPLR中。在一些實施例中，整合步驟藉由使用以下進行：CRISPR/Cas系統；Cre/Lox系統；FLP-FRT系統；TALEN系統；ZFN系統；歸巢核酸內切酶(homing endonuclease)；隨機整合；同源重組；轉位酶；或非核酸酶依賴性病毒載體，視情況選自反轉錄病毒載體、AAV載體及慢病毒載體。在其他實施例中，CRISPR/Cas系統包含導引RNA，且其中STAPLR為(i) RPL34基因與 OSTC基因之間的基因間區域且gRNA選自SEQ ID NO: 25-32，(ii) ACTB基因與 FSCN1基因之間的基因間區域且gRNA選自SEQ ID NO: 33-54，(iii) AKIRIN1基因及 NDUFS5基因之間的基因間區域且gRNA選自SEQ ID NO: 55-70，或(iv) PRDX1基因與 AKR1A1基因之間的基因間區域且gRNA選自SEQ ID NO: 71-92。

在一些實施例中，CRISPR/Cas系統包含第I型、第II型、第III型、第IV型、第V型之gRNA依賴性核酸酶或其變異體。在其他實施例中，CRISPR/Cas系統包含選自由以下組成之群之gRNA依賴性核酸酶：Cas9、Cpf1、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas12、Cas13、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、CasX、CasY、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、CasPhi、MAD7及Csf4。

在另一態樣中，本發明提供DNA分子，其包含由5'同源區(HR)及3' HR側接之相關核苷酸序列，其中5' HR及3' HR分別與本文中所描述之STAPLR中的第一基因組區(GR)及第二GR至少85% (例如至少90%、95%、96%、97%、98%或99%)同源。在一些實施例中，5' HR及3' HR中之各者獨立地為約至少50、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450、至少500、至少550、至少600、至少650、至少700、至少750、至少800、至少850、至少900、至少950、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、至少1800、至少1900或至少2000個鹼基對長。在一些實施例中，HR各自為200至2000 (例如300至2500、400至2000或500至1500)個鹼基對長。在其他實施例中，5'及3' HR分別與SEQ ID NO: 17及18、SEQ ID NO: 19及20、SEQ ID NO: 21及22、SEQ ID NO: 23及24、SEQ ID NO: 93及94或SEQ ID NO: 95及96至少90%同源。

在一些實施例中，外源核苷酸序列或相關核苷酸序列包含轉殖基因。在其他實施例中，轉殖基因包含編碼序列(例如用於蛋白質或RNA)及一或多個調節子元件(regulator element)。在一些實施例中，一或多個調節子元件包括引導編碼序列轉錄之持續型或可誘導型啟動子。在一些實施例中，轉殖基因編碼治療性蛋白質(例如，其缺乏或缺陷導致諸如遺傳性疾病之疾病的蛋白質、細胞介素或重組抗原受體)；細胞標記物；或調節細胞之分化狀態或活性的蛋白質(例如，再程式化因子)。在一些實施例中，轉殖基因編碼SOX10、IL-10、IL-12、CD19t或ThPOK。

在本發明之一些實施例中，哺乳動物細胞為人類細胞。在一些實施例中，哺乳動物細胞(例如人類細胞)為多潛能幹細胞(PSC；例如誘導性PSC (iPSC)或ESC)。在一些實施例中，哺乳動物細胞(例如人類細胞)為a)免疫系統中之細胞(例如T細胞、自然殺手細胞、樹突細胞、巨噬細胞/單核球或其造血祖細胞或前驅細胞)；b)心血管系統中之細胞(例如心室心肌細胞、結節細胞或其心肌祖細胞或前驅細胞)；c)代謝系統中之細胞(例如肝細胞或胰臟β細胞或其祖細胞或前驅細胞)；d)中樞神經系統中之細胞(例如感覺神經元、運動神經元、仲介神經元、微膠質細胞、寡樹突細胞或其祖細胞或前驅細胞)；e)肌細胞(例如骨骼肌細胞或平滑肌細胞或其祖細胞或前驅細胞)；f)脂肪細胞或其祖細胞或前驅細胞；或g)眼系統中之細胞(例如視網膜色素上皮細胞、感光受體細胞或其祖細胞或前驅細胞)。本發明之額外細胞類型描述於下文中。

本文亦提供包含本文中之基因工程化細胞及醫藥學上可接受之載劑的醫藥組合物，及包含如本文中所揭示之DNA分子的基因編輯系統及用於將DNA分子(例如核酸酶及gRNA)上之相關核苷酸序列併入至STAPLR中的必需基因編輯系統。

在另一態樣中，本發明提供用於鑑別哺乳動物細胞之基因組中之持續轉錄活性有效負載區(STAPLR)的方法，該方法包含：(i)對一組兩種或更多種哺乳動物細胞類型進行單細胞RNA定序分析，其中定序分析針對各細胞類型分配一個獨特轉錄組；(ii) 轉錄組中之組成基因(constituent gene)分配一個盛行率分數，其中盛行率分數代表含有至少一種基因轉錄本之哺乳動物細胞類型在哺乳動物細胞類型之組中的分率；(iii)鑑別哺乳動物細胞之基因組中組成基因之鄰近基因，其中鄰近基因不與組成基因重疊；(iv)確定非重疊基因對或包含步驟(iii)中所鑑別之三個或更多個基因之區域的鄰近分數，其中鄰近分數為基因對中或區域中之個別基因盛行率分數之結果；(v)對鄰近分數排序；及(vi)基於高排序選擇非重疊基因對或包含三個或更多個非重疊基因之區域，藉此鑑別所選基因對或區域之基因之間的基因間區域為STAPLR。在一些實施例中，該方法進一步包含(vii)選擇STAPLR中之可靶向基因間子區域；及(viii)在所選子區域處插入轉殖基因，其中持續轉殖基因或基因線路之轉錄。在一些實施例中，可靶向子區域包含：無已知啟動子或強化子區、最小數目之保守區、重複區、表觀遺傳標記及/或酶超敏區，及/或核酸酶為CRISPR核酸酶。在一些實施例中，其中基因間區域為至少30 (例如至少40、至少50、至少75或至少100)個鹼基對長，及/或不包含或包含最小數目之啟動子區、CpG島及H3K4Me1表觀遺傳標記、H3K4Me3表觀遺傳標記、H3K27Ac表觀遺傳標記、DNase I超敏區、保守區或重複區。

本發明之其他特徵、目標及優勢在以下具體實施方式中顯而易知。然而，應理解，具體實施方式雖然指示本發明之實施例及態樣，但仍僅藉助於說明而非限制的方式給出。對於熟習此項技術者而言，在本發明之範圍內的各種改變及修正將自具體實施方式變得顯而易知。

對相關申請案之交叉參考本申請案主張2022年4月28日申請之美國臨時申請案第63/336,248號之優先權，其內容以全文引用之方式併入本文中。

序列表本申請案含有以ASCII格式以電子方式提交且以全文引用之方式併入本文中之序列表。2023年4月27日創建之序列表的電子原稿命名為025450_TW017_SL.xml且大小為379,951位元組。

基因工程化細胞為細胞療法之重要工具。但因為細胞經歷增殖，或細胞狀態或活體內環境變化，工程化細胞中之人工基因線路通常隨時間推移而藉由轉殖基因沉默而被顛覆。因此，需要鑑別對於轉殖基因整合安全且亦提供在整個細胞類型、細胞狀態及活體內環境轉錄方面保持開放之染色質圖譜(chromatin landscape)的基因組區域。整合轉殖基因至此位點中將允許轉殖基因在細胞療法產品之壽命期間保持轉錄活性。

本文中提供適用於實現轉殖基因在各種細胞或分化狀態中之表現而不影響可能不利於細胞或細胞用作療法之目的之內源基因表現的組合物(例如核酸分子及細胞之組合物)及方法(例如用於基因組(基因)工程細胞)。所提供之組合物及方法至少部分地基於鑑別包含在不同分化細胞狀態下保持轉錄活性之多個持續轉錄活性有效負載區(STAPLR)的染色質圖譜。

I. STAPLR諸位發明人已發現，哺乳動物基因組中之某些基因間區域使得整合於其中之轉殖基因的表現量能夠一致，即使在細胞經歷其分化狀態之變化時及/或無關於細胞類型。此發現極大地擴展了轉殖基因可穩定整合且可在各種細胞狀態下維持其表現的基因組位點之基因譜。此發現因此解決例如在細胞療法之情形下轉殖基因表現中長期存在的一個問題。此等基因間區域在本文中稱為「持續轉錄活性有效負載區」(STAPLR)，其中「有效負載(payload)」或「基因組有效負載(genomic payload)」係指引入該區域的一或多個外源或異源核苷酸序列。STAPLR包含用於著陸基因組有效負載之開放染色質圖譜。STAPLR中之染色體DNA呈可接近基因編輯機構之組分且允許遺傳物質整合之構形。在一些個例中，STAPLR處於轉錄活性基因附近。

此發現之一個應用為有效產生基因工程化/基因改造治療細胞，其首先經基因改造且隨後例如藉由分化或去分化使其改變細胞狀態。例如，本基因工程方法可應用於隨後分化成各種細胞類型之iPSC。在過去，當iPSC經工程化以將轉殖基因併入其基因組中且隨後分化成所需細胞類型時，轉殖基因可在iPSC分化時變得無活性。然而，整合至如本文所揭示之STALPR中的轉殖基因在iPSC分化時不會變得無活性。因此，STALPR為轉殖基因表現提供通用的「著陸墊」。

此轉殖基因表現穩定性在向有需要之個體(例如人類患者)投與細胞療法中之治療細胞之後亦為有利的，其中治療細胞可遇到將閉合整合於別處之轉殖基因的不同且變化的環境。

此外，將轉殖基因整合於基因間區域而非基因內將對相鄰基因之表現或調節引起最小破壞，且因此使得基因工程化細胞功能正常。STAPLR處之轉殖基因整合亦降低在細胞中引起非所要作用的風險(例如活化致癌基因或破壞諸如腫瘤抑制基因之必需基因)。此外，STAPLR與其持續轉錄活性狀態一起將允許測試及使用較寬範圍之調節元件(例如啟動子及強化子)。

如本文中所使用，「基因間區域(intergenic region)」為位於兩個鄰近基因之間的核苷酸序列之區段。基因間區域可具有各種尺寸。例如，基因間區域可為至少30、40、50、75或100個鹼基對長。在一些實施例中，基因間區域可為至少150、200、300、400、500、750或1000個鹼基對長。在一些實施例中，基因間區域可為至少1500、2000、2500、3000、3500、5000或10000個鹼基對長。在一些實施例中，基因間區域可為至少15000、20000、30000、40000、50000、75000或100000個鹼基對長。在一些實施例中，基因間區域為30個鹼基對至100000個鹼基對長。在一些實施例中，基因間區域為50個鹼基對至75000個鹼基對長。在一些實施例中，基因間區域為75個鹼基對至70000個長。

本發明之STAPLR包括(但不限於)(人類基因之NCBI基因ID在圓括號中示出)： RPL34基因(基因ID：6164)與 OSTC基因(基因ID：58505)之間的基因間區域； ACTB基因(基因ID：60)與 FSCN1基因(基因ID：6624)之間的基因間區域； AKIRIN1基因(基因ID：79647)與 NDUFS5基因(基因ID：4725)之間的基因間區域； PRDX1基因(基因ID：5052)與 AKR1A1基因(基因ID：10327)之間的基因間區域； PTGES3基因(基因ID：10728)與 NACA基因(基因ID：4666)之間的基因間區域； MLF2基因(基因ID：8079)與 PTMS基因(基因ID：5763)之間的基因間區域； RAB13基因(基因ID：5872)與 RPS27基因(基因ID：4840565)之間的基因間區域； JTB基因(基因ID：10899)與 RAB13基因(基因ID：5872)之間的基因間區域； AKR1A1基因(基因ID：10327)與 NASP基因(基因ID：4678)之間的基因間區域； NDUFS5基因(基因ID：4725)與 MACF1基因(基因ID：23499)之間的基因間區域； SRSF9基因(基因ID：8683)與 DYNLL1基因(基因ID：8655)之間的基因間區域； MYL6B基因(基因ID：140465)與 MYL6基因(基因ID：4637)之間的基因間區域； GPX1基因(基因ID：2876)與 RHOA基因(基因ID：387)之間的基因間區域； HNRNPA2B1基因(基因ID：3181)與 CBX3基因(基因ID：11335)之間的基因間區域； ROMO基因(基因ID：140823)與 RBM39基因(基因ID：9584)之間的基因間區域； PA2G4基因(基因ID：5036)與 RPL41基因(基因ID：6171)之間的基因間區域；及 NDUFB10(基因ID：4716)與 RPS2基因(基因ID：6187)之間的基因間區域。在一些實施例中，本文中之基因係指人類基因且哺乳動物細胞為人類細胞。

人類基因組中之前述STAPLR基因間區域的起始配位及末端配位及尺寸列於下表 1中。配位係如藉由NCBI之RefSeq資料庫處可用之資訊定義。表 1. 精選基因之間的基因間區域

SEQ ID NO	STAPLR	起始配位	末端配位	尺寸
1	RPL34基因與 OSTC基因之間的基因間區域	chr4: 108,630,485	chr4: 108,650,584	20100
2	ACTB基因與 FSCN1基因之間的基因間區域	chr7: 5,530,602	chr7: 5,592,815	62214
3	AKIRIN1基因與 NDUFS5基因之間的基因間區域	chr1: 39,006,066	chr1: 39,026,294	20229
4	PRDX1基因與 AKR1A1基因之間的基因間區域	chr1: 45,522,891	chr1: 45,550,778	27888
5	PTGES3基因與 NACA基因之間的基因間區域	chr12: 56,688,285	chr12: 56,712,426	24142
6	MLF2基因與 PTMS基因之間的基因間區域	chr12: 6,753,142	chr12: 6,766,362	13221
7	RAB13基因與 RPS27基因之間的基因間區域	chr1: 153,986,340	chr1: 153,990,761	4422
8	JTB與 RAB13基因之間的基因間區域	chr1: 153,977,675	chr1: 153,981,649	3975
9	AKR1A1與 NASP基因之間的基因間區域	chr1: 45,570,050	chr1: 45,584,040	13991
10	NDUFS5與 MACF1基因之間的基因間區域	chr1: 39,034,616	chr1: 39,084,166	49551
11	SRSF9與 DYNLL1基因之間的基因間區域	chr12: 120,469,749	chr12: 120,469,841	93
12	MYL6B與 MYL6基因之間的基因間區域	chr12: 56,157,983	chr12: 56,158,358	376
13	GPX1與 RHOA基因之間的基因間區域	chr3: 49,358,354	chr3: 49,359,144	791
14	HNRNPA2B1與 CBX3基因之間的基因間區域	chr7: 26,200,747	chr7: 26,201,442	696
15	ROMO與 RBM39基因之間的基因間區域	chr20: 35,700,985	chr20: 35,701,346	362
16	PA2G4基因與 RPL41基因之間的基因間區域	chr12: 56,113,911	chr12: 56,116,632	2722
97	NDUFB10與 RPS2基因之間的基因間區域	chr16: 1,961,976	chr16: 1,962,057	81

由於人類之間的變化及哺乳動物屬種之間的變化，前述基因對之間的基因間區域可在一定程度上不同於表1中所示之對應SEQ ID NO。

在一些實施例中， RPL34基因與 OSTC基因之間的基因間區域包含與SEQ ID NO: 1至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 1充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 1之功能性，亦即 RPL34基因與 OSTC基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， ACTB基因與 FSCN1基因之間的基因間區域包含與SEQ ID NO: 2至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 2充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 2之功能性，亦即 ACTB基因與 FSCN1基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， AKIRIN1基因與 NDUFS5基因之間的基因間區域包含與SEQ ID NO: 3至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 3充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 3之功能性，亦即 AKIRIN1基因與 NDUFS5基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， PRDX1基因與 AKR1A1基因之間的基因間區域包含與SEQ ID NO: 4至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 4充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 4之功能性，亦即 PRDX1基因與 AKR1A1基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， PTGES3基因與 NACA基因之間的基因間區域包含與SEQ ID NO: 5至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 5充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 5之功能性，亦即 PTGES3基因與 NACA基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， MLF2基因與 PTMS基因之間的基因間區域包含與SEQ ID NO: 6至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 6充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 6之功能性，亦即 MLF2基因與 PTMS基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， RAB13基因與 RPS27基因之間的基因間區域包含與SEQ ID NO: 7至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 7充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 7之功能性，亦即 RAB13基因與 RPS27基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， JTB基因與 RAB13基因之間的基因間區域包含與SEQ ID NO: 8至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 8充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 8之功能性，亦即 JTB基因與 RAB13基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， AKR1A1基因與 NASP基因之間的基因間區域包含與SEQ ID NO: 9至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 9充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 9之功能性，亦即 AKR1A1基因與 NASP基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， NDUFS5基因與 MACF1基因之間的基因間區域包含與SEQ ID NO: 10至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 10充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 10之功能性，亦即 NDUFS5基因與 MACF1基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， SRSF9基因與 DYNLL1基因之間的基因間區域包含與SEQ ID NO: 11至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 11充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 11之功能性，亦即 SRSF9基因與 DYNLL1基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， MYL6B基因與 MYL6基因之間的基因間區域包含與SEQ ID NO: 12至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 12充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 12之功能性，亦即 MYL6B基因與 MYL6基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， GPX1基因與 RHOA基因之間的基因間區域包含與SEQ ID NO: 13至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 13充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 13之功能性，亦即 GPX1基因與 RHOA基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， HNRNPA2B1基因與 CBX3基因之間的基因間區域包含與SEQ ID NO: 14至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 14充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 14之功能性，亦即 HNRNPA2B1基因與 CBX3基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， ROMO基因與 RBM39基因之間的基因間區域包含與SEQ ID NO: 15至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 15充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 15之功能性，亦即 ROMO基因與 RBM39基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， PA2G4基因與 RPL41基因之間的基因間區域包含與SEQ ID NO: 16至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 16充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 16之功能性，亦即 PA2G4基因與 RPL41基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

在一些實施例中， NDUFB10與 RPS2基因之間的基因間區域包含與SEQ ID NO: 97至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 97充分類似之核苷酸序列，以使基因間區域保持SEQ ID NO: 97之功能性，亦即 NDUFB10與 RPS2基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。

兩個核苷酸序列之一致性百分比可藉由例如BLAST®使用預設參數(可在美國國家醫學圖書館國家生物技術資訊中心(U.S. National Library of Medicine's National Center for Biotechnology Information)網站獲得)測定。在一些實施例中，出於比較目的比對之參考序列的長度為參考序列之至少30%，例如至少40%、50%、60%、70%、80%或90%。

II. 外源序列至 STAPLR 中之整合 A. 整合位點相關外源核苷酸序列可整合於STAPLR內之任何位點處。例如，整合位點或外源序列與相鄰內源序列之間的接合點可位於STAPLR之第一半或第二半中；STAPLR之5'、中間或3'三分之一中；或STALPR之第一、第二、第三或第四四分之一中。在一些實施例中，外源序列之整合位點或外源序列與相鄰內源序列之間的接合點位於STAPLR內且離最接近基因(亦即，來自STAPLR之5'或3'邊界，例如來自表 1中所示之起始配位或末端配位)至少10、20、30、40、50、80、90、100、200、300、400、500、1000、1500、2000、2500、3000、3500、4000、5000、10000、15000或20000個鹼基對遠。

在單一基因組中，一或多個外源核苷酸序列可整合至一或多個STAPLR中。在一些實施例中，一或多個(例如兩個、三個或四個)外源核苷酸序列可整合至單一所載STALPR內之一或多個位點中。在一些實施例中，靶向單一基因組中超過一個STALPR用於整合外源核苷酸序列。

在一些實施例中，外源序列引入到至少一個STAPLR及至少一個如WO 2021/072329中所描述之持續轉殖基因表現基因座(STEL)中。STEL位點為在多潛能狀態中以及在分化期間穩固且一致地表現(例如，如藉由單細胞RNA定序(scRNAseq)分析所檢查)之內源基因的基因座。雖然STAPLR可與STEL位點相關聯，但其不需要與STEL位點相關聯。STEL位點可從單細胞RNA序列資料鑑別。理想STEL位點之界定特徵為表現之普遍存在性。STEL位點可藉由分析跨越不同細胞類型及細胞成熟期狀態之候選基因座的表現來鑑別，諸如PSC及PSC衍生之多巴胺神經元(及精選祖細胞狀態)、微膠質細胞(及精選祖細胞狀態)及心肌細胞(及精選心肌細胞祖細胞狀態)。添加成人組織之公開可獲得的單細胞RNA定序資料允許細化此類STEL分析。STEL包括(但不限於)在多種細胞類型中具有活性之某些管家基因，諸如參與基因表現(例如轉錄因子及組蛋白)、細胞代謝(例如GAPDH及NADH去氫酶)或細胞結構(例如肌動蛋白)之彼等者，或編碼核糖體蛋白之彼等者(例如大或小核糖體次單元，諸如RPL13A、RPLP0及RPL7)。STEL之實例為編碼核糖體蛋白之基因，諸如 RPL基因(例如 RPL13A 、 RPLP0 、 RPL10 、 RPL13 、 RPS18 、 RPL3 、 RPLP1 、 RPL15 、 RPL41 、 RPL11 、 RPL32 、 RPL18A 、 RPL19 、 RPL28 、 RPL29 、 RPL9 、 RPL8 、 RPL6 、 RPL18 、 RPL7 、 RPL7A 、 RPL21 、 RPL37A 、 RPL12 、 RPL5 、 RPL34 、 RPL35A 、 RPL30 、 RPL24 、 RPL39 、 RPL37 、 RPL14 、 RPL27A 、 RPLP2 、 RPL23A 、 RPL26 、 RPL36 、 RPL35 、 RPL23 、 RPL4及 RPL22)及 RPS基因(例如 RPS2 、 RPS19 、 RPS14 、 RPS3A 、 RPS12 、 RPS3 、 RPS6 、 RPS23 、 RPS27A 、 RPS8 、 RPS4X 、 RPS7 、 RPS24 、 RPS27 、 RPS15A 、 RPS9 、 RPS28 、 RPS13 、 RPSA 、 RPS5 、 RPS16 、 RPS25 、 RPS15 、 RPS20及 RPS11)；編碼粒線體蛋白之基因(例如 MT-CO1 、 MT-CO2 、 MT-ND4 、 MT-ND1及 MT-ND2)；編碼肌動蛋白之基因( ACTG1及 ACTB)；編碼真核細胞轉譯因子之基因(例如 EEF1A1 、 EEF2及 EIF1)；及編碼組蛋白之基因(例如 H3F3A及 H3F3B)。額外STEL為編碼參與局部附著、細胞受質黏著接合點、細胞受質接合點、細胞錨定、細胞外胞外體、細胞外囊泡、細胞內胞器或錨定接合點之蛋白質的彼等者。STEL之額外實例為 FTL、 FTH1、 TPT1、 TMSB10、 GAPDH、 PTMA、 GNB2L1、 NACA、 YBX1、 NPM1、 FAU、 UBA52、 HSP90AB1、 MYL6、 SERF2及 SRP14。

在一些實施例中，在單一哺乳動物(例如人類)基因組中，外源序列引入至STAPLR (諸如 RPL34/ OSTC或 PRDX1/ AKR1A1STAPLR)及STEL (諸如 GAPDH基因座)中。在一些實施例中，外源序列引入單一基因組中之多個STAPLR，諸如 RPL34/ OSTC及 PRDX1/ AKR1A1STAPLR中。

B. 整合之方法任何基因組整合方法均可用以利用本文中所描述之STAPLR。在一些實施例中，外源核苷酸序列在STAPLR中之整合藉由使用選自由以下組成之群的基因組編輯系統實現：CRISPR/Cas系統、Cre/Lox系統、FLP-FRT系統、類轉錄活化子效應物核酸酶(TALEN)系統、鋅指核酸酶(ZFN)系統、歸巢核酸內切酶、序列特異性核酸內切酶、隨機整合(例如，通過轉位子)、大範圍核酸酶、同源重組、轉位酶及非核酸酶依賴性病毒載體(例如反轉錄病毒載體、AAV載體及慢病毒載體)。在一些實施例中，整合不引起區域中之內源序列缺失，及/或不添加除待整合之外源供體序列以外的核苷酸序列。在一些實施例中，整合在整合位點引起(非供體序列之)插入及/或缺失(插入缺失)。

在一些實施例中，外源序列可經由同源重組在諸如CRISPR相關核酸內切酶之合適核酸內切酶產生之DNA斷裂處併入至STAPLR位點中，核酸內切酶可為例如選自(但不限於)第I型(例如，次型I-A、I-B、I-C、I-C變異體、I-D、I-E、I-F、I-F變異體1或I-F變異體2)、第II型(例如，次型II-A、II-B、II-B變異體或II-C)、第III型(例如，次型III-A、III-B或III-B變異體)、第IV型或第V型Cas蛋白質或其變異體。在一些實施例中，核酸酶選自由以下組成之群：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas12 (例如Cas12a或Cpf1或Cas12b)、Cas13、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、CasX、CasY、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、CasPhi、MAD7、Csf4及其同源物，或其經修改之版本(例如具有核酸酶活性之野生型Cas蛋白質的截短版本或變異體)。

在一些實施例中，Cas核酸內切酶為Cpf1 (Cas12a)核酸內切酶或其變異體、衍生物或片段，諸如(例如)衍生自以下之Cpf1：新兇手弗朗西斯氏菌( Francisella novicida) U112 (FnCpf1)、胺基酸球菌屬( Acidaminococcus sp.) BV3L6 (AsCpf1，包括經改良之變異體，諸如enAsCpf1)、毛螺菌科菌屬(Lachnospiraceae bacterium) ND2006 (LbCpf1)、毛螺菌科菌屬MA2020 (Lb2Cpfl)、毛螺菌科菌屬MC2017 (Lb3Cpfl)、牛眼莫拉氏菌( Moraxella bovoculi) 237 (MbCpf1)或解糖腖普雷沃菌( Prevotella disiens) (PdCpf1)。

在一些實施例中，Cas核酸內切酶為Cas9蛋白質或其變異體、衍生物或片段。在一些實施例中，Cas9蛋白質為SaCas9、SpCas9、SpCas9n、Cas9-HF、Cas9-H840A、FokI-dCas9或D10A切口酶。

在一些實施例中，Cas核酸內切酶為第五型RNA可程式化核酸酶，如WO 2022/258753中所揭示。

在一些實施例中，Cas核酸內切酶為MAD核酸酶，諸如MAD7核酸酶，如美國專利10,337,028中所揭示。

適合之核酸內切酶的非限制性實例闡述於下表 A中。表 A 例示性核酸內切酶

酶	序列
Cas12a	MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN (SEQ ID NO: 98)
Cas12a變異體1	MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQRPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAARLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFLFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNGRSSDDEATADSQHAAPPKKKRKV (SEQ ID NO: 99)
第V型RNA可程式化核酸酶實例1	MTIRSMKLKLKIYSGRSAPQLRQGLWRLHRLLNEGTAYYMDWLVHMRQEALPGKSKEEIRAELERRVRQQQEKNGVQNDQVPMDEVLSALRQLYELLVPSAVNNSGDAQTLSRKFLSPLVDPNSEGGKGTSNAGAKPGWRKKQEAGDPSWEKDYERWLKRKQADPTAEILGKLETAGLKPLFPLYTNEVKDIRWMPLTSKQYVRNWDRDMFQQAIEHLLSWETWNRKVNEERAKLKETVRRFEEQHLANGKDWLSPLQAYEANREQALRDMAISPSDRFRITRRQIKGWSELYERWNKLAPTASVEAYMQEVRHVQKKLGGTFGDADLYRFLAKPENVHIWRDHQERLHYYAAYNDLHKRLMSAKEQAAFTLPDPVAHPLWVRFDARDGNLFTYILQADSSKQRSRRYVNFSRFLWPVEDGYFEETENVKVELALSKQFYRQVIVHDNPTGKQKITFQDYSSKEILEGHLGGAKLQLDRNFLRKSGRDFETGDFGPAFLNVVLDLKPKQEVKNGRLQSPLGQALLVKSRPNDIPKVYGYKPDALAAWLEQASGEESLGSESLRQGFRVMSIDLGVRSAAAISVFSVKGEKTREGDKVCYPVGETGLFAVHDRSFLLRLPGESSEKRVNVERDKRKTERMQIRYHIRTLARVLRLANKATPMDRIKAVQDVLNDIESTRFMNDHDHHVYNHALETLRTYAPDHQGIWEEQVIAAHRQLEHHVGVIVGEWRKNWGKDRRGTVGLSMDNIEELDEMRRLLISWSRRARYPREAKPFQVNESNPVHLLRHLQNLKEDRLKQLANLIVMTALGYVYDSKEKKWKAAYPACQLILFEDLQRYRFHLDRSARENSQLMKWAHRSIPKYVWMQGEPYGLQIGDVWAGFTSRYHAKTGAPGIRCKALTEKDFQQGRLLESLVAEGMFTLQEVGTLKPGDIVPAEGGELFVTLADDSGDRIVITHADINAAQNVQKRFWLANSERFRVACRSVQIASQECFIPSSESVAKKMGKGVFVRDFSFHKDMEVYHWNNQVKLTAKNVPTDHSDDLQDLQDYQAILEEARESSSSYKTLFRDPSGFFFPDDVWVPQNIYWREVKKTITALLRKRIMST (SEQ ID NO: 100)
第V型RNA可程式化核酸酶實例2	MPIRSFKLKLVTHNGDSTYMDKLRRGLWKTHVIINRGIAYYMNTLALMRQEPYGSKSREEVRLDLLSTLREQQRRNNWSEQTGTDDELLSLSRRVYELLVPSAIGEKGDAQMLSRKFLSPLVDPNSEGGRGTAKSGRKPRWKKMMEEGHPDWEKEKEKDAAKKAEDPTASILADLEAVGLLPLFPLFSDEQKEIRWLPKKKRQFVRTWDRDMFQQALERMLSWESWNRRVAEEYLKLQAQRDEVYAKYLEDAGSWLNDLQTFEKQREEELAEVSFEPNSEYLITRRQIRGWKEVYEKWSKTSENASQEQLWRMVADVQTAMAGAFGDPKVYQFLSQPKHHHIWREHPNRLFYYSKYNEVREKLNRAKKQAAFTLPDPVEHPLWTRFDARGGNIHDYEISKVGKQYHVTFSSLILPEAQSWVEIENVTVGIGNSLQLKRQIRLDGYADKKQKVKYYDYSSRFELTGVLGGAKIQFDRKHLKKAAHRLAEGETGPIFLNVVVDVEPFLEVKNGRLRTPLGQVLQVNTRDWPKVVDYKAKELSVLMENTQIGNENGVSTIEAGMRIMSIDLGQRTAAAVSIFEVISKKPDEKETKLFYPIADTDLYAVHRRSLLLRLPGEEISSKKMIEKRKERARIRSLVRYQIRLLSEVLRLHTQGTAEQRRFKLDELLVSIQKKLELDQSEWISELEKLFDYIDESAEKWKEALVVAHRTLEPIVVEAVRNWKKSLSKENKDRRRIAGISIWSIEELEETRKLLIAWSKHSREPGIPKRLEKEETFAPEHLQHIQNVKDDRLKQMANLFVMTALGYKYDEGNKRWVEAYPACQVILFEDLSRYRFALDRPRRENNRLMKWAHRSIPRLTYMQAELFGIQVGDVYSAYTSRFHAKTGAPGIRCHALTEADLQSNSYVVNQLIKDKFIQDNQTEILKAGQIVPWQGGELFVTFADRSGASLAVIHADINAAQNLQKRFWQHNSEVFRVPCKVVKGGLVPVYEKMRKLFGKGLFVNIDDPESKEVYRWEHSTKMKSKTTPVDLESEDIDHEELSDEWEDMQEGYKTLLRDPSGFFWSSDSWIPQKDFWIRVKSRIGKSLREQIR (SEQ ID NO: 101)
第V型RNA可程式化核酸酶實例3	MPIRSFKLKLVTHNGDSTYMDKLRRGLWKTHVIINRGIAYYMNTLALMRQEPYGSKSREEVRLDLLSTLREQQRRNNWSEQTGTDDELLSLSRRVYELLVPSAIGEKGDAQMLSRKFLSPLVDPNSEGGRGTAKSGRKPRWKKMMEEGHPDWEKEKEKDAAKKAEDPTASILADLEAVGLLPLFPLFSDEQKEIRWLPKKKRQFVRTWDRDMFQQALERMLSWESWNRRVAEEYQKLQAQRDEVYAKYLEDAGSWLNDLQTFEKQREEELAEVSFEPNSEYLITRRQIRGWKEVYEKWSKTSENASQEQLWRMVADVQTAMAGAFGDPKVYQFLSQPKHHHIWREHPNRLFYYSKYNEVREKLNRAKKQAAFTLPDPVEHPLWTRFDARGGNIHDYEISKVGKQYHVTFSSLILPEAQSWVEIENVTVGIGNSLQLKRQIRLDGYADKKQKVKYYDYSSRFELTGVLGGAKIQFDRKHLKKAAHRLAEGETGPIFLNVVVDVEPFLEVKNGRLRTPLGQVLQVNTRDWPKVVDYKAKELSVLMENTQIGNENGVSTIEAGMRIMSIDLGQRTAAAVSIFEVISKKPDEKETKLFYPIADTDLYAVHRRSLLLRLPGEEISSKKMIEKRKERARIRSLVRYQIRLLSEVLRLHTQGTAEQRRFKLDELLVSIQRKLELDQSEWISELEKLFDYIDESAEKWKEALVVAHRTLEPIVVEAVRNWKKSLSKENKDRRRIAGISIWSIEELEETRKLLIAWSKHSREPGIPKRLEKEETFAPEHLQHIQNVKDDRLKQMANLFVMTALGYKYDEGNKRWVEAYPACQVILFEDLSRYRFALDRPRRENNRLMKWAHRSIPRLTYMQAELFGIQVGDVYSAYTSRFHAKTGAPGIRCHALTEADLQSNSYVVNQLIKDKFIQDNQTEILKAGQIVPWQGGELFVTFADRSGASLAVIHADINAAQNLQKRFWQHNSEVFRVPCKVVKGGLVPVYEKMRKLFGKGLFVNIDDPESKEVYRWEHSTKMKSKTTPVDLESEDIEHEELSDEWEDMQEGYKTLLRDPSGFFWSSDSWIPQKDFWIRVKSRIGKSLREQIR (SEQ ID NO: 102)

在一些實施例中，CRISPR/Cas系統包含靶向所選基因間區域之gRNA依賴性核酸酶(或其編碼序列)、gRNA (或其編碼序列)及包含外源核苷酸序列之供體DNA。

在一些實施例中，STAPLR為 RPL34基因與 OSTC基因之間的基因間區域，且gRNA選自SEQ ID NO: 25-32。

在一些實施例中，STAPLR為 ACTB基因與 FSCN1基因之間的基因間區域，且gRNA選自SEQ ID NO: 33-54。

在一些實施例中，STAPLR為 AKIRIN1基因與 NDUFS5基因之間的基因間區域，且gRNA選自SEQ ID NO: 55-70。

在一些實施例中，STAPLR為 PRDX1基因與 AKR1A1基因之間的基因間區域，且gRNA選自SEQ ID NO: 71-92。

在一些實施例中，核酸內切酶在STAPLR內產生DNA斷裂。在其他實施例中，核酸內切酶在與STAPLR相鄰之基因中產生DNA斷裂，使得在整合之後，外源核苷酸序列仍整合於STAPLR內。在一些實施例中，不當整合事件之篩檢可根據WO 2021/226151中所描述之方法進行，其中在與STAPLR相鄰之基因的外顯子中引入DNA斷裂且為細胞存活所必需的，且整合未恰當達成之彼等細胞不存活。

C. 外源核苷酸序列在一些實施例中，用於整合之相關外源核苷酸序列可包含編碼蛋白質或RNA之轉殖基因。轉殖基因可包含基因產物之編碼序列及視情況一或多個轉錄調節元件。在一些實施例中，轉殖基因包含一或多個調節元件，其中一或多個調節元件可視情況與編碼序列可操作地鍵聯。

調節元件之非限制性實例為啟動子、強化子、沉默子、染色質絕緣子、內含子序列、Kozak序列、普遍存在之染色質開放元件(UCOE)、轉錄活化子結合元件、增強基因表現或RNA穩定性之序列(例如WPRE元件)、多腺苷酸化信號序列(例如SV40 polyA信號)及其類似物。

在一些實施例中，引導轉殖基因表現之啟動子為持續型啟動子，包括(但不限於) EF1a、EFS、UBC、PGK、CAGGS、CMV、SV40、B2M及ROSA26啟動子。在一些實施例中，外源核苷酸序列之表現處於細胞類型特異性啟動子、組織特異性啟動子或譜系特異性啟動子之控制下。例如，啟動子可為多巴胺能神經元之酪胺酸羥化酶啟動子；運動神經元之Hb9啟動子；心肌細胞之SIRPA啟動子；骨髓譜系之細胞的CD14、CD33、CD45或CD11b啟動子；或T淋巴細胞之CD3、FOXP3、CD25、CD8或CD4啟動子。在一些實施例中，外源核苷酸序列之表現處於可誘導型啟動子(例如乳糖操縱子，其可藉由異丙基β-D-1-硫代半乳糖苷(IPTG)觸發；TRE啟動子，其可藉由四環素及其衍生物觸發)之控制下。

在一些實施例中，外源序列包含一或多個對由另一位點(例如由內源基因或整合於STEL或STAPLR處之轉殖基因)表現之因子起反應的調節元件。此類調節元件之非限制性實例為轉錄因子結合位點。在一些實施例中，此類調節元件整合於其他一或多個調節元件及/或轉殖基因之編碼序列附近的STAPLR位點處。例如，細胞可經如本文中所揭示之包含外源核苷酸序列的DNA分子修飾，外源核苷酸序列包含轉殖基因及轉錄因子結合位點，其中可結合至轉錄因子結合位點之轉錄因子由內源基因或基因組任何部分中(例如在STAPLR、STEL或另一安全港位點中)之另一轉殖基因表現或異位表現。

在一些實施例中，轉殖基因編碼RNA (例如小干擾RNA或微型RNA)或相關蛋白質。相關蛋白質(如本文中所使用，包括肽)可為例如球狀蛋白質(例如白蛋白、球蛋白、榖蛋白、醇溶蛋白、組蛋白、血球蛋白或魚精蛋白)、纖維蛋白質(例如硬蛋白質，諸如膠原蛋白、彈性蛋白、角蛋白或絲蛋白)或中間蛋白質。在一些實施例中，相關蛋白質為複合蛋白質，諸如金蛋白質、色蛋白、醣蛋白、黏蛋白、磷蛋白、脂蛋白。在一些實施例中，相關蛋白質為治療性蛋白質(例如可改良或預防疾病或病況之症狀的蛋白質)。治療性蛋白質之非限制性實例包括在諸如血友病及溶酶體貯積病(lysosome storage disease)之遺傳性疾病中缺乏或有缺陷的蛋白質、酶、調節免疫力之細胞介素、重組抗原受體(例如嵌合抗原受體)、抗體、調節經修飾細胞之分化或活性的蛋白質(例如維持細胞在M1或M2極性中之轉錄因子或蛋白質)及其類似物。在一些實施例中，相關蛋白質為細胞標記物、用於免疫逃避之蛋白質或用於細胞療法之安全或殺滅開關。相關蛋白質之實例為(但不限於) SOX10、IL-10、IL-12、CD19t及ThPOK。

D. 靶向載體本發明提供用於將外源核苷酸序列整合至STAPLR中之靶向載體。如本文中所使用，「靶向載體(targeting vector)」為包含相關外源核苷酸序列及與側接基因組中所需整合位置之內源染色體核苷酸序列同源之序列的核酸。此等側接同源序列稱為「同源臂」。同源臂藉助於同源臂與對應內源核苷酸序列之間存在的同源性將靶向載體引導至基因組內之特異性染色體位置。在一些實施例中，靶向載體為包含相關核酸之核酸，該核酸側接有5'核苷酸序列(左同源臂或左同源區)及3'核苷酸序列(右同源臂或右同源區)，其中5'核苷酸序列及3'核苷酸序列為側接細胞基因組中之整合位點的核苷酸序列且經由同源性調解相關核酸整合至整合位點中。整合位點可在STAPLR內或在與STAPLR相鄰之基因序列中(例如基因之外顯子、內含子或UTR中)。

在一些實施例中，5'核苷酸序列及3'核苷酸序列充分類似於側接細胞基因組中之整合位點的核苷酸序列，以允許經由同源性將相關核酸整合至STAPLR中。5'序列及3'序列充分類似於用於同源重組所靶向之內源核苷酸序列，使得同源臂在整合(完全或部分)時不會對整合之基因環境造成不利影響(例如不影響鄰近基因之功能)。在一些實施例中，同源臂與所靶向STAPLR中之核苷酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致。

在一些實施例中，如本文中所提供之靶向載體包含一或多個核酸內切酶靶向序列，例如用以在與核酸內切酶-導引組合一起使用時線性化載體。

在一些實施例中，靶向載體為環狀載體。在一些實施例中，靶向載體為線性載體。在一些實施例中，靶載體為病毒載體(例如AAV載體、腺病毒載體、慢病毒載體、單純疱疹病毒載體)或質體載體。靶載體亦可包含一或多個核酸內切酶識別位點。

例如，在一些實施例中， RPL34基因與 OSTC基因之間的基因間區域包含與SEQ ID NO: 1至少80%一致之核苷酸序列，以便 RPL34基因與 OSTC基因之間的基因間區域之功能在整合後保持完整。在一些實施例中， RPL34基因與 OSTC基因之間的基因間區域包含與SEQ ID NO: 1至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致之核苷酸序列，使得 RPL34基因與 OSTC基因之間的基因間區域之功能在整合後保持完整。同樣的道理可適用於 ACTB基因與 FSCN1基因之間的基因間區域及其與SEQ ID NO: 2之一致性； AKIRIN1基因與 NDUFS5基因之間的基因間區域及其與SEQ ID NO: 3之一致性； PRDX1基因與 AKR1A1基因之間的基因間區域及其與SEQ ID NO: 4之一致性； PTGES3基因與 NACA基因之間的基因間區域及其與SEQ ID NO: 5之一致性； MLF2基因與 PTMS基因之間的基因間區域及其與SEQ ID NO: 6之一致性； RAB13基因與 RPS27基因之間的基因間區域及其與SEQ ID NO: 7之一致性； JTB基因與 RAB13基因之間的基因間區域及其與SEQ ID NO: 8之一致性； AKR1A1基因與 NASP基因之間的基因間區域及其與SEQ ID NO: 9之一致性； NDUFS5基因與 MACF1基因之間的基因間區域及其與SEQ ID NO: 10之一致性； SRSF9基因與 DYNLL1基因之間的基因間區域及其與SEQ ID NO: 11之一致性； MYL6B基因與 MYL6基因之間的基因間區域及其與SEQ ID NO: 12之一致性； GPX1基因與 RHOA基因之間的基因間區域及其與SEQ ID NO: 13之一致性； HNRNPA2B1基因與 CBX3基因之間的基因間區域及其與SEQ ID NO: 14之一致性； ROMO基因與 RBM39基因之間的基因間區域及其與SEQ ID NO: 15之一致性； PA2G4基因與 RPL41基因之間的基因間區域及其與SEQ ID NO: 16之一致性；及 NDUFB10與 RPS2基因之間的基因間區域及其與SEQ ID NO: 97之一致性。

在本發明之方法中，同源臂之長度不同。在一些實施例中，同源臂中之各者獨立地約為至少50、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450、至少500、至少550、至少600、至少650、至少700、至少750、至少800、至少850、至少900、至少950、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、至少1800、至少1900或至少2000個鹼基對長。在一些實施例中，同源臂中之各者獨立地為50-2000、100-1900、150-1800、200-1700、250-1600、300-1500、350-1400、400-1300、450-1200、500-1100、550-1000、600-950、650-900、700-850或750-800個鹼基對長。

在本發明之方法中，同源臂(亦即5'核苷酸序列及3'核苷酸序列)可經設計以靶向所揭示之基因間區域內的任何位置。

在一些實施例中，5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 17的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 18的核苷酸序列。在一些實施例中，5'核苷酸序列包含與SEQ ID NO: 17至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 17之功能保持完整。在一些實施例中，3'核苷酸序列包含與SEQ ID NO: 18至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 18之功能保持完整。

在一些實施例中，5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 19的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 20的核苷酸序列。在一些實施例中，5'核苷酸序列包含與SEQ ID NO: 19至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 19之功能保持完整。類似地，在一些實施例中，3'核苷酸序列包含與SEQ ID NO: 20至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 20之功能保持完整。

在一些實施例中，5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 21的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 22的核苷酸序列。在一些實施例中，5'核苷酸序列包含與SEQ ID NO: 21至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 21之功能保持完整。類似地，在一些實施例中，3'核苷酸序列包含與SEQ ID NO: 22至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 22之功能保持完整。

在一些實施例中，5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 23的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 24的核苷酸序列。在一些實施例中，5'核苷酸序列包含與SEQ ID NO: 23至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 23之功能保持完整。類似地，在一些實施例中，3'核苷酸序列包含與SEQ ID NO: 24至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 24之功能保持完整。

在一些實施例中，5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 93的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 94的核苷酸序列。在一些實施例中，5'核苷酸序列包含與SEQ ID NO: 93至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 93之功能保持完整。類似地，在一些實施例中，3'核苷酸序列包含與SEQ ID NO: 94至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 94之功能保持完整。

在一些實施例中，5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 95的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 96的核苷酸序列。在一些實施例中，5'核苷酸序列包含與SEQ ID NO: 95至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 95之功能保持完整。類似地，在一些實施例中，3'核苷酸序列包含與SEQ ID NO: 96至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列，用以使SEQ ID NO: 96之功能保持完整。

在一些實施例中，同源臂完全落於所靶向STAPLR內。在其他實施例中，同源臂可在整合之後與鄰近基因之一部分重疊而不妨礙其功能且外源序列仍整合於STAPLR內。

本發明提供STAPLR靶向系統，其包含本文中之靶向載體及用於將靶向載體上之相關核苷酸序列併入至STAPLR中的恰當基因編輯系統，諸如本文中所描述之彼等者。

III. 基因改造哺乳動物細胞本文中提供基因改造細胞，其包含本文中所揭示之STAPLR中之一或多者中的修飾。靶向STAPLR整合之哺乳動物細胞可為任何細胞類型或呈任何相關細胞狀態。例如，細胞可為幹細胞或分化細胞。細胞(諸如人類細胞)可藉由基因編輯方法(諸如本文中所描述之彼等方法)活體外、活體內或離體工程化。細胞亦可為非人類細胞，諸如來自實驗室動物(例如非人類靈長類動物、小鼠、大鼠及兔)、農畜(例如牛及馬)及寵物(例如狗及貓)之細胞。

A. 幹細胞在一些實施例中，靶向其STAPLR處之修飾的哺乳動物細胞為幹細胞，尤其多潛能幹細胞(PSC)，諸如誘導性多潛能幹細胞(iPSC；例如，人類iPSC)或胚胎幹細胞(ESC；例如，人類ESC)。隨後可誘導工程化幹細胞以使其分化成在本文中稱為PSC衍生物、PSC衍生物細胞或PSC衍生細胞的所需細胞類型。幹細胞為可能產生大量特異性細胞類型之起點，該等細胞類型可用於再生醫學遞送至患有多種不同疾病之患者中。

如本文中所使用，術語「多潛能(pluripotent)」或「多能性(pluripotency)」係指細胞自我更新且分化成三個胚層：內胚層、中胚層或外胚層中之任一者之細胞的能力。「多潛能幹細胞」或「PSC」包括例如自囊胚之內細胞團衍生之或藉由體細胞核轉移衍生之ESC，及自非多潛能細胞衍生之iPSC。

如本文中所使用，術語「胚胎幹(embryonic stem)」、「ES」細胞及「ESC」係指獲自早期胚胎之多潛能幹細胞。在一些實施例中，該術語不包括涉及破壞人類胚胎之幹細胞；亦即，ESC獲自先前已建立ESC細胞株。

術語「誘導性多潛能幹細胞(induced pluripotent stem cell)」或「iPSC」係指藉由引入一或多個再程式化因子或使細胞與其接觸而從非多潛能細胞人工製備的多潛能幹細胞類型，諸如成人體細胞、部分分化細胞或末端分化細胞(諸如纖維母細胞)、造血譜系細胞、肌細胞、神經元、表皮細胞或其類似物。產生iPSC之方法包括例如誘導一或多個基因(例如，POU5F1/OCT4 (基因ID：5460)與(但不限於) SOX2 (基因ID：6657)、KLF4 (基因ID：9314)、c-MYC (基因ID：4609)、NANOG (基因ID：79923)及/或LIN28/LIN28A (基因ID：79727) 之組合)的表現。再程式化因子可藉由各種手段遞送(例如，病毒、非病毒、RNA、DNA或蛋白質遞送)；或者，內源基因可藉由使用例如CRISPR工具將非多潛能細胞再程式化至PSC中來活化。參見例如WO 2013/177133及WO 2022/204567。

用於誘導PSC分化成各種譜系之細胞的方法為此項技術中已知的。例如，用於誘導PSC分化成樹突細胞之方法描述於Slukvin等人, J Imm. (2006) 176:2924-32；及Su等人, Clin Cancer Res. (2008) 14(19):6207-17；及Tseng等人, Regen Med. (2009) 4(4):513-26中。用於誘導PSC變成造血祖細胞、骨髓譜系細胞及T淋巴球之方法描述於例如Kennedy等人, Cell Rep. (2012) 2:1722-35中。

重組PSC可分化成適合於療法之細胞，包括內胚層(例如，肺、甲狀腺或胰臟細胞或其祖細胞)、外胚層(例如，皮膚、神經元或色素細胞或其祖細胞)及中胚層(例如，心臟細胞、骨骼肌細胞、紅血球、平滑肌細胞或其祖細胞或前驅細胞)譜系中之細胞。

在一些實施例中，重組PSC分化成內胚層(例如，肺、甲狀腺或胰臟細胞或其祖細胞或前驅細胞)、外胚層(例如，皮膚、神經元或色素細胞或其祖細胞或前驅細胞)及中胚層(例如，心臟細胞、骨骼肌細胞、紅血球、平滑肌細胞或其祖細胞或前驅細胞)譜系中之細胞。

在一些實施例中，本發明之重組PSC分化成心臟細胞。在各種實施例中，心臟細胞為心臟祖細胞或成熟或不成熟(心房或心室)心肌細胞。在其他實施例中，心臟細胞為心臟內皮細胞或結節細胞。

在一些實施例中，本發明之重組PSC分化成人類免疫細胞，其視情況選自T細胞、表現嵌合抗原受體(CAR)或重組TCR之T細胞、調節T細胞、骨髓細胞、樹突細胞及/或巨噬細胞/單核球(例如免疫抑制巨噬細胞)或其祖細胞或前驅細胞。

在一些實施例中，本發明之重組PSC分化成寡樹突細胞祖細胞或前驅細胞或寡樹突細胞。在一些實施例中，本發明之重組PSC分化成微膠質細胞祖細胞或前驅細胞或微膠質細胞。

在一些實施例中，本發明之重組PSC分化成神經譜系細胞，例如神經脊細胞、星形膠質細胞、多巴胺能神經元祖細胞、多巴胺能神經元、中腦多巴胺能神經元祖細胞、中腦多巴胺能神經元、真實中腦多巴胺(DA)神經元、多巴胺能神經元前驅細胞、底板中腦祖細胞、底板中腦DA神經元或其祖細胞或前驅細胞。

在一些實施例中，本發明之重組PSC分化成眼系統之細胞，諸如感光受體細胞、感光受體祖細胞或前驅細胞、視網膜色素上皮(RPE)細胞或其祖細胞或前驅細胞、神經視網膜細胞或其祖細胞或前驅細胞。在其他實施例中，未經編輯之PSC分化成眼系統之細胞，其隨後經本發明之靶向構築體工程化。

在其他實施例中，本發明之重組PSC分化成微膠質細胞或微膠質細胞祖細胞或前驅細胞。

在其他實施例中，本發明之重組PSC分化成人類代謝系統中之細胞，其視情況選自肝細胞、膽管細胞及胰臟β細胞或其祖細胞或前驅細胞。

在其他實施例中，本發明之重組PSC分化成腸祖細胞或前驅細胞或腸細胞。

B. 分化細胞在另其他實施例中，待工程化之細胞為分化細胞(例如部分或末端分化細胞)。部分分化細胞可為例如組織特異性祖細胞或幹細胞，諸如造血祖細胞或幹細胞、骨胳肌肉祖細胞或幹細胞、心臟祖細胞或幹細胞、神經元祖細胞或幹細胞及間葉幹細胞。

可在其STAPLR中之一或多者處工程化之例示性分化細胞類型包括內胚層(例如肺、甲狀腺或胰臟細胞或其祖細胞)、外胚層(例如皮膚、神經元或色素細胞或其祖細胞或前驅細胞)及中胚層(例如心臟細胞、骨骼肌細胞、紅血球、平滑肌細胞或其祖細胞或前驅細胞)譜系中之細胞。或者，PSC可分化成此等譜系中之細胞且隨後經本發明之靶向構築體工程化。

在一些實施例中，心臟細胞經工程化。在一些實施例中，心臟細胞為心臟祖細胞或成熟或不成熟(心房或心室)心肌細胞。在其他實施例中，心臟細胞為心臟內皮細胞或結節細胞。

在一些實施例中，人類免疫細胞經工程化。人類免疫細胞視情況選自T細胞(例如，CD4+ T細胞、CD8+ T細胞或Treg細胞)、表現嵌合抗原受體(CAR)或重組TCR之T細胞、調節T細胞、骨髓細胞、樹突細胞及/或巨噬細胞(例如，免疫抑制巨噬細胞)，或其祖細胞或前驅細胞，諸如造血幹細胞或祖細胞。

在一些實施例中，寡樹突細胞祖細胞或前驅細胞或寡樹突細胞經工程化。

在一些實施例中，神經譜系細胞經工程化。在各種實施例中，神經譜系細胞為神經脊細胞、星形膠質細胞、多巴胺能神經元祖細胞、多巴胺能神經元細胞、中腦多巴胺能神經元祖細胞、中腦多巴胺能神經元、真實中腦多巴胺(DA)神經元、多巴胺能神經元前驅細胞、底板中腦祖細胞、底板中腦DA神經元或其祖細胞或前驅細胞。

在一些實施例中，眼系統之細胞經工程化。在各種實施例中，眼系統之細胞為感光受體細胞、感光受體祖細胞或前驅細胞、視網膜色素上皮細胞或其祖細胞或前驅細胞、神經視網膜細胞或其祖細胞或前驅細胞。

在其他實施例中，微膠質細胞或微膠質細胞祖細胞或前驅細胞經工程化。

在其他實施例中，人類代謝系統中之細胞經工程化。在各種實施例中，人類代謝系統中之細胞視情況選自肝細胞、膽管細胞及胰臟β細胞或其祖細胞或前驅細胞。

在其他實施例中，腸祖細胞或前驅細胞或腸細胞經工程化。

本文中可經工程化以將外源序列整合至STAPLR中之額外細胞類型為(但不限於)纖維母細胞、脂肪細胞、肌細胞(例如，骨骼肌細胞或平滑肌細胞)、骨細胞、骨髓細胞、骨髓祖細胞(例如，原始骨髓祖細胞)。

該等細胞可能來自已建立細胞株，或其等可為初代細胞，其中「初代細胞(primary cells)」、「初代細胞株(primary cell lines)」及「初代培養物(primary cultures)」在本文中可互換地使用，以指代來源於個體(例如人類)且允許活體外或離體生長用於有限數目之培養物繼代的細胞及細胞培養物。例如，初代培養物包括可能已繼代0次、1次、2次、4次、5次、10次或15次，但繼代次數尚不足以經歷危機階段之培養物。初代細胞株可活體外或離體維持少於10代。在一些實施例中，細胞在細胞療法之情形中為自體的。在一些實施例中，細胞在細胞療法之情形下為同種異體的。

可藉由任何適合方法自個體收穫初代細胞。例如，白細胞可適當藉由血球分離術、白血球分離術、密度梯度分離等收穫，而來自組織(諸如皮膚、肌肉、骨髓、脾臟、肝、胰臟、肺、腸、胃等)之細胞藉由活體組織切片收穫最適當。

前述分化細胞類型中任一者可以在其工程化之前自PSC分化。

本發明包含一種醫藥組合物，其包含本文中之工程化細胞及醫藥學上可接受之載劑。

IV. 鑑別 STAPLR 之方法本發明亦提供鑑別STAPLR作為用於哺乳動物細胞(例如人類細胞)中安全基因組整合之位點的方法。在此等方法中，第一步驟為選擇一組細胞類型用於單細胞RNA定序(「scRNAseq」)。細胞類型之實例在不限制的情況下為本文中所提及之彼等細胞類型，包括但不限於PSC (例如iPSC)、免疫系統中之細胞(例如T細胞、NK細胞、樹突細胞、巨噬細胞/單核球或其造血祖細胞)、心血管系統中之細胞(例如心室心肌細胞、結節細胞或心臟祖細胞)、代謝系統中之細胞(例如肝細胞及胰臟β細胞)、中樞神經系統中之細胞(例如感覺神經元、運動神經元、仲介神經元、微膠質細胞、寡樹突細胞或其祖細胞)、肌細胞(例如骨骼肌細胞及平滑肌細胞)、脂肪細胞及眼系統中之細胞(例如視網膜色素上皮細胞及感光受體細胞)。

第二步為進行scRNAseq分析，其中定序分析包含分配給通過品質標準之各細胞經轉錄基因之獨特轉錄組。為了通過品質標準，篩選轉錄組以排除具有高稀疏性或缺失之彼等轉錄組及可能衍生自超過一個細胞之彼等轉錄組。

隨後，各基因經分配一個盛行率分數。盛行率分數滿分為「1」且表示基於所收集資料集之scRNAseq資料庫含有所載基因之至少一種轉錄本的細胞之分率。在一些實施例中，scRNAseq資料集獲自PSC、多巴胺能神經元及/或其祖細胞(例如處於各種精選分化狀態下之彼等細胞)、微膠質細胞及/或其祖細胞(例如處於各種精選分化狀態下之彼等細胞)、心肌細胞及/或其祖細胞(例如處於各種精選分化狀態下之彼等細胞)、寡樹突細胞及/或其祖細胞(例如處於各種精選分化狀態下之彼等細胞)或巨噬細胞及/或其祖細胞(例如處於各種精選分化狀態下之彼等細胞)。

分配盛行率分數之後，判定哺乳動物(例如人類)基因組中各基因之位置。

鑑別哺乳動物細胞基因組中之STAPLR的下一步為鑑別鄰近非重疊基因。「非重疊基因(non-overlapping genes)」意謂基因在兩股中之任一股上彼此分隔至少50個鹼基對、至少75個鹼基對、至少100個鹼基對、至少200個鹼基對、至少300個鹼基對、至少400個鹼基對、至少500個鹼基對、至少1000個鹼基對、至少1500個鹼基對、至少2000個鹼基對、至少2500個鹼基對、至少3000個鹼基對、至少3500個鹼基對、至少5000個鹼基對、至少10000個鹼基對、至少15000個鹼基對或至少20000個鹼基對。用於計算鑑別非重疊基因之基因距離的轉錄本可由任何基因組資料庫(諸如NCBI之RefSeq資料庫及GENCODE資料庫)指定。

在一些個例中，不同基因組資料庫含有非共識基因邊界標註，其可引起關於兩個基因是否重疊之不同所計算基因距離及相反結論。在此類情況下，若藉由使用至少一個基因組資料庫測定非重疊，則兩個基因視為非重疊的。例如， MLF2下游側接有其鄰近基因 PTMS。如NCBI RefSeq資料庫中所標註，此等基因為非重疊的，其中基因間距離為約13 kb；然而，GENCODE V38資料庫記述一個 MLF2轉錄本之起始位點位於在相對股上編碼之 PTMS的第一內含子內。在此情況下，考慮RefSeq標註但不考慮GENCODE標註，並將此基因對歸類為非重疊。

一旦兩個或兩個以上基因視為非重疊，則確定非重疊基因對或包含三個或更多個非重疊基因之區域的鄰近分數。鄰近分數為個別盛行率分數之結果且反映兩個基因在集合scRNAseq資料集中轉錄活性之機率。鄰近分數實質上為轉錄活性基因附近之排序。

隨後分選鄰近分數以獲得非重疊基因對的排序或包含三個或更多個基因之區域的排序。一旦鄰近分數排序後，選擇具有最佳鄰近分數的基因對或包含三個或更多個基因之區域，且將所選基因對或區域之基因之間的基因間區域鑑別為潛在STAPLR。

可靶向STAPLR用於安全基因整合。然後標註具有排序最高鄰近分數之基因間區域以便設計用於位點特異性整合之同源臂。一般而言，對於整合位點需避免之序列包括啟動子區、強化子區、CpG島、表觀遺傳標記(例如H3K4Me1、H3K4Me3及H3K27Ac)、DNase I超敏峰、保守區及重複區。UCSC基因組瀏覽器可與(但不限於)以下基因標註渠道一起使用：GENCODE V32/RefSeq Genes/GTEx RNA-seq/EPDnew Promoters/ENCODE (轉譯、H3K4Me1、H3K4Me3, H3K27Ac及DNase Clusters)、GeneHancer、CpG Islands、Conservation 100脊椎動物及RepeatMasker。

在選擇可靶向基因間子區域時，必須避免已知啟動子區及強化子區。另外，保守區、重複區、表觀遺傳標記及DNase超敏區為選擇可靶向區域時應最小化的特徵。在一些實施例中，可靶向基因間子區域包含CRISPR核酸內切酶原始間隔基相鄰基序(PAM)位點之序列。PAM位點為緊隨藉由Cas (例如Cas9或Cpf1)核酸內切酶靶向之DNA序列的2-6鹼基對DNA序列。合成稱為導引RNA (gRNA)之短寡核苷酸以在CRISPR/Cas基因編輯系統中執行tracrRNA-crRNA複合物之功能。gRNA識別在5'或3'末端處具有PAM序列之基因序列。不同Cas蛋白質可識別不同PAM。例如，來自化膿性鏈球菌( Streptococcus pyrogenes)之Cas9識別5'-NGG-3' (「N」：任意核鹼基)；來自金黃色葡萄球菌( Staphylococcus aureus)之Cas9識別5'-NNGRR(N)-3'；來自腦膜炎雙球菌( Neisseria meningitidis)之Cas9識別5'-NNNNGATT-3'；來自空腸彎曲桿菌( Campylobacter jejuni)之Cas9識別5'-NNNNRYAC-3' (「Y」：嘧啶)；來自嗜熱鏈球菌( Streptococcus thermophilus)之Cas9識別5'-NNGRR(N)-3' (「W」：A或T)；來自毛螺菌科菌屬及胺基酸球菌屬之Cpf1 (Cas12a)識別5'-TTTV-3' (「V」：G、A或C)；來自環脂酸芽孢桿菌屬( Alicyclobacillus acidiphilus)之Cas12b識別5'-TTN-3'；及來自嗜熱芽孢桿菌屬( Bacillus hisashii)之Cas12b v4識別5'-ATTN-3'、5'-TTTN-3'及5'-GTTN-3'。

最後，確認所鑑別之基因間區域將安全地支撐外源基因有效負載可藉由使用基因編輯系統將轉殖基因插入基因間區域內之靶向位置來進行。基因編輯系統可為例如CRISPR系統(例如使用上文所揭示之CRISPR核酸內切酶的彼等系統)、Cre/Lox系統、FLP-FRT系統、TALEN系統、ZFN系統、利用歸巢核酸內切酶之系統、產生同源重組之系統，或利用非核酸酶依賴性病毒載體(例如反轉錄病毒載體、AAV載體或慢病毒載體)之系統。持續型、可誘導型、組織特異性或譜系特異性啟動子可用於引導所插入轉殖基因的表現。

在一些實施例中，所靶向基因間區域為至少30、40、50、75或100個鹼基對長。在一些實施例中，基因間區域不包含啟動子區或強化子區。雖然基因間區域不包含保守區、重複區、表觀遺傳標記及/或DNase超敏區可能較佳，但在一些實施例中基因間區域實際上可含有最小量之保守區、重複區、表觀遺傳標記及/或酶超敏區。例如，在一些實施例中，基因間區域將不包含CpG島、H3K4Me1表觀遺傳標記、H3K4Me3表觀遺傳標記、H3K27Ac表觀遺傳標記、DNase I超敏區、保守區或重複區。然而，在一些實施例中，基因間區域可包含CpG島、H3K4Me1表觀遺傳標記、H3K4Me3表觀遺傳標記、H3K27Ac表觀遺傳標記、DNase I超敏區、保守區或重複區。所允許保守區、重複區、表觀遺傳標記及/或DNase超敏區的量視各種因素而定。此等因素包括例如基因間區域之尺寸；保守區、重複區及/或超敏區或表觀遺傳標記之尺寸；gRNA結合位點之存在；或合成5'及3'同源臂以用於靶向之挑戰。

在基因組整合之後，量測經整合之轉殖基因的轉錄水平，且當經整合之轉殖基因呈現持續轉錄(或當誘導調節轉殖基因之可誘導型啟動子時呈現持續轉錄)時，所選基因對之間或所選區域內的基因間區域確認為STAPLR。

除非本文中另外定義，否則結合本發明使用之科學與技術術語應具有由一般技術者通常理解之含義。下文描述例示性方法及材料，但類似或等效於本文中所描述之方法及材料的方法及材料亦可用於實踐或測試本發明。在有衝突之情況下，將以本發明(包括定義)為準。此外，除非上下文另外需要，否則單數術語應包括複數且複數術語應包括單數。在整個本說明書及實施例中，詞語「具有(have)」及「包含(comprise)」或諸如「具有(has/having)」、「包含(comprises/comprising)」之變化形式應理解為暗示包括陳述的整數或整數群，但不排除任何其他整數或整數群。本文中所提及之所有公開案及其他參考文獻均以全文引用之方式併入本文中。儘管本文中引用多個文獻，但此引用不構成此等文獻中之任一者形成此項技術中公共常識之部分的許可。如本文中所使用，術語「大致(approximately)」或「約(about)」當應用於相關之一或多個值時係指類似於所陳述參考值的值。在一些實施例中，除非另行說明或以其他方式自上下文顯而易見，否則該術語係指值之範圍在所陳述參考值之任一方向(大於或小於)的10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更低內。

根據本發明，附屬請求項中之反向參考意謂用於由反向參考所指示申請專利範圍中之各個及每一組合之直接及明確揭示內容的簡寫。另外，創建本文中之標題係為了易於組織且不意欲以任何方式限制所主張發明之範圍。

為了能更好地理解本發明，闡述以下實例。此等實例僅為達成說明之目的且不應解釋為以任何方式限制本發明之範圍。

實例

實例 1 ：用於 STAPLR 靶向 之設計 gRNA 之選擇吾人使用CRISPOR鑑別靶向中點區域附近的基於Cas9之gRNA，其中STAPLR構築體同源臂側接轉殖基因整合之預期位點。吾人排除在基因組中具有完美脫靶之gRNA。吾人將具有最大3 bp脫靶錯誤配對之gRNA的使用減至最少。針對各STAPLR位點選擇三個gRNA，如表 2中所見。表 2. 用於靶向精選 STAPLR 位點之 gRNA

STAPLR 位點	gRNA 序列 (5' → 3')
PRDX1- AKIR1A1	CTTGCAGCACTGCCTAGGCT (SEQ ID NO: 71)
TGGTTCTTGCAGCACTGCCT* (SEQ ID NO: 72)
TCTTGCAGCACTGCCTAGGC (SEQ ID NO: 73)
ACTB- FSCN1	GCCCACCTTGAAGATCTGTA* (SEQ ID NO: 33)
TGCCCACCTTGAAGATCTGT (SEQ ID NO: 34)
CACCTTGAAGATCTGTAGGG (SEQ ID NO: 35)
RPL34- OSTC	TTATCATGATACTATGTCCC* (SEQ ID NO: 25)
AGTTACTGAGCACAGTGCCT (SEQ ID NO: 26)
GAGTTACTGAGCACAGTGCC (SEQ ID NO: 27)
AKIRIN1- NDUFS5	ATTAATGCCTTTAAATAGGT (SEQ ID NO: 55)
TCTTAAACCTACCTATTTAA* (SEQ ID NO: 56)
GCTAATTAATGCCTTTAAAT (SEQ ID NO: 57)

*較佳實施例。

用於STAPLR靶向之額外基於Cas9之及基於Cpf1之gRNA的清單列於表 3中。表 3. 額外 STAPLR 靶向之 gRNA

STAPLR 位點	核酸酶	gRNA 序列 (5' → 3')
PRDX1- AKIR1A1 位點 1	Cas9	CTTGCAGCACTGCCTAGGCT (SEQ ID NO: 74)
TGGTTCTTGCAGCACTGCCT (SEQ ID NO: 75)
TCTTGCAGCACTGCCTAGGC (SEQ ID NO: 76)
TAGGCTGGGCTCAAACTCCA (SEQ ID NO: 77)
CTAGGCTGGGCTCAAACTC (SEQ ID NO: 78)
TGAGAGGATCACTTGAGCCC (SEQ ID NO: 79)
CTGGAGTTTGAGCCCAGCCT (SEQ ID NO: 80)
TTCTTTGTTTGTTTAGAGAC (SEQ ID NO: 81)
Cpf1	AGCCCAGCCTAGGCAGTGCTG (SEQ ID NO: 82)
GAGACTGGTTCTTGCAGCACT (SEQ ID NO: 83)
TTTAGAGACTGGTTCTTGCAG (SEQ ID NO: 84)
TTTGTTTAGAGACTGGTTCTT (SEQ ID NO: 85)
TTTGTTTGTTTAGAGACTGGT (SEQ ID NO: 86)
ACTB- FSCN1	Cas9	GCCCACCTTGAAGATCTGTA (SEQ ID NO: 38)
TGCCCACCTTGAAGATCTGT (SEQ ID NO: 39)
GGGCCAAGAGGCTCAGTCAC (SEQ ID NO: 40)
GGATAAAGAGATCAGGTCCA (SEQ ID NO: 41)
CACCTTGAAGATCTGTAGGG (SEQ ID NO: 42)
TCCCTACAGATCTTCAAGGT (SEQ ID NO: 43)
TTCAAGGTGGGCAAGGAACT (SEQ ID NO: 44)
TCCCTCCCTACAGATCTTCA (SEQ ID NO: 45)
CTCCCTACAGATCTTCAAGG (SEQ ID NO: 46)
ACCTTGAAGATCTGTAGGGA (SEQ ID NO: 47)
CTTCAAGGTGGGCAAGGAAC (SEQ ID NO: 48)
ACAGATCTTCAAGGTGGGCA (SEQ ID NO: 49)
AAGAGATCAGGTCCAAGGCC (SEQ ID NO: 50)
GGGCAAGGAACTGGGCCAAG (SEQ ID NO: 51)
TAGGGAGGGATAAAGAGATC (SEQ ID NO: 52)
ATCAGGTCCAAGGCCAGGTG (SEQ ID NO: 53)
AGGTCCAAGGCCAGGTGCGG (SEQ ID NO: 54)
TGAACCACCGCACCTGGCCT (SEQ ID NO: 36)
Cpf1	TCCCTCCCTACAGATCTTCAA (SEQ ID NO: 37)
RPL34- OSTC	Cas9	TTATCATGATACTATGTCCC (SEQ ID NO: 28)
AGTTACTGAGCACAGTGCCT (SEQ ID NO: 29)
GAGTTACTGAGCACAGTGCC (SEQ ID NO: 30)
Cpf1	CAAGCATTTATCATGATACTA (SEQ ID NO: 31)
TCATGATACTATGTCCCAGGC (SEQ ID NO: 32)
AKIRIN1- NDUFS5	Cas9	ATTAATGCCTTTAAATAGGT (SEQ ID NO: 58)
TCTTAAACCTACCTATTTAA (SEQ ID NO: 59)
CCACTTCCCTCCTCCATTAA (SEQ ID NO: 60)
GCTAATTAATGCCTTTAAAT (SEQ ID NO: 61)
CTTTAATGGAGGAGGGAAGT (SEQ ID NO: 62)
CCTTTAATGGAGGAGGGAAG (SEQ ID NO: 63)
TTTAATGGAGGAGGGAAGTG (SEQ ID NO: 64)
Cpf1	ATGGAGGAGGGAAGTGGGGTG (SEQ ID NO: 65)
AGAGAATCTATGTCACCCCAC (SEQ ID NO: 66)
AAGGCATTAATTAGCGTTTGC (SEQ ID NO: 67)
AATAGGTAGGTTTAAGAGAAT (SEQ ID NO: 68)
CATGCACTACTTTAAAATTTT (SEQ ID NO: 69)
AAGTAGTGCATGCAAACGCTA (SEQ ID NO: 70)
PRDX1- AKR1A1 位點 2	Cas9	AAGGGCCAAGGGAGTTAGTG (SEQ ID NO: 87)
AGCTCCCTCACTAACTCCCT (SEQ ID NO: 88)
AGGGCCAAGGGAGTTAGTGA (SEQ ID NO: 89)
PRDX1- AKIR1A1 位點 3	Cas9	ATGAAAAATAAGCCCGGTAG (SEQ ID NO: 90)
CAGGCTGAGTCACCACTACC (SEQ ID NO: 91)
ACAGGCTGAGTCACCACTAC (SEQ ID NO: 92)

對於各STAPLR位點，用與呈核糖核蛋白(RNP)形式之Cas9核酸酶複合的各個別gRNA對人類iPSC進行核轉染。三天後，收穫經核轉染細胞，萃取基因組DNA，且對側接預期切割位點之基因組區域進行PCR擴增。對經純化PCR產物進行定序，且經由Synthego之ICE Analysis Tool (可在Synthego之網站獲得)分析定序資料之總切割效率( 圖 1)。當顯示大於50%的插入缺失編輯時，認為gRNA為有效的。

資料顯示每個STAPLR位點存在至少一個有效gRNA (＞50%的插入缺失編輯)。選擇具有最大總切割效率之gRNA用於未來實驗以在STAPLR位點整合轉殖基因。

STAPLR 同源臂之設計生成由均高度表現之基因組成的基因鄰之清單。對此清單進行篩選以移除含有至少一個基因為已知腫瘤抑制基因或致癌基因的基因對。起初，忽視其間具有小於5 kb基因間距離之基因對。然而，亦可標註且測試側接基因之間僅具有約100個鹼基基因間距離的基因對。設計中避免啟動子區、強化子區、CpG島及含有表觀遺傳標記物之區域。將避免調節元件且能夠在供體質體中合成之子區域歸類為潛在同源臂區且用作gRNA搜尋之基礎( 表 4)。表 4. 用於選擇 STAPLR 之參數

STAPLR 位點參數

位點側接有高度表現之相鄰基因

側接基因不係已知腫瘤抑制基因或致癌基因

側接基因之間的基因間距離＞50個鹼基

位點避免已標註之調節元件及重複區

位點允許同源臂合成且選殖至供體構築體中

位點具有可用的CRISPR gRNA，該等CRISPR gRNA具有預測之高效率及低數目之脫靶

在選擇具有預測高效率之gRNA之後，同源臂序列最終確定集中於在側接轉殖基因整合預期位點之800 bp左同源臂及800 bp右同源臂之內的所選gRNA。表 5指示各例示性STAPLR位點之兩個基因鄰之間的鹼基對中的基因間距離以及基於hg38人類參考基因組之各組STAPLR左同源臂及右同源臂之配位。使用NCBI之RefSeq資料庫計算基因距離。表 5. STAPLR 基因鄰之間的基因間距離及 STAPLR 同源臂配位

基因鄰	同源臂染色體配位 (Hg38)	基因間距離 (bp)	插入點至上游基因鄰之距離 (bp)	插入點至下游基因鄰之距離 (bp)
RPL34- OSTC	chr4:108,638,253-108,639,852	20,100	8,568	11,532
ACTB- FSCN1	chr7:5,545,025-5,546,624	62,214	15,223	46,991
AKIRIN1- NDUFS5	chr1:39,012,798-39,014,397	20,229	7,533	12,696
PRDX1-AKR1A1 位點 1	chr1:45,525,540-45,527,139	27,888	3,449	24,439
PRDX1-AKR1A1 位點 2	chr1: 45,524,377- 45,525,976	27,888	2,286	25,649
PRDX1-AKR1A1 位點 3	chr1: 45,528,804- 45,530,403	27,888	6,713	21,222

基於hg38人類參考基因組之靶向構築體之左同源臂及右同源臂的序列顯示於下表中。表 6. STAPLR 左同源臂及右同源臂

STAPLR 位點	左同源臂	右同源臂
AKIRIN1- NDUFS5	TTCTCATTTAGCAAGAGTGGAAAACTGTTGTGGATCCCAGGAGAAGTCTGGAGCTAGGTAGTAGGGGCTAGATAATAGAGGGCTTTGACTAATAGGAGTTTGGGCCTTATCCTGTGGAAATCTGAAGGGTTTTGGGAAAATGAATTCAGGGCTAGGTGCAAGACAGAAGGGCAAATACCAGACTAAGACACACAGCCACTAAGAGCCTCTTTTTTTTTTTTTGTCCAGTCAGAGGTAATGAGGCCTATATATTTATTAGGAAGGATGATTAACCATGGCTGTAGCTTCACCTAAGAGGAACGTGGCTCTTGGGCCGGGTGCGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGTAGAGGTGGGCGGATCACCTGAGGTCAGGAGTTCAAGACCAGCCTGACCAACATGGAGAAACCTCTTCTCTACTAAAAATACAAAATTAGCCGGGCGTGGTGGTGCATGCCTGTAATCCCTGTTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACCTGGGAGGTGGAGGTTGCGGTGAGCTGAGATCACACCATTGCACTCCAGCCTGGACAACAAGAGCAAAACTCTATCTCAAAAAAAAAGAGAGGAATGTGGCTCTTGAAGAATCTTTCTAGTCTCATCTTCCCTGTCCCCTTAGACACACCTTCAAAGATCCTTTTTCTTTTGGTTTGGCTTGTCTTTCCCCCTCACTTTACCTAATCCAGCCCAATTCCATAGCCACTGCTGGTTCCTTTAATGGAGGAGGGAAGTGGGGTGACATAGATTCTCTTAAACCTACC (SEQ ID NO: 17)	TATTTAAAGGCATTAATTAGCGTTTGCATGCACTACTTTAAAATTTTCCTCTCAATTGCTTGAGTCCAGGAGTTCGAGGTTACGGTGAACTATGATTTCACCATTGCAGTCCAGCTGAGGCAACAGAGAGAGACCCTCTTAAAGAAAAAAAAAACTTTTTCCTCTCAGACTCTGTCCCTAGCATTGACTCACCCCATCATTTTTTTTTTTTTTCTTGAGATGGAGTTTCAAGAAAAAACTCCAGGCTGGAGGCAGTGGTATGGTCTCGGCTCACTGCAACCTCCGCCTCCCGGGTTCAAGCGATTCTCCCTGCCTCAGCCTCCCAAATAGCTGGGATTACAGGCACCCGCCACCACACCCAGCTAATTTTTTGTATTTTTAGCAGAGACGGGGCTTCTCCATATTAGCCAAGCTGGTCTGGAACTCCTGACTTCAAGTGATCCACCCACCTTGGCCTCCCAAAGTACTGGGATTACAGGCACGAGCCACCGCGCCCGGCCTTCACCTATTATATCTATTCTTGTCTTTTAAATAGTGAGTGACTTCACAGCTCAGTCTCTTTGTTCTGAACTTCCATTCTGAGTCGCAACCCAGGTACACCTTAGGAAGGGCGGGATCCCGTTATCCTGTCCCTGAACATCAACTACTGAGACAGCTGATGAAGCTGGCTCGGTGTGTGACGGAGGCCCCCTCAGAGTCAGCAGAGCCGAGCGTACAGCGCACATCAGGCAGAGCAGACCAGAGGCAGGGAAGACACACTGGGGCAGGGCCAGTGGGCACATCTGGACCACCTGCGAGGG (SEQ ID NO: 18)
RPL34- OSTC	TTATTCTTCACAGAGGACAGCTCCCAACTCTTTACCTCTCTTCCTAATGCAACACTCACTCTCACTCTCAGCAGCCTTATAATATCTGTAAATGTAGAAACTATCAGTTATGAACTTCTGTAACTCCCTTTTCATCTTTGGCACCTCAAAACTTTAATGTATGTAAAAGCATGGGCTTTGAAATTGGTAAACTGGAGCTCTATCAATCTCTGGCTGTGTCAACTTGAGCATGTTGCCCAATTTCTATGAGCCTCAGTTTTCTTATCTAAAAAATGAAACTAATAATGCCTACTCCAAAGAATTGTTGGATGGATTAAGTAAGACAACCTAATATAATTGCTGTGCATAGTAAATCCTAACTGTTGGTTGCCTTATACCTCTAATCTTCTTTCTGCTCTCTTTTCTTTAGAAGATGGCATGCATCTTTTCCAAGGTAAATTTTACCTCTGTTGAACTCTATCCCATACTCTCTTGCCATGGCCCTAATTTTGTTCAGTTACTTAACTCCTTCCCTTCCCTCTGACATCCTTGGTCCCTTCCTCTCCACAGTTTTATTCTCTCGTCTTACACAAACATGCCCAAGTCTCATCATCCATAAAAACCTCTGTCATTACCACTTCAGCTCTCTTCTTCTGTTCATACCCAGCTGTGTTGGGTGCCATGAATCATTCACTACTATTATTTTTAAAATTCCTATCACTACTTCTCCCCTCTGCAATCTGGCTTCTCCTGCCAACATGCTACTGAAATTAATGAATTAATTCATCAAATATTTACAAGCATTTATCATGATACTATGT (SEQ ID NO: 19)	CACAGGCACTGTGCTCAGTAACTCAAGTCATTATAATACTGTGTGCTTGACAATATGTTGTACTTACTGGCCAAAAATCACCAATGTCTAATTGTCAAGCTAAATGTCTTCTTTCAATTTCAATCTATCTGACATGCTGGAAACTTCCCTTTCCAAGGCTTCTTTGCTATCGCTCCCTTGGCTCTTCTGTTCCTTTGATCTTGCTGTATTTACTTTGTAGTATCCTCCTAATTATGGGGGTGATTCCCTAGGCATCCATCTTCAGCTTTCTTCTCTCTCACTCTTTTAACTTTACTCTGTGAATTTCCTGTAATTATACACTACATTTGGTGTGTGTGTGTGTGTGTCTGTGTGCACGTGCATTTTTCTAGGAAGGAGTTCATAGCTTTTATCAGCTCTGCAAGGAGGTCTATGACCCTCCCAATAACAACCCTGACCAGTTCCACCTCACGTGTAGACACATTCTTCCACTGTGATGACTTCCATTATCCTCCACATGCTGCTGATTCCTGGATCTCCAACCCTAAACCTCTTTCCCATGCTCCAGCGACCATCTTCCCAACTCTGCCTAGGTCCCTCCTGGAGGGTCCTTCTAGAATAATAGTTCTCATCAGGCAGGTGGCAGAACCTCTGTCTCCCACTCCTTGCATGCCCCTCTGTGAGGCTTGGGTGGGTTGGGGGTGATGGGAGGGGTGCGTGTATAATCAGAGTCCCTGGGGTGCAGAAGCTCTGTTCTGACCTTGCCTCTTGCTATCCATGGAATTACTGCTCTATCCTGGCCATTTTCCCATTCTCTTTCT (SEQ ID NO: 20)
ACTB- FSCN1	GAAGCCGGGTGTGGTGGTGCATGCCTGTGGTCCCAGCCACTTGGGAAACTGAGGTGGGAGGATTGCTCAAGCCCAGGAGGTCAAGGCTGCTGTGAGCTATGATTGTGACACTGCACTCCAGCCTGGGCAACAAAGGGAGACCCCTTAACTAACTAAATGAATGAATGAATGAATGAATGAAGGCAACCTGAGCTGCATTCCTTGGCCTGCCAACCTGCCCAGCCCCATCCCTCAGCCCTCCCTGAGTCTGAGGGCCCTGCAGGTCCCACACAGGGCCAGGCTCCATCTTGTTTCTGCAAATTTGCACCTTCCGTTCCATTCCCTGCCACACTGCTCACGGGTCACCATGGATGCTGGATAACTGCCACCGTCTCCTTGGAGAAGCCCTCCGTCATCTCAGCCCCTGATGTCAGGTATTCAACCTGCAAATCCTCCCTGTAGGTGCTGGGCTCTCCAGAGCCCTGGGCTGTGTGCAGGGGACTCAGGGGAGAACGGGCCCCACCCAGCTCCTTCCTCACAGAGCTTTCAGAGGCTGGGGGCCTCCCTGATCCCCTCCCAGATCCCAAGGCCCCTGCTGCCCCCACCCTGCAGACTGGGACTCCGTGAGGCTGGGCTCTGACTTGGATATTGTGGTTCCAGCACACAGCAGGCACCGTGGCTGTAGTAGGCGTGCATGGGAAGTCAGGAGGAGCAGACCTGTCATCTCCCCTGCTGAGGACACAGCCCGGTCAGCGTGTCTTGGCGGCCTGGGGCCAGTGACTGAGCCTCTTGGCCCAGTTCCTTGCCCACCTTGAAGATCT (SEQ ID NO: 21)	GTAGGGAGGGATAAAGAGATCAGGTCCAAGGCCAGGTGCGGTGGTTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCAGGCAGATCGCGAGGTCAGGAGTTCGAGACGAGCCTGGCCATCATGGTGAAACCCCGTCTCTACTAAAAATACAAAAATTGGCCAGGCATGGTGGCAGGCGCCTGTAATCCCAGCTGAGGCAGGAGAATCGCTTGAACCCGGGAGGTGGAGGTTGCAGTGAGCCGAGAGCGAGCCACTGCACTCCTGCCTGGGTAACAAAGCAAGACTCCATCTCAAAAAAAAAAAAAAAAAAAAAAATCAAGTCTGGCGCAGCCCCAGGAAGCAATCTTGGGCTGGGCACACCGCATTTCTGTGACATGAAGGCAGCGACACCTCGTCGCTGTCACAGGGTTGCTGGGGTTGGGGGCTAGAGGAGAGGAGGAGCCTCTGTTGAGGGCTCCAAGAAGGGACAGAGAGGTGGTGCTCATGGGTCCTGGAGACACCTTTTGGGTGGTTCGTGCCCTCCATCCTGGGCCACTTTGGGGAGGTGAAGGAGGGAAGCATTAAGGGACAAGACCCCCCGTTCCCAATTTCTCTCCGGAGCCAGGGTTTCTCTGATTCGAAGAAACAGGTGTCACAACCCAGGAAGTCCACTGATGGCATCTGCCCTGGGGCATCAGCATTTAGGGCTGATCACTGAGGTCTGCACCTCCCAAGGCTGCTGTGCCCATTCCTGGGCGCCCCAAAGGGGAAGAAAAACTCCTGAATGTGCACCGGGACAGGACCCATCCCATGCGG (SEQ ID NO: 22)
PRDX1- AKR1A1位點1	AGAAAATTGCCACCTATTGTATTCACCATATGCCAGGCATTGGGCTGGGCACTTGAGTTTATTTTTCTAATTCAAGAACAAGGCCAGGCACGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTAAGGCGGGCAGATCACAAGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGAGAAATCCCATCTCTACTAAAAATACAAAAATTAGCTGGGTTTCGTGGTGTGCACCTGTAGTCCCAGCTACTCAGGGGGCTGAGGCAGGAGAATCTCTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCCGAGATCGCGCCACTGCACTCCAGCCTGAGTGACAGAGTGAGACTCCGTCTAAAAAAAAAGAACAAAAGCCGGGCATGGTGGCTCAAGCCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGCAGATCATGAGGTCAGTAGTTCCAGACCAGCCTGACCAACATGGTGAAAACCTGTTTCTACTAAAAATACAAAAATTAGCTGGGCGTGGTGGCAGGCACTTGCAATCCCAGCTACTCAGGAGGCTGCAGCAGGAGAATCACTTGAACCCGGGAGGCAGAGGTTTTAGTGAGCTGAGATCCCGCCACTGCACTCCAACCTGGGCAACAGAGCAAGACTCTGTCTCAAAAAAAAAAAAAAAGAAAAAAGAAAAAAAGAAAAGAAAAAAGAACTAAAAGAGAGTGGAGCACATTTGGCATGTGACTATAGTCCCAGCTACTTGGTAGGCTGAGGTGAGAGGATCACTTGAGCCCTGGAGTTTGAGCCCAGC (SEQ ID NO: 23)	CTAGGCAGTGCTGCAAGAACCAGTCTCTAAACAAACAAAGAAAAAAAAACAGGAAAAAAAAAGAGTTATCCTAGCCTAGAGAAATGTTAACAGTCTATCCCCTTAAGATCATAAAAGTGAAATAACTGGACAGAGTACTGAAAAAAGAAGAAATCTGTTGAACAAGTCTAAGTGATTTGTAGAGTCTCTCCAAAGGACAGTAAAGATTTCAGAACCATGGGGAGGAGGCTTTCTTGCAGGGTCTGATGTATACCTCTAGTTCTATTTTTAGATATATTCCATTGTGCTCTCTTCATTTGCTCACCATTAGCATGGGAATTATTCCCCTTGTTTTATTTATATTTGTAGTAACAAGTCTAGCACAGTAACTGGCATAGAAGTACTTAATAAATGTTACAATGTGTTGAAGACTTTTGAGATGTAGAATTAAATTATTTGAACTACGTTTCAGGAAGTTGACTCTGGAAGCTGTGTGATGAATGAATTTAGTGACTAGGAGATTAGGCAAAGAGAGCAATTGGGAGGCCACGGCAATGATCCAGACAAGAGAAGTCTCAGAACTGTAATATGACATTAGCAGCAGGGTAGAAAGAAGGAAATACAAGGTATATTTCTTCAGGCTTTAGGATTAATTGGATTTAGGATGAAAGGAAAGAGTAAATTAAATCCAGTTTCTTGGTGACATGAGTGATGTCATTAACCTGTGACATAGGAAACACTGGAAGAAAAGCAGGTTTGAGGTTTAAAATAATGTTAAACAGGCCGGGAGCGGTGGCTCACGCCTGTAATCCCAACATTTT (SEQ ID NO: 24)
PRDX1- AKR1A1位點2	AATAATATTAATACTTTATTGTGATTATCTATGTAGTTCAGTACAGTACTTAGTTCTTATTATAAATTAGAAATGTTAGCTGCTATTAGTATAACTCTTCCATCCTTCACACTTATAACACCCAGAACACAGTGTAGTTGTTTCAAGCCTTCAGACTTTTTTTTTTAAGATGGAATTTCGCTTTTCTTGCCCAGGCAGGAGTGCAATGGCACGACTTCTGCTCACTGCACCCTCCACCTCCAGCGTTCAAGCAATTCTCCTGCCTCAGCCTCCCAAGTAGCTGGGATTACAGGCGCCCACCACCACGCCCGGCTAATTTTTTGTATTTTTAGTAGAGACGGGGTTTCAGTATGTCAGCCAGGCTGGTCTCAAACTCCTGACCTCAGTTGATCTACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGGAGTGAGCCACTGAGCCCGGCCGCCTTCAGACTTTTGTTTGAACCTGGAAAACTCTTTCCCTGGAGAAAACATGTCTTTCAGCATTACTTTCTCTCCGGCTGTTTCTTACCTTTACTCATTCCCAGGATTTACAATTCCCCTCCTTTGTGTCCAAACAATAGCTTGTATAGCCAAAAAAATCTTTTAAGCAATTTTAGTTTTACATTTCTTCCTCTGCCTGCTAGAGTGACTTTCTGGAGAGTAGGATGTGGGTGACATCTGTCTCTGTGTCCCCAAAGTCACAACAAAGCATCTGATATAAAATAGGAGCTCAGTCAGTGAGCATTCAATCAATAGTATCATGTTTCTGTCTCTGTCCCCAGCTCCCTCAC (SEQ ID NO: 93)	TAACTCCCTTGGCCCTTATAGTGGGATAATGAATGAGGAAGTGCTGTCTCATGCTCATTGAGCATCTCAATTTTTGTTATTTATCATACTACTTTGCATAGACGTGATTTATTTGCTTTTTCCTTCTTTGCCTGAGGCTGAATAGTTAGTTGGCATTATTCCTTTTTTTAATTTTTATGTAACTTTTATTCTTTTTTATCAGGCAGCCACCCGAGCCAGCAGCCAGCGTAGGCTCAGAGAGACTCCCCTTTCTTTCTTGCAGGAGCAAGGGCAGCATGAAAGTTCAGAGCTTAATAATGGATGGTTATTGGCTATGGGCAGGCTAAACCAATACACAGTACATACAGTCATACTTCAGCCCAAAGAAAATTGCCACCTATTGTATTCACCATATGCCAGGCATTGGGCTGGGCACTTGAGTTTATTTTTCTAATTCAAGAACAAGGCCAGGCACGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTAAGGCGGGCAGATCACAAGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGAGAAATCCCATCTCTACTAAAAATACAAAAATTAGCTGGGTTTCGTGGTGTGCACCTGTAGTCCCAGCTACTCAGGGGGCTGAGGCAGGAGAATCTCTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCCGAGATCGCGCCACTGCACTCCAGCCTGAGTGACAGAGTGAGACTCCGTCTAAAAAAAAAGAACAAAAGCCGGGCATGGTGGCTCAAGCCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGCAGAT (SEQ ID NO: 94)
PRDX1- AKR1A1位點3	TGTTCACGTGTTTGTCTGCTGACCCTCTCCCCACAATTGTCTTGTGACCCTGACACATCCCCCTCTCCGAGAAACACCCACAAATGATCAATAAATACTAAGGGAACTCAGAGGCTGGCGGGATCCTCCATATGCTGAACGCTGGTCCCCTGGGTCCCCTTATTTCTTTCTCTATACTTTGTCTCTGTGTCTTTTTCTTTTCCAAGTCTCTCGTTCCACCTAACAAGAAACACCCACAGGTGTGGAGGGGCAACCCACCCCTTCACCATCTCCACAAAAAATAAAAAATTAGCCCAGTGTGGTGGTGTGTGCCTGTGGTCCTAACTAGTCCAGAGGCTGAGGTGGGAGGATTGCTTGAGTCCCAGAGCTCGAGGCTGCAGTGAGCCGAGATGGCACCACTGTACTCCAGCCTGGGTGACAGAGTGAGCAGAGTGAGACCCTGTCTCAAAAAATAATAAAATAAAATAATGGGAACCCAAATCACAAGACAGCACTCATTTTTCTTTTATTTATTTTATTTTTTTTGAGACAGAGTCTTGCTCTGCTGCCCAGACTGGAGTGCAGCAGCATGGTTTCGGCTCACTGCAACCTCCACCTCCTGGGTTCAAGTGATTCTTGTGCCTCAGCCTCCCAAGTAGCTGGAATTACAGGTATGTGCCACCATGCCTGACTGATTTTTGTATTTTTAATAGAGACAGGGTTACGCCATGTTGTCCAGTCTGGTTTCGAACTCCTGGTCTCAAGGGATTCACCCATCTCGGCCTCTCAAAGTACTGGGATTACAGGCTGAGTCACCACTA (SEQ ID NO: 95)	CCGGGCTTATTTTTCATACAGATGATTTAGAATATGTTTATGTTAAATTTTTTTAGATTATCACTAAAAGAAAACAGTTGAATTCTTCAATTTACAAGGATTCAATTTTTAAAATTATATTTGAATGTACAGAGGCCTACAAATACCAATTTCAGAAACACTGTTATCAAGGATATCTATTTGTTAAAATTGAATGCAACTGAAAGTAACAGATTAACTGCAAATAACAAGCTTAACCAAATAGGGGATTAATTTTTCCCATTTAACAAGGAGACAGGGCCGGGCACAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGTCGAGGCGGGTGGATCACTTGAGGTTGGGAGCTCAAGACCAGCCTGACCAACATGGAGAAACCCCGTGTCTACGAAAAATACAAAATTAGCCGGACGTGATGGTACATGCCTGTAATCTCAACTACTCGGGAGGCTGAGGCAGGAGAATGGCTTGAACCTGGGAGGTGGAGGTTGCAGTGAGCCAAGATCGCGCCATTTGCATTCCAGCCTGGGCAACAAGACGAGCTCCGTCTCAAAAAAAAAAAAAAAAAAAAAAAAGCAAGTAGACAGGGCCAGGTGGAGTGGCTCATGGTTGTAATCCCAGCATTTTGGGAGGCCGAGATGAGAGGATCATTTGAGCTCAGGAGTTGGAGACCAGCCTGGGCGACATAGGGGTACCCATCTCTACAAAAAATTAAACAAACAAACAAAAAATAGCCAAACATGATGACGCATGCCTGTAGTCCCAGCTACCCAGGAGGCTGAGATGAGAGAAT (SEQ ID NO: 96)

實例 2 ：在所靶向 iPSC 合倂群體中之 STAPLR 處之可誘導性及轉殖基因表現的試驗為了測試四個已標註STAPLR位點( PRDX1-AKR1A1(位點1) , ACTB-FSCN1, RPL34-OSTC, AKIRIN1-NDUFS5)中之各者處的可誘導性及轉殖基因表現之穩固性，使用來自Clontech/TakaRa之雙組分去氧羥四環素可誘導型rtTA/TRE系統Tet-On 3G (如美國專利9,127,283中所描述，其以全文引用之方式併入本文中)。對於持續型組分，經由本發明諸人之「持續轉殖基因表現基因座」(STEL)方法，Tet-On 3G rtTA (反向四環素反式活化因子(reverse tetracycline transactivator))自GAPDH基因座以二對偶基因形式表現( 圖 2)，如WO 2021/072329中所描述，其以全文引用的方式併入本文中。

為了測試來自STAPLR位點之轉殖基因的可誘導性，使用TRE3G啟動子測試eGFP運載物之表現。將Kozak序列包括在內以實現轉譯起始且添加SV40 PolyA序列以實現轉錄終止。在去氧羥四環素存在下，rtTA蛋白質結合至且活化四環素反應元件(TRE)最小啟動子( 圖 3)。對於各STAPLR位點，用所選高效RNP及對應STAPLR靶向構築體(STAPLR左同源臂-TRE3G啟動子-eGFP-SV40-STAPLR右同源臂)對在 GAPDH下具有二對偶基因rtTA整合之親本iPSC細胞株(GAPDH::rtTA iPSC)進行核轉染。從核轉染後第一天( 圖 4)開始且持續至核轉染後第七天( 圖 5)，向接受STAPLR RNP及STAPLR靶向構築體之細胞的池進給含有2 μg/ml去氧羥四環素之培養基以便誘導GFP表現。亦給與親本rtTA iPSC細胞株2 μg/ml去氧羥四環素培養基作為對照物。藉由螢光顯微鏡檢查術在一週過程內監測GFP表現。隨著細胞經去氧羥四環素治療更長持續時間，觀測到GFP強度之增加。此基於rtTA/TREG之轉殖基因表現系統在STAPLR處之初步試驗指示靶向STAPLR位點之iPSC的合併群體中值穩固的GFP可誘導性及表現。

實例 3 ：在所 靶向 iPSC 純系 群體中之 STAPLR 處之可誘導性及轉殖基因表現的試驗用RNP及STAPLR靶向構築體在四個STAPLR位點中之各者處對親本GAPDH::rtTA iPSC進行核轉染，隨後以純系密度接種靶向STAPLR之iPSC的各合併群體。藉由PCR跨越左同源臂與右同源臂之接合點挑選及篩選個別殖株，以確認TRE3G-eGFP-SV40在四個STAPLR位點中之各者處的精確整合。擴增所靶向iPSC殖株且用含有在0.1 μg/ml至5 μg/ml之範圍之去氧羥四環素的培養基治療0至68小時。在此GFP誘導時程內之0、3、8、24、48及68小時的時程收集細胞且進行流動式細胞量測分析( 圖 6)。結果表明來自所有四個STAPLR位點之最大GFP誘導可見於投與0.1 μg/ml去氧羥四環素及投與去氧羥四環素48小時之後。STAPLR位點之最大GFP表現量不同，其中 PRDX1- AKR1A1位點展現去氧羥四環素誘導之iPSC中的最高GFP表現。隨後用含有2 μg/ml去氧羥四環素之培養基治療來自各靶向STAPLR位點之一個純系衍生細胞株及野生型未經編輯之iPSC對照細胞株持續72小時( 圖 7)。 AKIRIN1- NDUFS5STAPLR細胞株展示稍微延遲之GFP誘導，因此用含有2 μg/ml去氧羥四環素之培養基治療增加至6天( 圖 7)。結果表明所有四種經治療的靶向STAPLR之iPSC細胞株可誘導高GFP表現量，其中 PRDX1- AKR1A1位點再次展現去氧羥四環素誘導之iPSC中的最高GFP表現，而野生型未經編輯之經去氧羥四環素治療的iPSC對照細胞株不表現GFP。在所有情況下，未接受去氧羥四環素治療之細胞不表現GFP。

實例 4 ：在 iPSC 衍生之骨髓祖細胞中之 STAPLR 處之可誘導性及轉殖基因表現的試驗將純系衍生之STAPLR iPSC細胞株分化成骨髓祖細胞，以證明STAPLR處之轉殖基因整合在分化iPSC中維持持續轉殖基因表現(Douvaras等人, Stem Cell Reports(2017) 8(6):1516-24)。在分化第12天添加2 μg/ml去氧羥四環素至各靶向STAPLR之純系細胞株，且每日補充去氧羥四環素持續三天。在分化第15天，收穫附著型骨髓祖細胞用於GFP誘導之流動式細胞量測分析。與未接受去氧羥四環素之分化細胞相比，四個TRE-eGFP-SV40 STAPLR細胞株中之三者( PRDX1- AKR1A1、 ACTB- FSCN1、 RPL34- OSTC)展現異質附著型骨髓祖細胞中之有效GFP誘導( 圖 8)。使用相同方案分化且經去氧羥四環素類似治療之野生型未經編輯之iPSC對照株不顯示GFP之誘導。在螢光顯微鏡檢查術下，TRE-eGFP-SV40 STAPLR細胞株中之一者( AKIRIN1- NDUFS5)展現延遲之GFP誘導。向此細胞株再補充去氧羥四環素持續額外三天且在分化第18天收穫附著型骨髓祖細胞用於流動式細胞量測分析。圖 8顯示可見於在分化第18天收穫之骨髓祖細胞的雙峰GFP誘導。在所有情況下，未接受去氧羥四環素治療之細胞不表現GFP。

超過30天後STAPLR靶向細胞株進一步分化直至在懸浮培養物中可收集非附著型骨髓祖細胞之時間點。添加2 μg/ml去氧羥四環素持續六天且採集非附著型骨髓祖細胞用於GFP誘導之流動式細胞量測分析。超過30天培養之所有四個TRE-eGFP-SV40 STAPLR細胞株展現向三陽性骨髓祖細胞之有效分化，如藉由細胞表面標記物CD45、CD14及CX3CR1共表現＞80%所定義( 圖 9)。與經去氧羥四環素治療之野生型未經編輯之對照細胞株相比，經去氧羥四環素治療之STAPLR細胞株亦展現異質非附著型骨髓祖細胞中之有效GFP誘導，其中最大GFP表現量有一些變化( 圖 10)。此資料表明，在所有四個STAPLR位點處之轉殖基因整合准許在外部啟動子控制下在分化成骨髓祖細胞期間及之後保持轉殖基因表現。

實例 5： 人類誘導性多潛能幹細胞株之衍生與來自 PRDX1-AKR1A1 STAPLR 位點之 CD19t-IL12 的可誘導型表現使用用於 PRDX1- AKR1A1STAPLR位點(位點1)之所選高效RNP及包含側接PRDX1-AKR1A1左同源臂及右同源臂之由去氧羥四環素可誘導型啟動子(TRE3G)驅動之CD19t-IL12序列盒的靶向構築體，對在 GAPDH下具有二對偶基因rtTA整合之親本iPSC細胞株(GAPDH::rtTA iPSC)進行轉染。CD19t在本文中作為非生物功能性運載物包括在內；其充當用於藉由流動式細胞量測術替代偵測IL-12轉殖基因整合之抗原決定基標記物。使用兩個不同gRNA及其相應核酸酶靶向 PRDX1- AKR1A1STAPLR位點。選擇具有序列5'-GAGACTGGTTCTTGCAGCACT-3' (SEQ ID NO: 83)之基於Cpf1之導引RNA或具有序列5'-CTTGCAGCACTGCCTAGGCT-3' (SEQ ID NO: 71)之基於Cas9之導引RNA以產生純系細胞株。GAPDH::rtTA持續表現來自GAPDH基因座之反向四環素反式活化因子(rtTA)。在去氧羥四環素存在下，rtTA結合至TRE3G啟動子且誘導由TRE3G啟動子驅動之CD19t及IL-12的表現( 圖 11)。

製備GAPDH::rtTA iPSC之單細胞懸浮液用於用Cpf1或Cas9 gRNA RNP複合物及 PRDX1- AKR1A1靶向pTRE3G-CD19t-IL-12 DNA供體模板轉染。轉染後兩天，用去氧羥四環素(2 μg/mL)治療細胞48小時以誘導CD19t-IL12表現，使用AF488結合抗CD19t抗體染色的活細胞成像對其分析( 圖 12，圖A及圖B)。隨後解離細胞且以單細胞純系密度接種。純系密度接種之後四天，用2 μg/mL去氧羥四環素治療生長菌落持續48小時以誘導CD19t-IL-12表現。在48小時去氧羥四環素治療之後，使用AF488結合抗CD19t抗體用活細胞成像分析菌落。鑑別CD19t陽性菌落( 圖 12，圖A及B圖，標記在「純系密度」下)。

資料表明， PRDX1-AKR1A1STAPLR位點處之CD19t-IL-12表現序列盒整合准許在外部啟動子控制下在用去氧羥四環素治療之後靶向STAPLR之iPSC合併群體及純系群體中轉殖基因之持續表現。

實例 6 ：所靶向 iPSC 中 STAPLR 基因間區域內各種位點處之報導子轉殖基因表現的誘導為了測試 PRDX1-AKR1A1基因間區域內之兩個替代位點處( PRDX1-AKR1A1位點2及位點3)之可誘導性及轉殖基因表現的穩固性，吾人同樣利用雙組分去氧羥四環素可誘導型rtTA/TRE系統。TRE3G啟動子用於測試EGFP運載物之表現。根據原始 PRDX1-AKR1A1靶向構築體之設計，將Kozak序列包括在內以實現轉譯起始且添加SV40 PolyA序列以實現轉錄終止。在去氧羥四環素存在下，rtTA蛋白質結合至且活化TRE最小啟動子。用所選高效RNP及對應 PRDX1- AKR1A1靶向構築體對在 GAPDH下具有二對偶基因rtTA整合之親本iPSC細胞株(GAPDH::rtTA iPSC)進行核轉染(對於位點2或位點3)。針對 PRDX1-AKR1A1位點2測試三個不同gRNA (SEQ ID NO: 87-89)且針對 PRDX1-AKR1A1位點3測試三個不同gRNA (SEQ ID NO: 90-92)。從核轉染後第二天(位點2；圖 13)或第一天(位點3，圖 14)開始且至多持續至核轉染後第7天( 圖 15及圖 16)，向接受 PRDX1-AKR1A1位點2或位點3 RNP及靶向構築體之細胞的池進給含有2 μg/ml去氧羥四環素之培養基以便誘導GFP表現。藉由螢光顯微鏡檢查術或流動式細胞量測術，在7天過程內監測GFP表現。自 PRDX1-AKR1A1位點2及 PRDX1-AKR1A1位點3均誘導GFP表現。針對各位點測試之所有三個gRNA展示構築體靶向效率之差異(流動式細胞量測直方圖中所見之不同尺寸峰)，但全部能夠在去氧羥四環素添加之後誘導GFP表現達到類似高強度(類似對數級表現量)。在約10 ⁶觀測到的峰表示表現高GFP量之經編輯細胞，而在約10 ⁴觀測到的峰表示自非整合靶向構築體表現之暫態GFP。資料表明 PRDX1-AKR1A1基因間區域內之多個位點准許靶向STAPLR位點之iPSC的合併群體中穩固的GFP可誘導性及表現。

圖 1點陣圖顯示使用Synthego之ICE Analysis Tool進行桑格定序(Sanger sequencing)檢查之後獲得的插入缺失編輯百分比。對於各不同STAPLR位點，測試三個不同gRNA且圈出具有最高插入缺失編輯百分比之gRNA。實心水平線指示每個STAPLR位點之三個不同gRNA的平均插入缺失編輯百分比。

圖 2圖表繪示在 GAPDH基因座處編碼2A肽之序列及編碼rtTA之Tet-On 3G版本之序列的整合。左同源臂及右同源臂經設計以使得能夠將緊鄰5'之轉殖基因同框整合至 GAPDH之終止密碼子。此允許在內源 GAPDH啟動子控制下表現rtTA。已經用靶向構築體編輯之iPSC持續表現rtTA蛋白質。

圖 3圖表繪示四種STAPLR靶向構築體中之各者在持續表現rtTA蛋白質之iPSC中之各STAPLR位點處的整合，該等STAPLR靶向構築體包含側接有左同源臂及右同源臂之pTRE3G-eGFP-Sv40轉殖基因。去氧羥四環素之添加允許結合rtTA蛋白質及活化來自TRE3G啟動子之GFP表現。

圖 4為一組螢光顯微鏡影像，其描繪已接受去氧羥四環素24小時之細胞合併群體中之GFP的表現。在用STAPLR靶向構築體及對應RNP進行iPSC核轉染之後24小時，添加去氧羥四環素至培養基中。在未接受去氧羥四環素之細胞中未觀測到GFP。經去氧羥四環素治療但未用STAPLR靶向構築體及RNP進行核轉染之持續表現rtTA的對照iPSC亦不表現GFP。

圖 5為一組螢光顯微鏡影像，其描繪已接受去氧羥四環素6天之細胞合併群體中之GFP的表現。在用STAPLR靶向構築體及對應RNP進行iPSC核轉染之後24小時，添加去氧羥四環素至培養基中。在未接受去氧羥四環素之細胞中未觀測到GFP。經去氧羥四環素治療但未用STAPLR靶向構築體及RNP進行核轉染之持續表現rtTA的對照iPSC亦不表現GFP。

圖 6為一組流動式細胞量測直方圖，其描繪在不同濃度之去氧羥四環素下隨時間推移四種不同純系衍生之STAPLR iPSC細胞株中GFP表現之誘導。在去氧羥四環素投與之0、3、8、24、48及68小時之後收集細胞用於分析。

圖 7為一組流動式細胞量測直方圖，其描繪用2 μg/ml去氧羥四環素治療後隨時間推移四種不同純系衍生之STAPLR iPSC細胞株中GFP表現之誘導。左圖顯示在無去氧羥四環素治療或有去氧羥四環素治療72小時情況下之 PRDX1- AKR1A1、 ACTB- FSCN1及 RPL34- OSTCSTAPLR細胞株及野生型未經編輯之iPSC對照細胞株。右圖顯示無去氧羥四環素治療或用去氧羥四環素治療6天情況下之 AKIRIN1- NDUFS5STAPLR細胞株。

圖 8為一組流動式細胞量測直方圖，其描繪在用2 μg/ml去氧羥四環素治療後分化成骨髓祖細胞之四種不同純系衍生之STAPLR iPSC細胞株中GFP表現之誘導。在分化第12天添加去氧羥四環素至培養基中。左圖顯示在無去氧羥四環素治療或有去氧羥四環素治療72小時情況下之骨髓分化第15天之後的 PRDX1- AKR1A1、 ACTB- FSCN1及 RPL34- OSTCSTAPLR細胞株及野生型未經編輯之iPSC對照細胞株。右圖顯示在無去氧羥四環素治療或用無去氧羥四環素治療6天情況下之骨髓分化第18天之後的 AKIRIN1- NDUFS5STAPLR細胞株。

圖 9為一組流動式細胞量測點陣圖，其顯示已分化超過30天之非附著型骨髓STAPLR靶向iPSC細胞株群體中骨髓祖細胞標記物CD45、CD14及CX3CR1之表現。CD14與CX3CR1細胞組閘控於CD45陽性細胞上。

圖 10為一組流動式細胞量測直方圖，其描繪在四種分化同源細胞衍生之STAPLR iPSC細胞株及野生型未經編輯之iPSC對照細胞株中用2 μg/ml去氧羥四環素治療之後非附著型骨髓祖細胞中之GFP表現的誘導。在分化第30天之後添加去氧羥四環素至培養基中持續六天。

圖 11圖表繪示靶向構築體之整合的圖，該靶向構築體包含側接有左同源臂及右同源臂以允許在 PRDX1- AKR1A1STAPLR位點整合的pTRE3G-CD19t-IL12轉殖基因。此構築體在持續表現來自 GAPDH內源啟動子之rtTA蛋白質的iPSC中經轉染。

圖 12為一組相片，其顯示在用 PRDX1- AKR1A1pTRE3G-CD19t-IL12供體模板靶向後之細胞合併樣品中或在相比於未經治療細胞之單細胞純系密度接種之後的細胞純系群體中用2 μg/mL去氧羥四環素治療48小時後CD19t (截短以防止細胞內信號轉導)染色之活細胞成像。圖A展示用基於Cpf1之RNP靶向之後的細胞。圖B顯示在用基於Cas9之RNP靶向之後的細胞。

圖 13為一組螢光顯微鏡影像，其描繪已接受去氧羥四環素24小時之細胞合併群體中GFP之表現。在用 PRDX1- AKR1A1位點2靶向構築體及包含三個靶向位點2之不同gRNA的三個不同RNP進行iPSC核轉染之後48小時，添加去氧羥四環素至培養基中。在未接受去氧羥四環素之細胞中未觀測到GFP。

圖 14為一組螢光顯微鏡影像，其描繪已接受去氧羥四環素24小時之細胞合併群體中GFP之表現。在用 PRDX1- AKR1A1位點3靶向構築體及包含三個靶向位點3之不同gRNA的三個不同RNP進行iPSC核轉染之後24小時，添加去氧羥四環素至培養基中。在未接受去氧羥四環素之細胞中未觀測到GFP。

圖 15為一組流動式細胞量測直方圖，其描繪在用2 μg/ml去氧羥四環素治療之後細胞合群體中之GFP表現的誘導。在用 PRDX1- AKR1A1位點2靶向構築體及包含三個靶向位點2之不同gRNA的三個不同RNP進行iPSC核轉染之後48小時，添加去氧羥四環素至培養基中。在用去氧羥四環素治療後5天進行流動式細胞量測分析。在未接受去氧羥四環素之細胞中及在未接受靶向構築體及RNP之親本GAPDH::rtTA iPSC中未觀測到GFP。

圖 16為一組流動式細胞量測直方圖，其描繪在用2 μg/ml去氧羥四環素治療之後細胞合併群體中之GFP表現的誘導。在用 PRDX1- AKR1A1位點3靶向構築體及包含三個靶向位點3之不同gRNA的三個不同RNP進行iPSC核轉染之後24小時，添加去氧羥四環素至培養基中。在用去氧羥四環素治療後6天進行流動式細胞量測分析。在未接受去氧羥四環素之細胞中及在未接受靶向構築體及RNP之親本GAPDH::rtTA iPSC中未觀測到GFP。

TW202400252A_112116119_SEQL.xml

Claims

一種基因改造哺乳動物細胞，該細胞包含整合於細胞基因組中之持續轉錄活性有效負載區(STAPLR)中的外源核苷酸序列，其中該STAPLR選自由以下組成之群： RPL34基因與 OSTC基因之間的基因間區域； ACTB基因與 FSCN1基因之間的基因間區域； AKIRIN1基因與 NDUFS5基因之間的基因間區域； PRDX1基因與 AKR1A1基因之間的基因間區域； PTGES3基因與 NACA基因之間的基因間區域； MLF2基因與 PTMS基因之間的基因間區域； RAB13基因與 RPS27基因之間的基因間區域； JTB基因與 RAB13基因之間的基因間區域； AKR1A1基因與 NASP基因之間的基因間區域； NDUFS5基因與 MACF1基因之間的基因間區域； SRSF9基因與 DYNLL1基因之間的基因間區域； MYL6B基因與 MYL6基因之間的基因間區域； GPX1基因與 RHOA基因之間的基因間區域； HNRNPA2B1基因與 CBX3基因之間的基因間區域； ROMO基因與 RBM39基因之間的基因間區域； PA2G4基因與 RPL41基因之間的基因間區域；及 NDUFB10與 RPS2基因之間的基因間區域。
一種用於改造哺乳動物細胞之方法，該方法包含將外源核苷酸序列整合在細胞基因組之持續轉錄活性有效負載區(STAPLR)中，其中該STAPLR選自由以下組成之群： RPL34基因與 OSTC基因之間的基因間區域； ACTB基因與 FSCN1基因之間的基因間區域； AKIRIN1基因與 NDUFS5基因之間的基因間區域； PRDX1基因與 AKR1A1基因之間的基因間區域； PTGES3基因與 NACA基因之間的基因間區域； MLF2基因與 PTMS基因之間的基因間區域； RAB13基因與 RPS27基因之間的基因間區域； JTB基因與 RAB13基因之間的基因間區域； AKR1A1基因與 NASP基因之間的基因間區域； NDUFS5基因與 MACF1基因之間的基因間區域； SRSF9基因與 DYNLL1基因之間的基因間區域； MYL6B基因與 MYL6基因之間的基因間區域； GPX1基因與 RHOA基因之間的基因間區域； HNRNPA2B1基因與 CBX3基因之間的基因間區域； ROMO基因與 RBM39基因之間的基因間區域； PA2G4基因與 RPL41基因之間的基因間區域；及 NDUFB10與 RPS2基因之間的基因間區域。
如請求項2之方法，其中整合步驟藉由使用以下進行：CRISPR/Cas系統；Cre/Lox系統；FLP-FRT系統；TALEN系統；ZFN系統；歸巢核酸內切酶(homing endonuclease)；隨機整合；同源重組；轉位酶；或非核酸酶依賴性病毒載體，視情況選自反轉錄病毒載體、AAV載體及慢病毒載體。
如請求項2之方法，其中整合步驟藉由使用包含導引RNA之CRISPR/Cas系統進行，且其中該STAPLR為該 RPL34基因與該 OSTC基因之間的該基因間區域且gRNA選自SEQ ID NO: 25-32，該STAPLR為該 ACTB基因與該 FSCN1基因之間的該基因間區域且該gRNA選自SEQ ID NO: 33-54，該STAPLR為該 AKIRIN1基因與該 NDUFS5基因之間的該基因間區域且該gRNA選自SEQ ID NO: 55-70，或該STAPLR為該 PRDX1基因與該 AKR1A1基因之間的該基因間區域且該gRNA選自SEQ ID NO: 71-92。
如請求項3或4之方法，其中該CRISPR/Cas系統包含第I型、第II型、第III型、第IV型、第V型之gRNA依賴性核酸酶或其變異體。
如請求項3或4之方法，其中該CRISPR/Cas系統包含選自由以下組成之群之gRNA依賴性核酸酶：Cas9、Cpf1、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas12、Cas13、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、CasX、CasY、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、CasPhi、MAD7及Csf4。
一種DNA分子，該分子包含經以5'同源區(HR)及3' HR側接之相關核苷酸序列，其中該5' HR及該3' HR各自地與哺乳動物細胞基因組之持續轉錄活性有效負載區(STAPLR)中的第一基因組區(GR)及第二GR至少95%同源，其中該STAPLR選自由以下組成之群： RPL34基因與 OSTC基因之間的基因間區域； ACTB基因與 FSCN1基因之間的基因間區域； AKIRIN1基因與 NDUFS5基因之間的基因間區域； PRDX1基因與 AKR1A1基因之間的基因間區域； PTGES3基因與 NACA基因之間的基因間區域； MLF2基因與 PTMS基因之間的基因間區域； RAB13基因與 RPS27基因之間的基因間區域； JTB基因與 RAB13基因之間的基因間區域； AKR1A1基因與 NASP基因之間的基因間區域； NDUFS5基因與 MACF1基因之間的基因間區域； SRSF9基因與 DYNLL1基因之間的基因間區域； MYL6B基因與 MYL6基因之間的基因間區域； GPX1基因與 RHOA基因之間的基因間區域； HNRNPA2B1基因與 CBX3基因之間的基因間區域； ROMO基因與 RBM39基因之間的基因間區域； PA2G4基因與 RPL41基因之間的基因間區域； NDUFB10與 RPS2基因之間的基因間區域。
如請求項7之DNA分子，其中該5' HR及該3' HR中之各者獨立地為約至少50、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450、至少500、至少550、至少600、至少650、至少700、至少750、至少800、至少850、至少900、至少950、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、至少1800、至少1900或至少2000個鹼基對長。
如請求項7或8之DNA分子，其中該5' HR及該3' HR分別與 SEQ ID NO: 17及18， SEQ ID NO: 19及20， SEQ ID NO: 21及22， SEQ ID NO: 23及24， SEQ ID NO: 93及94，或 SEQ ID NO: 95及96，至少90%同源。
如請求項1至9中任一項之細胞、方法或DNA分子，其中：該 RPL34基因與該 OSTC基因之間的該基因間區域包含與SEQ ID NO: 1至少95%一致之核苷酸序列；該 ACTB基因與該 FSCN1基因之間的該基因間區域包含與SEQ ID NO: 2至少95%一致之核苷酸序列；該 AKIRIN1基因與該 NDUFS5基因之間的該基因間區域包含與SEQ ID NO: 3至少95%一致之核苷酸序列；該 PRDX1基因與該 AKR1A1基因之間的該基因間區域包含與SEQ ID NO: 4至少95%一致之核苷酸序列；該 PTGES3基因與該 NACA基因之間的該基因間區域包含與SEQ ID NO: 5至少95%一致之核苷酸序列；該 MLF2基因與該 PTMS基因之間的該基因間區域包含與SEQ ID NO: 6至少95%一致之核苷酸序列；該 RAB13基因與該 RPS27基因之間的該基因間區域包含與SEQ ID NO: 7至少95%一致之核苷酸序列；該 JTB基因與該 RAB13基因之間的該基因間區域包含與SEQ ID NO: 8至少95%一致之核苷酸序列；該 AKR1A1基因與該 NASP基因之間的該基因間區域包含與SEQ ID NO: 9至少95%一致之核苷酸序列；該 NDUFS5基因與該 MACF1基因之間的該基因間區域包含與SEQ ID NO: 10至少95%一致之核苷酸序列；該 SRSF9基因與該 DYNLL1基因之間的該基因間區域包含與SEQ ID NO: 11至少95%一致之核苷酸序列；該 MYL6B基因與該 MYL6基因之間的該基因間區域包含與SEQ ID NO: 12至少95%一致之核苷酸序列；該 GPX1基因與該 RHOA基因之間的該基因間區域包含與SEQ ID NO: 13至少95%一致之核苷酸序列；該 HNRNPA2B1基因與該 CBX3基因之間的該基因間區域包含與SEQ ID NO: 14至少95%一致之核苷酸序列；該 ROMO基因與該 RBM39基因之間的該基因間區域包含與SEQ ID NO: 15至少95%一致之核苷酸序列；該 PA2G4基因與該 RPL41基因之間的該基因間區域包含與SEQ ID NO: 16至少95%一致之核苷酸序列；及/或該 NDUFB10基因與該 RPS2基因之間的該基因間區域包含與SEQ ID NO: 97至少95%一致之核苷酸序列。
如請求項1至10中任一項之細胞、方法或DNA分子，其中該外源核苷酸序列或該相關核苷酸序列包含轉殖基因，視情況其中該轉殖基因包含持續型啟動子或可誘導型啟動子。
如請求項11之細胞、方法或DNA分子，其中該轉殖基因編碼治療性蛋白質，視情況遺傳性疾病中缺乏或有缺陷之蛋白質、細胞介素、重組抗原受體；細胞標記物；或調節該細胞之分化狀態或活性的蛋白質；視情況其中該轉殖基因編碼SOX10、IL-10、IL-12、CD19t或ThPOK。
如請求項1至12中任一項之細胞、方法或DNA分子，其中該細胞為人類細胞。
如請求項1至13中任一項之細胞、方法或DNA分子，其中該細胞為多潛能幹細胞(PSC)，視情況誘導性PSC (iPSC)。
如請求項1至13中任一項之細胞、方法或DNA分子，其中該細胞為以下細胞： a)免疫系統中之細胞，視情況T細胞、自然殺手細胞、樹突細胞、巨噬細胞/單核球或其造血祖細胞； b)心血管系統中之細胞，視情況心室心肌細胞、結節細胞或心臟祖細胞； c)代謝系統中之細胞，視情況肝細胞或胰臟β細胞； d)中樞神經系統中之細胞，視情況感覺神經元、運動神經元、仲介神經元、微膠質細胞、寡樹突細胞或其祖細胞； e)肌細胞，視情況骨骼肌細胞或平滑肌細胞； f)脂肪細胞；或 g)眼系統中之細胞，視情況視網膜色素上皮細胞、感光受體細胞或感光受體前驅細胞。