用于產生真實世界證據的真實世界數據指導原則(征求意見稿)

2020-08-03 CDE CDE

為進一步指導和規范申辦者利用真實世界數據生成真實世界證據支持藥物研發,我中心組織起草了《用于產生真實世界證據的真實世界數據指導原則(征求意見稿)》,現在中心網站予以公示,以廣泛聽取各界意見和建議,歡迎

為進一步指導和規范申辦者利用真實世界數據生成真實世界證據支持藥物研發,我中心組織起草了《用于產生真實世界證據的真實世界數據指導原則(征求意見稿)》,現在中心網站予以公示,以廣泛聽取各界意見和建議,歡迎各界提出寶貴意見和建議,并請及時反饋給我們。

征求意見時限為自發布之日起2個月。

您的反饋意見請發到以下聯系人的郵箱:

聯系人:高麗麗、趙駿

聯系方式:[email protected],[email protected]

感謝您的參與和大力支持。

國家藥品監督管理局藥品審評中心

2020年8月3日

 

附件1:《用于產生真實世界證據的真實世界數據指導原則(征求意見稿)》

附件2:《用于產生真實世界證據的真實世界數據指導原則(征求意見稿)》起草說明

附件1

用于產生真實世界證據的真實世界數據指導原則(征求意見稿)

2020年7月

目  錄

一、概述

二、真實世界數據來源及現狀

(一)真實世界數據常見的主要來源

1.醫院信息系統數據

2.醫保支付數據

3.登記研究數據

4.藥品安全性主動監測數據

5.自然人群隊列數據

6.組學數據

7.死亡登記數據

8.患者報告結局數據

9.來自移動設備的個體健康監測數據

10.其它特定功能數據

(二)真實世界數據應用面臨的主要問題

三、真實世界數據適用性評價

(一)源數據的適用性評價

(二)經治理數據的適用性評價

1.相關性評價

2.可靠性評價

四、真實世界數據治理

(一)個人信息保護和數據安全性處理

(二)數據提取

(三)數據清洗

(四)數據轉化

(五)數據傳輸和存儲

(六)數據質量控制

(七)通用數據模型

(八)真實世界數據治理計劃書

五、真實世界數據的合規性、安全性與質量管理體系

(一)數據合規性

(二)數據安全管理

(三)質量管理體系

六、與監管機構的溝通

名詞解釋

參考文獻

附錄1 中英文對照表

 

用于產生真實世界證據的真實世界數據指導原則

一、 概述

真實世界證據(Real World Evidence,RWE)是藥物有效性和安全性評價證據鏈的重要組成部分,其相關概念和應用參見《真實世界證據支持藥物研發與審評的指導原則(試行)》。而真實世界數據(Real World Data, RWD)則是產生RWE的基礎,沒有高質量的適用的RWD支持,RWE亦無從談起。

真實世界數據是指來源于日常所收集的各種與患者健康狀況和/或診療及保健有關的數據。并非所有的真實世界數據經分析后就能產生真實世界證據,只有滿足適用性的RWD經恰當和充分地分析后才有可能形成RWE。目前RWD普遍存在數據的記錄、采集、存儲等流程缺乏嚴格的質量控制,數據不完整,數據標準和數據模型不統一等問題,對RWD的有效使用形成了障礙。因此,如何使收集的RWD能夠成為或經治理后能夠成為滿足臨床研究目的所需的分析數據,以及如何評估RWD是否適用于產生RWE,是使用真實世界數據形成真實世界證據支持藥物監管決策的關鍵問題。

本指導原則作為《真實世界證據支持藥物研發與審評的指導原則(試行)》的補充,將從真實世界數據的定義、來源、評價、治理、標準、安全合規、質量保障、適用性等方面,對真實世界數據給出具體要求和指導性建議,以幫助申辦者更好地進行數據治理,評估RWD的適用性,為產生有效的RWE做好充分準備。

二、 真實世界數據來源及現狀

與藥物研發有關的真實世界數據主要包括在真實醫療環境下業務流程記錄的數據(如電子病歷),以及各種觀察性研究數據等。此類數據可以是開展真實世界研究前已經收集的數據,也可以是為了開展真實世界研究而新收集的數據。

(一) 真實世界數據常見的主要來源

我國真實世界數據的來源按功能類型主要可分為醫院信息系統數據、醫保支付數據、疾病登記數據、公共衛生監測數據(如藥品安全性監測、死亡信息登記、院外健康監測)、自然人群隊列數據等,以下是根據數據功能類型分類的常見真實世界數據來源。

1. 醫院信息系統數據

醫院信息系統數據包括結構化和非結構化的數字化或非數字化患者記錄,如患者的人口學特征、臨床特征、診斷、治療、實驗室檢查、安全性和臨床結局等,通常分散存儲于醫療衛生機構的電子病歷/電子健康檔案(EMR/EHR)、實驗室信息管理系統(LIS)、醫學影像存檔與通訊系統(PACS)、放射信息管理系統(RIS)等不同信息系統中。有些醫療機構在數據集成平臺或臨床數據中心(CDR)的基礎上建立院級科研數據平臺,整合患者門診、住院、隨訪等各類信息,形成直接用于臨床研究的數據。有些區域性醫療數據庫,利用相對集中的物理環境進行跨醫療機構的臨床數據的存儲和處理,具有存儲量大、類型多等特點,也可作為RWD的潛在來源。

醫院信息系統數據基于臨床診療實踐過程的記錄,涵蓋臨床結局和暴露變量范圍較廣,尤其電子病歷數據在真實世界研究中應用較廣。

2. 醫保支付數據

我國醫保支付數據的主要來源有兩類,一類是政府、醫療機構建立的基本醫療保險體系,進行醫保支付數據庫的建立和統一管理,包含有關患者基本信息、醫療服務利用、處方、結算、醫療索賠和計劃保健等結構化字段的數據。另一類是商業健康保險數據庫,由保險機構建立,數據以保險公司理賠給付與保險期限作為分類指標,數據維度相對簡單。醫保系統作為真實世界數據來源,較多用于開展衛生技術評價和藥物經濟學研究。

3. 登記研究數據

登記研究(Registry Study)數據是通過有組織的系統,利用觀察性研究的方法搜集臨床和其他來源的數據,可用于評價特定疾病、特定健康狀況和暴露人群的臨床結局。登記研究根據研究定義的人群特點主要包括產品登記、健康服務登記和疾病登記三類,我國的登記研究主要是疾病登記和產品登記研究。其中,醫療機構和企業支持開展的產品登記研究,觀察對象是使用某種醫藥產品的病例,重點觀察其不同適應癥的效果或監測不良反應。

登記研究數據庫的優勢在于以特定患者為研究人群,通過整合臨床診療、醫保支付等多種數據來源,數據采集較為規范,一般包括患者自報數據和長期隨訪數據,觀測結局指標通常較為豐富,具有準確性較高、結構化強、人群代表性較好等優點,對于評價藥物的有效性、安全性、經濟性和依從性具有較好的適用性。

4. 藥品安全性主動監測數據

藥品安全性主動監測數據主要用于開展藥物安全性研究及藥物流行病學研究,通過國家或區域藥品安全性監測網絡,從醫療機構、制藥公司、醫學文獻、網絡媒體、患者報告結局等渠道,進行數據收集。此外,醫療機構和企業自身建立的自有藥品的安全性監測數據庫也可能成為此類數據來源的一部分。

5. 自然人群隊列數據

自然人群隊列數據指對普通人群或患有重大疾病人群通過長期前瞻性動態追蹤觀察,獲取的各種數據。自然人群隊列數據具有統一標準、信息化共享、時間跨度長和樣本量較大的特點,此類RWD可以幫助構建常見疾病風險模型,可對藥物研發的精準目標人群定位提供支持。

6. 組學數據

組學數據作為精準醫學的重要支撐,主要包括基因組、表觀遺傳、轉錄組、蛋白質組和代謝組等數據,這些數據從系統生物學角度刻畫了患者在遺傳、生理學、生物學等方面的特征。通常組學數據需要結合臨床數據才可能成為適用的RWD。

7. 死亡登記數據

人口死亡登記是一個國家對其國民的死亡信息持續完整的收集和記錄。目前我國有四個系統用于收集人口死亡信息,分別隸屬于國家疾控中心、國家衛生健康委員會、公安部和民政部。人口死亡登記數據包含死亡醫學證明書中的所有信息,記錄了詳細的死亡原因和死亡時間,可以產出人群分死因死亡率的數據來源。

8. 患者報告結局數據

患者報告結局(Patient-Reported Outcome, PRO)是一種來自患者自身測量與評價疾病結局的指標,包括癥狀、生理、心理、醫療服務滿意度等,PRO在藥物評價體系發展中越來越重要。其記錄有紙質和電子兩種方式,后者稱為電子患者報告結局(ePRO),ePRO的興起與應用,使得PRO與電子病歷系統對接并形成患者層面的完整數據流成為可能。

9. 來自移動設備的個體健康監測數據

個人健康監測數據可通過移動設備(如智能手機、可穿戴設備)實時采集個體生理體征指標。這些數據常產生于普通人群的自我健康管理、醫療機構對慢病患者的監測、醫療保險公司對參保人群健康狀況評估的過程,通常存儲于可穿戴設備企業、醫療機構數據庫以及商業保險公司數據系統等。由于可穿戴設備在收集生理和體征數據方面具有便利性和即時性等優勢,與電子健康數據銜接可形成更完整的RWD。

10. 其它特定功能數據

(1) 公共衛生監測數據

我國建立了一系列有關公共衛生監測的數據庫,如傳染病監測、免疫接種不良事件(Adverse Events Following Immunization,AEFI)監測等,所記錄的數據可用于分析傳染病的發病情況、疫苗的一般反應和異常反應發生率等。

(2) 患者隨訪數據

在真實世界臨床診療環境中,院內電子病歷數據往往無法涵蓋患者一些重要的臨床指標,如總生存期、五年生存率、不良反應信息等,需要補充長期隨訪數據,才能形成適用的RWD?;颊唠S訪數據主要是指以臨床研究為目的,醫院隨訪部門或第三方授權服務商以信件、電話、門診、短信、網絡隨訪等方式對離院患者開展臨床終點、康復指導、用藥提醒、滿意度調查等服務,服務中收集的院外數據,通常存儲于醫院隨訪數據系統。通過與病歷數據的連接,實現多源臨床數據的融合,可最終形成覆蓋患者生命周期的完整數據,用以探索疾病發生機制、發展規律、治療方法、預后相關因素等臨床研究問題。

(3) 患者用藥數據

患者診療過程藥品使用數據包括患者信息、藥品品類、劑量以及不良反應等信息,通常存儲于醫院藥品管理信息系統、醫藥電子商務平臺、制藥企業產品追溯和藥品安全性信息數據庫,以及藥品使用監測平臺等。伴隨遠程診療和互聯網+慢病管理模式的普及,存儲于處方流轉平臺或醫藥電商平臺的患者院外用藥數據逐漸增多,此類數據的有效利用或拼接,可作為患者維度診療過程記錄的RWD來源。

隨著醫療信息技術的不斷發展,新的RWD類型和來源會不斷出現,但其具體應用還有賴于所要解決的臨床研究問題,以及該數據所支持產生RWE的適用性。

(二) 真實世界數據應用面臨的主要問題

從數據來源看,相較于RCT數據,RWD在大多數情況下缺乏其記錄、采集、存儲等流程的嚴格質量控制,會造成數據不完整、關鍵變量缺失、記錄不準確等問題,這些數據質量上的缺陷,會極大地影響后續的數據治理和應用,甚至會影響數據的可追溯性,研究者也難以發現其中的問題并進行核對和修正。由于患者病程、就診地點以及時間和空間等因素的變化,可能導致患者疾病狀態及相關因素等信息的缺失,為臨床研究疾病狀態及結局的系統性評價帶來挑戰。傾向性的數據收集,特別是登記研究數據,會導致研究結果偏倚的潛在風險。

由于各種RWD來源之間相對獨立和封閉、數據管理系統種類繁多、數據存儲分散且數據標準不一致、數據橫向整合和交換存在困難,造成數據碎片化和信息孤島現象突出。對于電子病歷數據,由于其高度敏感性,業務系統一般封閉管理,對它們的利用可能會受到一定限制。此外,在缺乏統一標準的情況下,數據類型較為多樣,既有結構化數據,也有文本、圖片、視頻等非結構化和半結構化數據,在數據記錄、采集、存儲的過程中,也會導致數據的冗余和重復,進而造成數據處理難度加大。

三、 真實世界數據適用性評價

真實世界數據的適用性評價應基于特定的研究目的和監管決策用途。適用性評價可分為兩個階段,第一階段是從可及性、倫理合規、代表性、關鍵變量完整性、樣本量和源數據活動狀態等維度,對源數據進行初步評價和選擇,判斷其是否滿足研究方案的基本分析要求;第二階段包括數據的相關性、可靠性,以及采用的或擬采用的數據治理機制(數據標準和通用數據模型)的評價分析,經治理的數據是否適用于產生真實世界證據(見圖1)。如果真實世界研究中研究者根據自己設計好的電子病例報告表(eCRF)前瞻性收錄指定來源數據,則無需進行第一階段的初步適用性評價。

圖1 真實世界數據的適用性評價和數據治理過程示意圖

(一) 源數據的適用性評價

滿足基本分析要求的源數據至少應具備以下條件:

1. 數據庫處于活動狀態且數據可及

在研究期間數據庫應是連續的處于活動狀態的,所記錄的數據均是可及的,即具有數據的使用權限,并且可被第三方特別是監管機構評估。

2. 符合倫理和數據安全性要求

源數據的使用應通過倫理審核,并符合數據安全性要求。

3. 臨床結局和暴露/干預變量

數據的記錄必須有臨床結局變量和暴露/干預變量。

4. 具有一定的數據完整性

源數據通常是不完整的,但應具有一定的完整性,至少應包括結局變量、暴露/干預變量、人口學變量和重要的協變量,還要考慮分析模型中缺失數據對研究結論穩健性的影響。

5. 樣本量足夠

應充分考慮和預判經數據治理后源數據例數明顯減少的情況,以保證統計分析所需的樣本量。

(二) 經治理數據的適用性評價

經治理的真實世界數據的適用性評價主要根據數據相關性和可靠性。

1. 相關性評價

相關性評價旨在評估RWD是否與所關注的臨床問題密切相關,重點關注關鍵變量的覆蓋度、臨床結局定義的準確性、目標人群的代表性和多源異構數據的融合性。

(1) 關鍵變量和信息的覆蓋度

RWD應包含與臨床結局相關的重要變量和信息,如藥物使用、患者人口學和臨床特征、協變量、結局變量、隨訪時間、潛在安全性信息等。如果上述變量存在部分缺失,需充分評估是否能夠使用可靠的估計方法進行填補,以及對于因果推斷結果可能造成的影響。

(2) 臨床結局定義的準確性

選擇具有臨床意義的結局并進行準確定義對于真實世界研究至關重要。臨床結局的定義應包括所基于的診斷標準、測量方法及其質量控制(如果有)、測量工具(如量表的使用)、計算方法、測量時點、變量類型、變量類型的轉換(如從定量轉換為定性)、終點事件評價機制(如終點事件委員會的運行機制)等。當不同數據源對臨床結局的定義不一致時,應定義統一的臨床結局,并采用可靠的轉換方法。

(3) 目標人群的代表性

真實世界研究較傳統RCT的優勢之一是具有更廣泛的目標人群的代表性。因此,在制定納入和排除標準時,應盡可能地符合真實世界環境下目標人群。

(4) 多源異構數據的融合性

由于RWD的特性,很多情況下屬于多來源的異構數據,需要將不同來源數據在個體水平進行數據的鏈接、融合和同構處理。因此,應通過身份標識符進行個體水平的準確鏈接,以支持通用數據模型或數據標準對數據源中關鍵變量進行整合。

2. 可靠性評價

真實世界數據的可靠性主要從數據的完整性(Completeness)、準確性(Accuracy)、透明性(Transparency)、質量控制(Quality Control)和質量保證(Quality Assurance)幾個方面進行評價。

(1) 完整性

完整性是指數據信息的缺失程度,包括變量的缺失和變量值的缺失。對于不同研究,數據的缺失程度、缺失原因和變量值的缺失機制不盡相同,應該予以詳盡描述。雖然RWD無法避免數據缺失問題,但缺失比例應有一定限度。當特定研究的數據缺失比例明顯超過同類研究的比例時,會加大研究結論的不確定性,此時需要慎重考慮該數據能否作為支持產生RWE的數據。對缺失原因的詳細分析有助于對數據可靠性的綜合判斷。如果涉及缺失數據的填補問題,應根據缺失機制的合理假設采用正確的填補方法。

(2) 準確性

準確性是指數據與其描述的客觀特征是否一致,包括源數據是否準確、數據值域是否在合理范圍、結局變量隨時間變化趨勢是否合理、編碼映射關系是否對應且唯一等。數據的準確性需要依據較權威的參照進行識別和驗證,例如,終點事件是否經獨立的終點事件委員會做出判斷。

(3) 透明性

RWD的透明性是指RWD的治理方案和治理過程清晰透明,應確保關鍵暴露變量、協變量和結局變量能夠追溯至源數據,并反映數據的提取、清洗、轉換和標準化過程。無論采用人工數據處理還是自動化程序處理,數據治理標準化操作程序和驗證確認文件要清晰記錄和存檔,尤其反映數據可信性的問題,如數據缺失度、變量閾值范圍、衍生變量計算方法和映射關系等。數據治理方案應事先根據研究目的制定,應確保數據治理過程與治理方案保持一致。數據的透明性還包括數據的可及性(Accessibility)、數據庫之間的信息共享和對患者隱私的保護方法的透明。

(4) 質量控制

質量控制是指用以確證數據治理的各個環節符合質量要求而實施的技術和活動。質量控制評價包括但不限于:數據提取、安全處理、清洗、結構化,以及后續的存儲、傳輸、分析和遞交等環節是否均有質量控制,以保證所有數據是可靠的,數據處理過程是正確的;是否遵循完整、規范、可靠的數據治理方案和計劃,并依托于相應的數據質量核查和系統驗證規程,以保障數據治理系統在正常和穩態下運行,確保真實世界數據的準確性和可靠性。

(5) 質量保證

質量保證是指預防、探測和糾正研究過程中出現的數據錯誤或問題的系統性措施。RWD的質量保證與監管合規性密切相關,應貫穿于數據治理的每一個環節,考慮的內容包括但不限于:是否建立與真實世界數據有關的研究計劃、方案和統計分析計劃;是否有相應的標準操作規程;數據收集是否有明確流程和合格人員;是否使用了共同的定義框架,即數據字典;是否遵守收集關鍵數據變量的共同時間框架;用于數據元素捕獲的技術方法是否充分,包括各種來源數據的集成、藥物使用和實驗室檢查數據的記錄、隨訪記錄、與保險數據的鏈接等;患者的選擇是否將偏倚最小化以體現真正的目標人群;數據輸入是否及時、傳輸是否安全;是否滿足監管機構現場核查調閱源數據、源文件等相關要求。

四、 真實世界數據治理

數據治理(Data Curation)是指針對特定臨床研究問題,為達到適用于統計分析而對原始數據所進行的治理,其內容包括但不限于:數據安全性處理、數據提?。ê鄠€數據源)、數據清洗(邏輯核查及異常數據處理、數據完整性處理)、數據轉化(數據標準、通用數據模型、歸一化、自然語言處理、醫學編碼、衍生變量計算)、數據傳輸和存儲、數據質量控制等若干環節。

(一) 個人信息保護和數據安全性處理

真實世界研究涉及個人信息保護應遵循國家信息安全技術規范、醫療大數據安全管理相關規定,對個人敏感信息應進行去標識化(de-identification)處理,確保根據數據無法進行個人敏感信息匹配還原,通過技術和管理方面的措施,防止個人信息的泄漏、損毀、丟失、篡改。

數據安全性處理應基于研究所涉及的各種數據的類型、數量、性質和內容,尤其對于個人敏感信息,建立數據治理各環節的數據加密技術要求、風險評估和應急處置操作規程,并開展安全措施有效性審計。

(二) 數據提取

根據源數據的存儲格式、是否為電子數據、是否包含非結構化數據等因素選擇合適的方式進行數據提取,在數據提取時均應遵守以下原則:

數據提取的方法應通過驗證,以保障提取到的數據符合研究方案的要求。數據提取應確保提取到的原始數據與源數據的準確性,應對提取到的原始數據與源數據進行時間戳管理。

使用與源數據系統可互操作或集成的數據提取工具可以減少數據轉錄中的錯誤,從而提高數據準確性以及臨床研究中數據采集的質量和效率。對于盲法研究,還應評估使用可互操作或集成的數據提取工具帶來的揭盲風險。

(三) 數據清洗

數據清洗(Data Cleaning)是指對提取的原始數據進行重復或冗余數據的去除、變量值邏輯核查(Edit Check)和異常值的處理,以及數據缺失的處理。需要注意,在修正數據時如果無法追溯到主要研究者或源數據負責方簽字確認,數據不應做修改,以保證數據的真實性。

首先在保證數據完整性的前提下去除重復數據及不相關數據。在不同數據源合并過程中,可能產生重復數據,需要去除。同時由于數據源與通用數據模型映射關系的不準確,可能會采集到與研究目標不相關的數據,從數據集中刪除不需要的觀測值可以減少不必要的工作。

然后進行邏輯核查和異常數據處理。通過邏輯核查可以發現原始數據或者提取數據時產生的錯誤,例如出院時間早于入院時間,出生年月按年齡推算不符,實驗室檢查結果不符合實際,定性判斷結果與方案中定義的判斷標準不一致等。對異常數據的處理要非常謹慎,避免由此產生的偏倚。對于發現的錯誤和異常數據應通過進一步核實才能更改數據,數據的更改應保留記錄。

最后對數據缺失進行處理,對于不同研究,數據的缺失程度、缺失原因和變量值的缺失機制不盡相同。如果涉及缺失數據的填補問題,應根據缺失機制的合理假設采用正確的填補方法。

(四) 數據轉化

數據轉化是將經過數據清洗后原始數據的數據格式標準、醫學術語、編碼標準、衍生變量計算,按照分析數據庫(Analysis Dataset)中對應標準進行統一轉化為適用RWD的過程。

對于自由文本數據的轉化可使用可靠的自然語言處理算法,在保障數據轉化準確、可溯源的前提下,提高轉化效率。

在進行衍生變量計算時,應明確用于計算的原始數據變量及變量值、計算方法及衍生變量的定義,并進行時間戳管理,以保障數據的準確性和可追溯性。

(五) 數據傳輸和存儲

真實世界數據的傳輸和存儲應當基于可信的網絡安全環境,在數據收集、處理、分析至銷毀的全生命周期予以控制。在數據傳輸和存儲過程中都應有加密保護。此外,應建立操作設置審批流程、角色權限控制和最小授權的訪問控制策略,鼓勵建立自動化審計系統,監測記錄數據的處理和訪問活動。

(六) 數據質量控制

數據質量控制是確保研究數據完整性、準確性和透明性的關鍵。數據質量控制需要建立完善的RWD質量管理體系和SOP,建議原則包括:

1. 確保源數據的準確性和真實性

如電子病歷作為關鍵數據源,應有病歷質控標準以滿足分析要求。來源于門診的疾病描述、診斷及其用藥信息需要有相關證據鏈佐證。

2. 在數據提取時充分考慮數據完整性問題

評估和確立提取字段,制定相應的核查規則和數據庫架構。

3. 建立數據錄入和結構化的標準指南,確保錄入數據與源數據的一致性。

對于錄入過程中的任何修改,需要有負責人的確認和簽名,并提供修改原因,確保留下完整的稽查軌跡。

4. 制定完善的數據質量管理計劃

制定系統質控和人工質控計劃,確保數據的準確性和完整性。對于關鍵變量,應進行100%核查和源文件調閱;其它變量可根據實際情況抽樣核查,例如,對于人口學信息、數值型變量閾值、編碼映射關系等,可按一定比例抽樣,核查其準確性與合理性。

(七) 通用數據模型

通用數據模型(Common Data Model,CDM)是多學科合作模式下對多源異構數據進行快速集中和標準化處理的數據系統,其主要功能是將不同標準的源數據轉換為統一的結構、格式和術語,以便跨數據庫/數據集進行數據整合。

由于多源數據的結構和類型的復雜性、樣本規模和標準的差異性,在將源數據轉換為CDM的整體過程中,需要對源數據進行提取、轉換、加載(Extract-Transform-Load,ETL),應確保源數據在語法和語義上與目標分析數據庫的結構和術語一致。

圖2 異源數據模型向通用數據模型轉化的示意圖

理想的通用數據模型應遵循以下原則:

1. CDM可以定義為一種數據治理機制,通過該機制可以將源數據標準化為通用結構、格式和術語,從而允許跨多個數據庫/數據集進行數據整合。CDM應具有訪問源數據的能力,是可動態擴展和持續改進的數據模型,并有版本控制;

2. CDM變量的定義、測量、合并、記錄及其相應的驗證應保持透明,多個數據庫的數據轉換應有清晰一致的規則;

3. CDM應有基線概念,安全性和有效性相關的常用變量或概念都應映射到CDM,以適用于不同臨床研究問題,并可通過公認或已知的研究結果進行比對。

(八) 真實世界數據治理計劃書

RWD治理計劃書應事先制定,與整個項目研究計劃同步。如果治理計劃書在研究進行過程中需要修訂,應與審評機構溝通并備案。計劃書中應說明使用RWD用于監管決策的目的、使用RWD的研究設計,還應對RWD源數據進行說明,包括但不限于:RWD源數據/源文件的類型,例如衛生信息系統數據、疾病登記數據、醫保數據等;RWD的源數據/源文件,適當評價其既往應用情況,說明采用的理由;RWD的治理,即由RWD數據來源到分析數據庫的治理過程,包括數據提取、數據安全性處理、數據清洗(邏輯核查及異常數據處理、數據完整性處理)、數據導入和結構化(通用數據模型、歸一化、自然語言處理、醫學編碼、衍生變量)、數據傳輸等;采用的數據模型和數據標準;缺失數據的處理方法;減少或控制使用RWD帶來的潛在偏倚所采取的措施;質量控制和質量保證;RWD的適用性評估,即申報項目對RWD的適用性評估準則。

五、 真實世界數據的合規性、安全性與質量管理體系

(一) 數據合規性

RWD 來源于患者個人診療等多種途徑的數據,數據的收集、處理與使用等會涉及倫理及患者隱私問題。為充分保護患者的安全和權益,獲取和使用RWD以開展真實世界研究,須通過倫理委員會的審核批準。參與RWD治理的相關人員需嚴格遵守相關法律、法規的要求,申辦者應嚴格執行,盡保護和管理義務。

(二) 數據安全管理

應依照國家法律法規、行業監管要求等做好數據安全管理工作,對承載健康醫療數據的信息系統和網絡設施以及云平臺等進行必要的安全保護。數據安全保護范圍應涵蓋包括數據收集、數據提取、數據傳輸、數據存儲、數據交換、數據銷毀等在內的各個生命周期。采用加密技術保證數據在收集、提取、傳輸和存儲過程中的完整性、保密性、可追溯性,使用介質傳輸的,應對介質實施管控。對不同介質的數據形式采用不同的保護措施,并建立相對應的訪問控制機制,對訪問記錄進行審核、登記、歸檔和審計。

數據審計及相關操作規程為數據的收集、提取、傳輸、維護、存儲、共享、使用等提供記錄和依據,應包括人員審計、管理審計、技術審計,應制定和部署醫療信息系統活動審計政策和適當的標準操作流程。審計的內容應包括數據的任何狀態的任何操作,包括登錄、創建、修改和刪除記錄的行為,都應自動生成帶有時間標記的審計記錄,包括但不限于授權信息、操作時間、操作原因、操作內容、操作人及簽名等信息,并可供審計。審計記錄應被安全存儲并建立訪問控制策略。

(三) 質量管理體系

應建立完整的質量管理體系,以規范RWD的處理流程,并在實際工作中持續優化、完善?;举|量要素應覆蓋:確保RWD的質量,應建立覆蓋RWD全生命周期管理的操作流程;計算機化系統功能應滿足RWD的管理需求,符合相關法規對計算機化系統的相關要求;建立完善的人員管理制度,數據收集、治理、分析人員應獲得相應的培訓,符合職責能力要求,并對人員的權限進行標準化管理;建立從數據收集至數據遞交各環節的風險管理流程;制定標準的信息與文檔管理規范(紙質、電子介質),確保RWD處理流程記錄完整、準確、透明,保護數據的安全性與合規性。

六、 與監管機構的溝通

為保證RWD的質量符合監管要求,鼓勵申請人與監管機構及時溝通交流。在真實世界研究正式開始前,基于整體研發策略和具體研究方案等,就RWD是否支持產生RWE進行交流,包括RWD的可及性、樣本量是否足夠大、數據治理計劃是否合理可行、數據質量可否得到保障等。在研究進行中,如果根據研究實施中的變化情況對數據治理計劃進行調整,申辦者需衡量數據治理計劃調整對試驗目標的潛在影響,向監管機構說明調整的充分理由,并征得其同意,還應將更新的研究方案和數據治理計劃書備案。在研究完成后和遞交資料前,申辦者可與監管機構咨詢遞交資料和數據庫進行溝通。

名詞解釋

電子病歷(Electronic Medical Record,EMR):由醫療機構中授權的臨床專業人員創建、收集、管理和訪問的個體患者的健康相關信息電子記錄。

電子健康檔案(Electronic Health Record,EHR):符合國家認可的使用的互操作性標準,并能夠由多個醫療機構中授權的臨床專業人員創建、管理和咨詢的針對個體患者的健康相關信息電子記錄。

分析數據庫(Analysis Dataset):根據特定研究的具體要求,對原始數據庫做該研究特有的定制化處理后形成的數據庫,包括從研究中心提取原始數據補足缺失項、完成隨訪、通過患者ID進行數據關聯、衍生指標計算、數據標準化、醫學編碼等。

觀察性研究(Observational Study):根據特定研究問題,不施加主動干預的、以自然人群或臨床人群為對象的、探索暴露/治療與結局因果關系的研究。

患者報告結局(Patient-Reported Outcome,PRO):是一種來自患者自身測量與評價疾病結局的指標,包括癥狀、生理、心理、醫療服務滿意度等。其記錄有紙質和電子兩種方式,后者稱為電子患者報告結局(ePRO)。

邏輯核查(Edit Check):對輸入計算機系統的臨床研究數據的有效性的檢查,主要評價輸入數據與其預期的數值邏輯、數值范圍或數值屬性等方面是否存在邏輯性錯誤。

數據標準(Data Standard):是關于如何在計算機系統之間構建、定義、格式化或交換特定類型數據的一系列規則。數據標準可使遞交的資料具有可預測性和一致性,且具有信息技術系統或科學工具可以使用的形式。

數據清洗(Data Cleaning):數據清洗旨在識別和糾正數據中的噪聲,將噪聲對數據分析結果的影響降至最低。數據中的噪聲主要包括不完整的數據、冗余的數據、沖突的數據和錯誤的數據等。

數據融合(Data Linkage): 將多來源的數據和信息加以合并、關聯及組合,形成統一的數據集。

數據元素(Data Element):臨床研究中記錄的受試者的單一觀察值,例如,出生日期,白細胞計數,疼痛嚴重程度,以及其它臨床觀察值。

數據治理(Data Curation):針對特定臨床研究問題,為達到適用于統計分析而對原始數據所進行的治理,其內容至少包括數據提?。ê鄠€數據源)、數據安全性處理、數據清洗(邏輯核查及異常數據處理、數據完整性處理)、數據轉化(通用數據模型、歸一化、自然語言處理、醫學編碼、衍生變量計算)、數據質量控制、數據傳輸和存儲等若干環節。

通用數據模型(Common Data Model,CDM):是多學科合作模式下對多源異構數據進行快速集中和標準化處理的數據系統,其主要功能是將不同數據標準的源數據轉換為統一的結構、格式和術語,以便跨數據庫/數據集進行數據整合。

協變量(Covariate):研究者預計的或通過探索性分析確定的會對主要結局變量產生重要影響的變量,它可以分為基線協變量和非基線協變量兩類。

源數據(Source Data):臨床研究中記錄的臨床癥狀、觀測值和用于重建和評估該研究的其他活動的原始記錄和核證副本上的所有信息。源數據包含在源文件中(包括原始記錄或其有效副本)。

真實世界數據(Real-World Data,RWD):來源于日常所收集的各種與患者健康狀況和/或診療及保健有關的數據。并非所有的真實世界數據經分析后就能成為真實世界證據,只有滿足適用性的真實世界數據才有可能產生真實世界證據。

真實世界研究(Real-World Research/Study,RWR/RWS):針對臨床研究問題,在真實世界環境下收集與研究對象健康狀況和/或診療及保健有關的數據(真實世界數據)或基于這些數據衍生的匯總數據,通過分析,獲得藥物的使用價值及潛在獲益-風險的臨床證據(真實世界證據)的研究過程。

真實世界證據(Real-World Evidence,RWE):通過對適用的真實世界數據進行恰當和充分的分析所獲得的關于藥物的使用情況和潛在獲益-風險的臨床證據。

參考文獻

[1] 蔡婷, 詹思延. 加快我國疫苗安全主動監測系統建設的思考[J]. 中華預防醫學雜志. 2019,53(7): 664-667.

[2] 國家衛生健康委, 國家藥品監督管理局. 《藥物臨床試驗質量管理規范》. 2020.07.01.

[3] 國家藥品監督管理局藥品審評中心. 《臨床試驗數據管理工作技術指南》. 2016.07.27.

[4] 國家藥品監督管理局. 《真實世界證據支持藥物研發與審評的指導原則(試行)》. 2020.01.07.

[5] 侯永芳, 宋海波, 劉紅亮, 等. 基于中國醫院藥物警戒系統開展主動監測的實踐與探討[J]. 中國藥物警戒. 2019,16(4): 212-214.

[6] 周莉, 歐陽文偉, 李庚, 等. 中國登記研究的現狀分析[J] 中國循證醫學雜志. 2019,19(6): 702-707.

[7] Berger M, Daniel G, Frank K, et al. A framework for regulatory use of real world evidence. https://healthpolicy.duke. edu/sites/default/files/atoms/files/rwe_white_paper_2017.09.06.pdf.

[8] Booth CM, Karim S, Mackillop WJ. Real-world data: towards achieving the achievable in cancer care[J]. Nat Rev Clin Oncol. 2019,16(5): 312-325.

[9] Duke-Margolis Center for Health Policy. Characterizing RWD Quality and Relevancy for Regulatory Purposes. https://healthpolicy.duke.edu/publications.

[10] Duke-Margolis Center for Health Policy. Determining Real-World Data’s Fitness for Use and the Role of Reliability. https://healthpolicy.duke.edu/publications.

[11] EMA. Reflection paper on expectations for electronic source data and data transcribed to electronic data collection tools in clinical trials. https://www.ema.europa.eu/en/documents/regulatory-   procedural-guideline/reflection-paper-expectations-electronic-source-data-data-transcribed-electronic-data-collection_en.pdf.

[12] EMA. A Common Data Model for Europe – Why? Which? How? https://www.ema. europa.eu/en/documents/report/common-data-model-europe-why-which-how-workshop-report_en.pdf.

[13] Khozin S, Abernethy AP, Nussbaum NC, et al. Characteristics of real-world metastatic non-small cell lung cancer patients treated with nivolumab and pembrolizumab during the year following approval [J]. Oncologist. 2018, 23: 328–336.

[14] OHDSI – Observational Health Data Sciences and Informatics, https://www. ohdsi.org.

[15] Ong TC, Kahn MG, Kwan BM, et al. Dynamic ETL: a hybrid approach for health data extraction transformation and loading J.BMC Medical Informatics and Decision Making 2017, 17(1) : 134.

 

附錄1 

中英文對照表

中文

英文

標準操作規程

Standard Operation Procedure, SOP

病例報告表

Case Report Form, CRF

病例登記

Patient Registry

電子病歷

Electronic Medical Record, EMR

電子健康檔案

Electronic Health Record, EHR

分析數據庫

Analysis Dataset

觀察性研究

Observational Study

患者報告結局

Patient Reported Outcome, PRO

結局變量

Outcome Variable

可追溯性

Traceability

臨床數據中心

Clinical Data Repository

邏輯核查

Edit Check

免疫接種不良事件

Adverse Events Following Mmunization, AEFI

數據標準

Data Standard

數據清洗

Data Cleaning

數據元素

Data Element

數據治理

Data Curation

通用數據模型

Common Data Model, CDM

衛生信息系統

Hospital Information System, HIS

適用真實世界數據

Research-ready RWD

衍生變量

Derived Variable

醫保支付數據

Medical Claims Data

源數據

Source Data

真實世界數據

Real World Data, RWD

真實世界研究

Real World Research/Study,

RWR/RWS

真實世界證據

Real World Evidence,RWE

 

附件2

 

《用于產生真實世界證據的真實世界數據指導原則(征求意見稿)》起草說明

 

為進一步指導和規范申辦者利用真實世界數據生成真實世界證據支持藥物研發,藥品審評中心組織起草了《用于產生真實世界證據的真實世界數據指導原則(征求意見稿)》?,F將有關情況說明如下:

一、背景和目的

國家藥品監督管理局于2020年1月7日發布了《真實世界證據支持藥物研發與審評的指導原則(試行)》,為工業界利用真實世界證據支持藥物研發提供了科學可行的指導意見。該指導原則一經發布即受到了工業界的廣泛關注。

真實世界數據是產生真實世界證據的基礎,高質量的適用的真實世界數據是產生真實世界證據的前提條件。目前真實世界數據普遍存在數據的記錄、采集、存儲等流程缺乏嚴格的質量控制,數據不完整,數據標準和數據模型不統一等問題,對真實世界數據的有效使用形成了障礙。因此現階段需明確如何使收集的真實世界數據能夠成為或經治理后能夠成為滿足臨床研究目的所需的分析數據,以及如何評估真實世界數據是否適用于產生真實世界證據。

藥品審評中心組織起草《用于產生真實世界證據的真實世界數據指導原則(征求意見稿)》,作為《真實世界證據支持藥物研發與審評的指導原則(試行)》的補充。

二、起草過程

本指導原則的起草小組基于藥審中心與南方醫科大學戰略合作建立的三方學術協調委員會,由學術界、制藥工業界和監管機構代表共同組成,保證了本指導原則高效、高質量完成。

本指導原則自2020年1月正式啟動,分別于2020年5月和7月召開兩次專家研討會,對指導原則初稿進行了充分的討論和交流,并經藥審中心內部征求意見與審核,形成征求意見稿。

參與制訂本指導原則的專家名單見附錄,在此一并致謝。

三、主要內容與說明

本指導原則從真實世界數據的定義、來源、評價、治理、標準、安全合規、質量保障、適用性等方面,對真實世界數據給出具體要求和指導性建議,包括引言、真實世界數據來源及現狀、真實世界數據適用性評價、真實世界數據治理、真實世界數據的合規性、安全性與質量管理體系、與監管機構的溝通以及附件等內容。

(一)引言

闡述了本指導原則的起草背景、目的和適用范圍。

(二)真實世界數據來源及現狀

梳理介紹了國內真實世界數據的主要來源,并分析真實世界數據應用面臨的主要問題。

(三)真實世界數據適用性評價

詳細介紹了基于特定的研究目的和監管決策用途,如何對真實世界數據進行適用性評價,包括源數據的適用性評價和經治數據的適用性評價。

(四)真實世界數據治理

詳細介紹了針對特定臨床研究問題,為達到適用于統計分析而對原始數據所進行的治理,其內容包括但不限于:數據安全性處理、數據提取、數據清洗、數據轉化、數據傳輸和存儲、數據質量控制等若干環節。附錄2較為詳盡的提供了真實世界數據治理流程的案例。

(五)真實世界數據的合規性、安全性與質量管理體系

強調應依照國家法律法規、行業監管要求等做好數據安全管理工作,應建立完整的質量管理體系,以規范真實世界數據的處理流程。

(六)與監管機構的溝通

為保證真實世界數據的質量符合監管要求,鼓勵申請人與監管機構及時溝通交流。

(七)附錄

提供了參考文獻、詞匯表、中英文詞匯對照、真實世界數據治理流程案例。

 

附件1

 

參與制訂《用于產生真實世界證據的真實世界數據指導原則(征求意見稿)》的專家名單

 

主要執筆人:陳平雁、王駿、陳杰、田正隆、高麗麗、狄佳寧

外部專家:羅立剛

三方學術協調委員會:陳平雁、王駿、狄佳寧

(其余按姓氏筆劃順序):

王北琪、王秋珍、王勇、尹平、田正隆、閆波、李若冰、李康、何崑、辛曉娜、陳剛、陳杰、陳峰、歐春泉、趙耐青、趙駿、賀佳、高麗麗、郭翔、譚銘

秘書:吳瑩、段重陽



版權聲明:
本網站所有注明“來源:梅斯醫學”或“來源:MedSci原創”的文字、圖片和音視頻資料,版權均屬于梅斯醫學所有。非經授權,任何媒體、網站或個人不得轉載,授權轉載時須注明“來源:梅斯醫學”。其它來源的文章系轉載文章,本網所有轉載文章系出于傳遞更多信息之目的,轉載內容不代表本站立場。不希望被轉載的媒體或個人可與我們聯系,我們將立即進行刪除處理。
在此留言
評論區 (2)
#插入話題

相關資訊

CDE公開征求意見:兒童用藥研究如何使用真實世界證據

5月18日,國家藥監局藥品審評中心發布通知,就《真實世界證據支持兒童藥物研發與審評的技術指導原則(征求意見稿)》(以下簡稱指導原則)公開征求意見。征求意見時間為期一個月。

謝生榮:CRO業務的下一個風口,真實世界證據一體化解決方案

1998年8月,國家藥品監督管理局(SDA)正式成立,SDA成立后為加強藥品監督管理力度和依法行政,重新制定頒布了當時既能與國際接軌又符合我國國情的《新藥審批辦法》和《藥品臨床試驗管理規范》(GCP)

真實世界證據支持藥物研發與審評的指導原則 (試行)

注:藍色且帶【】為批注。其它部分為正文,標紅色為梅斯醫學highlight

真實世界證據(RWE)證實:Cosentyx在臨床實踐中具有高有效性和長期安全性

來自五個真實世界研究的證據以及在北美、拉丁美洲和歐洲進行的觀察性研究為超過13,000例患者提供了關于Cosentyx(secukinumab)臨床實踐的廣泛見解,報告了Cosentyx在真實世界中的持續療效、有利的安全性以及對生活質量的有益影響。

CDE:《真實世界證據支持藥物研發的基本考慮》意見稿

為落實國務院《關于改革藥品醫療器械審評審批制度的意見》(國發〔2015〕44號)以及中共中央辦公廳、國務院辦公廳印發的《關于深化審評審批制度改革鼓勵藥品醫療器械創新的意見》(廳字〔2017〕42號)鼓勵研究和創制新藥的要求,考慮到藥物臨床研發過程中,存在臨床試驗不可行或難以實施等情形,利用真實世界證據用以評價藥物的有效性和安全性成為可能的一種策略和路徑。???&n

中國真實世界證據論文榮登BMJ“中國專輯”

真實世界證據(RWE),近年來不斷頻頻出現在醫藥工作者的視野之中。那么究竟什么是真實世界證據?真實世界證據與傳統隨機對照試驗(RCT)有何異同?真實世界證據在中國的實施究竟面臨著哪些困難?為推進真實世界證據在中國的發展,我國醫藥界需要付諸哪些行動?針對這些問題,四川大學華西醫院中國循證醫學中心主任孫鑫教授、國家食品藥品監督管理總局藥品不良反應監測中心李馨齡處長及同事于2018年2月5日,在《英國醫

官方江西11选5走势图