一、觀測(cè)指標(biāo)標(biāo)識(shí)符邏輯命名與編碼系統(tǒng)(LOINC)數(shù)據(jù)庫(kù)介紹(論文文獻(xiàn)綜述)
任慧玲,李曉瑛,鄧盼盼,冀玉靜,劉懿,黃裕翔[1](2021)在《國(guó)際醫(yī)學(xué)術(shù)語體系進(jìn)展及特色優(yōu)勢(shì)分析》文中進(jìn)行了進(jìn)一步梳理文章深入調(diào)研國(guó)際主流醫(yī)學(xué)術(shù)語體系的新進(jìn)展,為中文醫(yī)學(xué)術(shù)語體系建設(shè)提供參考。選取國(guó)際具有較高影響力的醫(yī)學(xué)術(shù)語體系,概要闡述其編制目標(biāo)、內(nèi)容結(jié)構(gòu)及應(yīng)用現(xiàn)狀等基本情況,并對(duì)其特色優(yōu)勢(shì)進(jìn)行剖析與歸納,發(fā)現(xiàn)國(guó)際主流醫(yī)學(xué)術(shù)語體系表現(xiàn)出更新持久、應(yīng)用目標(biāo)明確、開放易獲取、語義關(guān)系豐富等特色。國(guó)際醫(yī)學(xué)術(shù)語體系的編制模式及新進(jìn)展,開辟了一條融合創(chuàng)新與應(yīng)用驗(yàn)證相結(jié)合的醫(yī)學(xué)術(shù)語標(biāo)準(zhǔn)化之路,有助于推動(dòng)中文醫(yī)學(xué)術(shù)語體系的建設(shè)落地。
井杰[2](2021)在《知識(shí)和數(shù)據(jù)雙驅(qū)動(dòng)的檢驗(yàn)人工智能疾病診斷系統(tǒng)的構(gòu)建》文中研究指明研究背景:近年來,人工智能(artificial intelligence,AI)技術(shù)在醫(yī)學(xué)領(lǐng)域迅速發(fā)展,越來越多模擬醫(yī)生診斷能力的醫(yī)療AI被開發(fā),以期為患者提供更優(yōu)質(zhì)的醫(yī)療服務(wù)。然而,目前醫(yī)療AI系統(tǒng)在現(xiàn)實(shí)世界中的臨床應(yīng)用尚未普及。迄今為止,AI一共經(jīng)歷了兩代發(fā)展。第一代AI是基于知識(shí)驅(qū)動(dòng)AI模型,旨在模仿人類專家的推理和決策能力,其顯著優(yōu)點(diǎn)是輸出結(jié)果具有可解釋性。主要缺點(diǎn)是處理大數(shù)據(jù)時(shí)耗時(shí)耗力且計(jì)算成本高昂。第二代AI是以深度學(xué)習(xí)為代表的數(shù)據(jù)驅(qū)動(dòng)AI模型。該類模型可從大量案例中自動(dòng)提取規(guī)則,而無需專家知識(shí)的指導(dǎo)。其優(yōu)點(diǎn)是具有大數(shù)據(jù)處理優(yōu)勢(shì),可自動(dòng)搜索和處理大量變量,從而可靠地對(duì)結(jié)果進(jìn)行分類和預(yù)測(cè)。但輸出結(jié)果缺乏可解釋性是其面臨的主要問題。因此,近幾年AI學(xué)者提出了一個(gè)新的概念,即第三代AI,大體說來,是通過結(jié)合知識(shí)驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)方法的優(yōu)勢(shì),構(gòu)建更強(qiáng)大、兼具可解釋性和魯棒性的AI系統(tǒng),推動(dòng)AI的創(chuàng)新應(yīng)用。檢驗(yàn)醫(yī)學(xué)是現(xiàn)代醫(yī)學(xué)的重要組成部分,臨床決策所需信息70%來自檢驗(yàn)。檢驗(yàn)項(xiàng)目涵蓋臨床化學(xué)、毒理學(xué)、血液學(xué)、免疫學(xué)以及微生物學(xué)等在內(nèi)的數(shù)千項(xiàng)指標(biāo),為臨床醫(yī)生提供大量客觀數(shù)據(jù)以支持臨床決策。眾所周知,糖尿病、癌癥、內(nèi)分泌、感染性以及遺傳性疾病在內(nèi)的大量常見病都需實(shí)驗(yàn)室檢查確診或協(xié)助確診。然而,目前臨床??苹l(fā)展趨勢(shì)不可避免,臨床醫(yī)生只熟悉自己??瞥S玫臋z驗(yàn)項(xiàng)目,很容易忽視超出其專科知識(shí)范圍的關(guān)鍵結(jié)果和重要參數(shù)。此外,隨著檢驗(yàn)醫(yī)學(xué)的快速發(fā)展,檢驗(yàn)項(xiàng)目越來越多。臨床醫(yī)生在疾病診療過程中,面臨多個(gè)檢驗(yàn)項(xiàng)目指標(biāo)異常時(shí),很難從異常檢驗(yàn)數(shù)據(jù)中綜合提取其對(duì)應(yīng)的醫(yī)學(xué)信息。由于疾病影響著機(jī)體的整體狀態(tài),許多異常檢驗(yàn)數(shù)據(jù)之間隱藏著疾病的關(guān)鍵信息或重要趨勢(shì)。然而,當(dāng)眾多檢驗(yàn)指標(biāo)發(fā)生異常時(shí),即使是經(jīng)驗(yàn)豐富的醫(yī)生也很容易忽視其內(nèi)在關(guān)系,從而造成疾病的漏診或誤診。盡管綜合分析檢驗(yàn)數(shù)據(jù)的相互關(guān)聯(lián)對(duì)臨床病情判斷具有深遠(yuǎn)意義,但這一過程涉及了復(fù)雜的邏輯推理和計(jì)算,給人腦分析帶來了巨大的挑戰(zhàn)。因此,通過AI技術(shù)開發(fā)基于實(shí)驗(yàn)室檢查的可解釋檢驗(yàn)AI工具以挖掘檢驗(yàn)數(shù)據(jù)中的隱藏價(jià)值,為提高實(shí)驗(yàn)室診斷價(jià)值提供了巨大的應(yīng)用前景。研究目的:本研究的主要目的是運(yùn)用知識(shí)圖譜和ML算法對(duì)大量實(shí)驗(yàn)室檢查數(shù)據(jù)和實(shí)驗(yàn)診斷數(shù)據(jù)進(jìn)行訓(xùn)練和分析,建立一個(gè)由知識(shí)和數(shù)據(jù)雙驅(qū)動(dòng)的,兼具魯棒性和可解釋性的檢驗(yàn)AI系統(tǒng),其核心功能是準(zhǔn)確診斷疾病并提供合理的解釋。同時(shí),開發(fā)集檢驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)化、智能檢驗(yàn)報(bào)告解讀和智能疾病推薦為一體的多功能智慧檢驗(yàn)平臺(tái),以便于檢驗(yàn)AI系統(tǒng)運(yùn)用于臨床實(shí)踐。研究方法:本課題所采用的研究方法如下所述:1.構(gòu)建檢驗(yàn)知識(shí)圖譜。檢驗(yàn)知識(shí)圖譜的構(gòu)建主要包括概念設(shè)計(jì)、知識(shí)構(gòu)建、知識(shí)圖譜應(yīng)用和知識(shí)補(bǔ)充四個(gè)方面。2.數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理過程包括數(shù)據(jù)清洗、數(shù)據(jù)集成、特征標(biāo)準(zhǔn)化和特征變換。3.數(shù)據(jù)收集、研究人群和研究設(shè)計(jì)。以2020年1月1日為時(shí)間節(jié)點(diǎn),2010年1月1日至2020年10月31日所有門診和住院患者的合格參與者被分為回顧性隊(duì)列和前瞻性隊(duì)列。其中,回顧性隊(duì)列以8:2的比例隨機(jī)分為訓(xùn)練集和驗(yàn)證集。訓(xùn)練集用于訓(xùn)練和構(gòu)建檢驗(yàn)AI系統(tǒng)。前瞻性測(cè)試隊(duì)列用于測(cè)試檢驗(yàn)AI系統(tǒng)的疾病診斷性能。4.構(gòu)建多標(biāo)簽疾病診斷系統(tǒng)。模擬醫(yī)生對(duì)疾病診斷推理的全過程,本研究構(gòu)建了基于不同器官系統(tǒng)的疾病診斷體系。首先,將診斷分為不同器官系統(tǒng)診斷。然后,每個(gè)器官系統(tǒng)內(nèi)又進(jìn)一步分為不同的疾病診斷。5.構(gòu)建檢驗(yàn)AI系統(tǒng)。采用了LR、XGBoost以及ANN三種ML算法分別構(gòu)建三種檢驗(yàn)AI系統(tǒng)數(shù)據(jù)驅(qū)動(dòng)模型?;跈z驗(yàn)知識(shí)圖譜的知識(shí)驅(qū)動(dòng)模型和基于ML算法的數(shù)據(jù)驅(qū)動(dòng)模型的集成呈現(xiàn)了知識(shí)和數(shù)據(jù)雙驅(qū)動(dòng)檢驗(yàn)AI系統(tǒng)的形式與內(nèi)容。6.檢驗(yàn)AI系統(tǒng)的網(wǎng)頁應(yīng)用與圖形化展示。開發(fā)智慧檢驗(yàn)平臺(tái),核心組件主要包括檢驗(yàn)醫(yī)師智能助手、臨床檢驗(yàn)數(shù)據(jù)中臺(tái)、檢驗(yàn)AI運(yùn)行監(jiān)測(cè)以及檢驗(yàn)大數(shù)據(jù)看板在內(nèi)的四大模塊。7.數(shù)據(jù)分析。模型診斷效能的評(píng)價(jià)使用召回率(Recall)和平均精度均值(m AP)指標(biāo)。研究結(jié)果:1.基線特征。2010年1月1日至2020年10月31日期間,所有門診和住院患者共730,113名合格參與者被納入臨床研究。其中,訓(xùn)練集509,841人,驗(yàn)證集235,074人,測(cè)試隊(duì)列69,101人。2.數(shù)據(jù)驅(qū)動(dòng)模型?;贚R算法模型的檢驗(yàn)AI系統(tǒng)預(yù)測(cè)疾病準(zhǔn)確性(m AP=87.53%)要略優(yōu)于ANN(m AP=86.83%),強(qiáng)于XGBoost(m AP=84.41%)。因此,本研究選擇LR算法構(gòu)建檢驗(yàn)AI系統(tǒng)的數(shù)據(jù)驅(qū)動(dòng)模型。3.知識(shí)和數(shù)據(jù)雙驅(qū)動(dòng)檢驗(yàn)AI系統(tǒng)的構(gòu)建。檢驗(yàn)AI系統(tǒng)由兩個(gè)核心模型組成,即基于檢驗(yàn)知識(shí)圖譜的知識(shí)驅(qū)動(dòng)AI模型和基于LR算法的數(shù)據(jù)驅(qū)動(dòng)AI模型。本研究共建立了4,147種知識(shí)驅(qū)動(dòng)AI模型和168種疾病的數(shù)據(jù)驅(qū)動(dòng)AI模型。4.檢驗(yàn)AI系統(tǒng)的工作思路。檢驗(yàn)AI系統(tǒng)存在四種通用類型診斷模式。模式1被稱為“金標(biāo)準(zhǔn)”診斷的知識(shí)驅(qū)動(dòng)AI診斷模式;模式2被稱為“分類診斷”的疊加知識(shí)驅(qū)動(dòng)AI診斷模式;模式3被稱為“鑒別診斷”的“知識(shí)+數(shù)據(jù)”雙驅(qū)動(dòng)AI診斷模式;模式4被稱為“以臨床特征驅(qū)動(dòng)診斷”的“知識(shí)+數(shù)據(jù)”雙驅(qū)動(dòng)AI診斷模式。5.檢驗(yàn)AI系統(tǒng)對(duì)多系統(tǒng)多疾病的診斷性能評(píng)價(jià)。檢驗(yàn)AI系統(tǒng)在各個(gè)診斷層次水平都實(shí)現(xiàn)了高水平的準(zhǔn)確性和全面性。預(yù)測(cè)10種器官系統(tǒng)時(shí),m AP值為95.19%,Recall值為100.00%;預(yù)測(cè)10種具體疾病時(shí),m AP值為96.01%,Recall值為78.90%。6.檢驗(yàn)AI系統(tǒng)的臨床應(yīng)用。檢驗(yàn)醫(yī)師智能助手展示基于患者檢驗(yàn)數(shù)據(jù)的模型算法診斷推薦并附有疾病的診斷解釋。臨床檢驗(yàn)數(shù)據(jù)中臺(tái)用于實(shí)現(xiàn)檢驗(yàn)數(shù)據(jù)的結(jié)構(gòu)化、標(biāo)準(zhǔn)化以及歸一化。檢驗(yàn)AI運(yùn)行監(jiān)測(cè)可記錄和展示檢驗(yàn)AI系統(tǒng)的預(yù)測(cè)結(jié)果。檢驗(yàn)大數(shù)據(jù)看板展示檢驗(yàn)AI系統(tǒng)的運(yùn)行狀態(tài)等情況。結(jié)論:在本研究中,基于知識(shí)和數(shù)據(jù)雙驅(qū)動(dòng)的檢驗(yàn)AI系統(tǒng)能夠自動(dòng)識(shí)別并綜合分析2,071種檢驗(yàn)指標(biāo),完成對(duì)包含感染、呼吸系統(tǒng)以及血液系統(tǒng)等在內(nèi)10種器官系統(tǒng)疾病和441種具體疾病診斷的多元關(guān)系推理,且所有推理過程具備良好的可解釋性。預(yù)測(cè)10種器官系統(tǒng)和10種具體疾病診斷時(shí)漏診極少且準(zhǔn)確性高。檢驗(yàn)AI系統(tǒng)良好的疾病診斷性能有助于輔助臨床醫(yī)生進(jìn)行診療決策;對(duì)復(fù)雜及疑難疾病的早期診斷也具有重要意義。
陳祿明[3](2021)在《基于真實(shí)世界醫(yī)療大數(shù)據(jù)的中文醫(yī)學(xué)本體重構(gòu)的研究》文中研究說明高質(zhì)量的醫(yī)學(xué)本體,可以打破不同醫(yī)學(xué)文本數(shù)據(jù)之間的藩籬,使得醫(yī)學(xué)數(shù)據(jù)能以統(tǒng)一的標(biāo)準(zhǔn)形式被各類信息處理方法充分利用,進(jìn)而形成一套有效的醫(yī)學(xué)知識(shí)表示體系,從而產(chǎn)生有價(jià)值的臨床應(yīng)用。相較于西方發(fā)達(dá)國(guó)家,尤其是英語國(guó)家,國(guó)內(nèi)的生物醫(yī)學(xué)本體無論從規(guī)模、數(shù)量還是內(nèi)容上都處于相對(duì)滯后的水平,因此我們急需發(fā)展出一套具有中國(guó)特色的中文醫(yī)學(xué)本體構(gòu)建策略與技術(shù)路徑,來實(shí)現(xiàn)中文信息處理技術(shù)與中文臨床生物醫(yī)學(xué)數(shù)據(jù)間的有效融合。在我們的調(diào)研工作之中,我們會(huì)系統(tǒng)性調(diào)研并分析整理出國(guó)際上已有生物醫(yī)學(xué)本體的構(gòu)建策略與技術(shù)路徑,再依據(jù)中文語言特性、國(guó)內(nèi)臨床現(xiàn)狀及中文臨床生物醫(yī)學(xué)數(shù)據(jù)的特點(diǎn)提出一套自己的具有創(chuàng)新性的中文醫(yī)學(xué)本體構(gòu)建策略,其包括問題定義、術(shù)語富集、關(guān)系屬性提取等七個(gè)關(guān)鍵步驟。以此為基礎(chǔ),我們將中文生物醫(yī)學(xué)本體重構(gòu)定義為三個(gè)不同層次的問題,即:中文生物醫(yī)學(xué)本體關(guān)注問題的重構(gòu)、內(nèi)容的重構(gòu)及結(jié)構(gòu)的重構(gòu)。內(nèi)容的重構(gòu)是醫(yī)學(xué)本體構(gòu)建的基礎(chǔ),因此本論文以生物醫(yī)學(xué)本體內(nèi)容的重構(gòu)作為研究重心。我們首先嘗試了面向內(nèi)容重構(gòu)中文生物醫(yī)學(xué)實(shí)體挖掘。此外,大部分本體都是表型概念,缺乏表型屬性,因此我們提出了一種通過表型屬性的定義,實(shí)現(xiàn)臨床表型信息的精細(xì)表征,即實(shí)現(xiàn)疾病的細(xì)粒度知識(shí)表征圖譜。屬性作為本體內(nèi)容的進(jìn)一步豐富和擴(kuò)充,為本體在實(shí)際場(chǎng)景中的應(yīng)用提供了更細(xì)粒度的信息表示策略,因此我們提出一種利用本體屬性的細(xì)粒度語義信息模型PhenoSSU(表型的語義結(jié)構(gòu)單元),可為本體對(duì)疾病知識(shí)的描述提供更為豐富的表達(dá)能力,為臨床診斷提供依據(jù)。。在中文生物醫(yī)學(xué)實(shí)體挖掘的工作之中,我們首先構(gòu)建了基于深度學(xué)習(xí)模型的有監(jiān)督生物醫(yī)學(xué)實(shí)體挖掘方法,該方法以Bert預(yù)訓(xùn)練語言模型為核心結(jié)合Bi-LSTM神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)生物醫(yī)學(xué)實(shí)體的挖掘。然而,有監(jiān)督方法存在依賴人工標(biāo)注質(zhì)量和上下文多樣性方面的問題。因此,我們又基于n-gram統(tǒng)計(jì)語言模型以及句法分析模型實(shí)現(xiàn)了基于無監(jiān)督方法的中文生物醫(yī)學(xué)實(shí)體挖掘。最后,為了更近一步的提高實(shí)體挖掘的收錄范圍,將罕見詞匯、不規(guī)范詞匯也盡可能進(jìn)行挖掘,我們提出利用雙語映射方法引入高質(zhì)量英文生物醫(yī)學(xué)本體輔助中文生物醫(yī)學(xué)本體建設(shè)的思路,并以UMLS術(shù)語集、SimAlign雙語詞對(duì)齊工具以及MetaMap術(shù)語標(biāo)注工具為基礎(chǔ),完成了基于雙語資源的中文生物醫(yī)學(xué)實(shí)體挖掘。最終采用多方法有機(jī)組合的策略,在海量真實(shí)世界中文醫(yī)學(xué)大數(shù)據(jù)語料的加持之下,完成了中文生物醫(yī)學(xué)實(shí)體挖掘。為了評(píng)測(cè)基于多方法融合策略的實(shí)體挖掘成果,我們將挖掘后的擴(kuò)展詞表與現(xiàn)有最全面、權(quán)威的中文術(shù)語集合進(jìn)行對(duì)比,來測(cè)試重構(gòu)所得中文生物醫(yī)學(xué)實(shí)體的表達(dá)能力是否能得到顯著提高。相比已有術(shù)語集合,挖掘所得的生物醫(yī)學(xué)術(shù)語擴(kuò)展詞表,對(duì)真實(shí)世界醫(yī)學(xué)信息的描述能力得到明顯提升,從原來的58.2%上升到80.2%,提高了37.8%。在構(gòu)建細(xì)粒度本體屬性語義模型PhenoSSU工作中,我們旨在用一系列屬性和值來獲取表型描述背后的完整語義信息。選取維基百科中193個(gè)傳染病臨床指南作為研究語料,基于表型概念和屬性值的共現(xiàn)性,將SNOMED-CT中的12個(gè)屬性引入到PhenoSSU模型中。通過分析PhenoSSU實(shí)例是否能夠捕獲對(duì)應(yīng)表型描述背后的完整語義來評(píng)估PhenoSSU模型的表達(dá)能力。為了自動(dòng)構(gòu)建細(xì)粒度表型知識(shí)圖,提出了一種融合MetaMap標(biāo)注工具以及機(jī)器學(xué)習(xí)屬性識(shí)別算法的混合策略。最后,用BRAT標(biāo)注工具手工構(gòu)建了 193種傳染病的細(xì)粒度表型知識(shí)圖。共形成4020個(gè)PhenoSSU語義單元,其中3757個(gè)(89.5%)能夠很好地捕獲臨床指南中列出的相應(yīng)表型描述的完整語義。相比之下,其他信息模型,如CEM和HL7-FHIR模型,分別只能捕獲48.4%(2034/4020)和21.8%(914/4020)的完整語義信息?;旌喜呗栽诒硇透拍钭R(shí)別子任務(wù)上的F1得分為0.732,在屬性值預(yù)測(cè)子任務(wù)上的加權(quán)平均準(zhǔn)確率為0.776。因此,PhenoSSU是一個(gè)有效的進(jìn)行臨床指南知識(shí)表征的語義信息模型。
楊濤[4](2020)在《面向醫(yī)學(xué)大數(shù)據(jù)的實(shí)驗(yàn)室檢查結(jié)果結(jié)構(gòu)化、標(biāo)準(zhǔn)化研究》文中提出目的:近年來,人工智能在醫(yī)療領(lǐng)域取得了前所未有的進(jìn)展,對(duì)疾病的診斷和治療具有重要的應(yīng)用價(jià)值。而人工智能的發(fā)展,離不開大數(shù)據(jù)的支持。電子病歷作為醫(yī)學(xué)大數(shù)據(jù)的重要來源,包含了大量的疾病診療知識(shí)和患者健康數(shù)據(jù)。其中,實(shí)驗(yàn)室檢查作為臨床信息的重要組成部分,對(duì)醫(yī)生做出疾病診斷和治療起到了舉足輕重的作用。但是,這些信息都蘊(yùn)含在非結(jié)構(gòu)化的醫(yī)學(xué)文本中,這對(duì)計(jì)算機(jī)讀懂實(shí)驗(yàn)室檢查信息帶來了極大的困難。并且,由于檢查的表述多種多樣,其結(jié)構(gòu)化、標(biāo)準(zhǔn)化本身就具有很大的挑戰(zhàn)。除此之外,醫(yī)學(xué)本體主要是以單個(gè)術(shù)語形式存在,但是實(shí)驗(yàn)室檢查結(jié)果是一般是由“樣本、檢查對(duì)象和異常情況”三個(gè)部分構(gòu)成,所以從檢查本體到醫(yī)學(xué)本體之間存在著結(jié)構(gòu)和語義的差距。為了解決這一系列問題,本課題探索了通過建立UMLS編碼的實(shí)驗(yàn)室檢查知識(shí)庫(kù),并發(fā)展相應(yīng)的算法,將電子病歷中非結(jié)構(gòu)化的實(shí)驗(yàn)室檢查,轉(zhuǎn)換為術(shù)語形式的結(jié)構(gòu)化、標(biāo)準(zhǔn)化的表述方式,為后續(xù)的研究奠定了基礎(chǔ)。方法:①構(gòu)建知識(shí)庫(kù)。利用相關(guān)英文實(shí)驗(yàn)室檢查名稱資源,構(gòu)建以UMLS術(shù)語為核心的實(shí)驗(yàn)室檢查知識(shí)庫(kù)。②首先將自由文本中的實(shí)驗(yàn)室檢查轉(zhuǎn)換為結(jié)構(gòu)化的三聯(lián)體格式“樣本—檢查對(duì)象—異常情況”,再通過本知識(shí)庫(kù)將此邏輯型的實(shí)驗(yàn)室檢查表述轉(zhuǎn)換為UMLS術(shù)語型表達(dá)。最終,我們選擇在互聯(lián)網(wǎng)上獲取的電子病例作為語料集,評(píng)估本知識(shí)庫(kù)及配套算法的效果。結(jié)果:我們將453個(gè)實(shí)驗(yàn)室檢查映射到2242個(gè)UMLS術(shù)語,這453個(gè)檢查中,72.6%為定量檢查,27.4%為定性檢查。另外,我們共收集了 966份電子病歷,覆蓋26個(gè)不同科室。以專家標(biāo)注作為金標(biāo)準(zhǔn),一共標(biāo)注出12949個(gè)實(shí)驗(yàn)室檢查結(jié)果,其中定量檢查10585個(gè),定性檢查2364個(gè)。①對(duì)專家標(biāo)注的金標(biāo)準(zhǔn)檢查結(jié)果進(jìn)行標(biāo)準(zhǔn)化的準(zhǔn)確率、召回率和F1值分別為:1.000,0.731和0.845。②首先將這些病例進(jìn)行預(yù)處理,經(jīng)過算法輸出為結(jié)構(gòu)化的三聯(lián)體格式,一共得到11219個(gè)結(jié)構(gòu)化的實(shí)驗(yàn)室檢查結(jié)果,再將這些結(jié)構(gòu)化數(shù)據(jù)標(biāo)準(zhǔn)化為UMLS編碼。統(tǒng)計(jì)結(jié)果,其中真陽性個(gè)數(shù)為7262個(gè),準(zhǔn)確率、召回率和F1值分別為:0.647,0.767和0.701。③我們使用了 210份病例,針對(duì)21個(gè)不同科室進(jìn)行分科室測(cè)評(píng),其中算法評(píng)估最高的為普外科,其F1值分別為0.933、0.833。結(jié)論:本課題構(gòu)建了一個(gè)從邏輯表達(dá)表型到術(shù)語表達(dá)表型的知識(shí)庫(kù),并基于該知識(shí)庫(kù),發(fā)展了將病例中的實(shí)驗(yàn)室檢查結(jié)果自動(dòng)結(jié)構(gòu)化、標(biāo)準(zhǔn)化的配套算法工具。該知識(shí)庫(kù)及算法可以成功的將非結(jié)構(gòu)化的實(shí)驗(yàn)室檢查結(jié)果轉(zhuǎn)換為結(jié)構(gòu)化、標(biāo)準(zhǔn)化的術(shù)語型表述。這對(duì)計(jì)算機(jī)理解實(shí)驗(yàn)室檢查結(jié)果以及電子病歷的二次利用具有重要作用,例如相同特征的患者聚類、機(jī)器學(xué)習(xí)、醫(yī)學(xué)人工智能等都具有重要應(yīng)用價(jià)值。除此之外,該知識(shí)庫(kù)也為我們以后構(gòu)建實(shí)驗(yàn)室檢查結(jié)果本體奠定了基礎(chǔ)。
陳東華[5](2020)在《面向決策支持的醫(yī)學(xué)文本語義分析方法研究》文中認(rèn)為隨著醫(yī)療信息化的快速發(fā)展,醫(yī)療信息系統(tǒng)中存儲(chǔ)著各類醫(yī)療數(shù)據(jù)的體量不斷增長(zhǎng),海量異構(gòu)醫(yī)療數(shù)據(jù)的分析成為推動(dòng)醫(yī)療健康領(lǐng)域管理決策支持的挑戰(zhàn)。醫(yī)學(xué)文本信息是推動(dòng)該領(lǐng)域相關(guān)研究的重要數(shù)據(jù)基礎(chǔ)?;颊叩碾娮硬v中包含了大量癥狀、診斷、病程、會(huì)診等文本信息,充分利用這些包含豐富臨床醫(yī)學(xué)知識(shí)的醫(yī)學(xué)文本對(duì)醫(yī)療健康領(lǐng)域決策支持非常重要。然而,當(dāng)前這些有價(jià)值的醫(yī)學(xué)文本卻難以有效地應(yīng)用在實(shí)際醫(yī)院管理、臨床決策支持、個(gè)人健康管理、公共衛(wèi)生決策等實(shí)際場(chǎng)景中,原因包括:非結(jié)構(gòu)化醫(yī)學(xué)文本無法精準(zhǔn)結(jié)構(gòu)化、醫(yī)學(xué)文本豐富的語義信息致使難以分析、醫(yī)學(xué)文本信息無法脫離具體的醫(yī)學(xué)情境、不一致的醫(yī)療信息標(biāo)準(zhǔn)導(dǎo)致信息交換困難、不同醫(yī)療機(jī)構(gòu)之間共享數(shù)據(jù)機(jī)制的缺失等。這些問題的根源在于醫(yī)學(xué)文本是特殊的專業(yè)領(lǐng)域語言,不僅具有各類語義信息,還包含豐富醫(yī)學(xué)領(lǐng)域知識(shí)。有效的醫(yī)學(xué)文本語義分析成為解決這些難題的關(guān)鍵技術(shù)。當(dāng)前語義分析研究更多地是研究面向通用領(lǐng)域的自然語言處理技術(shù),相關(guān)技術(shù)雖然在方法上進(jìn)行創(chuàng)新,卻無法結(jié)合醫(yī)學(xué)場(chǎng)景和領(lǐng)域知識(shí)推動(dòng)醫(yī)學(xué)文本語義的分析,致使無法為機(jī)器學(xué)習(xí)乃至深度學(xué)習(xí)模型提供高質(zhì)量訓(xùn)練數(shù)據(jù)集,降低決策的質(zhì)量。同時(shí),海量醫(yī)療文本在分布式計(jì)算環(huán)境的分析和處理也成為利用這些數(shù)據(jù)分析決策的障礙和挑戰(zhàn),現(xiàn)有研究遇到了方法和性能上的瓶頸。本博士研究依托國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目“大數(shù)據(jù)驅(qū)動(dòng)的智慧醫(yī)療健康管理創(chuàng)新”(編號(hào):71532002),在充分對(duì)國(guó)內(nèi)外理論和技術(shù)文獻(xiàn)綜述基礎(chǔ)上圍繞著面向決策支持的醫(yī)療文本語義分析相關(guān)方法進(jìn)行研究,研究?jī)?nèi)容包括醫(yī)學(xué)場(chǎng)景下的文本語義分析、醫(yī)療信息標(biāo)準(zhǔn)化、領(lǐng)域知識(shí)建模、機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析等方法,解決當(dāng)前醫(yī)療信息行業(yè)中海量醫(yī)學(xué)文本數(shù)據(jù)挖掘和分析的難題,為大數(shù)據(jù)時(shí)代下我國(guó)醫(yī)療信息化發(fā)展提供借鑒。研究?jī)?nèi)容和結(jié)果如下:(1)基于自然語言處理的醫(yī)學(xué)文本結(jié)構(gòu)化和標(biāo)準(zhǔn)化方法首先分析現(xiàn)有中文和英文電子病歷中存在的醫(yī)學(xué)文本特征和信息結(jié)構(gòu),建立基于N-Gram的醫(yī)學(xué)文本語義模型。然后,針對(duì)非標(biāo)準(zhǔn)化的醫(yī)學(xué)敘述性文本,研究具體的醫(yī)學(xué)文本分析任務(wù),對(duì)醫(yī)學(xué)文本進(jìn)行分詞、詞性標(biāo)注、語義關(guān)系提取等分析,提出針對(duì)中文病歷文本的自動(dòng)結(jié)構(gòu)化處理方法;結(jié)合醫(yī)學(xué)場(chǎng)景的語義和語境知識(shí),以中文超聲檢查報(bào)告分析為例,對(duì)該類文本關(guān)鍵信息進(jìn)行分解、標(biāo)注和重組。結(jié)果表明,基于語義分析的醫(yī)學(xué)文本分析方法在醫(yī)學(xué)文本結(jié)構(gòu)化、分詞、標(biāo)注等文本分析任務(wù)的性能得到明顯提升。(2)基于領(lǐng)域知識(shí)庫(kù)的醫(yī)學(xué)文本語義分析和知識(shí)發(fā)現(xiàn)方法首先研究醫(yī)學(xué)領(lǐng)域的相關(guān)知識(shí)庫(kù),并分析這些知識(shí)庫(kù)在醫(yī)學(xué)文本數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)上的應(yīng)用前景。然后,為了解決醫(yī)學(xué)文本語義相似度計(jì)算方法,提出一種基于加權(quán)Levenshtein距離和N-Gram的文本相似度計(jì)算方法。為了解決醫(yī)學(xué)概念相似度計(jì)算的問題,提出基于UMLS的醫(yī)學(xué)文本相似度和相關(guān)性度量的計(jì)算方法。結(jié)果表明,在融入醫(yī)學(xué)文本語義特征和領(lǐng)域知識(shí)庫(kù)中醫(yī)學(xué)概念文本定義信息后,基于文本相似度和相關(guān)性計(jì)算的醫(yī)學(xué)文本分析任務(wù)能更好地滿足實(shí)際需求。最后,針對(duì)醫(yī)院中計(jì)算機(jī)輔助ICD編碼的決策支持場(chǎng)景,融合Word Net語義知識(shí)庫(kù),提出一種基于語義分析的計(jì)算機(jī)輔助ICD-11編碼方法,提高患者診斷信息編碼的精確度和ICD編碼員的工作效率。(3)面向決策支持的海量醫(yī)學(xué)文本分析方法及應(yīng)用案例研究在研究?jī)?nèi)容(1)和(2)基礎(chǔ)上研究面向海量醫(yī)學(xué)文本分析的方法和應(yīng)用案例,并提出大數(shù)據(jù)分析性能自動(dòng)優(yōu)化方法。首先,研究面向具有復(fù)雜結(jié)構(gòu)的醫(yī)學(xué)文本的主題建模方法,分析相關(guān)機(jī)器學(xué)習(xí)算法在不同場(chǎng)景的應(yīng)用特點(diǎn);然后,針對(duì)海量醫(yī)療文本數(shù)據(jù)的分析,創(chuàng)新地提出基于Map Reduce分布式計(jì)算模型的醫(yī)學(xué)文本處理方法,并以醫(yī)療數(shù)據(jù)的關(guān)聯(lián)操作和自動(dòng)編碼等應(yīng)用場(chǎng)景,對(duì)提出的分布式醫(yī)學(xué)文本分析方法性能進(jìn)行實(shí)驗(yàn)和分析。最終,提出基于無導(dǎo)數(shù)優(yōu)化理論的Map Reduce性能自動(dòng)調(diào)優(yōu)方法,解決了海量醫(yī)學(xué)文本分析方法在分布式計(jì)算環(huán)境運(yùn)行的方法設(shè)計(jì)和性能自動(dòng)優(yōu)化的關(guān)鍵問題。
逯暢[6](2020)在《基于序列的膜蛋白配體交互研究》文中研究說明生物信息學(xué)是以計(jì)算機(jī)為輔助工具,通過數(shù)學(xué)及統(tǒng)計(jì)學(xué)方法對(duì)生物學(xué)領(lǐng)域內(nèi)問題進(jìn)行建模、分析和仿真的一門交叉學(xué)科。隨著生物學(xué)研究手段取得突破性進(jìn)展,生物數(shù)據(jù)不斷積累,計(jì)算機(jī)技術(shù)日新月異,生物大數(shù)據(jù)時(shí)代已然來臨。生物信息學(xué)研究日趨成熟,成為生物學(xué)領(lǐng)域不可或缺的重要組成部分,為傳統(tǒng)生物研究方法提供強(qiáng)有力的補(bǔ)充和支持。生物信息學(xué)在微觀領(lǐng)域主要包括基因組學(xué)和蛋白質(zhì)組學(xué),本文研究?jī)?nèi)容屬于蛋白質(zhì)組學(xué)范疇,是用機(jī)器學(xué)習(xí)方法對(duì)膜蛋白及跨膜蛋白的結(jié)構(gòu)和功能進(jìn)行預(yù)測(cè)分析。膜蛋白是具有特殊結(jié)構(gòu)和功能的一類蛋白質(zhì),這類蛋白質(zhì)與生物膜關(guān)系密切,或永久地附著在生物膜上,或短暫地與生物膜發(fā)生交互。膜蛋白參與諸多重要的細(xì)胞生命活動(dòng),例如物質(zhì)傳遞、信號(hào)傳導(dǎo)、免疫應(yīng)答、能量代謝等??缒さ鞍资亲畹湫颓液孔疃嗟哪さ鞍追N類,它們貫穿生物膜并永久穩(wěn)定地嵌于生物膜上,其異常會(huì)直接導(dǎo)致疾病的產(chǎn)生。與此同時(shí),跨膜蛋白是醫(yī)藥學(xué)領(lǐng)域的重點(diǎn)研究目標(biāo),目前市場(chǎng)上超過半數(shù)藥物的靶蛋白為跨膜蛋白。鑒于膜蛋白及跨膜蛋白的重要生物學(xué)意義,科研工作者們一直孜孜不倦地對(duì)它們進(jìn)行研究,并取得了豐碩的成果。利用生物信息學(xué)手段對(duì)膜蛋白及跨膜蛋白進(jìn)行研究可以輔助蛋白質(zhì)相互作用網(wǎng)絡(luò)建立、代謝通路繪制、藥物篩選等工作,針對(duì)膜蛋白及跨膜蛋白結(jié)構(gòu)與功能的研究已然成為生物信息學(xué)領(lǐng)域的重要研究方向。本文圍繞膜蛋白及跨膜蛋白開展一系列研究工作,主要目標(biāo)是通過機(jī)器學(xué)習(xí)方法,從蛋白質(zhì)一級(jí)序列中提取特征,預(yù)測(cè)并分析膜蛋白-配體的相互作用。首先,為了彌補(bǔ)一級(jí)序列信息不足的缺點(diǎn),構(gòu)造兩個(gè)基于深度學(xué)習(xí)的跨膜蛋白結(jié)構(gòu)描述符預(yù)測(cè)器,分別是殘基表面可及性預(yù)測(cè)器(TMP-SSurface)和殘基Z坐標(biāo)預(yù)測(cè)器(TM-ZC)。殘基表面可及性以及Z坐標(biāo)是與功能密切相關(guān)的結(jié)構(gòu)信息,可以為后續(xù)針對(duì)膜蛋白功能的研究提供幫助。接下來,將預(yù)測(cè)的殘基表面可及性和Z坐標(biāo)作為特征,構(gòu)造基于隨機(jī)森林的膜蛋白-配體結(jié)合位點(diǎn)預(yù)測(cè)器(MPLs-Pred),并根據(jù)不同配體類型訓(xùn)練配體特異性預(yù)測(cè)模型,從而進(jìn)一步提高預(yù)測(cè)性能。在對(duì)膜蛋白-配體進(jìn)行研究的過程中,筆者注意到一種典型的以膜蛋白作為靶蛋白的配體:泛醌,并構(gòu)造了基于XGBoost的泛醌結(jié)合蛋白預(yù)測(cè)器(UBPs-Pred),并對(duì)泛醌結(jié)合蛋白進(jìn)行生物信息學(xué)分析。根據(jù)上述研究思路,本文的研究工作如下:1)本文提出了基于深度學(xué)習(xí)的跨膜蛋白殘基表面可及性預(yù)測(cè)器TMP-SSurface,殘基的表面可及性用于描述殘基暴露于外部環(huán)境的情況,用相對(duì)溶劑可及表面積進(jìn)行衡量。TMP-SSurface適用于所有類型跨膜蛋白的全序列殘基,對(duì)跨膜蛋白類型,殘基拓?fù)浣Y(jié)構(gòu)均沒有限制,即沒有先驗(yàn)知識(shí)的約束。TMP-SSurface使用進(jìn)化保守性、二進(jìn)制編碼以及序列終端標(biāo)識(shí)符作為輸入特征,分類模型是Inception與CapsuleNet相融合的復(fù)合型深度學(xué)習(xí)網(wǎng)絡(luò)。實(shí)驗(yàn)證明TMP-SSurface是一個(gè)穩(wěn)定、高效的模型,且具有良好的泛化能力。對(duì)不同類型的跨膜蛋白均可取得良好的預(yù)測(cè)效果。同時(shí),預(yù)測(cè)器對(duì)特征依賴少,深度學(xué)習(xí)網(wǎng)絡(luò)可以挖掘跨膜蛋白序列與結(jié)構(gòu)之間的內(nèi)在聯(lián)系。2)本文提出了基于深度學(xué)習(xí)的跨膜蛋白殘基Z坐標(biāo)預(yù)測(cè)器TM-ZC,跨膜蛋白的殘基Z坐標(biāo)描述殘基到生物膜中心平面的垂直距離,是定量衡量殘基與生物膜之間相對(duì)位置關(guān)系的結(jié)構(gòu)描述符。與TMP-SSurface相似,TM-ZC同樣適用于所有類型跨膜蛋白的全序列殘基,使用者不需要先驗(yàn)知識(shí)。TM-ZC使用的特征與TMP-SSurface相同,即進(jìn)化保守性、二進(jìn)制編碼以及序列終端標(biāo)識(shí)符。分類模型是包含七個(gè)卷積層的卷積神經(jīng)網(wǎng)絡(luò)。實(shí)驗(yàn)證明TM-ZC模型穩(wěn)定,具有良好的泛化能力,且對(duì)各種類的跨膜蛋白預(yù)測(cè)性能良好。3)在前面工作的基礎(chǔ)上,本文提出了基于隨機(jī)森林的膜蛋白-配體結(jié)合位點(diǎn)預(yù)測(cè)器MPLs-Pred。蛋白質(zhì)很多基本功能是依賴于與配體發(fā)生交互而完成的,配體結(jié)合位點(diǎn)預(yù)測(cè)是蛋白質(zhì)功能注釋的重要工作之一。MPLs-Pred使用四種特征對(duì)膜蛋白殘基進(jìn)行特征編碼,分別為進(jìn)化保守性、物理化學(xué)屬性、表面可及性以及Z坐標(biāo),其中表面可及性和Z坐標(biāo)分別由TMP-SSurface和TM-ZC預(yù)測(cè)得到。MPLs-Pred的分類器為隨機(jī)森林,并使用多倍隨機(jī)欠采樣策略解決嚴(yán)重的樣本不平衡問題。此外,考慮到不同配體存在巨大差異,將配體分為三種類型,分別為類藥化合物、金屬以及生物大分子,并分別訓(xùn)練得到配體特異性預(yù)測(cè)模型,進(jìn)一步提高預(yù)測(cè)器性能。除此之外,本研究還對(duì)人類的類藥化合物靶標(biāo)膜蛋白進(jìn)行了基因本體富集分析和KEGG通路富集分析。4)在對(duì)膜蛋白-配體交互數(shù)據(jù)進(jìn)行整理分析的過程中,泛醌引起了筆者的關(guān)注,其靶蛋白中有86.9%為膜蛋白,其中68.5%為跨膜蛋白,是一種典型的以膜蛋白作為靶標(biāo)的配體。本文提出了泛醌結(jié)合蛋白識(shí)別模型UBPs-Pred,并對(duì)泛醌結(jié)合蛋白進(jìn)行生物信息學(xué)分析。UBPs-Pred使用氨基酸組成、二肽組成以及進(jìn)化保守性三種特征對(duì)蛋白質(zhì)進(jìn)行特征編碼,使用隨機(jī)森林對(duì)特征重要性進(jìn)行排序,并通過增量特征選擇策略進(jìn)行特征選擇。UBPs-Pred使用XGBoost作為分類器,考慮到XGBoost涉及參數(shù)較多且性能對(duì)參數(shù)敏感,本實(shí)驗(yàn)使用多目標(biāo)粒子群算法對(duì)XGBoost的參數(shù)進(jìn)行優(yōu)化。實(shí)驗(yàn)證明UBPs-Pred性能很好。為了對(duì)泛醌結(jié)合蛋白進(jìn)行進(jìn)一步了解,本實(shí)驗(yàn)對(duì)泛醌結(jié)合蛋白進(jìn)行了生物信息學(xué)分析,包括:對(duì)泛醌結(jié)合域中的模體進(jìn)行統(tǒng)計(jì);對(duì)泛醌結(jié)合蛋白的超級(jí)家族進(jìn)行分類統(tǒng)計(jì);對(duì)人類的泛醌結(jié)合蛋白進(jìn)行基因本體富集分析以及KEGG通路富集分析。
張盼[7](2020)在《中醫(yī)臨床信息分類與代碼體系構(gòu)建及應(yīng)用研究》文中指出隨著信息化、大數(shù)據(jù)技術(shù)的發(fā)展,中醫(yī)藥逐漸步入標(biāo)準(zhǔn)化、現(xiàn)代化、科學(xué)化的應(yīng)用進(jìn)程,也為中醫(yī)藥信息資源數(shù)字化的處理和研究提供了手段和機(jī)會(huì)。為促進(jìn)信息化與標(biāo)準(zhǔn)化雙向融合,在大數(shù)據(jù)世界觀和方法論引導(dǎo)下,通過“規(guī)范化數(shù)據(jù)、多元化采集、主題化匯聚、集約化存儲(chǔ)和知識(shí)化處理”形成以“數(shù)據(jù)說話、數(shù)據(jù)管理、數(shù)據(jù)決策和數(shù)據(jù)創(chuàng)新”的大數(shù)據(jù)治理能力實(shí)現(xiàn)醫(yī)院臨床、科研、教學(xué)和運(yùn)營(yíng)相結(jié)合的管理與決策。由于中醫(yī)在診斷、治療疾病的過程中采用自然語言的方法記錄,使得豐富、復(fù)雜的臨床信息表達(dá)難以規(guī)范和統(tǒng)一,導(dǎo)致計(jì)算機(jī)無法對(duì)這些信息進(jìn)行快速的識(shí)別和存儲(chǔ),不能對(duì)中醫(yī)臨床信息的內(nèi)涵屬性進(jìn)行深入的探索。因此,構(gòu)建中醫(yī)臨床信息分類與代碼體系,統(tǒng)一規(guī)范中醫(yī)藥數(shù)字化流程,開展應(yīng)用研究,為中醫(yī)藥大數(shù)據(jù)挖掘提供數(shù)據(jù)支撐,是中醫(yī)藥大數(shù)據(jù)治理研究亟需開展的一項(xiàng)基礎(chǔ)工作。目的:構(gòu)建中醫(yī)臨床信息分類與代碼體系,以真實(shí)世界臨床電子病歷為原始數(shù)據(jù),基于中醫(yī)藥數(shù)據(jù)標(biāo)準(zhǔn),統(tǒng)一、規(guī)范中醫(yī)臨床信息數(shù)字化流程,通過應(yīng)用研究,驗(yàn)證標(biāo)準(zhǔn)體系及其數(shù)字化流程的科學(xué)性、可行性和可操作性,為計(jì)算機(jī)識(shí)別、處理中醫(yī)臨床信息奠定基礎(chǔ),從不同角度觀察、認(rèn)知中醫(yī)藥辨證論治全方位視圖,探索中醫(yī)臨床信息處理、利用的新思維和新手段。方法:采用統(tǒng)一建模語言(UML)中的活動(dòng)圖了解中醫(yī)望聞問切、辨證論治的整個(gè)活動(dòng)過程,分析中醫(yī)臨床信息診療活動(dòng)業(yè)務(wù)信息流,通過靜態(tài)建模的方法對(duì)其信息流進(jìn)行分析建立相應(yīng)的中醫(yī)臨床信息概念模型,為構(gòu)建中醫(yī)臨床信息模型提供基礎(chǔ)信息。信息模型建立之后提取需要進(jìn)行分類編碼的信息元素構(gòu)建中醫(yī)臨床信息分類與代碼體系,應(yīng)用中醫(yī)藥數(shù)據(jù)標(biāo)準(zhǔn)和信息分類編碼技術(shù),統(tǒng)一規(guī)范中醫(yī)臨床信息數(shù)字化流程和方法。最后通過319例臌脹病患者的中醫(yī)電子病歷數(shù)據(jù)進(jìn)行應(yīng)用示范研究,探討中醫(yī)臨床數(shù)據(jù)分析的應(yīng)用方法以及當(dāng)前存在的不足。結(jié)果:(1)設(shè)計(jì)了中醫(yī)臨床信息模型。采用統(tǒng)一建模語言動(dòng)態(tài)建模的活動(dòng)圖分析對(duì)象的行為活動(dòng),描述中醫(yī)臨床醫(yī)生辨證論治的診療活動(dòng)全過程,從而進(jìn)一步分析中醫(yī)臨床信息診療活動(dòng)業(yè)務(wù)信息流,通過靜態(tài)建模的方法建立相應(yīng)的中醫(yī)臨床信息概念模型,構(gòu)建中醫(yī)臨床信息模型。(2)構(gòu)建了中醫(yī)臨床信息分類與代碼體系。在中醫(yī)臨床信息模型的基礎(chǔ)上,參考中醫(yī)藥行業(yè)標(biāo)準(zhǔn)體系框架結(jié)構(gòu)層次圖,從基本信息、中醫(yī)臨床診斷信息、中醫(yī)臨床治療信息和中醫(yī)臨床評(píng)價(jià)信息等四大類信息中提取需要進(jìn)行分類編碼的信息,建立中醫(yī)臨床信息分類與代碼體系。該體系中一共提取出77個(gè)信息元素,需要進(jìn)行分類編碼的有38個(gè),其中基本信息12個(gè)、中醫(yī)臨床診斷信息12個(gè)、中醫(yī)臨床治療信息10個(gè)、中醫(yī)臨床評(píng)價(jià)信息4個(gè)。(3)應(yīng)用研究。在大數(shù)據(jù)理念和技術(shù)法指引下,應(yīng)用中醫(yī)藥數(shù)據(jù)標(biāo)準(zhǔn)和信息分類編碼技術(shù),在統(tǒng)一規(guī)范的中醫(yī)臨床信息數(shù)字化流程的基礎(chǔ)上,選取某中醫(yī)醫(yī)院319例臌脹病患者的電子病歷數(shù)據(jù),按中醫(yī)臨床信息模型對(duì)臨床信息進(jìn)行數(shù)據(jù)規(guī)范化、標(biāo)準(zhǔn)化采集和整理,根據(jù)中醫(yī)臨床信息數(shù)字化流程對(duì)采集的數(shù)據(jù)進(jìn)行數(shù)字化,形成主題數(shù)據(jù)庫(kù)。建立中醫(yī)臨床信息數(shù)據(jù)庫(kù)之后可以從多個(gè)方面進(jìn)行探討和分析,如病種基本情況分析以及挖掘癥狀與病種、處方用藥、中藥藥性與功效等關(guān)聯(lián)關(guān)系。結(jié)論:構(gòu)建中醫(yī)臨床信息分類與代碼體系,將臨床信息標(biāo)準(zhǔn)化、規(guī)范化,解決了當(dāng)前信息系統(tǒng)之間數(shù)據(jù)接口與標(biāo)準(zhǔn)不統(tǒng)一的問題。同時(shí),構(gòu)建中醫(yī)臨床信息數(shù)字化模型,充分挖掘其臨床信息內(nèi)涵屬性并數(shù)字化,為計(jì)算機(jī)從語義識(shí)別和處理中醫(yī)臨床診療信息、分析挖掘有價(jià)值的揭示真實(shí)世界狀態(tài)和規(guī)律提供依據(jù),對(duì)中醫(yī)電子病歷信息的深度挖掘與利用進(jìn)行了深入的探索。然而,在體系構(gòu)建的過程中還存在屬性分類不夠完善、考慮信息內(nèi)涵屬性內(nèi)容不夠全面等不足,下一步將繼續(xù)進(jìn)行研究和優(yōu)化。
朱天一[8](2020)在《SDTM與ADaM在腫瘤臨床試驗(yàn)中的應(yīng)用》文中進(jìn)行了進(jìn)一步梳理藥物臨床試驗(yàn)是指以人體(病人或健康志愿者)為研究對(duì)象進(jìn)行的藥物系統(tǒng)性研究,以發(fā)現(xiàn)或證實(shí)試驗(yàn)藥物的臨床及藥理學(xué)作用,根據(jù)其不良反應(yīng)及藥代動(dòng)力學(xué),確定試驗(yàn)藥物的有效性與安全性。在研究過程中,數(shù)據(jù)管理和統(tǒng)計(jì)分析是至關(guān)重要的環(huán)節(jié),試驗(yàn)數(shù)據(jù)質(zhì)量的高低直接影響到整體臨床研究的質(zhì)量,關(guān)系到對(duì)藥物有效性和安全性的客觀評(píng)價(jià)。實(shí)現(xiàn)臨床數(shù)據(jù)標(biāo)準(zhǔn)化,有助于優(yōu)化數(shù)據(jù)管理中數(shù)據(jù)交流、遞交的流程,縮短研究周期、節(jié)省費(fèi)用,提高研究效率,加快藥物上市速度。為解決臨床試驗(yàn)數(shù)據(jù)的標(biāo)準(zhǔn)化問題,全球32家機(jī)構(gòu)于2000年開始成立了臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(huì)(Clinical Data Inter-change Standards Consortium,CDISC),至今已有200家機(jī)構(gòu)。臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(huì)是一個(gè)全球性、開放、多學(xué)科、非盈利性的組織,致力于臨床醫(yī)療和醫(yī)學(xué)研究信息價(jià)值的最大化、研究過程的合理化、研究成果轉(zhuǎn)化為臨床決策的便捷化,并為此制定了一系列的標(biāo)準(zhǔn),支持臨床研究數(shù)據(jù)與元數(shù)據(jù)的采集、交換、遞交和儲(chǔ)存工作。其中與臨床試驗(yàn)數(shù)據(jù)相關(guān)的包括臨床試驗(yàn)數(shù)據(jù)采集整合標(biāo)準(zhǔn)(Clinical Data Acquisition Standards Harmonization Model,CDASH)、研究數(shù)據(jù)列表模型(Study Data Tabulation Model,SDTM)、分析數(shù)據(jù)模型(Analysis Data Model,ADa M)。我國(guó)國(guó)家藥品監(jiān)督管理局(National Medical Products Administration,NMPA)于2016年7月發(fā)布了《臨床試驗(yàn)數(shù)據(jù)管理工作技術(shù)指南》,建議在新藥上市注冊(cè)申請(qǐng)時(shí),采用CDISC標(biāo)準(zhǔn)遞交原始數(shù)據(jù)庫(kù)和分析數(shù)據(jù)庫(kù)。目前國(guó)內(nèi)部分大型藥企和合同研究組織(Contract Rearsch Organization,CRO)公司已經(jīng)開始使用CDISC中的部分標(biāo)準(zhǔn),如SDTM和ADa M標(biāo)準(zhǔn),但對(duì)于這些標(biāo)準(zhǔn)的了解和應(yīng)用還處于初級(jí)階段,在應(yīng)用時(shí)也是以手動(dòng)編程為主。目的 本課題將從CDISC的介紹入手,考慮腫瘤藥物臨床試驗(yàn)本身特點(diǎn)和復(fù)雜性,結(jié)合具體腫瘤藥物臨床試驗(yàn)項(xiàng)目,說明CDISC在腫瘤臨床試驗(yàn)過程中的應(yīng)用;同時(shí),為解決手動(dòng)編寫SAS程序速度較慢等問題,將編寫能快速實(shí)現(xiàn)數(shù)據(jù)格式轉(zhuǎn)換的宏程序,實(shí)現(xiàn)從原始數(shù)據(jù)到SDTM再到ADa M的自動(dòng)化轉(zhuǎn)換,提高數(shù)據(jù)轉(zhuǎn)換的效率,加快腫瘤藥臨床試驗(yàn)的統(tǒng)計(jì)分析進(jìn)程。方法 首先在數(shù)據(jù)管理環(huán)節(jié),根據(jù)臨床試驗(yàn)中常用的域及變量,如人口統(tǒng)計(jì)學(xué)域、實(shí)驗(yàn)室檢查域、生命體征域、心電圖域、不良事件域、合并用藥域等;結(jié)合腫瘤藥物臨床試驗(yàn)的專用域,如腫瘤識(shí)別(Tumor Identification,TU)、腫瘤結(jié)果(Tumor Results,TR)、疾病反應(yīng)(Disease Response,RS)域;設(shè)計(jì)元數(shù)據(jù)文件,編寫EXCEL映射文件,編寫通用的調(diào)用元數(shù)據(jù)的宏,由原始數(shù)據(jù)生成SDTM數(shù)據(jù)集。其次在統(tǒng)計(jì)分析環(huán)節(jié),根據(jù)臨床試驗(yàn)方案和統(tǒng)計(jì)分析計(jì)劃,明確腫瘤藥物的主要療效指標(biāo)和次要療效指標(biāo),設(shè)計(jì)合理數(shù)量的分析數(shù)據(jù)集,設(shè)計(jì)元數(shù)據(jù)文件,編寫EXCEL映射文件,編寫通用的調(diào)用元數(shù)據(jù)的宏,由SDTM數(shù)據(jù)生成ADa M分析數(shù)據(jù)集。結(jié)果 通過一項(xiàng)實(shí)際的腫瘤藥物臨床試驗(yàn),設(shè)計(jì)SDTM域,配置EXCEL文件,并運(yùn)行宏程序,產(chǎn)生人口統(tǒng)計(jì)學(xué)域、實(shí)驗(yàn)室檢查域、生命體征域、心電圖域、不良事件域、合并用藥域等,完成從原始數(shù)據(jù)到SDTM數(shù)據(jù)的轉(zhuǎn)換;再設(shè)計(jì)ADa M數(shù)據(jù)集,配置EXCEL文件,運(yùn)行宏程序,生成相關(guān)的分析數(shù)據(jù)集,完成從SDTM數(shù)據(jù)到ADa M數(shù)據(jù)集的轉(zhuǎn)換;最后在原始數(shù)據(jù)和ADa M數(shù)據(jù)集兩個(gè)數(shù)據(jù)集的基礎(chǔ)上,分別編程進(jìn)行統(tǒng)計(jì)分析,進(jìn)行結(jié)果比對(duì),顯示分析結(jié)果一致,且基于ADa M數(shù)據(jù)集進(jìn)行分析更快捷,更能節(jié)約時(shí)間。結(jié)論 本課題以腫瘤藥為例,在數(shù)據(jù)管理和統(tǒng)計(jì)分析過程中,采用SDTM和ADa M實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化,優(yōu)化數(shù)據(jù)管理中數(shù)據(jù)交流、遞交的流程,提高數(shù)據(jù)質(zhì)量,使統(tǒng)計(jì)分析更快捷。在醫(yī)藥研發(fā)過程中統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),不僅可以解決某一個(gè)或某一類正在研發(fā)的藥物臨床試驗(yàn)的數(shù)據(jù)規(guī)范問題,而且可以促進(jìn)以后所有臨床試驗(yàn)數(shù)據(jù)質(zhì)量水平的提高,以及全行業(yè)包括研究者和監(jiān)管者之間的信息交流。對(duì)于藥企方面來說,統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),解決的也不僅僅是單個(gè)或單類藥物臨床試驗(yàn)過程中物力財(cái)力和人力成本過高的問題,它為臨床試驗(yàn)提供的標(biāo)準(zhǔn)數(shù)據(jù)模板,具有可重復(fù)性,為以后臨床試驗(yàn)過程中的工作節(jié)約時(shí)間和成本,提高效率。因此在數(shù)據(jù)管理和統(tǒng)計(jì)分析中實(shí)現(xiàn)臨床數(shù)據(jù)標(biāo)準(zhǔn)化,有助于優(yōu)化數(shù)據(jù)管理中數(shù)據(jù)交流、遞交的流程,有助于注冊(cè)臨床試驗(yàn)數(shù)據(jù)的審核,有助于臨床試驗(yàn)數(shù)據(jù)的薈萃,從而縮短研究周期、節(jié)省研究費(fèi)用,提高研究效率,加快藥物上市速度。
周招福[9](2020)在《面向上市公司三類公告的摘要生成系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)》文中指出上市公司公告是公司按照證監(jiān)會(huì)要求發(fā)布的報(bào)告,其中包含的豐富信息對(duì)經(jīng)營(yíng)狀況的分析、投資決策和部門監(jiān)管具有重要作用。對(duì)公告摘要的自動(dòng)生成,可以快速獲取公告的核心信息,提高閱讀效率。然而,公告的結(jié)構(gòu)復(fù)雜,公告的內(nèi)容冗長(zhǎng)且干擾信息多,傳統(tǒng)的摘要生成方法難以準(zhǔn)確地生成通順的公告摘要。本文提出一種以摘要模板為基礎(chǔ)的摘要生成方法,并以三類公告為研究對(duì)象,根據(jù)類別的不同設(shè)計(jì)了三種不同的摘要元素抽取方法,將抽取的摘要元素填充至模板中生成公告摘要。具體分為三個(gè)部分:1.分析公告結(jié)構(gòu)特點(diǎn),提出一種基于文檔結(jié)構(gòu)的公告分類方法,將公告標(biāo)題和一級(jí)小標(biāo)題作為分類特征進(jìn)行分類。首先設(shè)計(jì)公告小標(biāo)題提取方案,接著將提取的小標(biāo)題和公告標(biāo)題組成特征文本,然后使用預(yù)訓(xùn)練的詞向量將文本向量化,最后構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)對(duì)公告分類。實(shí)驗(yàn)表明,該方案在公告分類任務(wù)上F1值達(dá)到98.47%。2.分別制定解禁類、定期報(bào)告類和并購(gòu)重組類公告的摘要模板,以摘要模板為基礎(chǔ),抽取摘要元素并填充至模板中生成摘要。對(duì)于解禁類公告,利用規(guī)則法匹配摘要句,經(jīng)過后處理組成摘要。對(duì)于定期報(bào)告類公告,采用表格定位及表格解析的方法抽取摘要字段,將其填充至模板中生成摘要。對(duì)于并購(gòu)重組類公告,分為摘要句抽取和摘要字段抽取兩階段進(jìn)行:第一階段采用標(biāo)題規(guī)則和內(nèi)容規(guī)則組合的方式抽取摘要句,首先自定義一套規(guī)則標(biāo)識(shí)符;然后根據(jù)標(biāo)識(shí)符制定各級(jí)標(biāo)題規(guī)則、內(nèi)容規(guī)則、規(guī)則組合表達(dá)式;最后解析組合表達(dá)式用于抽取摘要句。第二階段,構(gòu)建多特征融合的命名實(shí)體識(shí)模型用于識(shí)別摘要句中的摘要字段,首先在語料庫(kù)上預(yù)訓(xùn)練詞向量和字符向量;接著編寫領(lǐng)域詞典用于構(gòu)建特征向量,并與詞向量和字符向量融合;然后使用長(zhǎng)短期記憶網(wǎng)絡(luò)對(duì)上下文語義建模,再由條件隨機(jī)場(chǎng)得到文本序列的最佳標(biāo)簽;最后通過標(biāo)簽的解析來抽取摘要字段,并將其填充至模板中生成摘要。經(jīng)實(shí)驗(yàn)和驗(yàn)證,解禁類公告的摘要句抽取平均F1達(dá)到98.59%,定期報(bào)告類公告的摘要字段抽取平均F1達(dá)到98.10%,并購(gòu)重組類公告的摘要句抽取平均F1達(dá)到96.47%,摘要字段的識(shí)別平均F1達(dá)到93.51%。實(shí)驗(yàn)結(jié)果表明,以摘要模板為基礎(chǔ),按公告類別的不同采用不同的摘要元素抽取方法,能夠保證摘要元素抽取的準(zhǔn)確性。3.在理論研究的基礎(chǔ)上,根據(jù)實(shí)際的業(yè)務(wù)需求,面向解禁類、定期報(bào)告類和并購(gòu)重組類三類公告,設(shè)計(jì)并實(shí)現(xiàn)了包含公告獲取模塊、公告分類模塊、公告摘要生成模塊、展示及存儲(chǔ)模塊的公告摘要生成系統(tǒng),將各個(gè)功能模塊整合在一起,實(shí)現(xiàn)自動(dòng)化地生成公告摘要。此外,對(duì)整個(gè)系統(tǒng)和各個(gè)模塊進(jìn)行了測(cè)試。
蔡燁[10](2019)在《基于CDISC標(biāo)準(zhǔn)的EDC臨床試驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)化研究》文中指出研究目的隨著國(guó)家監(jiān)管部門對(duì)臨床試驗(yàn)數(shù)據(jù)質(zhì)量要求的逐漸提高,使用電子數(shù)據(jù)采集(Electronic Data Capture,EDC)系統(tǒng)和臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(huì)(Clinical Data Interchange Standards Consortium,CDISC)標(biāo)準(zhǔn)成為必然趨勢(shì)。CDISC提供一系列標(biāo)準(zhǔn)涵蓋試驗(yàn)設(shè)計(jì)、數(shù)據(jù)收集、交換、遞交和分析多個(gè)過程。目前國(guó)內(nèi)臨床試驗(yàn)過程中仍存在一些不規(guī)范之處,臨床試驗(yàn)從方案設(shè)計(jì)到數(shù)據(jù)收集交換分析的全生命周期若均能使用CDISC標(biāo)準(zhǔn),可提高試驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)化程度,保證數(shù)據(jù)質(zhì)量。臨床試驗(yàn)方案設(shè)計(jì)是否合理與完整是一個(gè)試驗(yàn)成功與否的基礎(chǔ),利用CDISC中的方案表述模型(Protocol Representation Model,PRM)不僅可以為研究方案撰寫提供標(biāo)準(zhǔn)化的參考和指導(dǎo),還可以對(duì)已完成撰寫的方案進(jìn)行標(biāo)準(zhǔn)化程度評(píng)估,提高研究方案質(zhì)量。臨床試驗(yàn)過程中涉及外部實(shí)驗(yàn)室數(shù)據(jù)交流時(shí),常常由于傳送數(shù)據(jù)沒有統(tǒng)一格式而需要進(jìn)行多次數(shù)據(jù)轉(zhuǎn)換處理,無法形成可重復(fù)利用的處理程序,因此造成時(shí)間和人力成本的增加,根據(jù)實(shí)驗(yàn)室數(shù)據(jù)模型(Laboratory Data Model,LAB)形成統(tǒng)一的傳輸格式可在一定程度上解決這個(gè)問題。當(dāng)前國(guó)內(nèi)臨床試驗(yàn)電子化和標(biāo)準(zhǔn)化仍處于初級(jí)發(fā)展階段,行業(yè)內(nèi)EDC系統(tǒng)應(yīng)用水平參差不齊,存在不少紙質(zhì)研究項(xiàng)目依舊采用Epidata軟件進(jìn)行數(shù)據(jù)轉(zhuǎn)錄或使用EDC進(jìn)行已收集數(shù)據(jù)再電子化錄入的情況,這些數(shù)據(jù)變量命名、數(shù)據(jù)結(jié)構(gòu)均與CDISC標(biāo)準(zhǔn)相差較大,可利用SAS編寫自動(dòng)化程序?qū)⑦@類非標(biāo)準(zhǔn)原始數(shù)據(jù)按照臨床數(shù)據(jù)獲取協(xié)調(diào)標(biāo)準(zhǔn)(Clinical Data Acquisition Standards Harmonization,CDASH)進(jìn)行整理,提高數(shù)據(jù)標(biāo)準(zhǔn)化水平,并進(jìn)一步向其他數(shù)據(jù)標(biāo)準(zhǔn)轉(zhuǎn)化。目前針對(duì)CDISC核心標(biāo)準(zhǔn)間的數(shù)據(jù)轉(zhuǎn)化已有一些研究,如線性法、混合法。但在一些不需要向監(jiān)管機(jī)構(gòu)遞交數(shù)據(jù)的情況中,如非注冊(cè)臨床研究,如何簡(jiǎn)化數(shù)據(jù)整理過程,直接從CDASH標(biāo)準(zhǔn)向分析數(shù)據(jù)模型(Analysis Data Model,ADaM)標(biāo)準(zhǔn)進(jìn)行映射的問題缺乏研究。研究方法本研究基于EDC系統(tǒng)進(jìn)行實(shí)例數(shù)據(jù)收集,通過對(duì)多個(gè)數(shù)據(jù)階段應(yīng)用相應(yīng)CDISC標(biāo)準(zhǔn)對(duì)該實(shí)例的方案信息和原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化研究。根據(jù)PRM提供的方案關(guān)鍵信息大綱形成模板,提取研究方案中核心信息,按照提取信息匹配程度初步評(píng)估試驗(yàn)方案設(shè)計(jì)的標(biāo)準(zhǔn)化程度,并將該部分信息存儲(chǔ)為單獨(dú)文件供日后重復(fù)使用。利用SAS將外部實(shí)驗(yàn)室檢測(cè)數(shù)據(jù)合并至整體數(shù)據(jù)集,對(duì)照LAB中字段信息,利用SAS編寫程序生成分隔符平面文件(flat file),并進(jìn)一步編寫宏程序設(shè)計(jì)可拓展標(biāo)記語言(Extensible Markup Language,XML)對(duì)應(yīng)字段模板,生成LAB格式的XML傳輸文件。根據(jù)非標(biāo)準(zhǔn)數(shù)據(jù)的整理需求,編寫數(shù)據(jù)標(biāo)準(zhǔn)化整理SAS宏程序,結(jié)合填寫Excel參數(shù)表,將從EDC或其他數(shù)據(jù)庫(kù)導(dǎo)出的非標(biāo)準(zhǔn)數(shù)據(jù)統(tǒng)一進(jìn)行變量名標(biāo)準(zhǔn)化重命名、數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)化,按照CDASH域生成對(duì)應(yīng)數(shù)據(jù)集。在本課題組線性法工作基礎(chǔ)上,分析CDASH數(shù)據(jù)與ADaM數(shù)據(jù)差別,編寫SAS工具宏處理新增的數(shù)據(jù)映射需求,并將工具宏嵌入原始主程序,保持CDISC數(shù)據(jù)自動(dòng)化系統(tǒng)一致性。研究結(jié)果按照PRM模板摘取某狂犬疫苗研究方案中相關(guān)信息,找到對(duì)應(yīng)信息點(diǎn),根據(jù)提取信息的完整程度評(píng)價(jià)該試驗(yàn)方案滿足基本的標(biāo)準(zhǔn)化要求,此外,提取數(shù)據(jù)可存為單獨(dú)數(shù)據(jù)文件,用于其他數(shù)據(jù)管理步驟,為數(shù)據(jù)管理過程提供便利。利用SAS完成LAB字段的批量規(guī)范化整理,利用PROC EXPORT語句直接生成分隔符數(shù)據(jù)文件,利用SAS編寫宏程序?qū)ML文件中各層次字段信息編寫為模板,讀取實(shí)驗(yàn)室數(shù)據(jù)集中對(duì)應(yīng)數(shù)據(jù),生成有效的XML文件。編寫SAS宏程序,并以Excel作為宏參數(shù)的組織及調(diào)用載體,實(shí)現(xiàn)非標(biāo)準(zhǔn)變量名稱和標(biāo)簽的修改,橫向數(shù)據(jù)結(jié)構(gòu)向縱向數(shù)據(jù)結(jié)構(gòu)的轉(zhuǎn)化,并最終按域生成CDASH數(shù)據(jù)集。分析課題組線性法SAS自動(dòng)化主程序,將編寫的工具宏嵌入,實(shí)現(xiàn)從CDASH自動(dòng)化生成ADaM數(shù)據(jù)集。研究結(jié)論借助PRM大綱可形成便于應(yīng)用的模板文件,可進(jìn)行方案信息條目化提取,根據(jù)提取信息可初步評(píng)價(jià)方案標(biāo)準(zhǔn)化程度,該模板文件還可以為研究方案的撰寫和修改提供參考。根據(jù)模板文件中存儲(chǔ)的方案內(nèi)容,能夠方便重復(fù)利用方案信息,加速方案信息的映射,避免從整個(gè)方案中多次尋找,可提高信息復(fù)用效率。根據(jù)LAB模型生成的平面數(shù)據(jù)文件可以直接用SAS語句讀取,由于使用統(tǒng)一的字段信息,不僅文件內(nèi)變量信息明確,易于理解,還可以避免重復(fù)編程,而XML格式文件更適合其他數(shù)據(jù)管理軟件平臺(tái)解析,根據(jù)提供的Schema文件可開發(fā)固定的功能接口,實(shí)現(xiàn)數(shù)據(jù)自動(dòng)對(duì)接。通過填寫Excel參數(shù)表和調(diào)用對(duì)應(yīng)SAS宏程序,可快速得到CDASH和ADaM數(shù)據(jù)集,實(shí)現(xiàn)非標(biāo)準(zhǔn)數(shù)據(jù)的標(biāo)準(zhǔn)化整理和轉(zhuǎn)化。用于數(shù)據(jù)標(biāo)準(zhǔn)化整理的程序通用性和靈活性較高,可根據(jù)實(shí)際需要組合調(diào)用,適應(yīng)各種形式的非標(biāo)準(zhǔn)數(shù)據(jù)。用于生成ADaM數(shù)據(jù)集的自動(dòng)化程序添加工具宏后豐富了數(shù)據(jù)轉(zhuǎn)化能力,提高了程序通用性。
二、觀測(cè)指標(biāo)標(biāo)識(shí)符邏輯命名與編碼系統(tǒng)(LOINC)數(shù)據(jù)庫(kù)介紹(論文開題報(bào)告)
(1)論文研究背景及目的
此處內(nèi)容要求:
首先簡(jiǎn)單簡(jiǎn)介論文所研究問題的基本概念和背景,再而簡(jiǎn)單明了地指出論文所要研究解決的具體問題,并提出你的論文準(zhǔn)備的觀點(diǎn)或解決方法。
寫法范例:
本文主要提出一款精簡(jiǎn)64位RISC處理器存儲(chǔ)管理單元結(jié)構(gòu)并詳細(xì)分析其設(shè)計(jì)過程。在該MMU結(jié)構(gòu)中,TLB采用叁個(gè)分離的TLB,TLB采用基于內(nèi)容查找的相聯(lián)存儲(chǔ)器并行查找,支持粗粒度為64KB和細(xì)粒度為4KB兩種頁面大小,采用多級(jí)分層頁表結(jié)構(gòu)映射地址空間,并詳細(xì)論述了四級(jí)頁表轉(zhuǎn)換過程,TLB結(jié)構(gòu)組織等。該MMU結(jié)構(gòu)將作為該處理器存儲(chǔ)系統(tǒng)實(shí)現(xiàn)的一個(gè)重要組成部分。
(2)本文研究方法
調(diào)查法:該方法是有目的、有系統(tǒng)的搜集有關(guān)研究對(duì)象的具體信息。
觀察法:用自己的感官和輔助工具直接觀察研究對(duì)象從而得到有關(guān)信息。
實(shí)驗(yàn)法:通過主支變革、控制研究對(duì)象來發(fā)現(xiàn)與確認(rèn)事物間的因果關(guān)系。
文獻(xiàn)研究法:通過調(diào)查文獻(xiàn)來獲得資料,從而全面的、正確的了解掌握研究方法。
實(shí)證研究法:依據(jù)現(xiàn)有的科學(xué)理論和實(shí)踐的需要提出設(shè)計(jì)。
定性分析法:對(duì)研究對(duì)象進(jìn)行“質(zhì)”的方面的研究,這個(gè)方法需要計(jì)算的數(shù)據(jù)較少。
定量分析法:通過具體的數(shù)字,使人們對(duì)研究對(duì)象的認(rèn)識(shí)進(jìn)一步精確化。
跨學(xué)科研究法:運(yùn)用多學(xué)科的理論、方法和成果從整體上對(duì)某一課題進(jìn)行研究。
功能分析法:這是社會(huì)科學(xué)用來分析社會(huì)現(xiàn)象的一種方法,從某一功能出發(fā)研究多個(gè)方面的影響。
模擬法:通過創(chuàng)設(shè)一個(gè)與原型相似的模型來間接研究原型某種特性的一種形容方法。
三、觀測(cè)指標(biāo)標(biāo)識(shí)符邏輯命名與編碼系統(tǒng)(LOINC)數(shù)據(jù)庫(kù)介紹(論文提綱范文)
(1)國(guó)際醫(yī)學(xué)術(shù)語體系進(jìn)展及特色優(yōu)勢(shì)分析(論文提綱范文)
引言 |
1 國(guó)際醫(yī)學(xué)術(shù)語體系進(jìn)展 |
1.1 《醫(yī)學(xué)主題詞表》 |
1.2 《系統(tǒng)化臨床醫(yī)學(xué)術(shù)語集》 |
1.3 《國(guó)際疾病分類法》 |
1.4 《觀測(cè)指標(biāo)標(biāo)識(shí)符邏輯命名與編碼系統(tǒng)》 |
1.5 《腫瘤學(xué)敘詞表》 |
2 特色優(yōu)勢(shì)分析 |
3 結(jié)語 |
(2)知識(shí)和數(shù)據(jù)雙驅(qū)動(dòng)的檢驗(yàn)人工智能疾病診斷系統(tǒng)的構(gòu)建(論文提綱范文)
摘要 |
Abstract |
縮略詞表 |
前言 |
一、AI簡(jiǎn)介 |
二、AI的發(fā)展歷程 |
三、醫(yī)療AI發(fā)展面臨的問題 |
四、檢驗(yàn)醫(yī)學(xué)研究現(xiàn)狀 |
五、可解釋檢驗(yàn)AI研究開展的可行性和優(yōu)勢(shì) |
六、本課題的創(chuàng)新性工作 |
材料與方法 |
一、構(gòu)建檢驗(yàn)知識(shí)圖譜 |
二、數(shù)據(jù)預(yù)處理 |
三、數(shù)據(jù)收集、研究人群和研究設(shè)計(jì) |
四、基于檢驗(yàn)知識(shí)圖譜的多標(biāo)簽疾病診斷系統(tǒng) |
五、構(gòu)建檢驗(yàn)AI系統(tǒng) |
六、檢驗(yàn)AI系統(tǒng)的網(wǎng)頁應(yīng)用與圖形化展示 |
七、數(shù)據(jù)分析 |
實(shí)驗(yàn)結(jié)果 |
一、參與者的基線特征 |
二、數(shù)據(jù)驅(qū)動(dòng)模型 |
三、知識(shí)和數(shù)據(jù)雙驅(qū)動(dòng)檢驗(yàn)AI系統(tǒng)的構(gòu)建 |
四、知識(shí)和數(shù)據(jù)雙驅(qū)動(dòng)檢驗(yàn)AI系統(tǒng)的工作思路 |
五、檢驗(yàn)AI系統(tǒng)對(duì)多系統(tǒng)多疾病的診斷性能評(píng)價(jià) |
六、檢驗(yàn)AI系統(tǒng)的臨床應(yīng)用 |
討論 |
結(jié)論 |
參考文獻(xiàn) |
文獻(xiàn)綜述 可解釋人工智能助力檢驗(yàn)醫(yī)學(xué)在疾病診療中的應(yīng)用 |
參考文獻(xiàn) |
在讀期間發(fā)表論文和參加科研工作情況 |
致謝 |
(3)基于真實(shí)世界醫(yī)療大數(shù)據(jù)的中文醫(yī)學(xué)本體重構(gòu)的研究(論文提綱范文)
摘要 |
Abstract |
引言 |
第1章 緒論 |
1.1 研究背景與研究意義 |
1.1.1 生物醫(yī)學(xué)本體的概念與分類 |
1.1.2 生物醫(yī)學(xué)本體的表示方法 |
1.1.3 生物醫(yī)學(xué)本體的構(gòu)建工具 |
1.1.4 研究意義 |
1.2 國(guó)內(nèi)外生物醫(yī)學(xué)本體發(fā)展與研究現(xiàn)狀 |
1.2.1 國(guó)外生物醫(yī)學(xué)本體現(xiàn)狀 |
1.2.2 國(guó)內(nèi)生物醫(yī)學(xué)本體現(xiàn)狀 |
1.3 研究方法與文章結(jié)構(gòu) |
第2章 生物醫(yī)學(xué)本體內(nèi)容重構(gòu)的研究策略討論與相關(guān)資源收集 |
2.1 中文生物醫(yī)學(xué)本體內(nèi)容重構(gòu)的構(gòu)建策略 |
2.2 中文醫(yī)學(xué)本體內(nèi)容重構(gòu)的方法探究 |
2.2.1 中文生物醫(yī)學(xué)本體內(nèi)容重構(gòu)的關(guān)鍵科學(xué)問題 |
2.2.2 中文生物醫(yī)學(xué)本體內(nèi)容重構(gòu)的技術(shù)路徑 |
2.2.3 資源收集與預(yù)處理 |
2.3 小結(jié) |
第3章 面向內(nèi)容重構(gòu)的中文生物醫(yī)學(xué)本體實(shí)體挖掘 |
3.1 基于有監(jiān)督方法的中文醫(yī)學(xué)實(shí)體挖掘 |
3.1.1 背景介紹 |
3.1.2 實(shí)驗(yàn)設(shè)計(jì) |
3.1.3 實(shí)驗(yàn)結(jié)果與分析 |
3.1.4 總結(jié) |
3.2 基于無監(jiān)督方法的生物醫(yī)學(xué)實(shí)體挖掘 |
3.2.1 背景介紹 |
3.2.2 實(shí)驗(yàn)設(shè)計(jì) |
3.2.3 數(shù)據(jù)準(zhǔn)備 |
3.2.4 實(shí)驗(yàn)流程 |
3.2.5 評(píng)測(cè)任務(wù) |
3.2.6 實(shí)驗(yàn)結(jié)果與分析 |
3.2.7 小結(jié) |
3.3 基于雙語詞對(duì)齊方法的生物醫(yī)學(xué)實(shí)體挖掘 |
3.3.1 背景介紹 |
3.3.2 實(shí)驗(yàn)設(shè)計(jì) |
3.3.3 實(shí)驗(yàn)結(jié)果與分析 |
3.4 結(jié)果分析與討論 |
3.5 本章小結(jié) |
第4章 表型語義單元在傳染疾病精細(xì)表型譜構(gòu)建中的應(yīng)用 |
4.1 研究背景 |
4.2 實(shí)驗(yàn)設(shè)計(jì) |
4.2.1 實(shí)驗(yàn)任務(wù) |
4.2.2 實(shí)驗(yàn)過程與評(píng)價(jià)標(biāo)準(zhǔn) |
4.3 實(shí)驗(yàn)結(jié)果 |
4.3.1 PhenoSSU模型及基于PhenoSSU的知識(shí)圖譜構(gòu)建 |
4.3.2 自動(dòng)化PhenoSSU識(shí)別方法結(jié)果分析 |
4.3.3 PhenoSSU表達(dá)能力評(píng)價(jià)結(jié)果分析 |
4.4 本章小結(jié) |
第5章 總結(jié)與展望 |
5.1 成果總結(jié) |
5.2 理論創(chuàng)新與技術(shù)創(chuàng)新 |
5.3 未來展望 |
參考文獻(xiàn) |
附錄 |
附表1 UMLS詞表組成 |
附表2 詞性縮寫及其作用 |
附表3 PhenoSSU屬性定義及取值 |
文獻(xiàn)綜述 生物醫(yī)學(xué)本體研究與應(yīng)用:綜述與當(dāng)前發(fā)展 |
參考文獻(xiàn) |
致謝 |
博士期間發(fā)表的學(xué)術(shù)論文與成果 |
第一作者或共同第一作者發(fā)表工作 |
其他已發(fā)表工作 |
待發(fā)表工作 |
(4)面向醫(yī)學(xué)大數(shù)據(jù)的實(shí)驗(yàn)室檢查結(jié)果結(jié)構(gòu)化、標(biāo)準(zhǔn)化研究(論文提綱范文)
中文摘要 |
Abstract |
前言 |
1.1 研究背景 |
1.2 研究目的 |
1.3 實(shí)驗(yàn)室檢查結(jié)果抽提研究進(jìn)展 |
研究基礎(chǔ) |
2.1 LATTE簡(jiǎn)介 |
2.2 一體化醫(yī)學(xué)語言系統(tǒng) |
2.3 觀測(cè)指標(biāo)標(biāo)識(shí)符邏輯命名與編碼系統(tǒng) |
2.4 LOINC to HPO映射庫(kù) |
2.5 英文實(shí)驗(yàn)室檢查對(duì)象及來源 |
材料和方法 |
3.1 包含實(shí)驗(yàn)室檢查結(jié)果的病例收集 |
3.2 人工實(shí)驗(yàn)室檢查結(jié)果標(biāo)注 |
3.3 UMLS編碼的實(shí)驗(yàn)室檢查知識(shí)庫(kù)構(gòu)建 |
3.4 實(shí)驗(yàn)室檢查結(jié)果標(biāo)準(zhǔn)化轉(zhuǎn)換 |
知識(shí)庫(kù)及算法評(píng)價(jià)結(jié)果 |
4.1 知識(shí)庫(kù)概覽 |
4.2 評(píng)估結(jié)果 |
4.3 在胃腸病學(xué)中的應(yīng)用 |
討論 |
結(jié)論 |
參考文獻(xiàn) |
綜述 電子病歷信息抽提研究進(jìn)展 |
參考文獻(xiàn) |
附錄 概念說明 |
攻讀碩士學(xué)位期間發(fā)表的論文 |
致謝 |
(5)面向決策支持的醫(yī)學(xué)文本語義分析方法研究(論文提綱范文)
致謝 |
摘要 |
ABSTRACT |
1 引言 |
1.1 研究背景及研究意義 |
1.2 研究?jī)?nèi)容及關(guān)鍵問題 |
1.3 研究創(chuàng)新點(diǎn) |
1.4 技術(shù)路線 |
1.5 章節(jié)安排 |
2 文獻(xiàn)綜述和相關(guān)方法 |
2.1 文獻(xiàn)綜述 |
2.1.1 醫(yī)學(xué)文本分詞方法 |
2.1.2 醫(yī)學(xué)文本結(jié)構(gòu)化方法 |
2.1.3 語義分析和醫(yī)學(xué)概念抽取 |
2.1.4 基于醫(yī)學(xué)文本的決策支持 |
2.2 相關(guān)數(shù)據(jù)與方法 |
2.2.1 醫(yī)學(xué)領(lǐng)域知識(shí)庫(kù) |
2.2.2 機(jī)器學(xué)習(xí)方法 |
2.2.3 大數(shù)據(jù)分析方法 |
2.2.4 評(píng)估方法和指標(biāo) |
2.3 本章小結(jié) |
3 基于自然語言處理的醫(yī)學(xué)文本結(jié)構(gòu)化和標(biāo)準(zhǔn)化方法 |
3.1 醫(yī)學(xué)文本特征和語義復(fù)雜性分析 |
3.1.1 醫(yī)學(xué)文本數(shù)據(jù)的來源和特征 |
3.1.2 醫(yī)學(xué)文本分析的N-Gram語言模型 |
3.1.3 醫(yī)學(xué)文本語料庫(kù)的使用及影響分析 |
3.2 基于醫(yī)學(xué)文本語料庫(kù)的文本結(jié)構(gòu)化方法 |
3.2.1 基于字典的機(jī)械分詞和N-Gram分詞方法研究 |
3.2.2 基于序列標(biāo)注的醫(yī)學(xué)文本分詞方法研究 |
3.2.3 基于語義理解的醫(yī)學(xué)文本分析方法研究 |
3.3 中文超聲檢查報(bào)告文本分析和性能評(píng)估 |
3.3.1 專家輔助的超聲檢查報(bào)告文本標(biāo)注方法 |
3.3.2 超聲檢查報(bào)告的文本結(jié)構(gòu)化方法 |
3.3.3 超聲檢查報(bào)告的文本語義分析方法 |
3.3.4 標(biāo)注系統(tǒng)的性能評(píng)估方法 |
3.3.5 標(biāo)注系統(tǒng)的整體性能測(cè)試與分析 |
3.4 本章小結(jié) |
4 基于醫(yī)學(xué)領(lǐng)域知識(shí)的醫(yī)學(xué)文本語義分析和知識(shí)發(fā)現(xiàn)方法 |
4.1 面向醫(yī)學(xué)文本的語義相似度計(jì)算方法 |
4.1.1 語義關(guān)系與文本特征提取方法 |
4.1.2 基于加權(quán)Levenshtein距離和N-Gram的文本相似度計(jì)算方法 |
4.1.3 評(píng)估方法和實(shí)驗(yàn)分析 |
4.2 基于UMLS的醫(yī)學(xué)概念相似度和相關(guān)性計(jì)算方法 |
4.2.1 醫(yī)學(xué)文本語義相似度計(jì)算方法 |
4.2.2 醫(yī)學(xué)文本語義相關(guān)性計(jì)算方法 |
4.2.3 相關(guān)方法的測(cè)試和分析 |
4.3 基于語義分析的計(jì)算機(jī)輔助ICD-11編碼方法 |
4.3.1 相關(guān)知識(shí)庫(kù) |
4.3.2 ICD-11編碼語義模型 |
4.3.3 ICD-11編碼規(guī)則建模方法 |
4.3.4 ICD-11候選編碼相關(guān)性計(jì)算方法 |
4.3.5 相關(guān)方法的測(cè)試和分析 |
4.4 本章小結(jié) |
5 面向決策支持的海量醫(yī)學(xué)文本分析方法及應(yīng)用案例研究 |
5.1 醫(yī)學(xué)文本主題建模和知識(shí)發(fā)現(xiàn)方法 |
5.1.1 基于LDA的醫(yī)學(xué)文本主題建模方法 |
5.1.2 知識(shí)約束下醫(yī)學(xué)文本主題建模和預(yù)測(cè)方法 |
5.1.3 相關(guān)方法性能的對(duì)比分析 |
5.2 基于大數(shù)據(jù)分析的典型醫(yī)學(xué)文本分析方法設(shè)計(jì)和分析 |
5.2.1 基于Map Reduce模型的大規(guī)模數(shù)據(jù)集連接方法 |
5.2.2 基于Map Reduce模型的大規(guī)模文檔相似度計(jì)算方法 |
5.3 面向醫(yī)療大數(shù)據(jù)分析的HADOOP性能自動(dòng)調(diào)整優(yōu)化方法 |
5.3.1 Hadoop性能自動(dòng)調(diào)優(yōu)框架設(shè)計(jì)方法 |
5.3.2 基于無導(dǎo)數(shù)優(yōu)化理論的Hadoop最優(yōu)參數(shù)搜索方法 |
5.3.3 典型Map Reduce算法性能調(diào)優(yōu)和實(shí)驗(yàn)分析 |
5.4 本章小結(jié) |
6 總結(jié)與展望 |
6.1 總結(jié) |
6.2 展望 |
參考文獻(xiàn) |
作者簡(jiǎn)歷及攻讀博士學(xué)位期間取得的研究成果 |
學(xué)位論文數(shù)據(jù)集 |
(6)基于序列的膜蛋白配體交互研究(論文提綱范文)
摘要 |
Abstract |
第一章 緒論 |
1.1 生物信息學(xué)及蛋白質(zhì)組學(xué) |
1.1.1 生物信息學(xué) |
1.1.2 蛋白質(zhì)組學(xué) |
1.2 膜蛋白及跨膜蛋白 |
1.3 研究相關(guān)數(shù)據(jù)資源 |
1.4 研究相關(guān)工具資源 |
1.5 本文工作 |
1.5.1 本文研究?jī)?nèi)容 |
1.5.2 本文組織結(jié)構(gòu) |
第二章 跨膜蛋白殘基表面可及性預(yù)測(cè) |
2.1 引言 |
2.2 研究背景與思路 |
2.3 實(shí)驗(yàn)方法 |
2.3.1 數(shù)據(jù)集 |
2.3.2 計(jì)算rASA |
2.3.3 特征編碼 |
2.3.4 TMP-SSurface回歸模型 |
2.3.5 從概率到rASA |
2.3.6 實(shí)驗(yàn)環(huán)境 |
2.3.7 評(píng)價(jià)指標(biāo) |
2.4 實(shí)驗(yàn)結(jié)果及討論 |
2.4.1 模型穩(wěn)定性測(cè)試 |
2.4.2 模型訓(xùn)練過程 |
2.4.3 參數(shù)選擇 |
2.4.4 子網(wǎng)絡(luò)消融實(shí)驗(yàn) |
2.4.5 不同類型跨膜蛋白測(cè)試 |
2.4.6 預(yù)測(cè)器性能對(duì)比 |
2.4.7 短序列跨膜蛋白測(cè)試 |
2.4.8 預(yù)測(cè)器效率對(duì)比 |
2.4.9 案例分析 |
2.5 本章小結(jié) |
第三章 跨膜蛋白殘基Z坐標(biāo)預(yù)測(cè) |
3.1 引言 |
3.2 研究背景與思路 |
3.3 實(shí)驗(yàn)方法 |
3.3.1 數(shù)據(jù)集 |
3.3.2 計(jì)算殘基Z坐標(biāo) |
3.3.3 特征編碼 |
3.3.4 TM-ZC回歸模型 |
3.3.5 實(shí)驗(yàn)環(huán)境 |
3.3.6 評(píng)價(jià)指標(biāo) |
3.4 實(shí)驗(yàn)結(jié)果及討論 |
3.4.1 特征分析 |
3.4.2 滑窗尺寸調(diào)整 |
3.4.3 Z坐標(biāo)閾值調(diào)整 |
3.4.4 模型穩(wěn)定性測(cè)試 |
3.4.5 不同類型跨膜蛋白測(cè)試 |
3.4.6 預(yù)測(cè)器性能對(duì)比 |
3.4.7 拓?fù)浣Y(jié)構(gòu)相關(guān)性 |
3.4.8 案例分析 |
3.5 本章小結(jié) |
第四章 膜蛋白-配體結(jié)合位點(diǎn)預(yù)測(cè) |
4.1 引言 |
4.2 研究背景與思路 |
4.3 實(shí)驗(yàn)方法 |
4.3.1 數(shù)據(jù)集 |
4.3.2 特征編碼 |
4.3.3 MPLs-Pred分類模型 |
4.3.4 實(shí)驗(yàn)環(huán)境 |
4.3.5 評(píng)價(jià)指標(biāo) |
4.4 實(shí)驗(yàn)結(jié)果及討論 |
4.4.1 配體結(jié)合位點(diǎn)分析 |
4.4.2 特征分析 |
4.4.3 多倍隨機(jī)欠采樣測(cè)試 |
4.4.4 分類算法對(duì)比 |
4.4.5 配體特異性模型性能 |
4.4.6 獨(dú)立測(cè)試結(jié)果 |
4.4.7 預(yù)測(cè)器性能對(duì)比 |
4.4.8 案例分析 |
4.4.9 人類藥物靶標(biāo)膜蛋白分析 |
4.5 本章小結(jié) |
第五章 泛醌結(jié)合蛋白識(shí)別與分析 |
5.1 引言 |
5.2 研究背景與思路 |
5.3 實(shí)驗(yàn)方法 |
5.3.1 數(shù)據(jù)集 |
5.3.2 特征編碼 |
5.3.3 特征選擇 |
5.3.4 UBPs-Pred分類模型 |
5.3.5 參數(shù)尋優(yōu) |
5.3.6 實(shí)驗(yàn)環(huán)境 |
5.3.7 評(píng)價(jià)指標(biāo) |
5.4 實(shí)驗(yàn)結(jié)果及討論 |
5.4.1 分類算法對(duì)比 |
5.4.2 特征選擇結(jié)果 |
5.4.3 參數(shù)尋優(yōu)結(jié)果 |
5.4.4 預(yù)測(cè)器性能 |
5.4.5 案例分析 |
5.4.6 泛醌結(jié)合域模體統(tǒng)計(jì) |
5.4.7 泛醌結(jié)合蛋白超級(jí)家族分布 |
5.4.8 人類泛醌結(jié)合蛋白GO富集分析 |
5.4.9 人類泛醌結(jié)合蛋白KEGG通路富集分析 |
5.5 本章小結(jié) |
第六章 在線服務(wù)平臺(tái) |
6.1 網(wǎng)站簡(jiǎn)介 |
6.2 服務(wù)器環(huán)境 |
6.3 在線預(yù)測(cè) |
第七章 總結(jié)與展望 |
7.1 總結(jié) |
7.2 展望 |
參考文獻(xiàn) |
致謝 |
附錄 |
在學(xué)期間公開發(fā)表論文及著作情況 |
(7)中醫(yī)臨床信息分類與代碼體系構(gòu)建及應(yīng)用研究(論文提綱范文)
中文摘要 |
Abstract |
第1章 緒論 |
1.1 研究背景 |
1.2 研究目的及意義 |
1.2.1 研究目的 |
1.2.2 研究意義 |
1.3 研究?jī)?nèi)容及方法 |
1.3.1 研究?jī)?nèi)容 |
1.3.2 研究方法 |
1.3.3 技術(shù)路線 |
1.4 本文組織結(jié)構(gòu)與章節(jié)安排 |
第2章 基本理論基礎(chǔ)及相關(guān)技術(shù) |
2.1 基本理論 |
2.1.1 中醫(yī)臨床學(xué) |
2.1.2 分類學(xué) |
2.1.3 大數(shù)據(jù) |
2.2 相關(guān)概念 |
2.2.1 臨床信息分類 |
2.2.2 臨床信息代碼 |
2.2.3 數(shù)字化 |
2.3 相關(guān)技術(shù) |
2.3.1 信息分類與編碼技術(shù) |
2.3.2 信息建模技術(shù) |
第3章 中醫(yī)臨床信息分類與代碼體系及數(shù)字化流程的建立 |
3.1 中醫(yī)臨床信息模型的構(gòu)建 |
3.1.1 中醫(yī)臨床診療活動(dòng)分析 |
3.1.2 中醫(yī)臨床信息的抽取與整理 |
3.1.3 中醫(yī)臨床信息模型 |
3.2 中醫(yī)臨床信息分類與代碼體系框架的構(gòu)建 |
3.2.1 基本信息分類與代碼框架 |
3.2.2 中醫(yī)臨床診斷信息分類與代碼框架 |
3.2.3 臨床治療信息分類與代碼框架 |
3.2.4 臨床評(píng)價(jià)信息分類與代碼框架 |
3.3 中醫(yī)臨床信息數(shù)字化流程的建立 |
3.3.1 患者基本信息數(shù)字化流程 |
3.3.2 臨床診斷信息數(shù)字化流程 |
3.3.3 臨床治療信息數(shù)字化流程 |
3.3.4 臨床評(píng)價(jià)信息數(shù)字化流程 |
第4章 應(yīng)用研究 |
4.1 中醫(yī)臨床信息數(shù)據(jù)的來源及預(yù)處理 |
4.2 中醫(yī)臨床信息數(shù)字化 |
4.2.1 患者基本信息數(shù)字化 |
4.2.2 臨床診斷信息數(shù)字化 |
4.2.3 臨床治療信息數(shù)字化 |
4.2.4 臨床評(píng)價(jià)信息數(shù)字化 |
4.3 應(yīng)用結(jié)果與分析 |
4.3.1 描述性統(tǒng)計(jì)分析 |
4.3.2 中藥藥性關(guān)聯(lián)分析 |
第5章 總結(jié)與展望 |
5.1 總結(jié) |
5.2 展望 |
參考文獻(xiàn) |
附錄1 :中醫(yī)臨床信息模型 |
文獻(xiàn)綜述 |
參考文獻(xiàn) |
研究生期間發(fā)表論文情況 |
致謝 |
(8)SDTM與ADaM在腫瘤臨床試驗(yàn)中的應(yīng)用(論文提綱范文)
中文摘要 |
Abstract |
前言 |
1.1 研究背景 |
1.2 研究目的與意義 |
1.3 研究方法和內(nèi)容 |
第一部分 原始數(shù)據(jù)到SDTM的實(shí)現(xiàn) |
2.1 SDTM介紹 |
2.1.1 模型概念 |
2.1.2 通用觀測(cè)類別 |
2.2 腫瘤專用域介紹 |
2.2.1 TU域 |
2.2.2 TR域 |
2.2.3 RS域 |
2.3 實(shí)際案例 |
2.3.1 EXCEL映射表設(shè)計(jì) |
2.3.2 SAS實(shí)現(xiàn) |
2.4 討論 |
第二部分 SDTM到 ADa M的實(shí)現(xiàn) |
3.1 ADaM介紹 |
3.1.1 元數(shù)據(jù)類型 |
3.1.2 基本數(shù)據(jù)結(jié)構(gòu) |
3.2 腫瘤相關(guān)分析數(shù)據(jù)集 |
3.2.1 ADTTE |
3.2.2 ADRS |
3.3 實(shí)際案例 |
3.3.1 EXCEL映射表設(shè)計(jì) |
3.3.2 SAS實(shí)現(xiàn) |
3.4 討論 |
總結(jié) |
4.1 總結(jié) |
4.2 拓展 |
參考文獻(xiàn) |
綜述 CDISC 標(biāo)準(zhǔn)及其應(yīng)用 |
參考文獻(xiàn) |
附錄 |
附錄1 干預(yù)類觀測(cè) |
附錄2 事件類觀測(cè) |
附錄3 發(fā)現(xiàn)類觀測(cè) |
附錄4 宏程序代碼 |
攻讀學(xué)位期間發(fā)表文章情況 |
致謝 |
(9)面向上市公司三類公告的摘要生成系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)(論文提綱范文)
摘要 |
abstract |
注釋表 |
第1章 引言 |
1.1 公告摘要生成的背景及意義 |
1.2 公告摘要及相關(guān)技術(shù)的國(guó)內(nèi)外研究現(xiàn)狀 |
1.2.1 文本摘要研究現(xiàn)狀 |
1.2.2 文本分類研究現(xiàn)狀 |
1.2.3 命名實(shí)體識(shí)別研究現(xiàn)狀 |
1.3 本文研究?jī)?nèi)容以及組織結(jié)構(gòu) |
1.3.1 本文研究?jī)?nèi)容 |
1.3.2 組織結(jié)構(gòu) |
第2章 公告摘要生成相關(guān)技術(shù) |
2.1 文本摘要方法 |
2.1.1 基于統(tǒng)計(jì)的文本摘要方法 |
2.1.2 基于圖結(jié)構(gòu)的方法 |
2.1.3 基于深度學(xué)習(xí)的生成式摘要方法 |
2.1.4 基于信息抽取的文本摘要 |
2.2 正則表達(dá)式 |
2.3 詞向量技術(shù) |
2.4 條件隨機(jī)場(chǎng) |
2.5 深度學(xué)習(xí)模型 |
2.5.1 神經(jīng)網(wǎng)絡(luò) |
2.5.2 卷積神經(jīng)網(wǎng)絡(luò) |
2.5.3 循環(huán)神經(jīng)網(wǎng)絡(luò) |
2.5.4 長(zhǎng)短期記憶網(wǎng)絡(luò) |
2.6 實(shí)驗(yàn)評(píng)測(cè)指標(biāo) |
2.7 本章小結(jié) |
第3章 基于文檔結(jié)構(gòu)的公告分類 |
3.1 公告文本結(jié)構(gòu) |
3.2 小標(biāo)題提取方案設(shè)計(jì) |
3.3 公告分類方案設(shè)計(jì) |
3.3.1 預(yù)訓(xùn)練詞向量 |
3.3.2 卷積神經(jīng)網(wǎng)絡(luò) |
3.4 實(shí)驗(yàn)結(jié)果及結(jié)果分析 |
3.4.1 實(shí)驗(yàn)數(shù)據(jù) |
3.4.2 實(shí)驗(yàn)環(huán)境及參數(shù)設(shè)置 |
3.4.3 實(shí)驗(yàn)及結(jié)果分析 |
3.5 本章小結(jié) |
第4章 基于模板的公告摘要生成方法 |
4.1 公告摘要模板制定 |
4.2 解禁類公告摘要生成方法 |
4.2.1 解禁類公告特點(diǎn) |
4.2.2 解禁類公告摘要生成方法 |
4.3 定期報(bào)告類公告摘要生成方法 |
4.3.1 定期報(bào)告類公告特點(diǎn) |
4.3.2 定期報(bào)告類公告摘要生成方法 |
4.4 并購(gòu)重組類公告摘要生成方法 |
4.4.1 并購(gòu)重組類公告特點(diǎn) |
4.4.2 并購(gòu)重組類公告摘要生成方法 |
4.5 實(shí)驗(yàn)設(shè)計(jì)及結(jié)果分析 |
4.5.1 解禁類公告 |
4.5.2 定期報(bào)告類公告 |
4.5.3 并購(gòu)重組類公告 |
4.6 本章小結(jié) |
第5章 公告摘要生成系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) |
5.1 系統(tǒng)整體框架設(shè)計(jì) |
5.2 系統(tǒng)各模塊實(shí)現(xiàn) |
5.2.1 公告獲取模塊 |
5.2.2 公告分類模塊 |
5.2.3 公告摘要生成模塊 |
5.2.4 展示及存儲(chǔ)模塊 |
5.3 模塊測(cè)試 |
5.3.1 公告獲取模塊 |
5.3.2 公告分類模塊 |
5.3.3 摘要生成模塊 |
5.3.4 展示及存儲(chǔ)模塊 |
5.4 系統(tǒng)測(cè)試 |
5.5 本章小結(jié) |
第6章 總結(jié)與展望 |
6.1 工作總結(jié) |
6.2 未來展望 |
參考文獻(xiàn) |
致謝 |
攻讀碩士學(xué)位期間從事的科研工作及取得的成果 |
(10)基于CDISC標(biāo)準(zhǔn)的EDC臨床試驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)化研究(論文提綱范文)
摘要 |
Abstract |
中英文對(duì)照縮略詞表 |
第一章 前言 |
1.1 研究背景 |
1.2 研究目的與意義 |
第二章 原理與方法 |
2.1 研究方法與技術(shù)路線 |
2.2 方案表述模型(PRM) |
2.2.1 PRM內(nèi)容簡(jiǎn)介 |
2.2.2 PRM初步應(yīng)用方法 |
2.3 實(shí)驗(yàn)室數(shù)據(jù)模型(LAB) |
2.3.1 LAB內(nèi)容簡(jiǎn)介 |
2.3.2 LAB傳輸文件 |
2.3.3 利用SAS生成LAB傳輸文件 |
2.4 CDASH數(shù)據(jù)集 |
2.4.1 非標(biāo)準(zhǔn)數(shù)據(jù) |
2.4.1.1 非標(biāo)準(zhǔn)數(shù)據(jù)來源 |
2.4.1.2 非標(biāo)準(zhǔn)數(shù)據(jù)與CDASH數(shù)據(jù)的區(qū)別 |
2.4.2 非標(biāo)準(zhǔn)數(shù)據(jù)向CDASH轉(zhuǎn)化的SAS實(shí)現(xiàn) |
2.4.2.1 添加CDASH中指示變量 |
2.4.2.2 規(guī)范變量命名 |
2.4.2.3 變量名分域 |
2.4.2.4 調(diào)整數(shù)據(jù)結(jié)構(gòu)生成CDASH數(shù)據(jù)集 |
2.5 ADaM數(shù)據(jù)集 |
2.5.1 CDASH數(shù)據(jù)與ADa M數(shù)據(jù)的區(qū)別 |
2.5.2 CDASH數(shù)據(jù)向ADa M轉(zhuǎn)化思路 |
2.5.3 CDASH數(shù)據(jù)生成ADa M數(shù)據(jù)的SAS實(shí)現(xiàn) |
2.5.3.1 分析原始程序框架中工具宏接入點(diǎn) |
2.5.3.2 工具宏的SAS實(shí)現(xiàn) |
2.5.3.3 主體程序的擴(kuò)展 |
第三章 結(jié)果與分析 |
3.1 實(shí)例簡(jiǎn)介 |
3.2 根據(jù)PRM進(jìn)行方案信息標(biāo)準(zhǔn)化提取 |
3.3 根據(jù)LAB模型生成外部實(shí)驗(yàn)室數(shù)據(jù)傳輸文件 |
3.3.1 生成平面文件 |
3.3.2 生成XML文件 |
3.4 生成CDASH數(shù)據(jù)集 |
3.4.1 添加STUDYID和 SITEID |
3.4.2 變量名修改 |
3.4.3 變量名分域 |
3.4.4 調(diào)整數(shù)據(jù)結(jié)構(gòu)生成CDASH數(shù)據(jù)集 |
3.4.4.1 生成橫向結(jié)構(gòu)數(shù)據(jù)集 |
3.4.4.2 生成縱向結(jié)構(gòu)數(shù)據(jù)集 |
3.5 生成ADaM數(shù)據(jù)集 |
3.6 程序驗(yàn)證 |
3.6.1 驗(yàn)證方法 |
3.6.2 預(yù)期數(shù)據(jù)集結(jié)果 |
3.6.3 驗(yàn)證結(jié)果 |
3.6.3.1 CDASH數(shù)據(jù)集 |
3.6.3.2 ADaM數(shù)據(jù)集 |
3.6.3.3 驗(yàn)證結(jié)果分析 |
第四章 討論 |
第五章 總結(jié) |
參考文獻(xiàn) |
綜述:臨床試驗(yàn)數(shù)據(jù)管理中的電子化和標(biāo)準(zhǔn)化 |
參考文獻(xiàn) |
附錄 A |
附錄 B |
附錄 C |
附錄 D |
作者簡(jiǎn)介 |
碩士在讀期間發(fā)表論文情況 |
致謝 |
四、觀測(cè)指標(biāo)標(biāo)識(shí)符邏輯命名與編碼系統(tǒng)(LOINC)數(shù)據(jù)庫(kù)介紹(論文參考文獻(xiàn))
- [1]國(guó)際醫(yī)學(xué)術(shù)語體系進(jìn)展及特色優(yōu)勢(shì)分析[J]. 任慧玲,李曉瑛,鄧盼盼,冀玉靜,劉懿,黃裕翔. 中國(guó)科技術(shù)語, 2021(03)
- [2]知識(shí)和數(shù)據(jù)雙驅(qū)動(dòng)的檢驗(yàn)人工智能疾病診斷系統(tǒng)的構(gòu)建[D]. 井杰. 中國(guó)人民解放軍海軍軍醫(yī)大學(xué), 2021(09)
- [3]基于真實(shí)世界醫(yī)療大數(shù)據(jù)的中文醫(yī)學(xué)本體重構(gòu)的研究[D]. 陳祿明. 北京協(xié)和醫(yī)學(xué)院, 2021(02)
- [4]面向醫(yī)學(xué)大數(shù)據(jù)的實(shí)驗(yàn)室檢查結(jié)果結(jié)構(gòu)化、標(biāo)準(zhǔn)化研究[D]. 楊濤. 蘇州大學(xué), 2020(02)
- [5]面向決策支持的醫(yī)學(xué)文本語義分析方法研究[D]. 陳東華. 北京交通大學(xué), 2020(03)
- [6]基于序列的膜蛋白配體交互研究[D]. 逯暢. 東北師范大學(xué), 2020(01)
- [7]中醫(yī)臨床信息分類與代碼體系構(gòu)建及應(yīng)用研究[D]. 張盼. 湖北中醫(yī)藥大學(xué), 2020(12)
- [8]SDTM與ADaM在腫瘤臨床試驗(yàn)中的應(yīng)用[D]. 朱天一. 南京醫(yī)科大學(xué), 2020(07)
- [9]面向上市公司三類公告的摘要生成系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 周招福. 重慶郵電大學(xué), 2020(02)
- [10]基于CDISC標(biāo)準(zhǔn)的EDC臨床試驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)化研究[D]. 蔡燁. 東南大學(xué), 2019(01)
標(biāo)簽:大數(shù)據(jù)論文; 語義分析論文; 生物醫(yī)學(xué)論文; 文本分類論文; 文本分析論文;