基于關聯(lián)規(guī)則的2型糖尿病相關危險因素研究.pdf_第1頁
已閱讀1頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年來隨著醫(yī)療衛(wèi)生事業(yè)的迅速發(fā)展,醫(yī)療衛(wèi)生數(shù)據庫中存貯的海量醫(yī)療信息數(shù)據成為人們研究的熱點。這些數(shù)據都是與人們生命健康息息相關的載體,對疾病的診療和預防有著重要的意義。然而傳統(tǒng)的數(shù)據庫技術,僅僅只能夠針對實時數(shù)據進行簡單的查詢、修改、錄入、刪除等基本操作,若想要從這些數(shù)據中獲取隱含在其中的醫(yī)學規(guī)則,傳統(tǒng)的數(shù)據庫技術很難辦到。
  在此背景下,本文著重研究了目前數(shù)據挖掘與知識發(fā)現(xiàn)的主要研究內容之一——關聯(lián)規(guī)則。它側重于確定數(shù)據中不同

2、屬性之間的聯(lián)系,找出滿意約定支持度(Support)和信任度(Confidence)閾值的多個屬性之間的依賴關系。自1993年R.Agawal,R.Srikant首次提出該問題來,已經出現(xiàn)了許多關聯(lián)規(guī)則挖掘算法。本文研究了關聯(lián)規(guī)則算法中的經典算法Apriori算法,并結合前人的研究基礎,提出了一種Apriori算法的改進辦法。
  接著,本文運用數(shù)據挖掘中的關聯(lián)分析方法和SPSS Clementine12.0軟件對醫(yī)療信息數(shù)據庫中

3、的二型糖尿病患者數(shù)據進行多維度、多層次的分析,得到的結論可以用于輔助醫(yī)生和二型糖尿病高危人群量化判斷決策。
  本文的工作主要分為以下幾個方面:
 ?。?)研究經典關聯(lián)規(guī)則算法。研究當前主要關聯(lián)規(guī)則算法Apriori算法,并分析總結Apriori算法存在的優(yōu)勢和不足。
 ?。?)改進Apriori算法。研究前人改進Apriori算法的幾種思路,分為:基于分片的方法、基于Hash的方法、基于采樣的方法、減少交易個數(shù)的方法

4、和基于模糊集的方法。在此基礎上提出了一種改進Apriori算法的方法。
 ?。?)對比分析。本文利用C#語言對Apriori算法和改進Apriori算法進行編程,并將兩者做了對比實驗,從頻繁項集與支持度、運行時間與記錄數(shù)、運行時間與支持度這三個方面進行測試,實驗結果表明改進Apriori算法比經典Apriori算法更有效率。
 ?。?)建立數(shù)據挖掘初始集。從某三甲醫(yī)院醫(yī)學信息中心獲取的首次病程記錄及居民健康數(shù)據檔案中提取2型

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論