支持業(yè)務流程建模的塊結構流程挖掘技術的研究.pdf_第1頁
已閱讀1頁,還剩161頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著市場經(jīng)濟的發(fā)展,企業(yè)、機構需要順應市場需求的變化,隨時快速調整業(yè)務,提高應對市場變化的快速反應能力。因此企業(yè)的信息系統(tǒng)中支持業(yè)務運行的業(yè)務流程部分需要再造或優(yōu)化,而流程的再造或優(yōu)化首先需要理解當前業(yè)務流程運行的模式。目前,業(yè)務流程運行模式的提煉主要依賴技術人員與業(yè)務人員的溝通,其所得結果有很強的主觀性,缺乏整體、完善性,且時間成本高、效率低。目前,大多數(shù)企業(yè)的信息系統(tǒng)管理應用軟件,無論提供或不提供顯式的流程,這些軟件都提供企業(yè)實際業(yè)

2、務執(zhí)行的記錄,即流程日志。如何分析這些日志數(shù)據(jù),從中找出業(yè)務流程運行的模式,用于快速的流程再造和柔性管理是迫切需要解決的問題,而流程日志中抽取的業(yè)務流程模型,可以真實反映企業(yè)業(yè)務流程的執(zhí)行,支持業(yè)務流程再造或優(yōu)化的快速建模。
   本文研究的基礎--簡單格式的流程日志并不是僅僅局限于工作流管理系統(tǒng)所提供,目前公司、機構的信息系統(tǒng),它們的事務系統(tǒng),如ERP、CRM、B2B、SCM等都提供本文研究所需的簡單格式的日志信息。也就是說,

3、只需要收集記錄了業(yè)務流程中各個任務活動發(fā)生的順序序列,即流程日志。流程日志記錄了業(yè)務流程執(zhí)行的真實情況,從中挖掘出業(yè)務流程模式更加可信易讀。
   因為流程模型的結構往往比較復雜,存在循環(huán)、并行、選擇、非自由選擇等難以表述清楚的塊結構,現(xiàn)有文獻的挖掘方法對這些結果的處理不理想,如循環(huán)結構、非自由選擇結構等,目前沒有普適的處理方法解決這些問題。
   此外,利用流程日志中的時間信息可以挖掘到更精確的活動邏輯關系并計算流程工

4、作的性能,但是大多數(shù)的流程挖掘方法并沒有充分利用日志中的時間信息。
   本文主要是深入研究并提煉給出了流程挖掘概念、流程日志的數(shù)學表示、流程模型的Petri網(wǎng)表示及結構化工作流網(wǎng)概念,并給出相關的數(shù)學描述以及定義。在此基礎上的研究工作主要有以下三個方面的貢獻:
   第一,目前,企業(yè)應用系統(tǒng)軟件沒有統(tǒng)一的流程日志規(guī)范標準,日志格式分為兩類:無時間標志型日志和有時間標志型日志且一般原始日志帶有噪音。針對無時間標志型日志,

5、采用多步抽取模型方法,提出了一種基于簡單流程日志格式的塊結構挖掘方法BRC(Block_Structure Replace Compression:BRC),挖掘任務之間的邏輯關系,用于構建日志所反映的業(yè)務流程模型。
   基本塊結構對應于四種結構即順序、并行、選擇和循環(huán)結構。方法首先定義了能夠被挖掘的流程的基本要求,即結構化流程模型。方法的基本思想是在對四種基本結構進行分析的基礎上,從日志中找出具有這些結構的模塊,并用結點來替

6、換每個模塊。通過循環(huán)使用四種模塊挖掘算法從日志中挖掘和替換,使得日志不斷收縮。如果最后得到的日志是一個點,則只需進行一次逆變換,即將前面得到的模塊按照相反的順序依次代入到流程模型中,這樣得到一個容易理解的基于工作流網(wǎng)的WF網(wǎng)模型。同時,證明用該種方法得到的工作流網(wǎng)是合理的,安全的。在對順序任務和選擇任務進行挖掘的過程中,考慮到來自其他并行任務的干擾,BRC提出并采用了并行任務等價類概念,即首先從日志中劃分出并行任務等價類,再依次搜索各等

7、價類,挖掘出其中的順序和選擇任務,從而很好地解決了并行任務對結構化挖掘的干擾問題。通過生成和運行一定數(shù)量的實驗數(shù)據(jù),對BRC方法的挖掘質量進行了檢驗分析,證明該方法在復雜流程的挖掘方面具有明顯優(yōu)勢。討論了帶噪音的因果關系挖掘、帶噪音的并行關系挖掘、帶噪音的選擇結構的挖掘,并給出了帶噪音處理的改進型結構化挖掘算法。
   第二,無時間標志型日志中并行關系的挖掘是相對困難且計算量較大,針對有時間標志型日志,提出了一種基于時間間隔的簡

8、單流程日志格式的挖掘方法,用于構建日志所反映的業(yè)務流程模型。
   方法的基本思想不同于事件模型類思想,在事件挖掘類中,把一個任務的執(zhí)行看作是不可分割的,是一個原子性事件。而從基于時間間隔日志的流程挖掘方法解決方案看,每一個任務的執(zhí)行都具有一個時間間隔,即任務的開始事件和任務的結束事件??梢栽偻卣惯@個模型成為捕獲更精確的模型視圖,在其中,執(zhí)行活動是一個沿著時間軸的時間間隔,并且兩個間隔可以互相交叉。間隔方法分為兩大步驟:(1):

9、產(chǎn)生流程執(zhí)行圖。針對每一執(zhí)行產(chǎn)生一個DAG圖。在單個執(zhí)行中的間隔交叉使得此DAG圖易于對并行關系的挖掘,對具有同樣活動集合的執(zhí)行圖進行合并產(chǎn)生單個DAG圖;(2)合并流程執(zhí)行圖。對于流程圖的一個子圖,各個運行于其上的執(zhí)行覆蓋相同的活動集合,也就是業(yè)務流程中使用不同的參數(shù)來選擇合作伙伴的有向邊是一樣的。因此合并結果所產(chǎn)生的DAG圖就是流程的控制流圖。方法通過合并各個依賴于日志的DAG圖,產(chǎn)生現(xiàn)實意義上的流程模型圖。驗證對比了兩類算法:間隔

10、算法和非間隔算法。得出了有意義的一些結論,如丟失邊或多余邊與流程日志規(guī)模之間的關系等。
   第三,針對一般情況下,流程日志帶有噪音且是不完備的,探討分析了噪音情況,給出了日志中任務邏輯關系挖掘方法。方法中定義了一個概念:順序關系。該關系是基于START和COMPLETE這兩種事件類型和它們的時間戳的。隨后給出順序關系的度量方法。提出了一個挖掘流程模型圖的方法,源流程模型可以包括所有的基本塊結構和非自由選擇結構。
  

11、提出的方法使用具有時間戳的任務狀態(tài)流程日志,利用時間信息,比如活動的平均等待時間、平均執(zhí)行時間去挖掘流程模型。在挖掘流程模型時,首先通過掃描一次日志,為每一個任務構建平均值表:然后在平均值表的基礎上分兩步執(zhí)行:第一步是挖掘基本的結構,比如順序路由、并行路由、選擇和循環(huán)路由;第二步是分析流程模型的高級結構,如或連接結構。通過以上兩步,能挖掘出預期的流程模型。另外使用算法進行挖掘的時候,去除噪音問題通過觀測起始值來決定。最后對提出的挖掘算法

12、和文獻中已經(jīng)提到的算法做了比較,得出的結論是:TWM能挖掘α算法所挖掘的所有流程,然而,α算法不能挖掘TWM能挖掘的所有的流程,TWM和α算法在時間復雜度方面是等同的。另外,提出的算法對解決隱藏任務挖掘提供了有用的信息。
   此外,研究工作中,實現(xiàn)了一個支持流程挖掘算法的原型系統(tǒng)。設計此系統(tǒng)的目的主要是:(1)驗證α算法的有效性:(2)以此和我們所提方法算法進行有意義的比較,獲得有效的可信度;(3)驗證針對復雜變異結構流程,α

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論