所屬欄目:計算機網(wǎng)絡(luò)論文 發(fā)布日期:2015-05-27 16:55 熱度:
軟件工程是目前計算機科技中舉足輕重的一項技術(shù),國家對軟件工程師的需求也是越來越大了。本文是一篇軟件工程論文范文,主要論述了探索軟件工程數(shù)據(jù)挖掘技術(shù)。有需要發(fā)表論文的作者可以聯(lián)系網(wǎng)站在線編輯提供服務(wù)。
摘 要:隨著計算機軟件技術(shù)的不斷發(fā)展,傳統(tǒng)的軟件維護工作越來越難。數(shù)據(jù)挖掘技術(shù)能夠從軟件工程數(shù)據(jù)中提取所需數(shù)據(jù),從而有利于軟件開發(fā)順利完成。因此,軟件工程數(shù)據(jù)挖掘技術(shù)的研究工作具有重要的應(yīng)用價值。本文首先對數(shù)據(jù)挖掘技術(shù)的相關(guān)概念進行介紹,然后,對其面臨的挑戰(zhàn)及其未來發(fā)展方向進行分析。希望能夠為有關(guān)的研究人員提供一些參考。
關(guān)鍵詞:軟件工程論文范文,軟件工程,數(shù)據(jù)挖掘,發(fā)展趨勢
1 引言(Introduction)
數(shù)據(jù)挖掘技術(shù)既是在海量的數(shù)據(jù)當(dāng)中將需求信息挖掘出來的過程[1]。軟件工程數(shù)據(jù)挖掘則是數(shù)據(jù)挖掘技術(shù)在軟件工程領(lǐng)域的重要應(yīng)用[2]。軟件工程數(shù)據(jù)挖掘技術(shù)可以有效地提高軟件的開發(fā)效率,增強軟件的穩(wěn)定性以及可用性,隨著軟件工程數(shù)據(jù)挖掘技術(shù)的不斷提升,其應(yīng)用范圍更加的廣泛[3]。因此,對其的研究工作不僅具有重要的學(xué)術(shù)價值,更具有重大的實際應(yīng)用價值。本文重點探索軟件工程數(shù)據(jù)挖掘技術(shù)面臨的挑戰(zhàn)以及將來的發(fā)展趨勢。
2 軟件工程數(shù)據(jù)挖掘(Software engineering data
mining)
(1)軟件工程數(shù)據(jù)挖掘的必要性
軟件工程數(shù)據(jù)主要是指在軟件開發(fā)階段積累的相關(guān)數(shù)據(jù),其中包括軟件的可行性分析以及需求分析文本,軟件的注釋或者代碼等等。這些信息是軟件開發(fā)者獲取軟件相關(guān)數(shù)據(jù)的唯一來源。隨著軟件研發(fā)技術(shù)以及規(guī)模的不斷提升,其中包括的軟件工程數(shù)據(jù)也是成指數(shù)性增長。例如:Linux操作系統(tǒng)軟件,其僅代碼一項就超過了500萬行。這在無形中增加了軟件開發(fā)者獲取軟件相關(guān)數(shù)據(jù)的難度。因此,借助于數(shù)據(jù)挖掘技術(shù)的軟件工程信息搜索技術(shù)是十分必要的。
(2)軟件工程數(shù)據(jù)挖掘任務(wù)及其過程
一般來講,軟件工程的數(shù)據(jù)挖掘工作主要包括:
a.軟件數(shù)據(jù)的預(yù)處理。這一過程主要是將未曾加工的數(shù)據(jù)變?yōu)楸阌谕诰虺鰜淼男问健F渲饕婕暗讲煌瑏碓匆约案袷綌?shù)據(jù)的融合,進而轉(zhuǎn)化成為統(tǒng)一格式的數(shù)據(jù)。選取數(shù)據(jù)挖掘任務(wù)有關(guān)的數(shù)據(jù)記錄,并對數(shù)據(jù)中的噪音以及重復(fù)值進行清理。目前,數(shù)據(jù)挖掘的預(yù)處理技術(shù)主要采用的是LSA、PLSA、LDA等。
b.數(shù)據(jù)挖掘。這一過程主要是要將海量數(shù)據(jù)中能夠反映出軟件本質(zhì)或者規(guī)律的信息搜取出來。其中運用了大量的算法。輸入的是結(jié)構(gòu)規(guī)整的數(shù)據(jù),而將關(guān)聯(lián)、分類等信息模式進行輸出,這些信息模式與挖掘任務(wù)有關(guān)。
c.結(jié)果評估。這一過程的目的就是要是用戶獲得有用的信息。主要包括提出信息質(zhì)量不高的部分結(jié)果數(shù)據(jù),以及將計算機處理以及理解的信息模式轉(zhuǎn)換成為用戶能夠理解的信息模式,并傳遞給用戶。
2 軟件工程數(shù)據(jù)挖掘存在的挑戰(zhàn)(Challenge of
software engineering data mining)
(1)軟件工程數(shù)據(jù)復(fù)雜度高
目前的軟件工程數(shù)據(jù)主要包括結(jié)構(gòu)化和非結(jié)構(gòu)化兩類數(shù)據(jù)。其中,結(jié)構(gòu)化數(shù)據(jù)主要涉及到軟件的版本相關(guān)信息以及缺陷報告等。非結(jié)構(gòu)化數(shù)據(jù)主要包括一些軟件代碼、文檔等。這兩類數(shù)據(jù)不能采取同一種算法,但是兩類數(shù)據(jù)之間卻又存在著諸多相關(guān)性。因此,在數(shù)據(jù)挖掘算法開發(fā)上,要充分的考慮到兩類數(shù)據(jù)的復(fù)雜聯(lián)系,無形中增加了不小的難度。
(2)分析方法并非傳統(tǒng)模式
軟件工程數(shù)據(jù)挖掘工作的最后階段是將獲取的挖掘信息呈現(xiàn)給所需用戶。在傳統(tǒng)的數(shù)據(jù)挖掘應(yīng)用過程中,例如:銀行或者電子商務(wù),都是將其轉(zhuǎn)化為文字或者圖表的形式。但是,軟件開發(fā)者所需的信息并沒有如此簡單。其囊括了編程模板、缺陷定位等客戶信息。因此,這對數(shù)據(jù)挖掘技術(shù)提出了更高要求。
(3)數(shù)據(jù)挖掘結(jié)果評價標(biāo)準(zhǔn)不一
數(shù)據(jù)挖掘技術(shù)在很多行業(yè)都已經(jīng)廣泛應(yīng)用,并且,在結(jié)果表示以及評價標(biāo)準(zhǔn)制定等方面較為成熟,但是,在軟件工程數(shù)據(jù)挖掘領(lǐng)域卻不是這樣。軟件開發(fā)者需要獲取的信息不僅詳細而且極為復(fù)雜,同時,信息的表示方法也不盡相同,這樣一來,為信息對比增加了不小的難度,因此,很難對數(shù)據(jù)挖掘結(jié)果進行定量準(zhǔn)確分析。
3 軟件工程數(shù)據(jù)挖掘問題的解決方案(Solution of
software engineering data mining)
(1)數(shù)據(jù)復(fù)雜性解決方法
軟件工程數(shù)據(jù)的復(fù)雜性主要包括三方面:
a.數(shù)據(jù)的類型相對復(fù)雜。關(guān)于這一類型,目前一些學(xué)者提出可以從軟件程序的結(jié)構(gòu)圖以及文本數(shù)據(jù)等方面進行信息挖掘。
b.數(shù)據(jù)間聯(lián)系復(fù)雜。這一類型可以利用算法的改進,增強發(fā)現(xiàn)數(shù)據(jù)之間聯(lián)系能力來提升數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確程度,例如:社會網(wǎng)絡(luò)分析法比較適用于尚未存在大量研究工作的領(lǐng)域。
c.數(shù)據(jù)中存在噪音或缺失。這一類型可以采用類似于半監(jiān)督學(xué)習(xí)的方法以達到有效控制因數(shù)據(jù)缺失所帶來的不良影響程度。
總而言之,通過數(shù)據(jù)挖掘算法的不斷改進,能夠有效地解決數(shù)據(jù)復(fù)雜性問題。
(2)非傳統(tǒng)分析的解決方法
相對于文字、圖表等信息形式,軟件開發(fā)者往往更需要軟件使用范例。目前,很多研究成果會涉及到軟件使用例程以及編程規(guī)則等。同時,在軟件工程當(dāng)中,程序可視化作為一種信息表示方法正在逐漸成為趨勢,其與數(shù)據(jù)挖掘技術(shù)相結(jié)合,將會極大的滿足更多的非傳統(tǒng)分析需求。
(3)挖掘結(jié)果評估問題解決方法
傳統(tǒng)的評估體系很難在軟件工程數(shù)據(jù)挖掘中應(yīng)用。為了解決這一問題,一些研究者試圖利用缺陷檢測效果評估法進行挖掘數(shù)據(jù)評價,但是,這種方法有點以偏概全的嫌疑。還有一些學(xué)者采用用戶體驗評價方法,但是在用戶較少的情況下,結(jié)果評價的客觀性不足。軟件工程領(lǐng)域無論是理論研究還是實際應(yīng)用,其服務(wù)對象始終都是人,由此可見,軟件工程數(shù)據(jù)挖掘的結(jié)果評價方法會越來越貼近人類心理學(xué)以及管理學(xué)中的分析方法。 4 軟件工程數(shù)據(jù)挖掘的發(fā)展趨勢(Development
trend of software engineering data mining)
(1)基于現(xiàn)有問題,開法高性能挖掘算法
a.軟件工程數(shù)據(jù)的檢索由精確的關(guān)鍵詞檢索向模糊檢索、甚至不受格式限制的自然語言檢索發(fā)展,檢索返回的內(nèi)容從簡單的語句向完整的文檔發(fā)展。
b.缺陷檢測工具從僅能夠檢測缺陷的原因向更加復(fù)雜、范圍更加廣泛的缺陷發(fā)展。
c.用人類自然語言表達行為方法及軟件行為的模型將更加豐富,對應(yīng)的表達能力也會大幅度提升。
(2)提出更為復(fù)雜的問題及其解決方法
a.將研究基于數(shù)據(jù)挖掘技術(shù)的軟件結(jié)構(gòu)分析方法。
b.將研究軟件行為的評價方法和惡意軟件檢測方法。
c.通過數(shù)據(jù)挖掘方法定量分析、評估與預(yù)測軟件的穩(wěn)定性,從而指導(dǎo)軟件的開發(fā)和維護。
d.進一步發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系,綜合利用多方面的數(shù)據(jù)源進行挖掘。
(3)高效預(yù)處理,改進挖掘算法
研究更高效的數(shù)據(jù)預(yù)處理方法,最主要研究特征提取和數(shù)據(jù)降維方法;推進異構(gòu)數(shù)據(jù)的管理和整合技術(shù),如數(shù)據(jù)融合、數(shù)據(jù)空間等,以及分布式數(shù)據(jù)的并行處理技術(shù)。
(4)引入新的軟件工程理念,指導(dǎo)數(shù)據(jù)挖掘工作
隨著計算機網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,軟件開發(fā)工作逐漸呈現(xiàn)出了高效化、智能化,網(wǎng)絡(luò)化特征。這些更是成為軟件開發(fā)人以及數(shù)據(jù)的基本特征。正因為如此,軟件模塊的開發(fā)工作更加趨向于功能性以及可重用性。這樣發(fā)展趨勢勢必會導(dǎo)致軟件工程數(shù)據(jù)挖掘技術(shù)研究方向的改變。利用數(shù)據(jù)挖掘技術(shù)采集、整合網(wǎng)絡(luò)數(shù)據(jù),獲得信息的方法;以及利用數(shù)據(jù)挖掘工具設(shè)計軟件重用的規(guī)范和模式,以輔助可重用模塊的開發(fā)。
5 結(jié)論(Conclusion)
隨著計算機技術(shù)的快速發(fā)展,人們的生活也逐漸的進入到了網(wǎng)絡(luò)化時代。各種應(yīng)用軟件的開發(fā)速度之快令人震驚,而這也對軟件工程數(shù)據(jù)挖掘工作提出了更多、更高的要求。本文首先對軟件工程數(shù)據(jù)挖掘技術(shù)的相關(guān)概念進行分析,然后,對其遇到的挑戰(zhàn)和應(yīng)對措施進行探索,最后,研究其未來的發(fā)展趨勢。希望能夠為有關(guān)的研究工作者提供一些參考性的建議。
參考文獻(References)
[1] 毛澄映,盧炎生,胡小華.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用
綜述[J].計算機科學(xué),2009(05):1-6.
[2] 李新,張曉靜,米燕濤.軟件開發(fā)過程中的數(shù)據(jù)挖掘[J].石家莊
職業(yè)技術(shù)學(xué)院學(xué)報,2007(02):31-33.
[3] 趙志升,羅德林,李海英.數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].河北北方學(xué)
院學(xué)報(自然科學(xué)版),2006(06):63-66.
作者簡介:
孫黎明(1980-),男,碩士,講師.研究領(lǐng)域:軟件工程,圖像
處理.
軟件工程論文發(fā)表期刊推薦《機器人》設(shè)有論文與報告、綜論與介紹、研究通訊、短文等欄目,主要報道中國在機器人學(xué)及相關(guān)領(lǐng)域中的學(xué)術(shù)進展及研究成果,機器人在一、二、三產(chǎn)業(yè)中的應(yīng)用實例,發(fā)表機器人控制、機構(gòu)學(xué)、傳感器技術(shù)、機器智能與模式識別、機器視覺等方面的論文。
文章標(biāo)題:軟件工程論文范文探索軟件工程數(shù)據(jù)挖掘技術(shù)
轉(zhuǎn)載請注明來自:http://www.56st48f.cn/fblw/dianxin/wangluo/26920.html
攝影藝術(shù)領(lǐng)域AHCI期刊推薦《Phot...關(guān)注:105
Nature旗下多學(xué)科子刊Nature Com...關(guān)注:152
中小學(xué)教師值得了解,這些教育學(xué)...關(guān)注:47
2025年寫管理學(xué)論文可以用的19個...關(guān)注:192
測繪領(lǐng)域科技核心期刊選擇 輕松拿...關(guān)注:64
及時開論文檢索證明很重要關(guān)注:52
中國水產(chǎn)科學(xué)期刊是核心期刊嗎關(guān)注:54
國際出書需要了解的問題解答關(guān)注:58
合著出書能否評職稱?關(guān)注:48
電信學(xué)有哪些可投稿的SCI期刊,值...關(guān)注:66
通信工程行業(yè)論文選題關(guān)注:73
SCIE、ESCI、SSCI和AHCI期刊目錄...關(guān)注:120
評職稱發(fā)論文好還是出書好關(guān)注:68
復(fù)印報刊資料重要轉(zhuǎn)載來源期刊(...關(guān)注:51
英文期刊審稿常見的論文狀態(tài)及其...關(guān)注:69
Web of Science 核心合集期刊評估...關(guān)注:58
電子信息論文范文
智能科學(xué)技術(shù)論文 廣播電視論文 光電技術(shù)論文 計算機信息管理論文 計算機網(wǎng)絡(luò)論文 計算機應(yīng)用論文 通信論文 信息安全論文 微電子應(yīng)用論文 電子技術(shù)論文 生物醫(yī)學(xué)工程論文 軟件開發(fā)論文
期刊百科問答
copyright © www.56st48f.cn, All Rights Reserved
搜論文知識網(wǎng) 冀ICP備15021333號-3