所屬欄目:高等教育論文 發布日期:2011-01-20 17:13 熱度:
摘要:隨著手機的多樣化發展以及在人群中迅速普及,使手機領域知識涉及到的學科知識多、知識量大,如何使這些知識共享和重用,目前仍是一個重大的挑戰,通過構建手機領域本體庫來解決這一問題。本文首先給出領域(移動電話)知識獲取及管理的需求分析,然后分析了現有的本體構建方法體系及工具,最后通過屬性獲取算法得到一個上下位關系的概念體系。手機領域知識庫的構建不僅提高手機領域的廣大參與者對手機領域知識獲取的效率和可靠性,而且也為本體知識在實踐領域的應用奠定堅實的基礎。
關鍵詞:本體,知識庫,手機,檢索
1.引言
手機作為一種科技產品它有著更新換代快的特點,導致形形色色的手機種類越來越多,也就是手機領域知識量不斷擴大,這給手機設計者和維修者帶來了一定困難,也給手機購買者在這樣龐大的手機種類當中難以選擇。同時現有網絡上有很多介紹手機參數的網站,但有的只籠統的簡單介紹手機的部分屬性,有的對手機的功能分類十分粗糙,有的對手機同一屬性卻冠以不同的名稱,知識的管理缺乏科學性。
為了解決這一系列困難,我們必須構建手機領域本體庫使這些知識共享和重用,給手機設計者和維修者提供工業設計的全面知識,提高他們的工作效率,也使手機購買者能夠在該本體庫的導購基礎上僅需最短時間就可選擇一款合心意的手機,同時也可作為各大手機門戶網站的有力支撐。本體庫的構建本身也是語義WEB的重要基礎和必要組成部分,基于手機領域本體庫的共享和重用的特點,其他研究者也可以使用筆者創建好的本體庫進行研究。
2.相關工作
2.1.構建本體的方法體系
當前典型的本體構建方法都是從具體的本體構建項目中總結經驗而獲得的。盡管在實際應用階段已經利用了本體,但是本體的構建并沒有固定的模式。最早出現的是1995年根據企業本體(EnterpriseOntology)和TOVE本體的開發過程獲得的經驗總結,此后,陸續出現了一些新的本體構建方法。下面介紹的本體構建方法已經得到大家認可的經典方法。
骨架法[1],也稱為EO工程法,是Uschold和King在1995年開發EO(EnterpriseOntology,關于企業建模過程的本體,是相關商業企業間術語和定義的集合)中的經驗總結,它提出了一種本體開發的具體步驟,其基本流程如圖1所示:
圖1骨架法(EO工程法)的本體構建基本流程
TOVE法[2],是Grüninger和Fox等開發TOVE工程本體的經驗總結。這種方法先建立本體的非形式化描述說明,然后將這種描述形式化。Meth方法[3]由馬德里技術大學(PolytechnicUniversityofMadrid,UPM)工藝分校開發人工智能圖書館使用。采用Meth方法開發的本體有(Onto)Agent[4]:基于本體的WWW代理,關于本體使用參考本體作為知識源進行一定約束條件的重新知識獲取。該方法[5]是斯坦福大學醫學院提出的基于Protégé本體構建工具的一種領域本體構建方法。
其他的本體方法體系還包括KACTUS工程法[6]、IDEF5法[7]、AFM法(Activity-FirstMethod)[8]等。
2.2.構建本體的常用開發工具
OntoEdit[9]是基于On-To-Knowledge項目(該項目起源于KADS工程)的本體構建方法。在本體精煉階段則需要開發者使用編輯器精煉本體結構和概念及關系的定義。OntoEdit以F-Logic作為其推理引擎,用于在本體精煉和評價階段處理公理。
WebODE[10]是西班牙馬德里技術大學開發的一個綜合性的本體建模工具,它集成了本體開發過程中的大多數行為,支持METHONTOLOGY本體構建方法論。KAON[11]是德國Karlsruhe大學編制的一套用于語義網和本體研究的工具,包含各種模塊用于本體的構建、存儲、檢索、維護以及應用,它是當前比較好的本體構建和維護工具之一。
Protégé[12]是斯坦福大學為知識獲取而開發的一個工具,主要應用于知識的獲取以及現存本體合并和排列,可以免費下載并公開源代碼,再加上其支持中文,Protégé已經成為目前國內使用最為廣泛的本體編輯工具和基于知識的框架。
3面向手機網站的知識獲取
分析網站的結構,網站中需要的信息都是在一個表格中,因此在提取時,根據關鍵字可以提取出信息。關鍵字為:手機類型、操作系統、上市日期、硬件系統、基本配置、屏幕、網絡頻率、外觀設計、產品尺寸、產品天線、視頻播放、音樂播放、攝像功能描述、攝像頭、藍牙功能、數據線接口、內容容量、Wi-Fi功能、情景模式、待機圖片、鬧鐘功能、日歷功能、計算器、無線數據、日程表、其它功能。
針對專業手機網站,網頁的標題也是手機的型號,從這里可以提取到根,而下面的屬性是它的孩子,屬性的值又可以作為屬性的孩子,因此一個頁面就可以形成一棵樹。每一顆樹代表了一個一個手機也是一個頁面。而這棵樹的形式可以用這樣的二元關系來表示,(手機類型、只能)(手機類型、音樂手機)(無線數據,GPRS)(無線數據,EDGE)(產品尺寸,59*108*12毫米)(外觀設計,直板)。
為了實現這個功能,只要把獲得的文本信息與關鍵字匹配,再將緊隨其后的字符作為它的值就可以實現。其流程如下:將文本中的字符串按照空格分割為多個字符串,將這些字符串與關鍵字匹配,如果匹配成功,則將后面緊跟隨的字符串保存到achieve.txt文檔中。其中關鍵字的選擇有賴于網頁文本,例如上面的例子,其中的關鍵字有:手機類型、操作系統、上市日期、硬件系統、基本配置、屏幕、主屏尺寸、屏幕材質、主屏參數、手機制式、支持頻段、外觀設計、產品尺寸、產品天線、視頻播放、音樂播放、攝像頭、攝像頭、拍照功能描述、攝像頭像素、數據功能、藍牙功能、數據線接口、內存容量、情景模式、待機圖片、鬧鐘功能、日歷功能、計算器、無線數據等,這些關鍵字可由程序讀入或刪除并以一定的格式保存在key.txt文檔中。當匹配完成時,能夠實現將二元組輸出。
屬性關系的表達
針對大量的Web頁面,提取所需文本信息。采用字符串處理方式提取包含“是一種”和“是一類”特征詞的上下位概念。提取出的文本特定信息存儲在一起,完成文本特定信息的提取過程。從提取出的特定信息中,得到用戶感興趣的特定文本,最終用于表達屬性的上下位關系。
以手機屬性為例,在網絡上下載大量的有關手機的Web頁面,然后分析網頁上文本的上下位關系,提取出“是一個”和“是一種”的特征詞的句子。
1、摩托羅拉L7是一種于2005年12月上市的手機。
在上面的一段文本中,手機屬性是上位概念,摩托羅拉、L7、2005年12月是下位概念。
2、XX手機是一種有拍照、音樂播放、視頻播放、游戲這些娛樂功能,支持藍牙、數據接口的數據功能。
在上面的一段文本中,手機屬性是上位概念,娛樂功能、數據功能是下位概念,而拍照、音樂播放、視頻播放、游戲是娛樂功能的下位概念;藍牙、數據接口是數據功能的下位概念,如圖2所示。
圖2:手機屬性上下位關系圖
3、作為一款全能型的商務機型,網絡配置也是不可或缺的一部分,所以其在無線網絡功能方面表現的也應當是非常出色的,除了可以提供高速下載速率的PHS網絡之外,該機還支持WLAN(IEEE802.11b/g)無線局域網功能,并且在支持藍牙V2.0的基礎上還提供了對IrSS高速紅外功能的支持。此外,該機這次還內置Gmail及Yahoo郵箱,支持Flash3.0播放,同時裝載的全能瀏覽器可以在使用OperaMobile9.5和InternetExplorer網頁時可實現上下卷動及觸摸變焦功能。
在上面一段文本中,網絡配置是上位的關系,提供高速下載速率的PHS網絡、WLAN(IEEE802.11b/g)無線局域網、藍牙V2.0、IrSS高速紅外功能、內置Gmail及Yahoo郵箱、裝載的全能瀏覽器是下位的關系,如圖3所示。
圖3:網絡配置上下位關系圖 圖4:手機屬性上下位關系圖
4、這款夏普WS020SH在其它娛樂功能的配置上卻變成了"非主流",尤其是在攝像頭的配置上,在現在這個500萬像素滿天飛的時代,這款產品依然配備了一枚200萬像素的攝像頭,雖然支持自動對焦,但像素數決定了這款手機的成像質量。而為商務人士量身定制的功能有QC編碼和名片識別功能,支持ExcelMobile、OneNoteMobile、PowerPointMobile、WordMobile、WindowsMediaPlayer10Mobile等等等等,可以說是一應俱全了。
在上面一段文本中,娛樂功能是上位關系,200萬像素的攝像頭、QC編碼、名片識別是下位關系。
5、夏普WS020SH的尺寸為50×116×17.9毫米,重135克。在配備標準電池的情況下,手機可獲得420小時的待機時間和6小時的連續通話時間。除此之外其為用戶提供黑×金、黑×螢光綠、黑×桃紅等三種機身色彩選擇,并預計于6月上市,建議空機零售價格為63120日元,約合人民幣4288元左右。假如夏普把WS020SH改一下網絡制式,讓它兼容WCDMA/GSM,并且把攝像頭索性弄到500萬像素再拿到全球市場上去賣,不知道索尼愛立信的X1屆時會怎么樣?
手機屬性是上位關系,尺寸、重量、色彩、待機時間和通話時間、售價是下位關系。等等許多的例子提取出許多的上下位關系如圖4所示。
根據算法的實驗,整合提取的大量信息,合理的處理上下位關系圖,得到一張手機參數的上下位關系圖。
圖5:手機各種屬性上下位關系總結圖
從表上可以看出手機的各種上下位關系可以整合在一起。得到最終的上下位關系圖:手機屬性是上位,則型號、廠商、價格等等就是下位;娛樂功能是上位,則拍照、音樂、網絡功能則是下位;網絡功能是上位,則郵件、瀏覽器、WLAN功能等就是下位。
4結束語
本文從手機知識領域擁有涉及手機種類繁多、知識量大的特點的角度出發,探討了手機制造者、使用者、維修者對于手機領域知識的高效可靠提取的需求,提出了需要通過本體方法論構建可重用和可共享的手機知識庫來滿足他們的要求。同時,給出了一種手機領域知識的上下位關系獲取與表示方法。
然而由于不同本體構建者所表示的本體知識庫只是分散的或異質的,為了使不同構建者對于相同領域能夠表示成正確的統一的全面的知識庫,需要做本體推理和本體集成等方面的工作,本體映射作為本體集成的基礎,這些都是今后的進一步研究方向。 期刊論文
文章標題:一種領域知識獲取與管理方法
轉載請注明來自:http://www.56st48f.cn/fblw/jiaoyu/gaodeng/6562.html
攝影藝術領域AHCI期刊推薦《Phot...關注:106
Nature旗下多學科子刊Nature Com...關注:152
中小學教師值得了解,這些教育學...關注:47
2025年寫管理學論文可以用的19個...關注:192
測繪領域科技核心期刊選擇 輕松拿...關注:64
及時開論文檢索證明很重要關注:52
中國水產科學期刊是核心期刊嗎關注:54
國際出書需要了解的問題解答關注:58
合著出書能否評職稱?關注:48
電信學有哪些可投稿的SCI期刊,值...關注:66
通信工程行業論文選題關注:73
SCIE、ESCI、SSCI和AHCI期刊目錄...關注:121
評職稱發論文好還是出書好關注:68
復印報刊資料重要轉載來源期刊(...關注:51
英文期刊審稿常見的論文狀態及其...關注:69
教育論文范文
教育技術論文 特殊教育論文 影視教育論文 藝術教育論文 體育科學教育論文 人文教育論文 成人教育論文 職業教育論文 教育學論文 學前教育論文 小學教育論文 中學教育論文 初等教育論文 高等教育論文 天文學論文 數學論文 物理論文 化學論文
SCI期刊分析
copyright © www.56st48f.cn, All Rights Reserved
搜論文知識網 冀ICP備15021333號-3