所屬欄目:科技期刊 熱度: 時間:
數據分析與知識發現
關注()《數據分析與知識發現》雜志簡介
《數據分析與知識發現》(月刊)創刊于1985年,是中國科學院主管、中國科學院文獻情報中心主辦的計算機信息管理技術方面的學術性刊物,是國內唯一一份被中國圖書館學會和中國科技情報學會共同推薦的專業技術類核心期刊?镌O有“數字圖書館”、“知識組織與知識管理”、“情報分析與研究技術”、“應用實踐”、“動態”等一系列固定類欄目以及“特邀專欄”、“企業技術之窗”等不定期欄目。
《數據分析與知識發現》內容定位于廣泛吸納計算機科學、數據科學、情報科學以及數字科研、數字教育和數字文化等領域的技術與方法,研究數據驅動的語義計算、內容分析、數據挖掘、知識發現、智能管理和決策支持等方面的技術、方法、系統以及支撐設施、政策與機制等,尤其是聚焦從海量、異構、分布、動態、甚至富媒體數據中挖掘和發現知識以支持研究、管理和決策的理論、方法和技術。
《數據分析與知識發現》辦刊宗旨是聚焦各行各業中以大數據為基礎,依靠復雜挖掘分析方法,進行知識發現與預測、支持決策分析和政策制定的研究與應用,致力于提供理論指導、技術支持和最佳實踐。
《數據分析與知識發現》欄目設置
數學圖書館、知識組織與知識管理、情報分析與研究、應用實踐、動態、特邀專欄、金融證券管理、企業信息管理技術
《數據分析與知識發現》雜志榮譽
CSSCI 南大核心期刊(中文社會科學引文索引)(含擴展版)萬方收錄(中)上海圖書館館藏國家圖書館館藏知網收錄(中)維普收錄(中)中國期刊全文數據庫(CJFD)中國核心期刊遴選數據庫
2018年《數據分析與知識發現》雜志08期投稿論文目錄:
基于t-SNE降維的科學基金資助項目可視化方法研究陳挺;李國鵬;王小梅;
基于BRFSS數據庫應用人工神經網絡構建兒童哮喘預測模型馬曉宇;張晗;趙玉虹;
新一代知識問答平臺中提問者付費意愿的影響因素探究趙宇翔;劉周穎;宋士杰;
基于預警平臺大數據的事件旅游客流時空分布研究王玲;代前進;吳曉雋;
面向微博短文本分類的文本向量化方法比較研究李心蕾;王昊;劉小敏;鄧三鴻;
基于LDA和AdaBoost多特征組合的微博情感分析曾子明;楊倩雯;
基于領域本體的產品網絡口碑信息多層次細粒度情感挖掘何有世;何述芳;
跨設備搜索中設備轉移前后查詢式語義變化研究吳丹;陸柳杏;
等待感知對于移動信息產品用戶滿意度的影響研究——以數字小說書架為例馬艷陽;劉玉磊;徐伯初;支錦亦;
收錄論文:面向微博短文本分類的文本向量化方法比較研究
【摘要】:【目的】利用Word2Vec和Sent2Vec算法生成新浪微博的文本的向量化表示形式,以期在文本分類時獲得較低的計算成本和較高的分類效果!痉椒ā渴褂梦谋局性~的0-1矩陣進行分類,將分類效果作為基準線;采用Word2Vec算法生成詞向量并用不同方式合成句子的向量表示,進行文本分類,并與基準線進行對比;利用Sent2Vec算法直接生成句子向量進行分類,綜合評價3種方法的優缺點。【結果】研究顯示使用Word2Vec算法和Sent2Vec算法能夠極大程度上壓縮文本特征,對比于使用所有3萬多個詞作為特征,Word2Vec算法和Sent2Vec算法將特征數壓縮在1 000以內。在分類準確率方面,Word2Vec算法的分類準確率比基準線低約3%,準確率為75.14%。Sent2Vec算法的分類效果遠不如其他兩種方法,準確率只有63.08%。【局限】由于語料有限,Word2Vec算法在計算詞向量時可能缺少足夠的語義信息,導致詞向量的準確性不高,而Sent2Vec算法在中文文本語境下生成句向量的分類結果較差。【結論】Word2Vec算法更適用大規模語料文本分類,在文本量較少時應使用詞為特征分類。
數據分析與知識發現最新期刊目錄
多維細粒度政策知識圖譜構建方法————作者:趙雅潔;馮凌子;袁軍鵬;王立學;
摘要:[目的]政策蘊含豐富的信息資源,加強政策知識圖譜頂層設計,構建適配領域特性的通用政策知識圖譜,可將碎片化政策信息進行高效融合、共享和利用。[方法]運用解構主義觀點,融合對齊多理論與政策要素定位,實現多維度政策知識表示,形成模式層;結合網絡獲取、索引匹配、全文解析、實體識別與文本分類模型,設計細粒度知識要素抽取方法,獲取數據層;利用Neo4j圖數據庫實現知識存儲,可視化形成知識圖譜。[結果]最終構建...
關鍵核心技術識別的研究進展————作者:仵軒;李廣建;潘佳立;
摘要:【目的】對關鍵核心技術識別相關成果進行系統綜述,厘清其研究重點與發展脈絡,以期為后續研究提供參考。【文獻范圍】基于關鍵核心技術的系統分析制定檢索式,在Web of Science和CNKI數據庫中進行文獻檢索,獲取661篇論文進行定量分析,經人工篩選得到60篇代表性文獻進行綜述。【方法】首先,歸納關鍵核心技術的概念特點及檢索策略以明晰綜述范圍;其次,分析關鍵核心技術的特征體系及識別標準以厘清研究思...
用于隱私政策合規性分析的知識融入提示學習方法————作者:李非燕;曹詩權;蘇宇;
摘要:【目的】在數字化轉型和移動互聯網快速發展的背景下,隱私政策合規性分析已成為關鍵議題。以往的自動化分析方法主要關注隱私政策的完整性,忽略了分析隱私政策的一致性。同時,這些方法需要大量的標注樣本,限制了其使用場景。本文致力于提出一種兼顧完整性和一致性、且不需要標注樣本的自動化隱私政策合規性分析方法!痉椒ā渴紫龋鶕秱人信息保護法》等相關法規標準,從完整性和一致性兩個角度構建了隱私政策合規性評價體系...
融合時態信息和圖結構動態演化的知識圖譜補全模型研究————作者:張強;高穎;任豆豆;馬志遠;周洪;陶皖;
摘要:[目的]知識圖譜內蘊含海量的元組數據,且蘊含時態信息的知識圖譜可將隨時間變化的事實進行有效保留及使用。探究時態知識圖譜補全任務對圖譜內動態數據的完備性及其下游應用的發展有著重要意義。[方法]針對當前多數方法將時態知識圖譜視為離散數據,無法準確反應事物與時間信息的關系,忽略了局部圖結構演化與形成過程,以及全局圖結構演化所代表的圖譜連續形成模式。本文設計了如下流程:針對局部結構捕獲,提出基于表示強化的...
基于集成學習與半監督學習的突發事件識別研究————作者:田甜俊子;朱學芳;
摘要:[目的]緩解應急管理中高領域適配性標注數據稀缺的現狀,提高事件識別效果。[方法]研究基于集成學習與半監督學習提出一個持續自動標注學習機制,并結合實體識別、共現網絡分析、情感分析等技術實現一個突發事件識別系統。[結果]持續自動標注學習機制能夠使用全量數據的20%~35%達到與全量數據相當甚至更好的識別效果。[局限]當前研究收集的數據來源于中國新聞網單一網站,且注重對已有情報的挖掘,在豐富數據來源、應...
基于多模態橋連接的社交媒體多標簽情感分析————作者:于玉海;邢志琦;孟佳娜;高臨霖;王博林;
摘要:[目的]在互聯網迅速普及的時代,人們可以在數字平臺上以多種形式表達自己的情感,多模態情感分析已成為研究熱點,其研究結果將為情感分析提供有力支持。[方法]首先提取單模態的特有特征和多模態的共有特征,然后使用跨模態橋連接實現多模態融合,最后引入多頭自注意力機制進行多標簽預測,有效捕捉不同情緒標簽之間的共現關系。[結果]在CMU-MOSEI數據集上的實驗結果表明,本文模型在不同參數和對比實驗中,相比于基...
面向問題域的方法知識創新路徑識別研究——以計算語言學領域為例————作者:毛進;梁瑜萱;
摘要:[目的]通過厘清領域的研究問題、識別領域研究方法的創新路徑,幫助掌握領域發展的重點方向和領域內方法創新的演化脈絡。[方法]本文首先提出方法創新知識表示模型,利用SciBERT-BiLSTM-CRF模型識別論文全文中的問題知識與方法知識;然后根據共現關系分別構建領域問題網絡和方法創新網絡;最后使用社區發現算法對領域問題網絡進行子類劃分,并采用網絡全局搜索提取面向問題域的方法知識創新主路徑。[結果]從...
大模型主旨增強的圖文多模態句子摘要生成方法————作者:張樂;許央科;陳巖松;張雷瀚;
摘要:[目的] 運用圖文信息進行摘要生成的過程中,針對圖文信息不完全和參考摘要相關,直接融合導致噪聲信息引入的問題,提出一種大模型主旨增強的圖文多模態句子摘要生成方法。 [方法] 對大語言模型進行微調以生成高質量的主旨和關鍵詞信息,運用注意力機制有效地融合主旨和圖片信息以減少多模態特征內存在的噪聲信息;將原文本和關鍵詞進行融合以獲得增強主旨信息的多模態語義補充特征,最后融合兩種特征生成多模態摘要。 ...
基于隱喻信息和指令調優的心理疾病檢測————作者:張冬瑜;莊沐霖;靳森源;劉馨月;
摘要:[目的] 針對目前大量心理疾病檢測研究未能充分考慮到隱喻性信息在疾病識別過程中的關鍵作用,提出一種基于隱喻信息和指令調優的心理疾病監測方法。[方法] 該方法的核心在于通過隱喻識別技術引入隱喻信息,這包括對隱喻的使用頻率和隱喻中的實體間關聯性進行分析。此外,利用大語言模型捕捉癥狀和情緒信息,并整合這些特征,構建了指令集,對模型進行有效訓練。[結果] 本文模型在Twitter-Depression和M...
基于視覺線索學習的多模態命名實體識別————作者:白宇;王連吉;劉翔;袁金福;張桂平;
摘要:[目的]為提高多模態命名實體識別的效果,本文通過計算實體錨文本與圖像區域的語義相關性來過濾不相關視覺區域,達到消除視覺噪聲的目的。[方法]使用提示詞代替類別詞作為實體錨文本對視覺區域進行語義相關性評估,通過降低無關視覺區域的權重來消除無關視覺區域對實體識別的影響,采用多層交互式Transformer進行文本-視覺的模態融合,并通過CRF層實現實體識別。[結果]在公開數據基準上的實驗結果表明,本文方...
融合社交關系的流行度偏好感知序列推薦方法————作者:吳亦凡;馬崧捷;李樹青;
摘要:[目的]感知用戶個人及其好友對流行度處于某一階段的商品產生的偏好,實現更準確的推薦。[方法]首先計算融合貢獻度和影響力的項目流行度,使用注意力機制和循環神經網絡捕捉個人的流行度偏好表征,并使用卷積網絡和圖注意力機制獲得好友的長短期流行度偏好。[結果]在Douban數據集、Deliciouse數據集、Yelp數據集上進行了對比實驗,本模型的評價指標均優于次優模型DGRec。Recall@20最高提升...
短視頻廣告觀眾參與影響因素研究————作者:張治鵬;張李義;
摘要:[目的]以短視頻廣告的觀眾屬性為視角,提取觀眾的心理屬性和人口統計屬性變量,探索其對觀眾參與的影響。[方法]以自我效能理論為基礎,利用數據挖掘和深度學習方法構造觀眾心理屬性和人口統計屬性變量,通過多元回歸模型分析這些變量對觀眾參與的影響以及產品類型的調節作用。[結果]觀眾對廣告披露感知、消極熱評占比、女性占比以及Z世代、中間年齡層和中老年觀眾占比對觀眾參與均有不同程度的影響;產品類型對主效應均有調...
基于度量學習的人工智能專利應用領域識別————作者:溫曉波;化柏林;
摘要:[目的]對人工智能專利中所涉及到的應用領域進行識別。[方法]在度量學習的框架下,使用基于BERT的雙編碼器分別對專利文本與應用領域標注文本進行編碼并聯合優化,獲取能表征人工智能專利應用領域的編碼結果以完成識別任務。[結果]在人工智能專利應用領域多分類測試中達到了0.947的準確度,在人工智能專利應用識別中獲得了輪廓系數為0.36的多層級聚類體系。[局限]盡管質量中等的標注數據可以通過大語言模型獲取...
基于多視角融合表示的多模態方面級情感分析模型————作者:曹銀妮;韓虎;黃明偉;劉金德;
摘要:[目的]為減小跨模態語義鴻溝,并增強與方面相關的圖像特征提取,本文從全局與局部視角獲取細粒度的跨模態情感表達,提出一種多視角融合表示的多模態方面級情感分析模型。 [方法]首先,從全局視角出發對文本與圖像描述進行聯合編碼,并結合多頭自注意力機制捕捉跨模態全局語義特征。其次,從局部視角出發構建兩個圖結構挖掘文本和圖像的細粒度情感信息。通過文本圖結構引入語法依賴圖增強文本語法特征提取。在融合圖結構中,...
融合提示工程與圖卷積網絡的機構名稱對齊研究————作者:王茜;方安;婁培;楊雨生;王蕾;
摘要:[目的]提出一種面向科技文獻的機構名稱對齊方法。[方法]利用大語言模型結合提示工程,從科技文獻著錄信息中識別機構及其相關實體并構建機構知識圖譜,通過文本嵌入和圖卷積網絡,基于構建的知識圖譜實現不同表述形式的同一機構名稱對齊。[結果]與直接通過文本對齊的方法性能相比,在不需要額外訓練的情況下機構名稱對齊效果Hit@1,Hit@10和MRR分別提升24%,7%和12%。[局限]處理復雜信息結構文本中的...
基于圖神經網絡的學科交叉文獻識別方法————作者:馮嶺;潘云濤;
摘要:[目的]識別數據集中的學科交叉文獻,以準確地把握學科交叉的前沿動態。[方法]提出了一種基于圖神經網絡的學科交叉文獻識別方法,通過選取的代表性文獻,訓練基于圖神經網絡的多標簽分類模型,以用于學科交叉文獻的識別。[結果]在僅標注了5%的文獻作為代表性文獻的條件下,所提出方法在整個數據集上的學科交叉文獻識別的AUC值最高達到了0.843。[局限]對于多學科交叉文獻的識別問題,還需要對提出的方法進行改進;...
基于集成學習的顛覆性技術早期識別研究——以量子計算領域為例————作者:趙一鳴;劉順生;呂璐成;
摘要:[目的]通過分析關鍵技術領域下的專利數據,對具備高顛覆性潛力的技術專利進行早期識別。[方法]基于技術生命周期理論搭建顛覆性技術早期識別指標體系,以智慧芽專利數據庫中量子計算領域的專利數據作為研究對象,搭建集成學習模型對該領域具有高顛覆性潛力的技術專利進行早期識別。[結果]通過BERTopic主題建?蚣馨l現五個相關顛覆性研究方向:量子加密技術、量子處理器、超導量子比特、半導體技術與量子神經網絡,驗...
大語言模型場景下個人數據定價研究——基于隱私補償的方法————作者:劉曉慧;陶成煦;許葳;吳江;
摘要:[目的] 為大語言模型場景下的個人數據定價提供一種量化隱私損失、補償隱私價值的方法。[方法] 基于前提假設,結合差分隱私,以方向統計學為基礎,提出一種能夠評估數據隱私值并量化數據價值的方法,并利用SST-2數據集對方法進行評估。[結果] 在隱私參數與準確率、預算與準確率的關系方面,隨著隱私參數的增加,或者預算的增加,模型準確率均會增加,證明了方法的有效性。[局限] 數據集和模型架構的選擇較為單一;...
6D姿態數據集為機器人抓取性能設定新標準————作者:本刊訊;
摘要:<正>近日,日本芝浦工業大學的研究人員開發了一種新穎的6D姿態數據集,該數據集整合了RGB圖像和深度圖像,填補了機器人抓取和自動化研究中的一個重大空白,能夠提升機器人在動態環境中執行抓取和放置任務的精確性。準確的目標姿態估計,即機器人確定目標位置和方向的能力對于機器人技術至關重要,尤其是在制造業和物流等行業的抓取和放置任務中
研究發現大型語言模型以一般性方式推理多樣化數據————作者:本刊訊;
摘要:<正>早期的語言模型只能處理文本,而如今的大型語言模型(LLMs)能夠在不同類型的數據上執行高度多樣化的任務,如理解多種語言、生成計算機代碼、解決數學問題。近日,麻省理工學院的研究人員探究了LLMs的內部工作機制,試圖更好地理解其數據處理機制,是否與人腦存在相似之處
相關科技期刊推薦
核心期刊推薦
copyright © www.56st48f.cn, All Rights Reserved
搜論文知識網 冀ICP備15021333號-3