HOME 首頁
SERVICE 服務產(chǎn)品
XINMEITI 新媒體代運營
CASE 服務案例
NEWS 熱點資訊
ABOUT 關(guān)于我們
CONTACT 聯(lián)系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    數(shù)據(jù)挖掘與知識發(fā)現(xiàn)期刊(數(shù)據(jù)挖掘,雜志)

    發(fā)布時間:2023-04-19 05:44:36     稿源: 創(chuàng)意嶺    閱讀: 66        

    大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于數(shù)據(jù)挖掘與知識發(fā)現(xiàn)期刊的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。

    開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等

    只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端

    官網(wǎng):https://ai.de1919.com

    創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務請撥打電話175-8598-2043,或添加微信:1454722008

    本文目錄:

    數(shù)據(jù)挖掘與知識發(fā)現(xiàn)期刊(數(shù)據(jù)挖掘,雜志)

    一、50個數(shù)據(jù)挖掘?qū)W習資源網(wǎng)站 收藏!

    來自經(jīng)管之家(原人大經(jīng)濟論壇)

    經(jīng)管之家(原人大經(jīng)濟論壇)的會員小伙伴吐血整理了自己在學習數(shù)據(jù)分析和數(shù)據(jù)外加過程中常用的國內(nèi)外數(shù)據(jù)資源平臺,在教程學習之外更能開闊視野,對自己的學習大有裨益。趕緊拿回去搜藏吧!有些網(wǎng)站可能需要翻墻哦~

    知識型企業(yè)研究中心

    http://business.queensu.ca/index.php

    英國謝菲爾德大學自然語言處理研究組

    http://nlp.shef.ac.uk/

    PCAI

    http://www.pcai.com/

    美國印地安那大學人工智能/認知科學報告和再版文件匯編

    http://www.cs.indiana.edu/%7eleake/INDEX.html

    美國橡樹嶺國家實驗室圖像處理和機器視覺研究小組

    http://www.ornl.gov/sci/ismv/

    人工智能研究者俱樂部

    http://www.souwu.com/

    DFKI人工智能研究所

    http://www.dfki.uni-kl.de/

    數(shù)據(jù)管理前言技術(shù)國際研討會(中國,上海,2006)

    http://www.iipl.fudan.edu.cn/DM06/index.htm

    媒體計算與WEB智能實驗室(復旦大學)

    http://www.cs.fudan.edu.cn/mcwil/irnlp/

    奧地利人工智能研究所機器學習和數(shù)據(jù)挖掘小組

    http://www.oefai.at/oefai/ml/mldm/

    加拿大渥太華大學知識獲取與智能化學習研究小組

    http://www.site.uottawa.ca/tanka/kaml.html

    美國麻省理工大學生物與計算學習研究中心

    http://cbcl.mit.edu/

    德國烏爾姆大學人工神經(jīng)網(wǎng)絡小組

    http://www.informatik.uni-ulm.de/ni/forschung/ann.html

    優(yōu)秀知識發(fā)現(xiàn)網(wǎng)絡

    http://www.kdnet.org/

    奧地利維也納醫(yī)科大學腦研究中心醫(yī)學控制和人工智能學院

    http://www.ai.univie.ac.at/

    美國伍斯特工學院人工智能研究小組

    http://www.cs.wpi.edu/Research/airg/

    微軟研究-機器學習和應用統(tǒng)計研究小組

    http://research.microsoft.com/research/mlas/

    英國愛丁堡大學信息學校人工智能應用學院

    http://www.aiai.ed.ac.uk/

    北京大學計算語言學研究所

    http://www.icl.pku.edu.cn/

    哈爾濱工業(yè)大學智能技術(shù)與自然語言處理實驗室

    http://www.insun.hit.edu.cn/default_cn.asp

    加州大學伊榮/爾灣分校機器學習小組

    http://www.ics.uci.edu/~mlearn/Machine-Learning.html

    DMI:數(shù)據(jù)挖掘?qū)W院

    http://www.cs.wisc.edu/dmi/

    數(shù)據(jù)挖掘:原理,算法及應用

    http://www.cs.unc.edu/Courses/comp290-90-f04/

    國家數(shù)據(jù)挖掘中心

    http://www.ncdm.uic.edu/

    IBM智能情報系統(tǒng)研究中心

    http://www.almaden.ibm.com/software/disciplines/iis/

    清華大學知識工程研究室

    http://keg.cs.tsinghua.edu.cn/

    數(shù)據(jù)挖掘和數(shù)據(jù)倉庫

    http://www.crm2day.com/data_mining/

    數(shù)據(jù)挖掘課程

    http://cs.nju.edu.cn/zhouzh/zhouzh.files/course/dm.htm

    人工智能研究實驗室

    http://www.cs.iastate.edu/~honavar/aigroup.html

    美國人工智能協(xié)會

    http://www.aaai.org/home.html

    知識媒體學會

    http://kmi.open.ac.uk/index.cfm

    WEB數(shù)據(jù)挖掘?qū)嶒炇?/p>

    http://www.wdmlab.cn/

    中國科大博納數(shù)據(jù)挖掘中心

    http://bona.ustc.edu.cn/

    西南財經(jīng)大學商務數(shù)據(jù)挖掘中心

    http://riem.swufe.edu.cn/dataminingcenter/

    國際數(shù)據(jù)挖掘技術(shù)研究中心

    http://59.77.6.145/dmlab/DesktopDefault.aspx

    互聯(lián)網(wǎng)數(shù)據(jù)挖掘服務中心

    http://idm.yatio.com/index.html

    中科院數(shù)據(jù)技術(shù)與知識經(jīng)濟研究中心

    http://www.dtke.ac.cn/

    機器學習研究室

    http://www.cald.cs.cmu.edu/

    數(shù)據(jù)挖掘工程小組

    http://www.chem-eng.utoronto.ca/~datamining/

    查爾斯頓學院的信息發(fā)現(xiàn)

    http://di.cofc.edu/

    數(shù)據(jù)挖掘技能

    http://www.statsoft.com/textbook/stdatmin.html

    智能科學網(wǎng)站

    http://www.intsci.ac.cn/

    數(shù)據(jù)挖掘詞匯表

    http://www.twocrows.com/glossary.htm

    數(shù)字經(jīng)濟研究中心

    http://w4.stern.nyu.edu/ceder/

    診斷試驗評價與數(shù)據(jù)挖掘

    http://statdtedm.6to23.com/

    統(tǒng)計分析與數(shù)據(jù)挖掘?qū)嶒炇?/p>

    http://www.bistudy.com/

    Lotus知識發(fā)現(xiàn)服務器

    http://www.chinakm.com/share/list.asp

    知識發(fā)現(xiàn)新進展與成果概述

    http://202.113.96.26/tjcbe/xueshubaogao/yangbingru.ppt

    UCI數(shù)據(jù)庫知識發(fā)現(xiàn)

    http://kdd.ics.uci.edu/

    數(shù)據(jù)挖掘與知識發(fā)現(xiàn)軟件

    http://www.kdnuggets.com/software/index.html

    以上是小編為大家分享的關(guān)于50個數(shù)據(jù)挖掘?qū)W習資源網(wǎng)站 收藏!的相關(guān)內(nèi)容,更多信息可以關(guān)注環(huán)球青藤分享更多干貨

    二、數(shù)據(jù)挖掘概念綜述

    數(shù)據(jù)挖掘概念綜述

    數(shù)據(jù)挖掘又稱從數(shù)據(jù)庫中發(fā)現(xiàn)知識(KDD)、數(shù)據(jù)分析、數(shù)據(jù)融合(Data Fusion)以及決策支持。KDD一詞首次出現(xiàn)在1989年8月舉行的第11屆國際聯(lián)合人工智能學術(shù)會議上。隨后在1991年、1993年和1994年都舉行KDD 專題討論會,匯集來自各個領(lǐng)域的研究人員和應用開發(fā)者,集中討論數(shù)據(jù)統(tǒng)計、海量數(shù)據(jù)分析算 法、知識表示、知識運用等問題。隨著參與人員的不斷增多,KDD國際會議發(fā)展成為年會。1998 年在美國紐約舉行的第四屆知識發(fā)現(xiàn)與數(shù)據(jù) 挖掘國際學術(shù)會議不僅進行了學術(shù)討論,并且有30多家軟件公司展示了他們的數(shù)據(jù)挖掘軟件產(chǎn)品,不少軟件已在北美、歐洲等國得到應用。

    一、什么是數(shù)據(jù)挖掘

    1.1、數(shù)據(jù)挖掘的歷史

    近十幾年來,人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,千萬萬個數(shù)據(jù)庫被用于商業(yè)管理、政府辦公、科學研究和工程開發(fā)等等,這一勢頭仍將持續(xù)發(fā)展下去。于是,一個新的挑戰(zhàn)被提了出來:在這被稱之為信息爆炸的時代,信息過量幾乎成為人人需要面對的問題。如何才能不被信息的汪洋大海所淹沒,從中及時發(fā)現(xiàn)有用的知識,提高信息利用率呢?要想使數(shù)據(jù)真正成為一個公司的資源,只有充分利用它為公司自身的業(yè)務決策和戰(zhàn)略發(fā)展服務才行,否則大量的數(shù)據(jù)可能成為包袱,甚至成為垃圾。因此,面對”人們被數(shù)據(jù)淹沒,人們卻饑餓于知識”的挑戰(zhàn)。另一方面計算機技術(shù)的另一領(lǐng)域——人工智能自1956年誕生之后取得了重大進展。經(jīng)歷了博弈時期、自然語言理解、知識工程等階段,目前的研究 熱點是機器學習。機器學習是用計算機模擬人類學習的一門科學,比較成熟的算法有神經(jīng)網(wǎng)絡、遺傳算法等。用數(shù)據(jù)庫管理系統(tǒng)來存儲數(shù)據(jù),用機器學習的方法來分析數(shù)據(jù),挖掘大量數(shù)據(jù)背后的知識,這兩者的結(jié)合促成了數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KDD:Knowledge Discovery in Databases)的產(chǎn)生,因此,數(shù)據(jù)挖掘和知識發(fā)現(xiàn)(DMKD)技術(shù)應運而生,并得以蓬勃發(fā)展,越來越顯示出其強大的生命力。

    數(shù)據(jù)挖掘又稱從數(shù)據(jù)庫中發(fā)現(xiàn)知識(KDD)、數(shù)據(jù)分析、數(shù)據(jù)融合(Data Fusion)以及決策支持。KDD一詞首次出現(xiàn)在1989年8月舉行的第11屆國際聯(lián)合人工智能學術(shù)會議上。隨后在1991年、1993年和1994年都舉行KDD 專題討論會,匯集來自各個領(lǐng)域的研究人員和應用開發(fā)者,集中討論數(shù)據(jù)統(tǒng)計、海量數(shù)據(jù)分析算 法、知識表示、知識運用等問題。隨著參與人員的不斷增多,KDD國際會議發(fā)展成為年會。1998 年在美國紐約舉行的第四屆知識發(fā)現(xiàn)與數(shù)據(jù) 挖掘國際學術(shù)會議不僅進行了學術(shù)討論,并且有30多家軟件公司展示了他們的數(shù)據(jù)挖掘軟件產(chǎn)品,不少軟件已在北美、歐洲等國得到應用。

    2.2數(shù)據(jù)挖掘的概念

    從1989年到現(xiàn)在,KDD的定義隨著人們研究的不斷深入也在不斷完善,目前比較公認的定義是Fayyad 等給出的:KDD是從數(shù)據(jù)集中識別出有效的、新穎的、潛在有用的以及最終可理解模式的高級處理過程。從定義可以看出,數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。人們把原始數(shù)據(jù)看作是形成知識的源泉,就像從礦石中采礦一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學的,也可以是非數(shù)學的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)了的知識可以被用于信息管理、查詢優(yōu)化、決策支持、過程控制等,還可以用于數(shù)據(jù)自身的維護。因此,數(shù)據(jù)挖掘是一門很廣義的交叉學科,它匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化、并行計算等方面的學者和工程技術(shù)人員。

    特別要指出的是,數(shù)據(jù)挖掘技術(shù)從一開始就是面向應用的。它不僅是面向特定數(shù)據(jù)庫的簡單檢索查詢調(diào)用,而且要對這些數(shù)據(jù)進行微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理,以指導實際問題的求解,企圖發(fā)現(xiàn)事件間的相互關(guān)聯(lián),甚至利用已有的數(shù)據(jù)對未來的活動進行預測。

    一般來說在科研領(lǐng)域中稱為KDD,而在工程領(lǐng)域則稱為數(shù)據(jù)挖掘。

    二、數(shù)據(jù)挖掘的步驟

    KDD包括以下步驟:

    1、數(shù)據(jù)準備

    KDD的處理對象是大量的數(shù)據(jù),這些數(shù)據(jù)一般存儲在數(shù)據(jù)庫系統(tǒng)中,是長期積累的結(jié)果。但往往不適合直接在這些數(shù)據(jù)上面進行知識挖 掘,需要做數(shù)據(jù)準備工作,一般包括數(shù)據(jù)的選擇(選擇相關(guān)的數(shù)據(jù))、凈化(消除噪音、冗余數(shù)據(jù))、推測(推算缺失數(shù)據(jù))、轉(zhuǎn)換(離散值 數(shù)據(jù)與連續(xù)值數(shù)據(jù)之間的相互轉(zhuǎn)換,數(shù)據(jù)值的分組分類,數(shù)據(jù)項之間的計算組合等)、數(shù)據(jù)縮減(減少數(shù)據(jù)量)。如果KDD的對象是數(shù)據(jù)倉 庫,那么這些工作往往在生成數(shù)據(jù)倉庫時已經(jīng)準備妥當。數(shù)據(jù)準備是KDD 的第一個步驟,也是比較重要的一個步驟。數(shù)據(jù)準備是否做好將影 響到數(shù)據(jù)挖掘的效率和準確度以及最終模式的有效性。

    2、數(shù)據(jù)挖掘

    數(shù)據(jù)挖掘是KDD最關(guān)鍵的步驟,也是技術(shù)難點所在。研究KDD的人員中大部分都在研究數(shù)據(jù)挖掘技術(shù),采用較多的技術(shù)有決策樹、分類、 聚類、粗糙集、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡、遺傳算法等。數(shù)據(jù)挖掘根據(jù)KDD的目標,選取相應算法的參數(shù),分析數(shù)據(jù),得到可能形成知識的模式 模型。

    3、評估、解釋模式模型

    上面得到的模式模型,有可能是沒有實際意義或沒有實用價值的,也有可能是其不能準確反映數(shù)據(jù)的真實意義,甚至在某些情況下是與事 實相反的,因此需要評估,確定哪些是有效的、有用的模式。評估可以根據(jù)用戶多年的經(jīng)驗,有些模式也可以直接用數(shù)據(jù)來檢驗其準確性。 這個步驟還包括把模式以易于理解的方式呈現(xiàn)給用戶。

    4、鞏固知識

    用戶理解的、并被認為是符合實際和有價值的模式模型形成了知識。同時還要注意對知識做一

    致性檢查,解決與以前得到的知識互相沖 突、矛盾的地方,使知識得到鞏固。

    5、運用知識

    發(fā)現(xiàn)知識是為了運用,如何使知識能被運用也是KDD的步驟之一。運用知識有兩種方法:一種是只需看知識本身所描述的關(guān)系或結(jié)果,就 可以對決策提供支持;另一種是要求對新的數(shù)據(jù)運用知識,由此可能產(chǎn)生新的問題,而需要對知識做進一步的優(yōu)化

    三、數(shù)據(jù)挖掘的特點及功能

    3.1、數(shù)據(jù)挖掘的特點

    數(shù)據(jù)挖掘具有如下幾個特點,當然,這些特點與數(shù)據(jù)挖掘要處理的數(shù)據(jù)和目的是密切相關(guān)的。

    1、處理的數(shù)據(jù)規(guī)模十分巨大。

    2、查詢一般是決策制定者(用戶)提出的即時隨機查詢,往往不能形成精確的查詢要求。

    3、由于數(shù)據(jù)變化迅速并可能很快過時,因此需要對動態(tài)數(shù)據(jù)作出快速反應,以提供決策支持。

    4、主要基于大樣本的統(tǒng)計規(guī)律,其發(fā)現(xiàn)的規(guī)則不一定適用于所有數(shù)據(jù)

    3.2、數(shù)據(jù)挖掘的功能

    數(shù)據(jù)挖掘所能發(fā)現(xiàn)的知識有如下幾種:

    廣義型知識,反映同類事物共同性質(zhì)的知識;

    特征型知識,反映事物各方面的特征知識;

    差異型知識,反映不同事物之間屬性差別的知識 ;關(guān)聯(lián)型知識,反映事物之間依賴或關(guān)聯(lián)的知識;

    預測型知識,根據(jù)歷史的和當前的數(shù)據(jù)推測未來數(shù)據(jù);偏離型知識,揭示事物偏離常規(guī)的異?,F(xiàn)象。

    所有這些知識都可以在不同的概念層次上被發(fā)現(xiàn),隨著概念樹的提升,從微觀到中觀再到宏觀,以滿足不同用戶、不同層次決策的需要。例如,從一家超市的數(shù)據(jù)倉庫中,可以發(fā)現(xiàn)的一條典型關(guān)聯(lián)規(guī)則可能是”買面包和黃油的顧客十有八九也買牛奶”,也可能是”買食品的顧客幾乎都用信用卡”,這種規(guī)則對于商家開發(fā)和實施客戶化的銷售計劃和策略是非常有用的。至于發(fā)現(xiàn)工具和方法,常用的有分類、聚類、減維、模式識別、可視化、決策樹、遺傳算法、不確定性處理等。歸納起來,數(shù)據(jù)挖掘有如下幾個功能:

    預測/驗證功能:預測/驗證功能指用數(shù)據(jù)庫的若干已知字段預測或驗證其他未知字段值。預測方法有統(tǒng)計分析方法、關(guān)聯(lián)規(guī)則和決策樹預測方法、回歸樹預測方法等。

    描述功能:描述功能指找到描述數(shù)據(jù)的可理解模式。描述方法包括以下幾種:數(shù)據(jù)分類、回歸分析、簇聚、概括、構(gòu)造依賴模式、變化和偏差分析、模式發(fā)現(xiàn)、路徑發(fā)現(xiàn)等。

    四、數(shù)據(jù)挖掘的模式

    數(shù)據(jù)挖掘的任務是從數(shù)據(jù)中發(fā)現(xiàn)模式。模式是一個用語言L來表示的一個表達式E,它可用來描述數(shù)據(jù)集F中數(shù)據(jù)的特性,E 所描述的數(shù)據(jù)是集 合F的一個子集FE。E作為一個模式要求它比列舉數(shù)據(jù)子集FE中所有元素的描述方法簡單。例如,“如果成績在81 ~90之間,則成績優(yōu)良”可稱 為一個模式,而“如果成績?yōu)?1、82、83、84、85、86、87、88、89 或90,則成績優(yōu)良”就不能稱之為一個模式。

    模式有很多種,按功能可分有兩大類:預測型(Predictive)模式和描述型(Descriptive)模式。

    預測型模式是可以根據(jù)數(shù)據(jù)項的值精確確定某種結(jié)果的模式。挖掘預測型模式所使用的數(shù)據(jù)也都是可以明確知道結(jié)果的。例如,根據(jù)各種 動物的資料,可以建立這樣的模式:凡是胎生的動物都是哺乳類動物。當有新的動物資料時,就可以根據(jù)這個模式判別此動物是否是哺乳動物。

    描述型模式是對數(shù)據(jù)中存在的規(guī)則做一種描述,或者根據(jù)數(shù)據(jù)的相似性把數(shù)據(jù)分組。描述型模式不能直接用于預測。例如,在地球上,70 %的表面被水覆蓋,30 %是土地。

    在實際應用中,往往根據(jù)模式的實際作用細分為以下6 種:

    1、分類模式

    分類模式是一個分類函數(shù)( 分 類 器),能夠把數(shù)據(jù)集中的數(shù)據(jù)項映射到某個給定的類上。分類模式往往表現(xiàn)為一棵分類樹,根據(jù)數(shù)據(jù)的 值從樹根開始搜索,沿著數(shù)據(jù)滿足的分支往上走,走到樹葉就能確定類別。

    2、回歸模式

    回歸模式的函數(shù)定義與分類模式相似,它們的差別在于分類模式的預測值是離散的,回歸模式的預測值是連續(xù)的。如給出某種動物的特征,可以用分類模式判定這種動物是哺乳動物還是鳥類;給出某個人的教育情況、工作經(jīng)驗,可以用回歸模式判定這個人的年工資在哪個范圍內(nèi),是在6000元以下,還是在6000元到1萬元之間,還是在1萬元以上。

    3、時間序列模式

    時間序列模式根據(jù)數(shù)據(jù)隨時間變化的趨勢預測將來的值。這里要考慮到時間的特殊性質(zhì),像一些周期性的時間定義如星期、月、季節(jié)、年 等,不同的日子如節(jié)假日可能造成的影響,日期本身的計算方法,還有一些需要特殊考慮的地方如時間前后的相關(guān)性(過去的事情對將來有 多大的影響力)等。只有充分考慮時間因素,利用現(xiàn)有數(shù)據(jù)隨時間變化的一系列的值,才能更好地預測將來的值。

    4、聚類模式

    聚類模式把數(shù)據(jù)劃分到不同的組中,組之間的差別盡可能大,組內(nèi)的差別盡可能小。與分類模式不同,進行聚類前并不知道將要劃分成幾 個組和什么樣的組,也不知道根據(jù)哪一(幾)個數(shù)據(jù)項來定義組。一般來說,業(yè)務知識豐富的人應該可以理解這些組的含義,如果產(chǎn)生的模式無法理解或不可用,則該模式可能是無意義的,需要回到上階段重新組織數(shù)據(jù)。

    5、關(guān)聯(lián)模式

    關(guān)聯(lián)模式是數(shù)據(jù)項之間的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是如下形式的一種規(guī)則:“在無力償還貸款的人當中,60%的人的月收入在3000元以下。”

    6、序列模式

    序列模式與關(guān)聯(lián)模式相仿,而把數(shù)據(jù)之間的關(guān)聯(lián)性與時間聯(lián)系起來。為了發(fā)現(xiàn)序列模式,不僅需要知道事件是否發(fā)生,而且需要確定事件 發(fā)生的時間。例如,在購買彩電的人們當中,60%的人會在3個月內(nèi)購買影碟機

    五、數(shù)據(jù)挖掘的發(fā)現(xiàn)任務

    數(shù)據(jù)挖掘涉及的學科領(lǐng)域和方法很多,有多種分類法。根據(jù)挖掘任務分,可分為分類或預測模型發(fā)現(xiàn)、數(shù)據(jù)總結(jié)、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、依賴關(guān)系或依賴模型發(fā)現(xiàn)、異常和趨勢發(fā)現(xiàn)等等;根據(jù)挖掘?qū)ο蠓?,有關(guān)系數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、空間數(shù)據(jù)庫、時態(tài)數(shù)據(jù)庫、文本數(shù)據(jù)源、多媒體數(shù)據(jù)庫、異質(zhì)數(shù)據(jù)庫、遺產(chǎn)數(shù)據(jù)庫以及環(huán)球網(wǎng)Web;根據(jù)挖掘方法分,可粗分為:機器學習方法、統(tǒng)計方法、神經(jīng)網(wǎng)絡方法和數(shù)據(jù)庫方法。機器學習中,可細分為:歸納學習方法(決策樹、規(guī)則歸納等)、基于范例學習、遺傳算法等。統(tǒng)計方法中,可細分為:回歸分析(多元回歸、自回歸等)、判別分析(貝葉斯判別、費歇爾判別、非參數(shù)判別等)、聚類分析(系統(tǒng)聚類、動態(tài)聚類等)、探索性分析(主元分析法、相關(guān)分析法等)等。神經(jīng)網(wǎng)絡方法中,可細分為:前向神經(jīng)網(wǎng)絡(BP算法等)、自組織神經(jīng)網(wǎng)絡(自組織特征映射、競爭學習等)等。數(shù)據(jù)庫方法主要是多維數(shù)據(jù)分析或OLAP 方法,另外還有面向?qū)傩缘臍w納方法。

    從挖掘任務和挖掘方法的角度而言有數(shù)據(jù)總結(jié)、分類發(fā)現(xiàn)、聚類和關(guān)聯(lián)規(guī)則發(fā)現(xiàn)四種非常重要的發(fā)現(xiàn)任務。

    5.1、數(shù)據(jù)總結(jié)

    數(shù)據(jù)總結(jié)目的是對數(shù)據(jù)進行濃縮,給出它的緊湊描述。傳統(tǒng)的也是最簡單的數(shù)據(jù)總結(jié)方法是計算出數(shù)據(jù)庫的各個字段上的求和值、平均值、方差值等統(tǒng)計值,或者用直方圖、餅狀圖等圖形方式表示。數(shù)據(jù)挖掘主要關(guān)心從數(shù)據(jù)泛化的角度來討論數(shù)據(jù)總結(jié)。數(shù)據(jù)泛化是一種把數(shù)據(jù)庫中的有關(guān)數(shù)據(jù)從低層次抽象到高層次上的過程。由于數(shù)據(jù)庫上的數(shù)據(jù)或?qū)ο笏男畔⒖偸亲钤肌⒒镜男畔ⅲㄟ@是為了不遺漏任何可能有用的數(shù)據(jù)信息)。人們有時希望能從較高層次的視圖上處理或瀏覽數(shù)據(jù),因此需要對數(shù)據(jù)進行不同層次上的泛化以適應各種查詢要求。數(shù)據(jù)泛化目前主要有兩種技術(shù):多維數(shù)據(jù)分析方法和面向?qū)傩缘臍w納方法。

    1、多維數(shù)據(jù)分析方法是一種數(shù)據(jù)倉庫技術(shù),也稱作聯(lián)機分析處理(OLAP)。數(shù)據(jù)倉庫是面向決策支持的、集成的、穩(wěn)定的、不同時間的歷史數(shù)據(jù)集合。決策的前提是數(shù)據(jù)分析。在數(shù)據(jù)分析中經(jīng)常要用到諸如求和、總計、平均、最大、最小等匯集操作,這類操作的計算量特別大。因此一種很自然的想法是,把匯集操作結(jié)果預先計算并存儲起來,以便于決策支持系統(tǒng)使用。存儲匯集操作結(jié)果的地方稱作多維數(shù)據(jù)庫。多維數(shù)據(jù)分析技術(shù)已經(jīng)在決策支持系統(tǒng)中獲得了成功的應用,如著名的SAS數(shù)據(jù)分析軟件包、Business Object公司的決策支持系統(tǒng)Business Object,以及IBM公司的決策分析工具都使用了多維數(shù)據(jù)分析技術(shù)。

    采用多維數(shù)據(jù)分析方法進行數(shù)據(jù)總結(jié),它針對的是數(shù)據(jù)倉庫,數(shù)據(jù)倉庫存儲的是脫機的歷史數(shù)據(jù)。

    2、為了處理聯(lián)機數(shù)據(jù),研究人員提出了一種面向?qū)傩缘臍w納方法。它的思路是直接對用戶感興趣的數(shù)據(jù)視圖(用一般的SQL查詢語言即可獲得)進行泛化,而不是像多維數(shù)據(jù)分析方法那樣預先就存儲好了泛化數(shù)據(jù)。方法的提出者對這種數(shù)據(jù)泛化技術(shù)稱之為面向?qū)傩缘臍w納方法。原始關(guān)系經(jīng)過泛化操作后得到的是一個泛化關(guān)系,它從較高的層次上總結(jié)了在低層次上的原始關(guān)系。有了泛化關(guān)系后,就可以對它進行各種深入的操作而生成滿足用戶需要的知識,如在泛化關(guān)系基礎上生成特性規(guī)則、判別規(guī)則、分類規(guī)則,以及關(guān)聯(lián)規(guī)則等。

    5.2、分類發(fā)現(xiàn)

    分類在數(shù)據(jù)挖掘中是一項非常重要的任務,目前在商業(yè)上應用最多。分類的目的是學會一個分類函數(shù)或分類模型(也常常稱作分類器),該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別中的某一個。分類和回歸都可用于預測。預測的目的是從利用歷史數(shù)據(jù)紀錄中自動推導出對給定數(shù)據(jù)的推廣描述,從而能對未來數(shù)據(jù)進行預測。和回歸方法不同的是,分類的輸出是離散的類別值,而回歸的輸出則是連續(xù)數(shù)值。

    要構(gòu)造分類器,需要有一個訓練樣本數(shù)據(jù)集作為輸入。訓練集由一組數(shù)據(jù)庫記錄或元組構(gòu)成,每個元組是一個由有關(guān)字段(又稱屬性或特征)值組成的特征向量,此外,訓練樣本還有一個類別標記。一個具體樣本的形式可為:( v1, v2, …, vn; c );其中vi表示字段值,c表示類別。

    分類器的構(gòu)造方法有統(tǒng)計方法、機器學習方法、神經(jīng)網(wǎng)絡方法等等。統(tǒng)計方法包括貝葉斯法和非參數(shù)法(近鄰學習或基于事例的學習),對應的知識表示則為判別函數(shù)和原型事例。機器學習方法包括決策樹法和規(guī)則歸納法,前者對應的表示為決策樹或判別樹,后者則一般為產(chǎn)生式規(guī)則。神經(jīng)網(wǎng)絡方法主要是BP算法,它的模型表示是前向反饋神經(jīng)網(wǎng)絡模型(由代表神經(jīng)元的節(jié)點和代表聯(lián)接權(quán)值的邊組成的一種體系結(jié)構(gòu)),BP算法本質(zhì)上是一種非線性判別函數(shù)。另外,最近又興起了一種新的方法:粗糙集(rough set),其知識表示是產(chǎn)生式規(guī)則。

    不同的分類器有不同的特點。有三種分類器評價或比較尺度:1 預測準確度;2 計算復雜度;3 模型描述的簡潔度。預測準確度是用得最多的一種比較尺度,特別是對于預測型分類任務,目前公認的方法是10番分層交叉驗證法。計算復雜度依賴于具體的實現(xiàn)細節(jié)和硬件環(huán)境,在數(shù)據(jù)挖掘中,由于操作對象是巨量的數(shù)據(jù)庫,因此空間和時間的復雜度問題將是非常重要的一個環(huán)節(jié)。對于描述型的分類任務,模型描述越簡潔越受歡迎;例如,采用規(guī)則表示的分類器構(gòu)造法就更有用,而神經(jīng)網(wǎng)絡方法產(chǎn)生的結(jié)果就難以理解。

    另外要注意的是,分類的效果一般和數(shù)據(jù)的特點有關(guān),有的數(shù)據(jù)噪聲大,有的有缺值, 有的分布稀疏,有的字段或?qū)傩蚤g相關(guān)性強,有的屬性是離散的而有的是連續(xù)值或混合式的。目前普遍認為不存在某種方法能適合于各種特點的數(shù)據(jù)。

    5.3、聚類

    聚類是把一組個體按照相似性歸成若干類別,即”物以類聚”。它的目的是使得屬于同一類別的個體之間的距離盡可能的小,而不同類別上的個體間的距離盡可能的大。聚類方法包括統(tǒng)計方法、機器學習方法、神經(jīng)網(wǎng)絡方法和面向數(shù)據(jù)庫的方法。

    在統(tǒng)計方法中,聚類稱聚類分析,它是多元數(shù)據(jù)分析的三大方法之一(其它兩種是回歸分析和判別分析)。它主要研究基于幾何距離的聚類,如歐式距離、明考斯基距離等。傳統(tǒng)的統(tǒng)計聚類分析方法包括系統(tǒng)聚類法、分解法、加入法、動態(tài)聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。這種聚類方法是一種基于全局比較的聚類,它需要考察所有的個體才能決定類的劃分;因此它要求所有的數(shù)據(jù)必須預先給定,而不能動態(tài)增加新的數(shù)據(jù)對象。聚類分析方法不具有線性的計算復雜度,難以適用于數(shù)據(jù)庫非常大的情況。

    在機器學習中聚類稱作無監(jiān)督或無教師歸納;因為和分類學習相比,分類學習的例子或數(shù)據(jù)對象有類別標記,而要聚類的例子則沒有標記,需要由聚類學習算法來自動確定。很多人工智能文獻中,聚類也稱概念聚類;因為這里的距離不再是統(tǒng)計方法中的幾何距離 ,而是根據(jù)概念的描述來確定的。當聚類對象可以動態(tài)增加時,概念聚類則稱是概念形成。

    在神經(jīng)網(wǎng)絡中,有一類無監(jiān)督學習方法:自組織神經(jīng)網(wǎng)絡方法;如Kohonen自組織特征映射網(wǎng)絡、競爭學習網(wǎng)絡等等。在數(shù)據(jù)挖掘領(lǐng)域里,見報道的神經(jīng)網(wǎng)絡聚類方法主要是自組織特征映射方法,IBM在其發(fā)布的數(shù)據(jù)挖掘白皮書中就特別提到了使用此方法進行數(shù)據(jù)庫聚類分割。

    5.4、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

    關(guān)聯(lián)規(guī)則是形式如下的一種規(guī)則,”在購買面包和黃油的顧客中,有90%的人同時也買了牛奶”(面包+黃油 ( 牛奶 )。用于關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的主要對象是事務型數(shù)據(jù)庫,其中針對的應用則是售貨數(shù)據(jù),也稱貨籃數(shù)據(jù)。一個事務一般由如下幾個部分組成:事務處理時間 ,一組顧客購買的物品,有時也有顧客標識號(如信用卡號)。

    由于條形碼技術(shù)的發(fā)展,零售部門可以利用前端收款機收集存儲大量的售貨數(shù)據(jù)。因此,如果對這些歷史事務數(shù)據(jù)進行分析,則可對顧客的購買行為提供極有價值的信息。例如,可以幫助如何擺放貨架上的商品(如把顧客經(jīng)常同時買的商品放在一起),幫助如何規(guī)劃市場(怎樣相互搭配進貨)。由此可見,從事務數(shù)據(jù)中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,對于改進零售業(yè)等商業(yè)活動的決策非常重要。

    如果不考慮關(guān)聯(lián)規(guī)則的支持度和可信度,那么在事務數(shù)據(jù)庫中存在無窮多的關(guān)聯(lián)規(guī)則。事實上,人們一般只對滿足一定的支持度和可信度的關(guān)聯(lián)規(guī)則感興趣。在文獻中,一般稱滿足一定要求的(如較大的支持度和可信度)的規(guī)則為強規(guī)則。因此,為了發(fā)現(xiàn)出有意義的關(guān)聯(lián)規(guī)則,需要給定兩個閾值:最小支持度和最小可信度。前者即用戶規(guī)定的關(guān)聯(lián)規(guī)則必須滿足的最小支持度,它表示了一組物品集在統(tǒng)計意義上的需滿足的最低程度;后者即用戶規(guī)定的關(guān)聯(lián)規(guī)則必須滿足的最小可信度,它反應了關(guān)聯(lián)規(guī)則的最低可靠度。

    在實際情況下,一種更有用的關(guān)聯(lián)規(guī)則是泛化關(guān)聯(lián)規(guī)則。因為物品概念間存在一種層次關(guān)系,如夾克衫、滑雪衫屬于外套類,外套、襯衣又屬于衣服類。有了層次關(guān)系后,可以幫助發(fā)現(xiàn)一些更多的有意義的規(guī)則。例如,”買外套,買鞋子”(此處,外套和鞋子是較高層次上的物品或概念,因而該規(guī)則是一種泛化的關(guān)聯(lián)規(guī)則)。由于商店或超市中有成千上萬種物品,平均來講,每種物品(如滑雪衫)的支持度很低,因此有時難以發(fā)現(xiàn)有用規(guī)則;但如果考慮到較高層次的物品(如外套),則其支持度就較高,從而可能發(fā)現(xiàn)有用的規(guī)則。另外,關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的思路還可以用于序列模式發(fā)現(xiàn)。用戶在購買物品時,除了具有上述關(guān)聯(lián)規(guī)律,還有時間上或序列上的規(guī)律,因為,很多時候顧客會這次買這些東西,下次買同上次有關(guān)的一些東西,接著又買有關(guān)的某些東西。

    三、為什么北大法寶沒有了

    因法律綜合信息資源系統(tǒng)(北大法寶)數(shù)據(jù)庫所在服務器系統(tǒng)故障導致該數(shù)據(jù)庫本地鏡像無法正常使用。目前已重新部署法律綜合信息資源系統(tǒng)(北大法寶)數(shù)據(jù)庫的服務器。

    1985年誕生于北京大學法律系,經(jīng)過20多年不斷的改進與完善,是目前最成熟、專業(yè)、先進的法律信息全方位檢索系統(tǒng)。“北大法寶”在全國率先進行法律信息的數(shù)據(jù)挖掘和知識發(fā)現(xiàn),獨創(chuàng)了法規(guī)條文和相關(guān)案例等信息之間的“法寶聯(lián)想”功能。

    北大法寶是由北京大學法律人工智能實驗室與北京北大英華科技有限公司聯(lián)合推出的一款智能型法律信息檢索系統(tǒng),數(shù)據(jù)內(nèi)容涵蓋法律信息的方方面面,目前包含法律法規(guī)庫、司法案例庫、法學期刊庫、律所實務庫、專題參考庫、English庫、法寶視頻庫、法考系統(tǒng)庫、檢察文書庫、行政處罰庫等十大數(shù)據(jù)庫,特色功能有效提升檢索效率和法律信息價值,得到國內(nèi)外用戶的一致好評。

    四、安徽大學計算機科學與技術(shù)學院的研究生專業(yè)

    一.概況

    計算機應用技術(shù)專業(yè)現(xiàn)設有計算機應用技術(shù)的二級學科博士點和碩士點,其培養(yǎng)方式為碩士、博士、提前攻博等等。2002年獲準國家立項的計算機應用技術(shù)重點學科,2003年獲準建立計算機應用技術(shù)博士后流動站。碩士研究生學制3年,實行學分制,2005年招生規(guī)模為30人。博士研究生學制2年,實行學分制,2005年招生規(guī)模為12人。

    近年來,本學科先后獲得211工程和國家重點學科經(jīng)費資助,軟硬件設施得到了根本改善,在主要研究方向已形成人才高地。

    二.學科研究方向介紹

    主要研究方向是計算智能與知識工程,包括問題求解商空間理論及其應用、基于商空間理論的粒度計算理論及其應用、構(gòu)造性機器學習理論及其應用、優(yōu)化理論與方法的研究、新的層次機器學習理論和方法的研究以及復雜系統(tǒng)的優(yōu)化技術(shù)和方法等等,獲得了一批原創(chuàng)性在國內(nèi)外有重要影響的科研成果。

    三.專業(yè)課程設置

    1.學位課

    英語、科學社會主義理論與實踐、自然辯證法概論、組合數(shù)學、算法設計分析、高級數(shù)據(jù)庫系統(tǒng)、計算機科學數(shù)學理論、人工神經(jīng)網(wǎng)絡的理論及應用、人工智能高級教程、高級數(shù)據(jù)庫技術(shù)等等

    2.非學位課

    并行計算、智能計算、計算機視覺、知識發(fā)現(xiàn)、專家系統(tǒng)及其開發(fā)環(huán)境、優(yōu)化理論及方法、構(gòu)造性學習理論與方法和數(shù)據(jù)倉庫及數(shù)據(jù)采集等等

    四、學科導師隊伍

    張鈴:男,1937年5月生,福建福清人,1961年畢業(yè)于南京大學數(shù)學天文系.同年分配至安徽工作,先后在安徽四所大學任教。1993年調(diào)至安徽大學人工智能研究所,任所長、教授、博士生導師至今。1986年4月由講師破格晉升為正教授,1988年被授予國家有突出貢獻的中青年專家稱號,1991年獲享受國家特殊津貼待遇,先后被清華大學、浙江大學、同濟大學和中科院智能所等單位聘為客座教授。獲得榮譽稱號:改革開放以來,獲全國教育系統(tǒng)勞動模范等省級以上榮譽稱號八次;先后獲國家自然科學獎等省級以上學術(shù)獎勵十次;1978年獲安徽省首屆科技大會成果獎;1984年獲第六屆ICL歐洲人工智能獎;1987年獲國家教委科學技術(shù)進步一等獎;1991年獲國家教委科學技術(shù)進步二等獎;1992年專著《問題求解理論及應用》獲全國高等學校出版社優(yōu)秀學術(shù)專著特等獎;1992年專著《新一代計算技術(shù)前沿的研究》獲全國優(yōu)秀科技圖書一等獎;1993年獲電子工業(yè)部科技進步一等獎;1995年獲國家自然科學三等獎;1999年獲“全國優(yōu)秀科技圖書獎”暨“科技進步獎(科技著作)”一等獎;1999年獲安徽省自然科學二等獎。目前主要研究方向有:商空間粒度計算理論(這是目前國際上三大粒度計算理論之一)、智能計算、機器學習理論和方法等。

    程家興:男,澳大利亞南澳大學博士,教授,現(xiàn)任安徽大學計算智能與信號處理教育部重點實驗室主任,博士生導師,安徽省計算機學會常務理事,澳大利亞南澳大學SCG研究所研究員。主持和參加國家自然科學基金項目,國家自然科學基金中澳特別基金項目、教育部“優(yōu)秀青年教師資助計劃”項目、教育部博士點基金項目等。與澳大利亞南澳大學建立國際合作關(guān)系。研究方向:智能計算,算法分析與設計,最優(yōu)化方法。獲安徽省高??萍歼M步3等獎,安徽省第三屆自然科學優(yōu)秀學術(shù)論文2等獎.。目前,指導博士生5名,碩士生9名。主講課程有具體數(shù)學,智能計算,優(yōu)化理論與方法,組合數(shù)學以及本科生離散數(shù)學教學課程等。

    張燕平:女,1962.2出生,安徽巢湖人;1981年畢業(yè)于上海電力學院熱工自動化專業(yè); 1989年作為合肥工業(yè)大學微機應用研究所研究生獲工學碩士;2000年9月至2003年7月在職讀博士研究生,并獲得安徽大學計算機應用專業(yè)工學博士學位。2000年6月任安徽大學計算機系副教授;2003年擔任計算機應用專業(yè)碩士研究生導師; 2004年11月任教授。主持完成安徽省教育廳自然科學研究項目1項,參加國家自然科學基金項目多項。2004年獲安徽省科技進步二等獎。已在《計算機學報》、《計算機研究與發(fā)展》等國家重點期刊和國家級期刊發(fā)表學術(shù)論文18篇。

    汪繼文:男,1958年9月生,安徽宿松人。1982年1月本科畢業(yè)于安慶師范學院數(shù)學系,獲理學學士學位。1989年7月碩士畢業(yè)于安徽大學數(shù)學系,獲理學碩士學位。2001年7月博士畢業(yè)于中國科學技術(shù)大學數(shù)學系,獲理學博士學位。2001.12 進入中國科技大學動力工程及工程熱物理博士后流動站火災科學國家重點實驗室做博士后。2004.8出站,獲博士后證書。1982.1-1986.9在安慶師范學院數(shù)學系任教。1989年7月碩士畢業(yè)后留校到安徽大學計算機學院(原為計算機系)任教到至今。2001年6月?lián)未T士生導師,2002年9月受聘為教授。2002.12入選為安徽省高校中青年學科帶頭人培養(yǎng)對象。三次獲教學優(yōu)秀獎,一次獲安徽省高??萍歼M步三等獎。目前主要研究方向是計算機數(shù)值模擬技術(shù),先后參加了5項國家自然科學基金項目的研究工作,主持完成兩項省教委項目。目前參加一項國家自然科學基金項目,主持一項省自然科學基金項目。已發(fā)表學術(shù)論文28篇,SCI收錄論文4篇。 1. 智能軟件

    學科帶頭人李龍澍教授,博士生導師,主要研究興趣為軟件體系結(jié)構(gòu)、不精確知識表示和智能Agent技術(shù),發(fā)表研究論文50多篇,主持開發(fā)的主要系統(tǒng)有:農(nóng)業(yè)氣象決策支持系統(tǒng)、大型數(shù)據(jù)庫管理系統(tǒng)、電子政務系統(tǒng)、網(wǎng)絡信息管理系統(tǒng)。

    軟件體系結(jié)構(gòu)的研究:探討知識的繼承機制和抽象原理,使智能軟件系統(tǒng)的數(shù)據(jù)庫、模型庫和方法庫融為一體,引進了知識的層次結(jié)構(gòu),增強系統(tǒng)的可用性和維護效率。完成國家“863”項目“基于氣象分析的指導農(nóng)作物種植管理軟構(gòu)件”,主持研究國家自然科學基金項目“智能軟件體系結(jié)構(gòu)和組件技術(shù)的研究”,深入研究模糊商結(jié)構(gòu)理論,將粒度計算理論用于建造軟件體系結(jié)構(gòu)模型,提出了一種基于商空間的智能軟件體系結(jié)構(gòu)構(gòu)造模型,研究成果在農(nóng)業(yè)氣象、河流污染、公路管理、煤礦救護等GIS系統(tǒng)中有廣泛應用。

    不精確知識表示的研究:深入研究不精確知識表示的特點,提出一種適合領(lǐng)域特征的信息處理系統(tǒng)的框架和數(shù)據(jù)約簡、知識發(fā)現(xiàn)方案,促進知識庫系統(tǒng)開發(fā)技術(shù)水平的發(fā)展。研制適合模糊粗糙集信息處理的新的智能軟件體系結(jié)構(gòu),不僅具有重大學術(shù)價值,而且在農(nóng)業(yè)氣象分析應用中取得其它方法和系統(tǒng)無法替代的明顯效果,結(jié)合農(nóng)業(yè)氣象信息,分析模糊粗糙集的特性和優(yōu)點,研制適合知識處理的構(gòu)件模型,用于建造減災防災、農(nóng)作物管理等實際決策支持系統(tǒng),產(chǎn)生巨大的社會經(jīng)濟效益。

    智能Agent技術(shù)的研究:Agent體系結(jié)構(gòu)是智能Agent研究中一個重要的研究方向,它所要解決的問題是智能Agent是由哪些模塊組成,這些模塊之間如何交換信息,以及如何將這些模塊用軟件或硬件的方式組合起來形成一個有機的整體。結(jié)合完成國家“863”項目、國家自然科學基金項目等重大科研項目和機器人世界杯足球錦標賽RoboCup(Robot World Cup),面向大中型企業(yè)的數(shù)據(jù)倉庫進行數(shù)據(jù)挖掘和建造基于Agent技術(shù)的智能決策支持系統(tǒng),為安徽現(xiàn)代化建設產(chǎn)生重大社會經(jīng)濟效益。

    2. 數(shù)據(jù)庫與Web技術(shù)

    學科帶頭人鄭誠博士、副教授。2002年12月畢業(yè)于中國科學技術(shù)大學計算機系,并獲博士學位,研究方向:數(shù)據(jù)庫與數(shù)據(jù)倉庫技術(shù)、知識發(fā)現(xiàn)與數(shù)據(jù)挖掘技術(shù)、人工智能與機器學習、新一代Web技術(shù)等。2005年9月起在安徽大學計算機科學與技術(shù)博士后流動站進行博士后研究(在職)。安徽大學中青年骨干教師,安徽省高校骨干教師培養(yǎng)對象。近幾年內(nèi)作為主要骨干參加國家自然科學基金、863計劃、安徽省自然科學基金項目等項目4項。主持省教育廳自然科學研究項目二項,發(fā)表學術(shù)論文20余篇。

    數(shù)據(jù)庫與Web技術(shù)方向:研究數(shù)據(jù)庫與數(shù)據(jù)倉庫及其應用技術(shù)、基于數(shù)據(jù)庫和數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術(shù),研究多粒度數(shù)據(jù)挖掘技術(shù),將它們應用于稅務、網(wǎng)絡安全等領(lǐng)域;研究語義Web技術(shù),在Web中引入有關(guān)智能技術(shù),讓計算機能理解Web上的信息。

    3. 并行計算

    學科帶頭人劉鋒,博士,教授。主要研究方向:軟件工程、并行計算、網(wǎng)格計算,承擔國家自然基金項目、教育部科研項目、安徽省自然基金項目和安徽省教育廳自然基金項目多項。

    近期發(fā)表的主要論著:

    1. 基于改進型遺傳算法的門陣列模式布局 (EI)小型微型計算機系統(tǒng) 2002,no.3

    2. 求復函數(shù)方程根的遺傳算法 計算機工程與應用2001年,37卷,第24期

    3. PVM環(huán)境下求復函數(shù)方程根的并行遺傳算法 小型微型計算機系統(tǒng) 2003,no.7

    4. ORACLE數(shù)據(jù)庫的MIT在營業(yè)帳務系統(tǒng)中的應用 電信技術(shù) 2001.9

    5. 電子出版物與紙質(zhì)出版物異同論 情報科學 2001.7

    6. 基于遺傳算法的方程求根算法的設計和實現(xiàn) (EI)控制理論與應用 2004年第3期

    7. Internet QoS控制機制綜述 計算機科學 2002.3.

    8. 基于分布理論和遺傳算法的多項式求根算法 微機發(fā)展 2001年第6期

    9. 基于Agent網(wǎng)格計算性能的實時調(diào)節(jié) 計算機工程與應用 2003年第39期

    10. 并行遺傳算法求復函數(shù)方程根的設計和實現(xiàn) (EI)系統(tǒng)工程理論與實踐 2004年第6期

    4. 中間件技術(shù)

    學科帶頭人鄒海,博士,高工。2001年3月至2003年7月在中國礦業(yè)大學電氣工程(信息與電子技術(shù))博士后科研流動站從事博士后研究。近年來主要專注于模糊與隨機環(huán)境下的粗糙集理論與知識獲取、中間件技術(shù)等方面的研究。主持或參與完成了國家自然科學基金項目1項、948項目1項、省部級自然科學基金2項和10多項橫向合作項目,目前在研省青年教師基金項目1項、省教育廳自然科學基金1項,獲省、部級科學技術(shù)進步獎3項,發(fā)表論文10余篇。近年來承擔了包括東北晚中生代資源預測專家系統(tǒng)、壩工建筑物實時監(jiān)測數(shù)據(jù)采集系統(tǒng)、基于網(wǎng)絡通訊的遠程分布式遙測系統(tǒng)、基于數(shù)據(jù)挖掘的防汛抗旱調(diào)度指揮系統(tǒng)、B/S/S架構(gòu)的客戶關(guān)系管理系統(tǒng)在內(nèi)的多個應用系統(tǒng)的設計和研發(fā)工作,并得以成功應用。

    模糊與隨機環(huán)境下的粗糙集理論與知識獲取研究:針對信息識別中大量存在的不完備信息和隨機環(huán)境這一的特點,結(jié)合智能信息處理領(lǐng)域近年來迅速發(fā)展起來的粗糙集(Rough Set)理論,深入研究在復雜系統(tǒng)中不完備信息及其隨機環(huán)境下知識的表示、知識的約簡、知識的學習、歸納和推理等。

    中間件技術(shù)的研究:中間件技術(shù)作為90年代初發(fā)展起來的基礎軟件,近幾年來逐漸成為構(gòu)建網(wǎng)絡分布式應用系統(tǒng)的重要支撐工具。它能夠解決網(wǎng)絡分布計算環(huán)境中多種異構(gòu)數(shù)據(jù)資源互聯(lián)共享問題,實現(xiàn)多種應用軟件的協(xié)同工作。研究方向涉及分布式高性能高可靠企業(yè)級基礎軟件平臺架構(gòu)與機制、應用集成架構(gòu)與技術(shù)、J2EE應用服務器、、工作流技術(shù)、移動中間件技術(shù)、反射中間件技術(shù)、嵌入式中間件技術(shù)、網(wǎng)絡即插即用中間技術(shù)件、普適計算中間件技術(shù)、網(wǎng)格計算中間件技術(shù)、CORBA高級技術(shù)等。目前,中間件已與操作系統(tǒng)、數(shù)據(jù)庫、前端應用軟件一起,躋身于軟件業(yè)發(fā)展的重點之列,并成為分布式應用的關(guān)鍵性軟件。它可廣泛適用于政府部門、銀行、證券、電力、電信、交通與軍事等關(guān)鍵性的網(wǎng)絡分布應用。 一、研究生始招時間及在校研究生規(guī)模

    始招時間:2002年

    在校研究生規(guī)模:約60人

    二、導師梯隊介紹

    1.計算機視覺及應用方向

    韋穗:安徽大學副校長、教授、中國圖像圖形學會副理事長、教育部科學委員會信息學部委員,1983年4月至1985年9月在美國密執(zhí)安大學及弗吉尼亞多理學院作訪問學者。長期從事計算機視覺、圖像圖形學、模式識別、數(shù)學形態(tài)學和全息成像等領(lǐng)域的研究。近年來承擔了多項國家自然科學基金項目和863項目。其中大容量快速圖像分析系統(tǒng)(負責人)獲中科院科技進步二等獎;并榮獲國家863計劃智能機器人主題先進工作者稱號及國家科技部授予的國家863計劃先進工作者稱號。863項目“基于VR技術(shù)的裝配幫助系統(tǒng)”(負責人)的研究, 2000年經(jīng)863專家組組織驗收,認為該項目的成果對于本領(lǐng)域的研究起到了開拓性的作用。國家自然基金項目“基于SVD分解的射影重構(gòu)算法研究”在圖形學中的多視圖幾何、3D重構(gòu)和基于圖像的繪制、圖像獲取幾何和降低計算復雜性,實現(xiàn)復雜景物的3D描述與顯示方面取得了一定的研究成果。主持了2002年第二屆國際圖像圖形學會年會,編輯了兩本會議論文集,其中大部分論文都被EI收錄,翻譯出版《計算機視覺中的多視圖幾何》(由英國劍橋大學出版社和原著作者Richard Hartley和Sman的授權(quán))。

    梁棟:博士、教授(博導),安徽大學電子科學與技術(shù)學院副院長。1985年和1990年在安徽大學獲學士和碩士學位,2002年獲安徽大學計算機應用技術(shù)專業(yè)工學博士學位。1991年晉升為安徽大學講師,1996年晉升為安徽大學副教授,2002年晉升為安徽大學教授。1995年被評為安徽大學中青年骨干教師和安徽省中青年骨干教師培養(yǎng)對象,2002年被評為安徽省高等學校中青年學科帶頭人培養(yǎng)對象。近年來,在國內(nèi)外學術(shù)期刊和學術(shù)會議上發(fā)表專題學術(shù)論文30多篇,主持和參加安徽省自然科學基金、國家自然科學基金、國家863計劃、國家科技部科技型中小企業(yè)技術(shù)創(chuàng)新基金等科研項目20多項,先后獲安徽省科技進步四等獎1項、安徽省高等學校科技進步三等獎2項、新型實用專利1項、安徽大學教學成果二等獎1項。主要研究領(lǐng)域:計算機視覺、圖象信息處理。

    2.圖像處理與識別方向

    羅斌:博士、教授(博導),英國約克大學計算機科學博士,安徽大學計算機科學與技術(shù)學院教授,博士生導師,安徽省首批“皖江學者”特聘教授,安徽省跨世紀學術(shù)技術(shù)帶頭人后備人選,安徽大學計算機科學與技術(shù)學院院長。中國圖象圖形學會理事、學術(shù)委員會、青年工作委員會委員,IEEE學會會員,IEEE計算機學會會員,英國BMVA會員。研究領(lǐng)域為數(shù)字圖像處理與模式識別。目前主持國家自然科學基金項目《基于鄰接圖譜理論的圖像聚類方法研究》,以及教育部“優(yōu)秀青年教師資助計劃”項目、安徽省人才開發(fā)基金和安徽省教育廳自然科學研究項目等。與國外同行專家保持有良好的合作關(guān)系,參加英國EPSRC項目的研究。主要研究成果有:應用現(xiàn)代圖的分解理論對圖像的結(jié)構(gòu)化描述、圖匹配理論和圖的聚類方法進行了研究;利用EM算法和矩陣的SVD分解理論得到不同大小及包含結(jié)構(gòu)噪聲圖的匹配方法,提出一種基于圖匹配的圖像配準算法;將圖的譜分解理論應用于圖像的識別和聚類,提出圖譜結(jié)構(gòu)特征提取方法,以及利用譜特征進行圖的識別與聚類,并應用于圖像庫的檢索。研究成果曾獲亞洲計算機視覺學術(shù)會議最佳論文獎和安徽省科技進步三等獎。在國內(nèi)外學術(shù)刊物和國際會議上發(fā)表論文70余篇,論文被SCI、EI、ISTP等索引40多次,論文代表作曾發(fā)表于《IEEE Transactions on Pattern Analysis and Machine Intelligence》、《Computer Vision and Image Understanding》、《Pattern Recognition》、《Pattern Recognition Letters》、《Image Vision Computing》等學術(shù)期刊。

    3.智能信息處理方向

    吳小培:博士、教授(博導)。2002年12月于中國科學技術(shù)大學獲博士學位,研究方向為生物醫(yī)學信號處理。2003年10月起在中國科學技術(shù)大學信號與信息處理博士后流動站進行博士后研究(在職), 2004年4月-9月美國加州大學圣地亞哥分校訪問學者。安徽大學中青年骨干教師,安徽省高校學科帶頭人培養(yǎng)對象。研究領(lǐng)域:盲信號處理,生物醫(yī)學信號處理和語音、圖像處理和識別。近年內(nèi)主持和參加國家自然科學基金、安徽省自然科學基金項目等項目5項。發(fā)表學術(shù)論文40余篇。在盲源分離、獨立分量分析和腦電信號處理等方面的研究成果在國內(nèi)有一定的影響,相關(guān)論文多次被同行引用。

    柴曉冬:教授,博士。安徽省高校中青年骨干教師。目前在中國科技大學電子技術(shù)與科學系做博士后研究(在職),研究內(nèi)容為基于生物特征識別的信息安全。參與研究國家自然科學基金項目兩項,主持省教委自然科學基金項目二項,在國內(nèi)外重要學術(shù)刊物及學術(shù)會議上發(fā)表論文三十余篇。

    4.多維信號處理方向

    陶亮:博士、教授(博導),安徽省高校學科拔尖人才,計算機科學與技術(shù)學院院長助理。2003年于中國科技大學獲得信息與通信工程專業(yè)博士學位。1997年考取國家留學基金委公派訪問學者資格,次年被派往加拿大溫莎大學訪問研修一年。1999年被選為安徽大學中青年骨干教師,2001年入選教育部優(yōu)秀青年教師資助計劃并獲項目資助,2002年入選安徽省高校首批學科拔尖人才。自1988年研究生畢業(yè)留校以來,一直從事教學與科研工作,曾給本科生、研究生開設或主講過多門專業(yè)課程,獲得過校教學成果獎和校教書育人先進個人稱號;是本校信號與信息處理專業(yè)碩士生導師(該學位授予點開點導師之一),同時也是本校計算機應用技術(shù)專業(yè)博士生導師。參加或主持過多項科學研究,近期主持了安徽省教育廳自然科學重點研究項目、安徽省自然科學基金項目及教育部優(yōu)秀青年教師資助計劃項目的研究各一項。主要研究方向為多維信號處理、生物特征識別技術(shù)。在《Journal of Computer Science and Technology》、《Chinese Journal of Electronics》、《電子學報》、《Chinese Optics Letters》等核心學術(shù)期刊以及國際學術(shù)會議上發(fā)表論文50多篇,獲得過安徽省第四屆自然科學優(yōu)秀學術(shù)論文獎,目前(2005年4月)已有2篇論文被SCI收錄,22篇論文被EI收錄,10篇論文被ISTP收錄,多篇論文被他人引用;有專著1部(《實值Gabor變換理論及應用》);是《電路與系統(tǒng)學報》和《計算機輔助設計和圖形學學報》審稿人以及IEEE國際電路與系統(tǒng)專業(yè)學術(shù)年會審稿人(被邀請擔任過審稿委員會委員、專題分會主持)。

    三、主要學術(shù)成果

    1.在國家自然科學基金項目“基本矩陣的魯棒性計算及應用”支持下,應用視覺理論、投影幾何、代數(shù)幾何、矩陣分析和現(xiàn)代數(shù)學最優(yōu)化理論,完成了基本矩陣的魯棒性算法研究,并給出了在3維計算機視覺中相關(guān)問題的魯棒性算法。

    2.在國家自然科學基金項目“基于SVD分解的射影重構(gòu)算法研究”支持下,對基于SVD分解的射影重構(gòu)算法作深入系統(tǒng)的研究,并通過模擬數(shù)據(jù)和真實圖像兩方面的實驗,獲得圖像中匹配點噪聲效應的定量理解和算法性能的定性理解。

    3.在國家自然科學基金項目“基于照片的場景重現(xiàn)”支持下,對基于序列圖像的全景漫游技術(shù)進行了研究,主要包括:圖像插補問題、圖像整合問題及全景圖生成問題。

    4.在國家“863”計劃項目“基于虛擬現(xiàn)實技術(shù)的裝配幫助系統(tǒng)”支持下,完成了以下研究工作:1)建立一個Windows環(huán)境下的多模綜合實驗平臺;2)實現(xiàn)一個基于視點的物體識別、定位的幫助裝配系統(tǒng)的虛擬現(xiàn)實系統(tǒng);3)對攝像機自標定、基于視點的插補、3D重構(gòu)等問題進行了深入地研究。經(jīng)國家“863”專家組鑒定:對本領(lǐng)域的研究起到了開拓性的作用。

    5.在國家自然科學基金項目支持下對計算機產(chǎn)生體視全息圖進行了研究。全息技術(shù)能提供所有視點、距離上的3D(深度)感知,它是目前最理想的3D顯示。當今來自計算機、衛(wèi)星、先進醫(yī)學成像設備、戰(zhàn)場環(huán)境的精確模擬以及地質(zhì)勘探等各個領(lǐng)域的數(shù)據(jù)與日俱增,人們越來越希望能將這些數(shù)據(jù)變換成人們更易理解的形式,即真3D顯示的形式。它無須借助眼鏡、頭盔等輔助設備,并用計算機生成3D顯示的編碼,由光電器件生成空間顯示。

    6.先后完成“基于圖像的交通肇事現(xiàn)場測距系統(tǒng)”、“基于圖像序列的交互式全景漫游生成系統(tǒng)”、“合肥風光交互式全景漫游系統(tǒng)”、“基于圖像的犯罪現(xiàn)場重現(xiàn)系統(tǒng)”、“蕪湖長江大橋和合肥中心油庫交互演示系統(tǒng)”、“宜昌交互式招商引資展示系統(tǒng)”等開發(fā)和研制,并應用于交通事故處理、公安刑偵、城市規(guī)劃、旅游宣傳等多個方面,取得了較好的社會效益和經(jīng)濟效益。對計算機視覺、圖像處理以及虛擬現(xiàn)實技術(shù)的推廣應用起到了積極的促進作用。其中“基于圖像的交通肇事現(xiàn)場測距系統(tǒng)”和“合肥風光交互式全景漫游系統(tǒng)”經(jīng)合肥市科技局組織專家鑒定:核心技術(shù)水平達到國際先進水平,系統(tǒng)達到國內(nèi)領(lǐng)先水平,并填補國內(nèi)空白。

    7. 在國家自然科學基金、安徽省自然科學基金項目等項目的支持下,初步驗證了用獨立分量描述思維腦電特征的可行性,并提出了基于思維腦電獨立分量特征的腦機接口技術(shù)研究新設想。該研究思路和階段性成果獲得了國內(nèi)外專家的肯定;研究了小波變換和獨立分量分析進行結(jié)合的可行性,實驗結(jié)果表明,基于小波變換和ICA的時頻空三域分析方法能較好地解決多導腦電信號ICA分析中存在的過完備問題和非平穩(wěn)問題;研究了在線ICA算法及其實現(xiàn)技術(shù),提出了一種簡單實用的在線Infomax算法,并用于實測腦電數(shù)據(jù)的在線消澡問題,取得了較理想的結(jié)果,該項成果是對Infomax 盲源分離算法的擴展和補充。

    8.在教育部優(yōu)秀青年教師資助計劃項目、安徽省自然科學基金項目以及安徽省教育廳自然科學重點研究項目的支持下,研究提出了實值離散Gabor變換(RDGT)理論與快速算法,提出了基于RDGT的瞬變信號表示算法、基于過抽樣RDGT的核磁共振FID信號增強算法,以及基于RDGT的線性時變系統(tǒng)表示與逼近方法;研究了基于人臉識別的身份認證方法與系統(tǒng)。研究成果以40多篇論文中英文形式發(fā)表在《Journal of Computer Science and Technology》、《Chinese Journal of Electronics》、《電子學報》等重要的核心學術(shù)期刊和若干國際學術(shù)會議上,并且已有20多篇論文被SCI、EI、ISTP收錄。

    四、學科研究方向介紹

    1.計算機視覺及應用方向

    將多視圖幾何與矩陣分析、諧波分析和現(xiàn)代數(shù)學最優(yōu)化理論結(jié)合起來,研究基于圖像的3D成像幾何與物理中的算法和應用,包括基本矩陣的魯棒計算及應用、基于照片的場景重現(xiàn)和SVD重構(gòu)、基于虛擬現(xiàn)實技術(shù)的裝配幫助系統(tǒng)、計算機產(chǎn)生體視全息圖的研究及其在交通事故處理、公安刑偵、城市規(guī)劃、旅游宣傳、文化遺產(chǎn)保護等方面的應用。

    2.圖像處理與識別方向

    將現(xiàn)代圖的分解理論、現(xiàn)代統(tǒng)計學理論和模式識別理論應用于數(shù)字圖像的分析與識別,對圖像的結(jié)構(gòu)化描述、圖像特征的提取、圖像的配準、結(jié)構(gòu)模式識別中的圖匹配理論和圖的聚類方法進行研究,并將圖匹配理論和圖聚類方法應用于圖像庫的檢索和索引。

    3.智能信息處理方向

    研究小波分析理論及其在腦電信號處理中的應用、基于時-頻-空三域分析方法的思維腦電特征提取與識別、思維腦電的獨立分量分析及其在腦機接口中的應用、在線盲源分離算法及其DSP實現(xiàn)。

    4.多維信號處理方向

    研究多維信號分析與處理技術(shù)的新理論和新方法,并應用于生物信息、語音、圖像信號的處理和識別。如一維和二維實值離散Gabor變換理論、快速算法及應用的研究;復雜背景下灰度圖像和彩色圖像中人眼自動定位算法;基于人臉識別的身份認證方法與系統(tǒng)實現(xiàn);支持向量機快速學習算法及應用;語音消澡和識別技術(shù)等。

    數(shù)據(jù)挖掘與知識發(fā)現(xiàn)期刊(數(shù)據(jù)挖掘,雜志)

    以上就是關(guān)于數(shù)據(jù)挖掘與知識發(fā)現(xiàn)期刊相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。


    推薦閱讀:

    全國數(shù)據(jù)分析大賽(全國數(shù)據(jù)分析大賽獲獎名單)

    看直播數(shù)據(jù)(在看直播數(shù)據(jù))

    全國數(shù)據(jù)分析大賽官網(wǎng)(全國數(shù)據(jù)分析大賽官網(wǎng)查詢)

    抖音在哪開通櫥窗功能(抖音在哪開通櫥窗功能)

    商業(yè)街區(qū)景觀設計競賽作品(商業(yè)街區(qū)景觀設計競賽作品展示)