安徽省項(xiàng)目申報(bào)
按照國(guó)家科學(xué)技術(shù)獎(jiǎng)勵(lì)工作辦公室要求,現(xiàn)對(duì)安徽省2019年度提名國(guó)家科技獎(jiǎng)勵(lì)的7個(gè)項(xiàng)目進(jìn)行公示。
公示時(shí)間為2019年1月14日至2019年1月20日,為期7天。
公示期內(nèi),任何單位或者個(gè)人如對(duì)公示項(xiàng)目的真實(shí)性和內(nèi)容有異議,可以書(shū)面方式提出并提供必要的證明文件及聯(lián)系方式。個(gè)人提出異議的應(yīng)表明真實(shí)身份,單位提出的應(yīng)加蓋公章。匿名異議和超出期限的異議不予受理。
- 附件:1、大數(shù)據(jù)挖掘的若干模型和方法.docx
- 附件:2、強(qiáng)流穩(wěn)態(tài)中子調(diào)控關(guān)鍵技術(shù)及裝置.docx
- 附件:3、工業(yè)園區(qū)有毒有害氣體光學(xué)監(jiān)測(cè)技術(shù)及應(yīng)用.docx
- 附件:4、冷空調(diào)裝備綠色工質(zhì)替代關(guān)鍵技術(shù)與產(chǎn)業(yè)化.docx
- 附件:5、抗艾滋病、乙肝原料藥拉米夫定及其系列制劑開(kāi)發(fā).docx
- 附件:6、慢性前列腺炎及前列腺癌的系列研究與臨床應(yīng)用.docx
- 附件:7、難治性非小細(xì)胞肺癌手術(shù)關(guān)鍵技術(shù)創(chuàng)新應(yīng)用與推廣.doc
-
(一)項(xiàng)目名稱(chēng)
大數(shù)據(jù)挖掘的若干模型和方法
(二)提名意見(jiàn)
該項(xiàng)目對(duì)大數(shù)據(jù)挖掘的若干模型和方法開(kāi)展了深入研究,解決了大數(shù)據(jù)挖掘若干科學(xué)問(wèn)題,例如,系統(tǒng)性地闡明大數(shù)據(jù)的基本特征,提出了大數(shù)據(jù)多層次處理框架;設(shè)計(jì)稀疏嵌入與最小方差下的哈希方法,有效解決訓(xùn)練數(shù)據(jù)集具有海量特征和高維特征的問(wèn)題;發(fā)明了含缺失值的決策樹(shù)分類(lèi)子,可以直接有效地利用缺失數(shù)據(jù)。
研究成果發(fā)表在TKDE、TIP和PAMI等權(quán)威雜志,在國(guó)內(nèi)外產(chǎn)生一定的學(xué)術(shù)影響,被同行引用2600多次、SCI引用1100多次,獲得了學(xué)術(shù)界和工業(yè)界的跟進(jìn)發(fā)展和采用,推動(dòng)了本學(xué)科及相關(guān)學(xué)科的發(fā)展。
項(xiàng)目材料填寫(xiě)規(guī)范,內(nèi)容真實(shí),經(jīng)公示無(wú)異議。對(duì)照國(guó)家自然科學(xué)獎(jiǎng)授獎(jiǎng)條件,提名該項(xiàng)目為國(guó)家自然科學(xué)獎(jiǎng)二等獎(jiǎng)。
(三)項(xiàng)目簡(jiǎn)介
圖靈獎(jiǎng)獲得者斯通布雷克教授認(rèn)為,大數(shù)據(jù)的四種含義之一是大多樣性,意指:處理來(lái)自太多源的數(shù)據(jù)必然導(dǎo)致令人畏懼的數(shù)據(jù)集成挑戰(zhàn)。數(shù)據(jù)集成的實(shí)質(zhì)性困難在于多源數(shù)據(jù)的海量、異質(zhì)異構(gòu)和低質(zhì)量性,這也一直是數(shù)據(jù)庫(kù)領(lǐng)域的基礎(chǔ)性關(guān)鍵研究問(wèn)題。該項(xiàng)目組在過(guò)十來(lái)年對(duì)大數(shù)據(jù)的上述挑戰(zhàn)中海量、高維、動(dòng)態(tài)和低質(zhì)量等問(wèn)題展開(kāi)深入研究,揭示了大數(shù)據(jù)中模式的形態(tài)與演變態(tài)勢(shì),提出訓(xùn)練樣本的分塊挖掘方法、噪音數(shù)據(jù)和缺失數(shù)據(jù)利用模型,從而,在2013年闡明了大數(shù)據(jù)的四個(gè)基本特征:異構(gòu)、自治、復(fù)雜和演化,凝練出HACE定理。主要科學(xué)發(fā)現(xiàn)點(diǎn)如下:
1、大數(shù)據(jù)的基本特征與挖掘框架:闡明大數(shù)據(jù)的基本特征,提出了大數(shù)據(jù)多層處理框架,為大數(shù)據(jù)分析提供了理論基礎(chǔ)和應(yīng)用框架;提出稀疏嵌入與最小方差下的哈希方法,用于處理海量特征和高維特征的訓(xùn)練數(shù)據(jù)集。
2、不完全動(dòng)態(tài)大數(shù)據(jù)的模式發(fā)現(xiàn):揭示大數(shù)據(jù)中模式的形態(tài)與演變態(tài)勢(shì),提出面向大數(shù)據(jù)的不完全信息下模式發(fā)現(xiàn)、動(dòng)態(tài)模式發(fā)現(xiàn)和模式演變的模型與方法。
3、噪音以及缺失數(shù)據(jù)的模式質(zhì)量:揭示噪音數(shù)據(jù)的可修正機(jī)制及缺失數(shù)據(jù)與已知數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,提出誤差感知下的貝葉斯分類(lèi)器用于解決噪聲數(shù)據(jù)清洗所帶來(lái)的信息丟失和信息錯(cuò)誤的問(wèn)題。