國家茶葉全產(chǎn)業(yè)鏈大數(shù)據(jù)中心于2019年11日13經(jīng)農(nóng)業(yè)農(nóng)村部批復,2021年9日16通過農(nóng)業(yè)農(nóng)村部驗收。中心從國家戰(zhàn)略需求出發(fā),落實國家關(guān)于數(shù)字農(nóng)業(yè)農(nóng)村發(fā)展的部署要求,為涉茶政府部門、經(jīng)營主體、科研機構(gòu)、公眾等提供專業(yè)權(quán)威的數(shù)據(jù)服務(wù),致力于支撐茶產(chǎn)業(yè)科學決策,提高茶產(chǎn)業(yè)數(shù)字化水平,助推我國茶產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型,同時為數(shù)字農(nóng)業(yè)項目建設(shè)提供試點經(jīng)驗。中心開展茶產(chǎn)業(yè)數(shù)據(jù)的采集、存儲、挖掘工作,在功能上按照一體化管理和模塊化應(yīng)用思路進行,并強化了數(shù)據(jù)采集和應(yīng)用功能,開發(fā)了豐富多元的數(shù)據(jù)采集功能,同時根據(jù)具體的應(yīng)用場景開發(fā)了相對獨立的數(shù)據(jù)挖掘和模型系統(tǒng)。目前已具備數(shù)據(jù)采集、分析和發(fā)布能力,其中消費趨勢數(shù)據(jù)、電商數(shù)據(jù)、輿情監(jiān)測數(shù)據(jù)已經(jīng)具有明顯的輔助決策能力,對全面把握茶產(chǎn)業(yè)運行規(guī)律、產(chǎn)業(yè)政策制定、指導科學決策開始發(fā)揮作用。

建設(shè)內(nèi)容:
1.茶葉全產(chǎn)業(yè)鏈數(shù)據(jù)倉庫
利用大數(shù)據(jù)技術(shù)對互聯(lián)網(wǎng)采集信息進行加工處理,按照茶產(chǎn)業(yè)、茶科技、茶文化三大主題板塊初步建成一批涉茶專題庫。例如:匯聚涉茶電子商務(wù)數(shù)據(jù)上萬條,全面、真實地反映被監(jiān)測區(qū)的茶葉品牌線上流通情況,為指導茶葉經(jīng)營決策提供可靠數(shù)據(jù)來源;匯聚國際及國內(nèi)茶葉生產(chǎn)情況數(shù)據(jù)上萬條,為分析國內(nèi)外茶產(chǎn)業(yè)發(fā)展差異、了解國內(nèi)外茶葉發(fā)展情況提供數(shù)據(jù)支撐;匯聚茶葉昆蟲標本數(shù)據(jù)3000余條,提供在線瀏覽、檢索標本服務(wù),提升標本管理準確性,降低了對實物標本的人為損壞幾率...目前三大板塊專題數(shù)據(jù)庫建設(shè)10個,供社會公眾免費查詢。
2.數(shù)據(jù)挖掘與決策系統(tǒng)
中心建有功能相對完善的數(shù)據(jù)匯聚與挖掘平臺。數(shù)據(jù)挖掘系統(tǒng)可實現(xiàn)混搭數(shù)據(jù)的融合和數(shù)據(jù)價值發(fā)掘,具備分析系統(tǒng)的功能、分析能力和計算能力。通過數(shù)據(jù)采集系統(tǒng)的治理及清洗,數(shù)據(jù)挖掘系統(tǒng)將基于這部分數(shù)據(jù),進行指數(shù)編制、數(shù)學建模、查詢統(tǒng)計、機器學習、可視化展示等工作,實現(xiàn)對數(shù)據(jù)的綜合利用,為茶產(chǎn)業(yè)生產(chǎn)、管理與科學研究提供各類統(tǒng)計、檢索、分析、識別、評估、預測、決策等服務(wù)。
3. 茶葉輿情與熱點監(jiān)測系統(tǒng)
對互聯(lián)網(wǎng)上涉及茶葉全產(chǎn)業(yè)鏈的政策信息、消費趨勢、敏感事件等信息進行全面匯聚,開發(fā)輿情分析產(chǎn)品與服務(wù),包括茶葉輿情預警服務(wù)系統(tǒng)、茶葉互聯(lián)網(wǎng)輿情年度報告,為政府部門、生產(chǎn)經(jīng)營者提供茶葉產(chǎn)業(yè)鏈社會關(guān)注焦點,進而為提前研判茶葉產(chǎn)業(yè)形勢提供依據(jù)。利用NLP(自然語言處理)技術(shù)對帶有情感色彩的主觀性文本數(shù)據(jù)進行分析、處理、歸納和推理。可以將消費者對產(chǎn)品的評價以數(shù)字的形式直觀地展現(xiàn),可以形成關(guān)鍵字云圖。

4. 茶葉消費趨勢監(jiān)測系統(tǒng)
對互聯(lián)網(wǎng)上涉及茶葉消費的電商平臺,監(jiān)測主要茶類消費流通端的銷售數(shù)據(jù),主要包括六大茶類銷售額數(shù)據(jù)、各省份茶葉銷量訂單、各月份茶葉銷量訂單、熱點城市茶葉銷量訂單、各茗茶銷量訂單以及各品牌銷售金額情況等等。
5. 茶病茶蟲數(shù)字標本線上博物館
茶樹病蟲數(shù)字標本館平臺將中國農(nóng)業(yè)研究院茶葉研究所標本館藏的5目36科109種3000條標本搬上了數(shù)字化平臺,研究人員通過網(wǎng)絡(luò)查詢數(shù)字標本館,不僅能跨越時空,全方位、多層次檢索研究標本信息,還可以與自然因子、其他生物信息相結(jié)合探索生物多樣性及其保護的難點問題,為科學研究、多樣性保護決策及公眾查詢提供更優(yōu)質(zhì)、更高效的服務(wù)。

6. 數(shù)據(jù)挖掘應(yīng)用場景案例
針對茶產(chǎn)業(yè)研究的不同主題所需要用到的不同的計量模型或機器學習算法,大數(shù)據(jù)平臺也內(nèi)置了數(shù)據(jù)挖掘算法,實現(xiàn)常用算法的封裝,集成目前主流的計量統(tǒng)計分析模型,可簡單便捷的進行計量模型的抽取與運算。
