今天,大數(shù)據(jù)(big data)一詞正越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù)。隨著經(jīng)濟社會的發(fā)展,大數(shù)據(jù)可能帶來的深刻影響和巨大價值日益被認識,它通過技術(shù)的創(chuàng)新與發(fā)展,以及數(shù)據(jù)的全面感知、收集、分析、共享,為我們提供了一種全新的看待世界的方法,其帶來的信息風(fēng)暴正全方位地改變著我們的生活、工作和思維。
大數(shù)據(jù)時代,面向大數(shù)據(jù)市場的新技術(shù)、新產(chǎn)品、新服務(wù)、新業(yè)態(tài)會不斷涌現(xiàn)。在硬件與集成設(shè)備領(lǐng)域,大數(shù)據(jù)將對芯片、存儲產(chǎn)業(yè)產(chǎn)生重要影響,將催生一體化數(shù)據(jù)存儲處理服務(wù)器、內(nèi)存計算等市場。在軟件與服務(wù)領(lǐng)域,大數(shù)據(jù)將引發(fā)數(shù)據(jù)快速處理分析、數(shù)據(jù)挖掘技術(shù)和軟件產(chǎn)品的發(fā)展。
NLPIR大數(shù)據(jù)語義智能教學(xué)科研平臺是大數(shù)據(jù)語義智能分析專業(yè)的教學(xué)科研綜合平臺。平臺以自然語言理解為核心,結(jié)合北理工團隊多年的科學(xué)研究與一線教學(xué)經(jīng)驗,以科學(xué)嚴(yán)謹?shù)姆绞,致力于提升學(xué)員大數(shù)據(jù)與人工智能的教學(xué)培訓(xùn)、科學(xué)研究與工程實踐的水平。
NLPIR大數(shù)據(jù)語義智能教學(xué)科研平臺具有一套完善且豐富的教學(xué)體系,課程教材、視頻教學(xué)、實訓(xùn)平臺、實驗驗證和項目案例五位一體。
NLPIR大數(shù)據(jù)語義智能教學(xué)科研平臺教學(xué)內(nèi)容豐富,主要圍繞大數(shù)據(jù)、人工智能和自然語言理解三大核心領(lǐng)域展開,核心內(nèi)容包括以下幾個方面:
1)科學(xué)的大數(shù)據(jù)觀:大數(shù)據(jù)的定義,科學(xué)發(fā)展淵源;如何科學(xué)看待大數(shù)據(jù)?如何把握大數(shù)據(jù),分別從“知著”、“顯微”、“曉義”三個層面闡述科學(xué)的大數(shù)據(jù)觀。
2)大數(shù)據(jù)技術(shù)平臺與架構(gòu):云計算技術(shù)與開源平臺搭建;Hadoop、Spark等數(shù)據(jù)架構(gòu)、計算范式與應(yīng)用實踐;TensorFlow深度學(xué)習(xí)平臺。
3)機器學(xué)習(xí)與常用數(shù)據(jù)挖掘:常用機器學(xué)習(xí)算法:Bayes, SVM,深度神經(jīng)網(wǎng)絡(luò)等;常用數(shù)據(jù)挖掘技術(shù):關(guān)聯(lián)規(guī)則挖掘、分類、聚類、奇異點分析;深度學(xué)習(xí):CNN, RNN, LSTM, Attention模型,seq2seq模型。
4)大數(shù)據(jù)語義精準(zhǔn)搜索:通用搜索引擎與大數(shù)據(jù)垂直業(yè)務(wù)的矛盾;大數(shù)據(jù)精準(zhǔn)搜索的基本技術(shù):快速增量倒排索引、結(jié)構(gòu)化與非機構(gòu)化數(shù)據(jù)融合、大數(shù)據(jù)排序算法、語義關(guān)聯(lián)、自動緩存與優(yōu)化機制;大數(shù)據(jù)精準(zhǔn)搜索語法:鄰近搜索、復(fù)合搜索、情感搜索、精準(zhǔn)搜索;
5)非結(jié)構(gòu)化大數(shù)據(jù)語義挖掘
語義理解基礎(chǔ):ICTCLAS與漢語分詞;內(nèi)容關(guān)鍵語義自動標(biāo)引與詞云自動生成;大數(shù)據(jù)聚類;大數(shù)據(jù)分類與信息過濾;大數(shù)據(jù)去重、自動摘要;情感分析與情緒計算;不良信息智能過濾.
6)知識圖譜的大數(shù)據(jù)自動構(gòu)建與應(yīng)用:知識圖譜概念;知識點的自動發(fā)現(xiàn);基于bootstrapping的知識大數(shù)據(jù)生成;
7)NLPIR智能語義平臺:NLPIR智能語義分析在線云服務(wù);NLPIR Parser語義分析平臺實訓(xùn);NLPIR智能語義 |