文本挖掘(Text Mining,TM),又稱自然語言處理(Nature Language Processing,NLP),指從文本數據中提取有價值的信息,是數據挖掘中的一種方法,也是大數據時代的前沿領域。目前,文本挖掘不僅僅應用於人機對話系統、推薦算法及商業領域,學術圈也不例外;如果在知網以“文獻挖掘”為主題進行檢索,你會發現文本挖掘技術已經廣泛應用到了各個科研領域當中。
下圖為“文本挖掘”在知網學檢索科領域結果分析
語言研究、經濟管理、政策分析、新聞媒體輿情分析、生物醫葯等研究中都可以看到文本挖掘的身影,從海量的文本數據中挖掘有效的數據信息已成為了熱門的研究方向;2020年,教育部印發通知增設“交叉學科”門類,表明多學科交叉融合將成為加速科研發展的重大趨勢。
讓文本挖掘賦能你的研究,還不快上車?
你可能想說:我也想學,但是什麼數據挖掘聽上去很難?!別擔心,本次小募邀請到了數據分析領域著名專家——張文彤老師為大家帶來《Python數據分析-玩轉文本挖掘》課程!
文彤老師擁有20+年的數據分析/統計軟件商業培訓經驗,通俗易懂是他最突出的教學風格;《Python數據分析-玩轉文本挖掘》是從實際應用的角度出發,不會過多的強調編程技巧。課程中選用了經典武俠小說、大眾點評抓取結果、微博語料數據等多個實際案例進行教學,學習完本課程後,學員將能夠獨立使用Python環境完成中文文本挖掘的各種工作。