壹.擁有數據來源
數據量與日俱增,越來越多的數據以數據庫的形式存儲。如果妳想獲得自己的數據源,妳必須能夠使用SQL來檢索數據。
除了添加、刪除、修改SQL,最常用的關鍵字都是圍繞Select,包括Where、From、Group By、Order By、Having、Like、Sum、As、Distinct、Join、Limit等關鍵字。
另外,需要註意的是,不同的數據庫有不同的兼容性。
第二,外部數據源
1)網頁抓取數據
如果妳學Python,可以抓取網站上的壹些數據,比如JD。COM的評論數據和大眾點評數據。
2)國家統計局數據
國家數據來源,包括我們國家經濟民生的方方面面,可以從月度、季度、年度維度查閱。
3)百度指數數據
百度是壹個產品,可以幫助洞察某個關鍵詞在某個時間被關註的情況。通常可用於趨勢分析、人群洞察等。當然,除此之外,還有搜狗指數、360指數等搜索指數產品。
4)騰訊TBI指數
騰訊是壹個產品,有助於洞察互聯網熱點信息,了解大致行業趨勢和人群特征。
5)阿裏指數
阿裏系產品,依托天貓、淘寶等阿裏自有交易數據,是國內相對權威的大數據平臺。
此外,還有愛奇藝指數、微信指數等大數據產品。