大數據是近年來的熱門話題。大數據的優勢和大數據帶來的新思潮形成了研究熱潮。從隨機抽樣到所有樣本,從要求準確性到處理混雜,從追求因果關系到發現相關性,大數據時代正在改變我們的信息環境和信息處理思維模式。但是,並不是所有人都能同時進入大數據時代。像每壹次媒體技術的創新和擴散壹樣,敏感企業和組織是大數據的開拓者和實踐者,也是大數據的最早受益者;而普通個體在大數據面前各不相同,有的及時跟進慢,有的數據分析能力欠缺,有的不知道如何找到開放的數據,有的在數據噪音面前不知所措。傳統互聯網時代的數字鴻溝尚未完全彌合,但在大數據時代,新的數字鴻溝正在形成,並不斷影響和改變人們的政治和經濟地位。
討論大數據時代的數字鴻溝,需要明確區分“數字差異”和“數字鴻溝”。從詞源上看,兩者意思相近,都是從“數字鴻溝”翻譯過來的。但從傳播效果或情感色彩來看,數字鴻溝比數字差異更能引起人們的警醒。大數據時代,人們創造數據,被數據包圍。由於人的視野和精力,人在面對數據和做出選擇時難免會有分歧。比如互聯網提供的個性化搜索引擎和個性化文件夾,會導致信息瀏覽的個性化,大數據時代的數字差異不可避免。數字鴻溝比數字差異更能引起人們的警惕,數字鴻溝強調的是理解和機遇上的差異。數字差就是知道有機會而不去做,數字鴻溝就是想做而沒有能力和機會。大數據背景下,數字鴻溝可能存在於三個層面:擁有數據、分析數據、思考數據。
三種不同的分析維度
(壹)數據方面的數字鴻溝
大數據時代,“全新”、“革命”、“顛覆性”等術語頻繁出現,但“大數據”標簽下所指的問題卻由來已久。隨著互聯網的蓬勃發展,人們不得不面對數據的指數級增長、信息過載和數據處理問題。在大數據時代,數據挖掘、存儲、處理和應用的技術發展迅速,但目前對大數據的討論並沒有對誰擁有數據這個最基本的問題給出滿意的答案,這就造成了數字鴻溝。
1.開放數據
對於企業和政府來說,大數據是壹筆寶貴的財富。“掌握大數據可以轉化為經濟價值的來源”,可以從更準確的角度理解和管理社會。因此,企業和政府需要從普通大眾中收集數據。數據的傳播是壹個自下而上的過程,來自企業和政府的“數字化先鋒”最先擁有和控制大數據。然而,彌合數字鴻溝只需要另壹種形式的數據流,即開放數據——讓企業和政府擁有的數據為公眾所共享,這是壹個自上而下的過程。在現實生活中,這種自上而下的信息流處處面臨阻力:壹方面,企業將數據視為核心競爭力或核心機密,花費大量人力、物力、財力做數據分析,難以享受數據;另壹方面,政府數據公開的步伐仍然比較緩慢,公眾仍然難以獲得有價值的信息。
開放數據造成的數字差異,需要通過開放數據來解決。哪些數據可以向公眾開放,以什麽形式開放,誰是具體的實施者,誰可以為數據開放過程中的“搭便車”行為買單,這些都是需要考慮的問題。大數據不僅可以產生商業價值,還具有公共性的特點。在這個過程中,與公共利益密切相關的數據需要開放。早在2007年6月65438+10月65438+7月,我國就通過了《中華人民共和國信息公開條例》,明確規定了信息公開的原則、範圍、方式、程序和監督保障制度。大數據時代,政府應進壹步加大數據開放力度,同時對公眾進行獲取數據的素養教育,實現數據的全民所有和全民享用。作為壹種公共資源,數據分配的公平性和財富分配的公平性壹樣,會對社會結構產生很大的影響。政府和企業可以依靠數據存儲和分析技術的發展來做“數據銀行”業務,讓每個公民都有機會在“數據銀行”中存儲和提取自己想要的數據。國內學者塗子沛在《大數據》壹書中,從數據民主的角度思考開放數據,指出開放數據遊戲將推動“開放政治、開放政府、開放媒體、開放城市等壹系列運動和口號”,為消除數據所有權形成的數字鴻溝,建設壹個數據公平的美好新世界提供了可行的途徑。
2.數據收集
大數據時代的基礎在於海量數據。大數據有多大?麥肯錫全球研究院最新報告對大數據的定義是:“大數據是指規模超過傳統數據庫軟件工具抓取、存儲、管理和分析能力的數據組。”而且大數據的標準也是隨著數據的指數級增長而不斷變化的。今天,當我們談論大數據時,我們經常以pb為單位。海量數據提供了更詳細的信息,但也存在壹些隱憂,即數據的價值密度太小,因此收集數據和在海量數據中尋找有價值信息的成本太高。勛伯格在接受《中國經濟周刊》記者謝偉專訪時表示:“在很多方面,我們仍然生活在壹個‘小數據’的時代,而在這個時代收集數據是非常耗時、昂貴和困難的。”大數據時代的數據采集是壹個龐大的工程,大數據遠非普通人所能承受。
數據采集中的數字鴻溝在大數據時代似乎並沒有減少,而是隨著大數據處理技術的發展而逐漸擴大。對於媒體和企業來說,收集和處理數據並不容易。著名的《哈佛商業評論》雜誌對全球財富1000的企業應用大數據的情況做了壹個科學的調查,發現“大部分企業還處於大數據的初級階段,還很年輕,還不具備真正挖掘大數據的能力”。此外,“只有聰明的%的受訪者認為他們企業的數據可訪問性足夠好或達到世界壹流水平。只有21%的受訪者認為自己公司的分析能力足夠好或達到世界水平”。顯然,對於普通大眾來說,數據的收集和挖掘更加困難和不同。在搜索引擎主導信息流的時代,大眾因為使用不同的搜索引擎而產生了數字鴻溝。使用普通搜索引擎和使用更專業的搜索引擎和數據庫是有區別的。大數據時代,公眾不僅需要知道如何使用專業的搜索引擎,還需要在海量的信息中快速找到最有價值的信息。由於公共能力的差異,在收集階段產生的數字鴻溝將難以避免。而且互聯網下的數據是不斷更新的,時效性非常重要和關鍵。在對“知識鴻溝”的研究中,西方學者J.S .艾蒂瑪和F.G .克萊因曾提到“上限效應”,即知識鴻溝會隨著時間的推移而逐漸縮小。但是,在互聯網時代,信息的價值和時效性是密切相關的。即使公眾在收集數據上的“差距”隨著時間的推移逐漸縮小,後來者所擁有的數據價值也會大打折扣。媒體環境學派的代表人物萊文森或許有助於緩解大數據時代數據收集的差異。他認為建立信息分類規則可以解決信息過載的問題。比如在圖書上建立圖書分類規則,按照這個規則操作,可以解決圖書館信息過載的問題。這壹思想對於解決長期困擾人類的信息過載具有普遍的啟示意義。
(B)分析數據中的數字鴻溝
數據歸誰所有會有所不同,同樣數據的情況下,公眾對數據的使用能力不同,也會有所不同。大數據既包括基於數量關系的結構化數據,也包括基於定性描述的非結構化數據,非結構化數據往往占比很大。所以,在大數據時代,擁有相同的數據並不意味著妳也可以使用這些數據。分析數據,挖掘價值上的數字鴻溝,還是需要引起我們的警惕。
1.數據刪除
大數據時代是信息高度碎片化的時代。信息中的重復、噪音、冗余和人為因素(網絡水軍)都影響著人們對數據的分析和利用。這個時候刪除數據和收集數據壹樣重要。除了《大數據時代:生活、工作和思維的巨大變化》,勛伯格還有壹部頗具影響力的作品——刪除:選擇大數據的方式。在這部作品中,勛伯格提醒人們,大數據時代“記憶成為常態,遺忘成為例外”,要註意信息選擇的方式;在這個“沒有遺忘的世界”中,遺忘剛剛成為壹種有價值的信息處理方法,刪除權限數據是壹個人性化的問題。隨著“計算機原生代”的發展
長久以來,每個人都有壹段青澀、尷尬甚至渺小的過去。在互聯網出現之前,人們會努力忘記這些小小的快樂往事,但互聯網的記憶讓每個人都變得渺小,面對人們可能為十年前犯下的錯誤付出代價的現實。
刪除也是壹個技術問題。在互聯網時代,歷史悠久的數據會逐漸成為“數據垃圾”,不僅會占用大量存儲資源,還會影響對當前數據的分析。評估和刪除數據已經成為大數據時代必不可少的數據處理方法。但是涉及到個人,就有問題了。人無法像機器壹樣評價和處理信息,只能根據以往的經驗處理信息。另壹位國外學者提契諾在分析“知識鴻溝”產生的原因時提到,個人信息儲備也會產生“知識鴻溝”,即“正規教育和從大眾媒體獲得的信息會幫助受過高等教育的人提供理解知識的背景。”大數據時代並沒有改變人們接受信息的習慣,所以首先學會接受和刪除信息的還是受過高等教育的人。刪除也有哲學意義。大數據時代,選擇是刪除。人們對數據的接受存在零和效應。“面對壹組數據意味著放棄其他數據,這是另壹種刪除。處理低質量的過時數據是發現大數據意義的前提。著名學者馬修·e·梅(Matthew E. May)寫的《簡化:大數據時代商業的制勝法則》也提到了大數據時代的信息刪除和簡化問題。大數據時代,能在第壹時間快速獲取最有價值數據的企業會逐漸發展起來,不懂大數據或者沈迷於大數據的企業會逐漸落後。
2.有用數據
大數據時代提供了壹個多樣、詳細、復雜的數據環境。大數據時代,壹切現實都可以量化為數據。但如果用大數據創造價值,就需要從海量數據中找到有價值的數據,還原到現實中。因為擁有壹個數據集,無論大小,本身都不會帶來任何價值。“大數據的終極價值還是體現在數據的‘可用性’上。與此同時,數字鴻溝的問題也出現在數據的“可用性”上。大數據就像提供了壹個美味的堅果,沒有工具很難打開,而大數據所使用的“雲存儲和雲計算”也不是任何壹個公眾都容易掌握的。少部分人掌握了分析和應用數據的能力,相當壹部分人在海量的大數據面前不知所措,最終陷入信息過載的焦慮之中。
彌合數據可用性的“數字鴻溝”需要讓數據直觀可見,這仍然是壹個公共話題。將數據還原到現實,不僅需要數據分析的人工智能技術,還需要人敏銳的分析判斷能力。更重要的是,要把數據提示的環境真實地傳達給大眾。政府和媒體還有很多事情要做。第壹,需要數據處理技術的普及,將關於公共事務的大數據解讀視為公共事業。例如,在20世紀60年代,被稱為“人工智能之父”的約翰·麥卡錫(john mccarthy)就預言“有壹天,計算可能會成為公共設施”。其次,媒體要做好數據和現實之間的“擺渡人”。比如美國記者在報道龍卷風的時候,把被龍卷風破壞的房屋的破壞數據和地圖疊加起來,做成大數據地圖。“這樣,觀眾不僅可以準確了解龍卷風造成災害的大致區域,還可以準確了解龍卷風在某壹區域造成損失的具體情況。
(三)數據思維中的數字鴻溝
大數據熱潮帶來的重要改變,是關於數據思維的改變。關於大數據的討論很多,但並不是“大數據”這個概念自然而然地改變了我們的信息環境。而是在互聯網逐漸走向海量數據的今天,從“數字化生存”到“數字化生存”的大數據思維,給了人們壹個認識世界的額外視角。大數據技術之外的數字鴻溝來自於人的思維層面,即人們對數據的思維不同。
1.超越大數據
大數據時代的思維之壹,就是超越“數據神話”,把數據當成工具,而不是數據霸權。在《大數據時代》壹書中,勛伯格指出了大數據帶來的三個變化:不是隨機樣本,而是所有數據;不是準確,而是雜糅;不是因果關系,而是相關性。這些變化對傳統的定量研究方法產生了很大的沖擊,但定量方法的改進並不能取代定性研究,必須超越數據去發現數據背後的意義和價值。由此,大數據思維包括三個層面。第壹個層次是發現海量數據,了解其潛在價值,但不能很好的利用數據;第二個層次是能利用好數據,但往往陷入數據崇拜,無法解決意義問題;第三個層次是能夠使用數據,但同時要超越數據,發現價值。這三個層次既是大數據發展的歷時過程,也是* * *知識過程。大數據概念的興起和傳播還需要時間,所以數據思維中的三級“數字鴻溝”還會長期存在。
2.大數據素養
縮小數字鴻溝還需要硬件和軟件兩方面的努力,大數據時代依然如此。根據近幾年中國互聯網的統計報告,硬件的數字鴻溝在逐漸縮小,而軟件的數字鴻溝仍在擴大。彌合數字鴻溝需要政府、企業等。開放公共數據並提供使用公共數據的方法。還需要提高全體公民的大數據素養,實現大數據的全民所有和全民享用。數據素養又稱數據信息素養,主要是指人們在科學數據的采集、組織和管理、處理和分析,科學數據的共享和協同創新利用等方面的能力,以及在數據生產、管理和發布過程中的倫理道德和行為規範。只有全面提高全民的數據素養,才能理直氣壯地迎接大數據時代的到來,利用大數據為人類創造新的福祉。