【小D導讀】
騰訊網(wǎng)在正院會館舉辦了一場夏季思享會,而這次思享會的主題就是“大數(shù)據(jù)”。有意思的是,這次關于大數(shù)據(jù)的分享會請到了來自各個領域的學者和專家,是一場跨學科的思想碰撞。在現(xiàn)場的我聽完了整場分享,有趣的觀點不少,還有一些觀點是目前國內(nèi)關注大數(shù)據(jù)的人們不太提及的,非常思辨。
海量數(shù)據(jù)的應用正在改變我們現(xiàn)有的生產(chǎn)方式,其不僅成為了一個重要的生產(chǎn)要素,還在一定程度上提高了生產(chǎn)效率。這時,海量數(shù)據(jù)應用帶來的信息風暴不僅影響到我們的工作、生活,還可以逐漸影響我們的思維方式。有人說大數(shù)據(jù)本身是一場革命,這場革命就是把“量化”這個概念推動到我們生活中的方方面面。
1、關于大數(shù)據(jù)帶來的機遇可以說是學界業(yè)界一致認同的,而北大新聞與傳播學院的劉德寰教授卻提出,大數(shù)據(jù)也可以是“大忽悠”,甚至存在大風險。
大數(shù)據(jù)就一定是全數(shù)據(jù)嗎? 即使是像 BAT 這樣的互聯(lián)網(wǎng)巨頭,他們所擁有的數(shù)據(jù)也只是一座”數(shù)據(jù)孤島“。因此,很多大數(shù)據(jù)其實是斷裂且封閉的。在這一座座孤島被打破之前,大數(shù)據(jù)都無法稱”全“。這種大而不全的數(shù)據(jù)導致我們無法真正獲得想要的規(guī)律。
大數(shù)據(jù)也許會帶來“假規(guī)律”和“偽相關” 雖然關于大數(shù)據(jù)的介紹和分析都告訴我們,大數(shù)據(jù)注重的是“相關關系”,而非“因果關系”,但是,如果只注重相關關系,數(shù)據(jù)量的增加將不可避免的帶來偽相關的現(xiàn)象。當數(shù)據(jù)量達到幾十萬之巨之后,只會導向“萬物相聯(lián)系”這一結論。這時,所選取的變量都會呈現(xiàn)為統(tǒng)計顯著,而這樣的數(shù)據(jù)分析無疑就失敗了。因此,即使大數(shù)據(jù)現(xiàn)在備受推崇,但傳統(tǒng)的抽樣調(diào)查和實驗等社會學研究方法也不應該被拋棄,而應該結合使用。
《大數(shù)據(jù)時代》的譯者周濤也回應了這個觀點:從技術層面上來看,我們的確需要找到因果關系。一方面,有的關聯(lián)如果沒有因果在背后是很難被發(fā)現(xiàn)的;另一方面,因果能夠幫助我們更好的解釋和分析相關。
大數(shù)據(jù)離不開對“人性”的理解 大數(shù)據(jù)的挖掘過程也需要注入思想,這種思想就體現(xiàn)為“人性”。統(tǒng)計數(shù)據(jù)不能代替對人性的理解,真正進行跟人相關的大數(shù)據(jù)挖掘的時候一定要關注人性,這個時候的算法和建模才是有針對性、有意義的。怎樣在數(shù)據(jù)中注入人性?觀察、實驗、調(diào)查等傳統(tǒng)的研究方法都是很好的選擇。比如,喬布斯就經(jīng)常躲在蘋果體驗店外沒人看得見的地方觀察體驗店里的人的行為,這是最早期的研究方法,在擁有大數(shù)據(jù)的今天還在使用是有一定原因的。一句話:諸如“體會、體驗、直覺、靈機一動、內(nèi)省”這些看似與大數(shù)據(jù)無關的東西有可能恰恰就是大數(shù)據(jù)的核心。
大數(shù)據(jù)+小應用的趨勢 所謂大數(shù)據(jù)的小應用,就是把大數(shù)據(jù)應用到各個獨立領域中去。大數(shù)據(jù)運算本身構造了一個擁有更多能力的“新算盤”,擁有這個新算盤不意味著擁有一切,而是有了一個可以在各個領域使用的科學的工具。怎樣做好大數(shù)據(jù)的小應用?有兩個方面:第一,大數(shù)據(jù)與小數(shù)據(jù)結合,這個小數(shù)據(jù)就是基于抽樣調(diào)查的數(shù)據(jù);第二,來自各個獨立領域的專業(yè)知識非常重要,比如以心理學、法學、社會學、營銷學等混合知識作為背景,再去跟數(shù)據(jù)結合,就能夠探索出一個更科學的大數(shù)據(jù)分析和挖掘的方式。
2、關于大數(shù)據(jù)的產(chǎn)業(yè)應用,華大基因的董事長汪建表達了自己的看法:基因研究是一項很少被人了解的產(chǎn)業(yè)研究,但卻是真正的大數(shù)據(jù)應用。
怎樣有效的預測疾病、怎樣降低傳染病的發(fā)病率,這些都需要依靠于基因研究。人身體中的細胞數(shù)量有 10 的 14 次方個,而一個細胞的癌變就可能導致生命的終結。這一個癌細胞分解為 RNA 后就是 10 的 9 次方,變成蛋白質(zhì)則是 10 的 19 次方,這么大的數(shù)據(jù)量足以構成大數(shù)據(jù),而基因研究面對的就是如此量級的數(shù)據(jù)研究和應用。
以對腫瘤細胞的定性、定量研究為例。首先,要知道腫瘤細胞現(xiàn)在的基因是怎樣的,而當出現(xiàn)一兩個基因變化的時候,細胞又會變成什么樣。其次,當眾多腫瘤細胞的基因變化構成了相當量級的數(shù)據(jù)之后,我們就能通過數(shù)據(jù)來展現(xiàn)細胞癌變的動態(tài)變化過程,從而進一步預測疾病。這樣的研究如果用在先天性疾病的防治上將更有意義,這樣有出生缺陷的嬰兒會越來越少。華大在推進的”百萬人基因計劃“,就是一個名符其實的大數(shù)據(jù)應用。因此,汪建從基因研究出發(fā),表達了自己對大數(shù)據(jù)的理解:從大目標出發(fā),踐行大數(shù)據(jù),實現(xiàn)大科學,從而將研究成功運用到各個領域中去,形成大產(chǎn)業(yè)。
3、關于“新技術給我們的生活帶來了什么”這個話題,北大哲學系教授吳國盛給出了一個讓我很認同的觀點:技術本身并不是價值中立的,它有著自身的邏輯和屬性,而這就使得我們在使用新技術時,也必須接受新技術的內(nèi)在邏輯,而這就將改變我們原有的生活方式。
過去,我們認為技術是中性的,它是人類的使用工具,怎么使用它取決于人類自己,但事實并非如此。技術有著自己的自主性、自己的結構,某些技術必定指向某些事情。比如,互聯(lián)網(wǎng)是一種基于民主意識形態(tài)的技術配置,網(wǎng)民相對平等的分配信息,共同分享信息,所以這樣的技術發(fā)源于美國,而不是中國。而當互聯(lián)網(wǎng)進入中國之后,人們除了享受互聯(lián)網(wǎng)帶來的便捷高效,還要被迫接受互聯(lián)網(wǎng)世界中民主、平等、開放的意識形態(tài),這是根植于互聯(lián)網(wǎng)技術中的。因此,雖然國內(nèi)建起了互聯(lián)網(wǎng)高墻,但翻墻一事也是輕而易舉,這就是互聯(lián)網(wǎng)的內(nèi)在邏輯決定的。
4、關于大數(shù)據(jù)與社會變革這個不太被提及的話題,來自不同領域的專家們都從各自的領域出發(fā)分享了自己的感受。
《大數(shù)據(jù)時代》的譯者周濤認為,大數(shù)據(jù)更高級的階段應該是數(shù)據(jù)的集成與共享,并把集成和共享本身作為一種商業(yè)模式。 他舉了一個通過大數(shù)據(jù)幫助全球能源更好的進行配置的例子。首先,周濤所在的電子科大與電力集團達成合作,通過大量遙感裝置和本地勘探數(shù)據(jù)了解到各個國家的能源供需情況。其次,通過與氣象局合作獲得氣象數(shù)據(jù),包括日照、風速風向、降雨等,從而對太陽能、風能、水能等新能源做到短期預測,并實現(xiàn)能源負載平衡。而這些數(shù)據(jù)若再與電力集團的數(shù)據(jù)進行集成和分享,就能將各項能源更有效的調(diào)配使用。
專欄作家安替則談到一個問題:大數(shù)據(jù)是有階級性的,大數(shù)據(jù)時代也許是一個新的政治革命誕生的時代。 之前,社科院農(nóng)發(fā)所社會問題研究中心主任于建嶸說過大數(shù)據(jù)讓每個人變得更加透明,我們生活中的各種行為將通過數(shù)據(jù)被采集,并且分析出來,因此普通老百姓可以說是沒有秘密的。然而,這些數(shù)據(jù)卻不是普通老百姓可以看到或使用的,真正擁有這些數(shù)據(jù)的是部分企業(yè)、機構和政府,普通用戶只是大數(shù)據(jù)的提供者,這就是階級的產(chǎn)生。
因此,在大數(shù)據(jù)時代,數(shù)據(jù)的擁有權是一個關鍵的問題。這跟資本在資本主義剛誕生時最原始的情況是相似的。如果我們說物質(zhì)的匱乏造成資本的流動,資本主義的產(chǎn)生是一些企業(yè)崛起,并跟國家分享權力的話,我們也可以說大數(shù)據(jù)時代恰會濕一個新政治革命誕生的時代。如果擁有大數(shù)據(jù)的人們不讓民眾分享大數(shù)據(jù)的成果,反而用大數(shù)據(jù)來控制民眾(比如維穩(wěn)),那也許會造成更大的國內(nèi)沖突,甚至國際斗爭。
社會學教授郭于華關心的是社會當中的普通人怎樣面對和使用新技術,那么新技術是不是會縮小信息鴻溝和社會鴻溝? 她曾經(jīng)做過一個研究:新生代農(nóng)民工怎樣使用信息技術。她對研究結論的預判是:新技術將有助于新生代農(nóng)民工的社會融入、城市融入。事實上,新技術確實給他們的生活帶來了改變:其一,農(nóng)民工是一個公共生活缺失的人群,信息技術給他們相互之間的交流帶來了很多便利;其二,新媒體給了他們表達的渠道,這是以往所不曾有的;其三,他們可以通過新媒體即時調(diào)用各種所需要的信息,更加了解這個世界。
但即便如此,我們也不能過分夸大信息技術對弱勢群體的作用,因為它確實呈現(xiàn)出比較強的馬太效應:強勢著可以更好的、更有利的利用這些新技術,同時他們也會對其他人加以控制。所以,新技術有沒有可能穿透社會結構的屏障才是關鍵的問題。
其實,像郭于華教授這樣的調(diào)研,也是創(chuàng)業(yè)者們需要的。比如“豌豆莢”就曾經(jīng)派人去東莞的工廠里做調(diào)研,了解打工族們對智能終端和移動應用的真正需求。感興趣的人可以點此閱讀調(diào)查結果。
關于大數(shù)據(jù)和新技術,其實除去技術層面的研究和應用,在與歷史、 社會、人文等學科交叉的過程中還將引發(fā)很多話題,希望以上這些觀點能給大家?guī)ヒ稽c不一樣的思考。
來源:36氪 ? ?作者:張雨忻 整理:IPRdaily趙珍 網(wǎng)站:IPRdaily.com
IPRdaily的個人微信號已經(jīng)開通! 各位D友可添加“IPRdaily”的個人微信號:?iprdaily2014(驗證申請中請說明具體供職機構+姓名),關注小D可獲更多的實務干貨分享,定期私密線下活動,更有機會加入細分專業(yè),接地氣的知識產(chǎn)權圈實務社區(qū)交流群。
? “IPRdaily”是全球視野的知識產(chǎn)權科技媒體,我們報道國內(nèi)外最新知識產(chǎn)權動態(tài),最新創(chuàng)業(yè)公司知識產(chǎn)權部分情報分析,更關注知識產(chǎn)權領域創(chuàng)新商業(yè)模式,以及資本對本行業(yè)投融資信息,我們將客觀敏銳地記錄、述評、傳播、分享知識產(chǎn)權行業(yè)的每一天,我們努力利用互聯(lián)網(wǎng)連接知識產(chǎn)權&未來! ? ? 微信訂閱號: “IPRdaily” IPRdaily|讀懂知識產(chǎn)權&未來
文章不錯,犒勞下辛苦的作者吧