我時常聽創(chuàng)業(yè)者說自己的公司每天會生產(chǎn)/記錄很多的數(shù)據(jù),雖然他們暫時還沒想明白怎么用這些數(shù)據(jù),但把這些數(shù)據(jù)都先存起來了。他們經(jīng)常還說,通過這些數(shù)據(jù)他們的產(chǎn)品/服務(wù)將得到很大的提升,仿佛這些數(shù)據(jù)就是公司的救世主一樣。我不想討論這種觀點(diǎn)正確與否,但想在這里解釋兩個關(guān)于大數(shù)據(jù)的常見誤解:
一、數(shù)據(jù)不等于信息
經(jīng)常有人把數(shù)據(jù)和信息當(dāng)作同義詞來用。其實(shí)不然,數(shù)據(jù)指的是一個原始的數(shù)據(jù)點(diǎn)(無論是通過數(shù)字,文字,圖片還是視頻等等),信息則直接與內(nèi)容掛鉤,需要有資訊性(informative)。數(shù)據(jù)越多,不一定就能代表信息越多,更能不能代表信息就會成比例增多。我們來看兩個簡單的例子:
備份。很多人如今已經(jīng)會定期的對自己的硬盤進(jìn)行備份。這個沒什么好多解釋的,每次備份都會創(chuàng)造出一組新的數(shù)據(jù),但信息并沒有增多。
多個社交網(wǎng)站上的信息。我們當(dāng)中的很多人在多個社交網(wǎng)站上活躍,隨著我們上的社交網(wǎng)站越多,我們獲得的數(shù)據(jù)就會成比例的增多,我們獲得的信息雖然也會增多,但卻不會成比例的增多。不單單因?yàn)槲覀儠ハ噢D(zhuǎn)發(fā)好友的微博(或者其他社交網(wǎng)站上的內(nèi)容),更因?yàn)楹芏鄡?nèi)容會十分類似,有些微博雖然具體文字不同,但表達(dá)的內(nèi)容十分相似。
二、信息不等于智慧(Insight)
好吧,現(xiàn)在我們?nèi)コ藬?shù)據(jù)中所有重復(fù)的部分,也整合了內(nèi)容類似的數(shù)據(jù),現(xiàn)在我們剩下的全是信息了,這對我們就一定有用嗎?不一定,信息要能轉(zhuǎn)化成智慧,至少要滿足一下三個標(biāo)準(zhǔn):
可破譯性。這可能是個大數(shù)據(jù)時代特有的問題,越來越多的企業(yè)每天都會生產(chǎn)出大量的數(shù)據(jù),卻還沒想好怎么用,因此,他們就將這些數(shù)據(jù)暫時非結(jié)構(gòu)化(unstructured)的存儲起來。這些非結(jié)構(gòu)化的數(shù)據(jù)卻不一定可破譯。比如說,你記錄了某客戶在你網(wǎng)站上三次翻頁的時間間隔:3秒,2秒,17秒,卻忘記標(biāo)注這三個時間到底代表了什么,這些數(shù)據(jù)是信息(非重復(fù)性),卻不可破譯,因此不可能成為智慧。
關(guān)聯(lián)性。我們曾經(jīng)對關(guān)聯(lián)性的重要性進(jìn)行過解釋。這里不再贅述了,無關(guān)的信息,至多只是噪音。
新穎性。這個和我前文舉的那個社交網(wǎng)站的例子類似,不同的是,這里的新穎性很多時候無法僅僅根據(jù)我們手上的數(shù)據(jù)和信息進(jìn)行判斷。舉個例子,某電子商務(wù)公司通過一組數(shù)據(jù)/信息,分析出了客戶愿意為當(dāng)天送貨的產(chǎn)品多支付10塊錢,然后又通過另一組完全獨(dú)立的數(shù)據(jù)/信息得到了同樣的內(nèi)容,這樣的情況下,后者就不具備新穎性。不幸的是,很多時候,我們只有在處理了大量的數(shù)據(jù)和信息以后,才能判斷它們的新穎性。
說了這么多,是想表達(dá),其實(shí)我們手上有用的數(shù)據(jù)并沒有我們想象的那么多--大數(shù)據(jù)本身就是個耍噱頭的詞。在如今這個年代,一個普通的創(chuàng)業(yè)公司每天就能生產(chǎn)1GB以上的數(shù)據(jù),稍微大一點(diǎn)的公司每天生產(chǎn)的數(shù)據(jù)都以TB來技術(shù)。但在花錢進(jìn)行大數(shù)據(jù)分析之前,我們要意識到,數(shù)據(jù)不代表信息,更不代表智慧。(RFID世界網(wǎng)編輯整理)
聲明:
凡文章來源標(biāo)明“中國智能交通網(wǎng)”的文章版權(quán)均為本站所有,請不要一聲不吭地來拿走,轉(zhuǎn)載請注明出處,違者本網(wǎng)保留追究相關(guān)法律責(zé)任的權(quán)利;所有未標(biāo)明來源為“中國智能交通網(wǎng)”的轉(zhuǎn)載文章均不代表本網(wǎng)立場及觀點(diǎn),“中國智能交通網(wǎng)”不對這些第三方內(nèi)容或鏈接做出任何保證或承擔(dān)任何責(zé)任。
征稿:
為了更好的發(fā)揮中國智能交通網(wǎng)資訊平臺價值,促進(jìn)諸位自身發(fā)展以及業(yè)務(wù)拓展,更好地為企業(yè)及個人提供服務(wù),中國智能交通網(wǎng)誠征各類稿件,歡迎有實(shí)力的企業(yè)、機(jī)構(gòu)、研究員、行業(yè)分析師投稿。投稿郵箱: itsshenzhen@163.com (查看征稿詳細(xì))