国产一区在线不卡_国产精品天天摸av网_日韩精品中文字幕第1页_国产精品无码专区在线观看

財經(jīng)統(tǒng)計湖;中南財經(jīng)統(tǒng)計學

財經(jīng)統(tǒng)計湖;中南財經(jīng)統(tǒng)計學

數(shù)據(jù)湖是現(xiàn)在的一個熱點,在大廠迅速普及,可在傳統(tǒng)企業(yè)卻不溫不火,有點冰火兩重天的意思,為什么?

為了更好的理解這篇文章,建議大家可以先讀讀我這篇普及數(shù)據(jù)湖的文章《到底什么是數(shù)據(jù)湖?全面解讀數(shù)據(jù)湖的緣起、特征、技術(shù)、案例和趨勢》。

1、數(shù)據(jù)湖容易望文生義,導致雷聲大雨點小

在我第一次接觸數(shù)據(jù)湖的時候,就望文生義:“什么?把所有東西亂七八糟都扔到一個地方,這也叫一種技術(shù)?應該叫數(shù)據(jù)沼澤吧”,相信很多做數(shù)據(jù)倉庫的朋友第一次聽到這個名詞,會跟我有同樣的反應。

有一次參加合作伙伴大會,正好有展示數(shù)據(jù)湖的,然后我就問講解員:“這個數(shù)據(jù)湖有什么特點?” 然后講解員跟我說了一堆數(shù)據(jù)倉庫的東西,核心意思就是匯聚數(shù)據(jù)。然后我問:“這個跟數(shù)據(jù)倉庫又有什么區(qū)別?” 講解員又扒拉了老半天,我就知道其實他也不知道。

數(shù)據(jù)湖這個概念在大廠的節(jié)奏下莫名其妙的飛起來了,有一天公司同事給我發(fā)了一段老大要講的話,里面提到了數(shù)據(jù)湖,問我們是否已經(jīng)有數(shù)據(jù)湖了,老大的報告里提數(shù)據(jù)湖是不是合適?

我趕緊到網(wǎng)上查了數(shù)據(jù)湖的來龍去脈,發(fā)現(xiàn)hadoop算是一種數(shù)據(jù)湖的形式,但當初建hadoop的時候,可沒人說這是數(shù)據(jù)湖啊。數(shù)據(jù)湖顯然不是簡單的數(shù)據(jù)收容箱,技術(shù)內(nèi)涵遠不是hadoop所能囊括的,心里就慌得一比,不知道它到底能給企業(yè)帶來什么增值價值。

由于數(shù)據(jù)湖的概念大家混淆不清,很容易眉毛胡子一把抓的說成就是將所有數(shù)據(jù)匯聚在一個地方的簡單技術(shù),大多數(shù)老板會認為自己建設(shè)的大數(shù)據(jù)平臺就是數(shù)據(jù)湖,如果都是這種認知,那的確沒有再建設(shè)的必要了。

大廠想普及數(shù)據(jù)湖,傳統(tǒng)企業(yè)巋然不動,顯然跟概念沒講清楚有一定關(guān)系,同樣是數(shù)據(jù)歸集和整合,數(shù)據(jù)湖相較于數(shù)據(jù)倉庫,境界顯然要高很多,但到底高在哪里?想想我這個搞數(shù)據(jù)技術(shù)10多年的人都對其一臉懵逼,更何況一般的人?

2、數(shù)據(jù)湖技術(shù)門檻較高,標準化水平卻不高

數(shù)據(jù)湖有六個特點:保真性、靈活性、可管理、可分析、可追溯、可存儲,特點多了,一方面可以說是功能強大,另一方面也說明了技術(shù)復雜性,讓我們很難清晰判定什么樣的平臺才有資格叫作數(shù)據(jù)湖。

就拿保真性來說,其是這么描述的:“數(shù)據(jù)湖中對于業(yè)務系統(tǒng)中的數(shù)據(jù)都會存儲一份“一模一樣”的完整拷貝。與數(shù)據(jù)倉庫不同的地方在于,數(shù)據(jù)湖中必須要保存一份原始數(shù)據(jù),無論是數(shù)據(jù)格式、數(shù)據(jù)模式、數(shù)據(jù)內(nèi)容都不應該被修改。在這方面,數(shù)據(jù)湖強調(diào)的是對于業(yè)務數(shù)據(jù)“原汁原味”的保存。同時,數(shù)據(jù)湖應該能夠存儲任意類型/格式的數(shù)據(jù),包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。”

那么,原系統(tǒng)的實時數(shù)據(jù)如何保真到數(shù)據(jù)湖呢?

這個技術(shù)就復雜了,比如數(shù)據(jù)寫入數(shù)據(jù)湖的時候要保證ACID,要高效支持upsert /delete歷史數(shù)據(jù),要能容忍數(shù)據(jù)頻繁導入文件系統(tǒng)上產(chǎn)生的大量的小文件(顯然HDFS就不行了)。

Delta、iceberg和hudi等開源數(shù)據(jù)湖就是一些特定技術(shù)解決方案,但傳統(tǒng)企業(yè)連hadoop生態(tài)還沒搞通搞透呢,又搞出這么多技術(shù),而且還沒有統(tǒng)一標準,的確令人頭大。

然后國內(nèi)的大廠又基于開源的數(shù)據(jù)湖技術(shù)搞出了自己的數(shù)據(jù)湖,無論是騰訊的基于iceberg的Flink+Iceberg 企業(yè)級實時數(shù)據(jù)湖,還是阿里的基于hudi的湖倉一體,真是亂花漸欲迷人眼啊,但這個時候大多企業(yè)估計連數(shù)據(jù)湖還沒整明白吧。

3、數(shù)據(jù)湖理念比較超前,大規(guī)模普及尚需時日

10多年前自助BI就已經(jīng)提出來了,包括自助取數(shù),自助報表等等,其核心理念是業(yè)務人員能基于自助BI的產(chǎn)品自己操控數(shù)據(jù),從而提升業(yè)務響應速度。但10多年過去了,現(xiàn)在的傳統(tǒng)企業(yè)有多少比例的業(yè)務人員能夠自己取數(shù)分析?

客觀來講,比10多年前有進步,但自助BI對于大多數(shù)企業(yè)的業(yè)務人員仍然是奢侈品一樣的存在,一方面受限于企業(yè)的數(shù)字化水平,另一方面也受限于企業(yè)的數(shù)據(jù)文化,也許,只有等這一代的業(yè)務人員退休了,自助BI才能占據(jù)主流。

自助BI的數(shù)據(jù)模型好歹還是數(shù)據(jù)倉庫預先生成的,但數(shù)據(jù)湖就更加激進了,從數(shù)據(jù)采集、建模、挖掘到分析,所有工作都需要業(yè)務人員基于數(shù)據(jù)湖提供的工具來完成,因為數(shù)據(jù)湖倡導者認為只有這樣才能更快捷的響應市場需求。

如果說數(shù)據(jù)倉庫分層建模是計劃經(jīng)濟的話,那數(shù)據(jù)湖就是一種市場經(jīng)濟了,如果說自助BI是產(chǎn)品層面的創(chuàng)新,那數(shù)據(jù)湖就是全新升級版了,是對傳統(tǒng)數(shù)據(jù)倉庫服務模式的一種顛覆。

數(shù)據(jù)湖的始作俑者是亞馬遜,我不知道這個企業(yè)自己有多少人在用,但人家企業(yè)的數(shù)字化水平高是肯定的,國內(nèi)的大廠也差不多吧,但對于大多數(shù)企業(yè)來講,數(shù)據(jù)湖倡導的理念實在是有點超前。

20多年前,數(shù)據(jù)倉庫是很多巨無霸企業(yè)的技術(shù)狂歡,但當時的業(yè)務人員根本不知道建這個玩意有什么價值,也許我們還要再等10-20年,才能真正領(lǐng)悟數(shù)據(jù)湖的真諦,歷史,總是在不停的重復吧。

4、數(shù)據(jù)湖是數(shù)庫技術(shù)的升級,但不具備不可替代性

老板問我:“我們到底要不要數(shù)據(jù)湖?” 我說:“場景太少,即使需要,也有替代方案,雖然不是很完滿!”

數(shù)據(jù)湖有一種典型的應用場景,就是需要實時寫海量數(shù)據(jù)進數(shù)據(jù)庫然后能實時分析統(tǒng)計,很多大屏都需要用到這個技術(shù),我想諸如Flink+Iceberg 等數(shù)據(jù)湖技術(shù)引擎肯定是比較完美的解決方案。

但我安排幾個技術(shù)人員一周也搞定了,采用的是Flink+HTAP,雖然加載速度、查詢速度并不是毫秒級,但對于大多數(shù)場景夠用。

數(shù)據(jù)湖專業(yè)人士會跳出來說這個方案有很多問題,比如HTAP無法支持多種存儲引擎和計算引擎等等,但在這個場景下,不會追求通用的技術(shù)方案,而是盡量選擇符合企業(yè)技術(shù)現(xiàn)狀、性價比更高的方式。

數(shù)據(jù)湖總結(jié)下來有六大技術(shù)特點,包括(1)同時支持流批處理(2)支持數(shù)據(jù)更新(3)支持事務(ACID)(4)可擴展的元數(shù)據(jù)(5)支持多種存儲引擎(6)支持多種計算引擎等等。

對于大多數(shù)企業(yè),如果要為這些技術(shù)去找特定應用場景,并不是很好找,不信你找找看,即使找到了,估計用到其中的1-2個技術(shù)能力就可以了,而滿足1-2個條件的肯定有其他的替代品。

5、數(shù)據(jù)湖替換成本較大,無法保護原有的投資

從保護企業(yè)的固有資產(chǎn)投資的角度來講,如果你已經(jīng)建設(shè)了大數(shù)據(jù)平臺,現(xiàn)在選擇數(shù)據(jù)湖并不是明智之舉,當然新建另當別說。

在我們剛建設(shè)完成hadoop大數(shù)據(jù)平臺后,面臨的質(zhì)疑聲是很多的,因為業(yè)務人員并沒有看到什么顯性的價值,因此花了巨大的代價去建設(shè)基于Hadoop的數(shù)據(jù)管理體系,包括端到端的一體化工具鏈等等。

對于大多數(shù)企業(yè)來講,要用好Hadoop,Hadoop周邊生態(tài)體系的建設(shè)比hadoop建設(shè)本身更為重要,大家都聚焦到了如何讓大數(shù)據(jù)平臺發(fā)揮出應有的價值上來,這是好事情,而且完成hadoop大數(shù)據(jù)平臺建設(shè)也不過4-5年,從保護投資的角度講,這是理性的,不能這山望著那山高。

況且,Hadoop某種程度算是剛需,因為不采用它,海量數(shù)據(jù)根本處理不了,當然這種剛需也僅是針對擁有PB級別數(shù)據(jù)的企業(yè)來講的,而數(shù)據(jù)湖顯然還不是,它的技術(shù)緣起于解決某些特定場景,反正我想好了老半天,都沒找到必需使用它的理由。

最后,即使要采用數(shù)據(jù)湖,實施的難度不小,因為數(shù)據(jù)湖為了達成那六種技術(shù)能力,需要用到一種存儲中間件,對下統(tǒng)一對接各種存儲,對上統(tǒng)一對接各種技術(shù)引擎,這實在是太折騰了。

當然也許我說得都是錯的,那5年后再回過頭來看吧。

轉(zhuǎn)載自公眾號 大魚的數(shù)據(jù)人生

備案號:贛ICP備2022005379號
華網(wǎng)(http://www.acmerblog.com) 版權(quán)所有未經(jīng)同意不得復制或鏡像

QQ:51985809郵箱:51985809@qq.com

国产一区在线不卡_国产精品天天摸av网_日韩精品中文字幕第1页_国产精品无码专区在线观看
在线日韩av| 欧美激情一级片一区二区| 国产精品羞羞答答| 欧美日韩在线不卡一区| 欧美性猛交xxxx乱大交退制版 | 国产无遮挡一区二区三区毛片日本| 国产美女精品人人做人人爽| 国产一区二区成人| 狠狠操狠狠色综合网| aa级大片欧美三级| 欧美亚洲三区| 国产精品乱码妇女bbbb| 亚洲国产精品福利| 久久噜噜噜精品国产亚洲综合| 欧美四级在线| 日韩视频不卡| 欧美好吊妞视频| 亚洲日本电影| 欧美xx69| 亚洲日本一区二区| 欧美一区二区三区视频在线| 欧美黄污视频| 亚洲精品字幕| 一区二区三区欧美在线| 久久久久综合| 在线成人激情| 噜噜噜91成人网| 亚洲福利视频在线| 久久综合精品一区| 亚洲黄色在线| 欧美三级在线视频| 99re国产精品| 国产精品福利在线观看| 国产美女精品| 久久久www成人免费毛片麻豆| 国产日韩一区二区三区在线播放| 亚洲欧美国产77777| 国产精品视频免费观看www| 亚洲无限av看| 国产伦精品一区二区三区四区免费| 亚洲一区二区三区国产| 国产精品久久久久久模特| 亚洲一区在线看| 国产日韩av一区二区| 性久久久久久久久久久久| 欧美成人一区二免费视频软件| 国产免费亚洲高清| 午夜激情综合网| 一区二区三区亚洲| 亚洲尤物影院| 国产日韩欧美高清| 欧美r片在线| 亚洲一区免费视频| 国产日韩欧美| 欧美极品在线观看| 亚洲女性裸体视频| 亚洲国产毛片完整版| 欧美日韩国产限制| 亚洲精品四区| 欧美日韩免费看| 国产日韩精品综合网站| 麻豆视频一区二区| 一区二区三欧美| 狠狠色丁香婷婷综合影院| 欧美日韩国产欧| 欧美在线视频一区二区三区| 亚洲人成网站精品片在线观看| 国产精品久久久久久久浪潮网站| 久久国产精品电影| 日韩午夜激情电影| 激情小说另类小说亚洲欧美| 欧美一区二区三区四区在线观看| 亚洲国产另类久久精品| 国产精品ⅴa在线观看h| 美女视频黄a大片欧美| 一区二区av在线| 国内一区二区在线视频观看| 国产精品99一区| 欧美精品一区二区三区蜜桃 | 国产精品视频午夜| 欧美激情视频一区二区三区免费 | 欧美日韩国产综合久久| 久久不射网站| 午夜伦欧美伦电影理论片| 在线观看日韩av电影| 国产午夜精品一区二区三区欧美| 国产精品成人免费精品自在线观看| 久久香蕉国产线看观看av| 欧美一区二区三区免费观看| 亚洲综合国产精品| 亚洲一区成人| 亚洲一区三区在线观看| 亚洲色在线视频| 亚洲一卡二卡三卡四卡五卡| 亚洲一区二区3| 亚洲在线黄色| 性久久久久久| 亚洲精品国产精品国自产观看| 亚洲第一视频| 亚洲片区在线| 亚洲精品一区二区三区在线观看| 国产精品一区在线播放| 国产精品高潮呻吟久久av黑人| 欧美日韩国产黄| 国产精品久久一卡二卡| 国产女主播一区二区| 黑人一区二区三区四区五区| 欲香欲色天天天综合和网| 欧美午夜不卡在线观看免费 | 亚洲精品在线三区| 亚洲精品日韩激情在线电影| 91久久久亚洲精品| 一本综合久久| 久久av一区| 欧美成人免费va影院高清| 欧美美女操人视频| 国产精品美女久久久久av超清| 国产区精品视频| 亚洲国产精品va在线看黑人| 一本久久知道综合久久| 久久aⅴ国产欧美74aaa| 欧美sm视频| 国产精品网曝门| 亚洲国产成人精品久久久国产成人一区| 亚洲精品久久久久久一区二区| 一区二区三区成人| 久久狠狠婷婷| 欧美久久在线| 国产一区二区黄色| 日韩午夜中文字幕| 久久成人这里只有精品| 欧美日韩国产成人高清视频| 国产日韩亚洲欧美精品| 日韩一级不卡| 久久野战av| 国产精品一区二区三区乱码| 亚洲国产日韩欧美在线99| 亚洲一区在线免费| 免费的成人av| 国产亚洲一区二区三区在线观看 | 久久噜噜噜精品国产亚洲综合| 欧美日韩国产综合视频在线观看中文 | av成人免费在线| 性做久久久久久久免费看| 免费观看国产成人| 国产区二精品视| 亚洲美女视频网| 久久久久国内| 国产亚洲欧美另类中文| 亚洲在线视频观看| 欧美日韩国产亚洲一区| 伊人蜜桃色噜噜激情综合| 亚洲欧美色婷婷| 欧美性开放视频| 亚洲另类黄色| 欧美国产日韩xxxxx| 精品1区2区3区4区| 久久九九热re6这里有精品| 国产欧美日韩综合| 午夜激情久久久| 国产精品久久久久久五月尺| 一本一道久久综合狠狠老精东影业| 美女尤物久久精品| 在线播放日韩| 免费久久99精品国产| 激情一区二区| 久色成人在线| 亚洲黄色一区| 欧美成人xxx| 亚洲精品综合在线| 欧美日韩亚洲一区二区三区| 一本色道久久综合| 欧美三级资源在线| 亚洲欧美一级二级三级| 国产精品永久免费视频| 午夜精品久久久久久久| 亚洲国产精品va在线看黑人| 老司机精品福利视频| 亚洲国产日韩欧美在线99| 免费不卡亚洲欧美| 亚洲精品视频二区| 欧美日韩激情小视频| 在线视频亚洲欧美| 欧美三日本三级少妇三2023| 亚洲午夜一二三区视频| 国产精品亚洲成人| 欧美在线999| 在线观看欧美视频| 欧美日韩精品三区| 欧美高清视频一区| 免费亚洲一区二区| 亚洲精品免费一二三区| 国产精品高清免费在线观看| 亚洲欧美日韩国产综合在线| 国产精品九九久久久久久久| 亚洲一区二区在| 欧美一区二区视频在线观看2020| 国产亚洲福利一区| 美女黄网久久| 亚洲午夜电影在线观看|