尊敬的女士們 先生們 大家好此次演講的主題是普發銀行大數據平台雲原生探索首先做一下自我介紹我是來自普發銀行總航信息科技部大數據平台團隊的項目經理楚傑參加本次演講的還有來自我們團隊的技術骨幹少晴晴和來自上海道客網絡科技有限公司自身數據工程師鄭宏超我們很榮幸今天能代表各自公司在CubeCon的場合下為大家做介紹和分享好 現在讓我們進入到此次的話題中近年來數字化轉型已成為金融業的重要發展趨勢隨著大數據 人工智能和區塊鏈等應用科技技術在傳統金融領域的廣泛應用金融科技正在改變傳統的金融業金融業是基於數據和信息的產業其金融服務的業務型態靈活多樣而銀行作為金融行業中的重要代表都紛紛發力金融科技助推數字化轉型與此同時數據已經成為數字時代的基礎性戰略資源和革命性關鍵要素數據要素市場化以成為國家戰略在此背景下普發銀行以數據加技術雙人驅動的科技發展戰略服務於銀行數字經濟發展及數字化企業的建設目標在當今的銀行市場中數字化智能水平用戶體驗水平正成為銀行的核心競爭力服務智能越高代表銀行越能精準及時地洞察用戶的需求匹配合適的產品和服務並與用戶進行智能交互用戶體驗越高代表銀行越能滿足用戶多樣化的需求普發銀行以提升服務智能和用戶體驗為目標著力建設數據驅動模式下數據服務體系以數據服務數據產品的體系化建設為疏扭推進多元化的數據應用建設健全數據治理體系加速數據資產化管理激發數據動能在數據服務體系的建設過程中普發銀行大數據應用中心以構建數據中台服務能力為目標打造了DataO型系列數據品牌從平台 數據 模型 應用 服務等全方位建設數據服務產品提升數據服務能力目前以註冊的子品牌數達48個DataO型中的精砂品牌作為基礎數據平台的子品牌包含大數據平台和數據倉庫兩大系統其中 大數據平台基於哈多普技術以建設形成超1000節點的批避級兩地服務架構提供批量處理 實施計算連機查詢 數據探查 建模分析租戶應用等數據服務場景具備異地栽備能力為全行大數據應用提供服務支撐很多企業都利用大數據技術建設了自己的大數據平台在平台的建設 使用和運為過程中都會碰到不少問題普發銀行在大數據平台的建設過程中也遇到了很多的問題和難點大致可以分為以下幾個方面首先 是資源管理能力的不足傳統模式下大數據資源管理力度和功能都十分有限對於批量處理 交互式分析等不同的場景混合負載能力角落使得無法滿足業務功能的快速增長以及租戶模式下更強的管控需求其次 是存算一體的模式在傳統模式的存算一體方式中為了滿足複雜的應用場景及避免混合負載的情況往往需要通過拆分集群的思路去實現既然會帶來數據榮譽數據一致性 應用擴展性低等問題再有是租戶隔離能力的不足在總分行和全集團的服務支持過程中支持租戶模式是必然要解決的問題在傳統模式下在考慮資源利用率的情況下我們很難做到真正意義上的租戶資源隔離上有部分的大數據組件還不支持租戶的模式再有是橫向擴容的問題隨著大數據存儲計算需求的不斷增長平台需要不斷擴容在開展橫向擴容時結合應用功能的承接我們很難做到真正意義上的應用無感值往往需要在擴容時結合管理節點 應用連接服務等做好組件服務起庭的管理及應用服務的支持另外 在安全管控方面在全線管理層面多組件全線體系及多群群的管控體系無法對高權權用戶做到有效管理在安全模式下也無法做到應用揭露的限制比如應用之小連接地址並擁有用戶帳戶平台將無法限制用戶直連集群等場景對集群的整體安全管控具備一定的風險隱患再有是敏泰應用支持靈活性的問題在平台結合資源管理全線及安全管控等要求開展集群管理的同時天然對應用服務敏捷性的要求會有一定的衝突針對應用敏捷快速的需求傳統模式很難做到保障安全穩定前提下快速的響應各類複雜變化的新場景應用的自由度及靈活性無法得到很好的支持以上這些難點問題會不斷引發傳統大數據服務穩泰系統要求與敏泰應用要求之間的衝突以及平台在全線應用模式應用場景統一管控與更靈活的服務需求資源全線需求之間的衝突為了解決和緩解以上的問題普發銀行在大數據平台的建設和服務過程中從安全管控 資源管理應用模式等方面做了很多的探索在安全管控方面通過自言平台統一的管理門戶集成全線 資源 空間 作業等全方位的整體同管統分來滿足各維度 各力度的安全管控要求在資源管理上通過自言用量監控工具解決諸如KUDO這類無法有效支持租戶模式的組件的整體資源管理問題在敏泰應用支持上通過建立應用功能恢徒發布流程機制來滿足敏泰的數據應用需求通過以上流程機制的建立和功能自言等方式確實緩解了不少問題但仍然存在一些問題無法從根本上得到有效的解決首先是資源隔離的問題我們無法結合應用的需求給獨立租戶資源同時共享數據存儲也無法給租戶單獨的應用負載及權限體系來滿足類似租戶的自我管理無法做到資源的配置 同管統分來最到化的使用我們集群的資源其次在靈活性方面面對臨時性 輕量及高保障的負載無法快速上線及穩定運行及穩定等量的佔用獨立的資源另外個人應用功能也無法做到靈活定制化再有在架構節有方面計算資源無法真正與存儲資源相節有充分發揮計算能力的靈活性同時無法有效的共享存儲數據來達到減少數據榮譽及數據複製煉路的問題面對傳統模式無法解決的這些問題我們期待並不斷探索著根本性的變革的方法直到雲原生的出現這或許就是我們一直在尋找能夠解決這些問題的鑰匙通過大數據雲原生的引入在數據驅動能力下可以做到在平台層面存算分離及整合化的數據存儲資源降低榮譽數據節約成本在數據層面更加優化的數據路徑更少的數據備份及副本更高效的數據SLA在應用層面可以更靈活的支持應用的需求更獨立的開展租戶服務及管理在服務層面可以開展更高效的服務分裝數據服務可以以容器化及單元化的力度進行分裝提供端道端的高效服務普發銀行早在2017年借雙十一支付鏈路優化的契機完成雲原生技術在普發銀行從0到1的里程碑式落地成為中國銀行業內第一家在關鍵業務上使用雲原生技術的銀行2019年在應用容器化在普發銀行內已經是第一大渠道業務交易量所使用的技術2020年普發銀行成為中國第一家加入CNCF最終用戶社區的銀行積極參與到CNCF的社區貢獻和副化項目在大數據雲原生領域我們推進的內容主要包括我們的大數據平台積極開展基於存算分離架構的容器化私有雲部署探索目前已經面向數據探查積極學習等場景開展生產試點我們的海搖數據調度服務產品目前已在Gatehub上開源正積極推行雲原生的探索服務我們各類AI BI數據圖譜等大數據的應用系統正積極開展上雲部署在大數據平台容器化雲部署的實踐過程中為解決雲原生存儲的需求普發銀行與道客林北的公司一起聯合研發開源雲原生存儲項目PRES為容器提供高可用的數據卷服務來支撐大數據應用2021年7月PRES項目與世界人工智能大會論壇被CNCF正式接納為沙盒項目2021年8月PRES項目容獲中國信通院主辦的奧斯卡開源產業大會開源社區及開源項目獎項下面就由鄭宏超先生為大家分享雲原生存儲項目PRES的具體解決方案大家好我是道客的存儲架構師鄭宏超以下由我來具體介紹PRES項目2019年在雲原生技術主普級的背景下普發銀行大數據應用中心也開始探索將行內大數據中台等相關應用雲原生化上雲並在2020年初和道客以及林必公司一起研究將大數據應用中最為核心的大數據平台容器化在該課底的研究過程中我們很快發現了現有的容器存儲技術難以滿足大數據應用對於存儲安全穩定和高性能要求且部分存儲技術難以自主掌控基於這個需求我們確立了研發適配大數據應用的容器存儲技術作為本次課題的目標之一課題所運用的項目以希臘雅典的港口PRES命名2021年7月PRES正式成為CNCF官方的沙河項目PRES基於Kubernetes幾點的自由資源搭建存儲系統實現動態分配快照克隆等CSI特性以及高可用經檢支配壓縮備份等企業及功能如圖所示PRES可以聚合幾年裡的各類存儲戒指例如物理機的物理盤REID的盤NVME和PIMEM散存儲券共有運營的虛擬盤等可以適應易購的多雲環境總的說來相對於過去使用的NAS和本地盤PRES雲原生高可用技差技用和高性能等顯著優勢PRES的核心功能是基於DRBD的跨基點高可用如圖所示通過DRBD技術REID基點上的持有券數據實時同步複製到了R2和R3基點上當前基點發生故障後容器重新調度到R2基點上之後仍然可以通過本地掛帶的方式正常訪問數據這段視頻更加形象介紹了使用PRES之後有狀態應用例如各種Cycle和NoCycle數據庫可以平順的Failover到其他基點上讓買Cycle容器像TOMCAD容器一樣可以在Cooper Natives基點上自由的飄移為了實現高可用PRES使用了高度成熟的DRBD數據同步技術DRBD的作者是奧地利的開源故爭師Doctor Phil ReisnerDRBD基於Linux內核高效簡潔開源穩定2009年的時候DRBD就正式核入到Linux內核自此得到了廣泛的使用在Intel和IBM有大量的企業案例Field領導的公司Linbit也在一直維護和疊帶DRBD這是PRES在GitHub上的開源官網目前已經獲得許多點贊心我們還有自己的Stack Channel和用戶微信群歡迎大家訪問和支持Doctor負責維護PRES中文文檔網站我們會不斷添加和更新更詳細的技術文檔以及使用方案今年普發雲原生大數據平台實現了管理組件和算力組件的雲原生容器化尤其是Hive和Impala的上雲實現了數據處理的彈性伸縮在控制台組件中平台使用Polarius雙負本卷支持PostgreSQL數據庫VodMia管理和普羅米修斯監控系統保證了數據對於存儲的高可用和性能需求在積極學習組件中平台使用Polarius的雙負本卷支持PostgreSQL數據庫地理代碼庫和Grafana衣錨盤在數據倉庫組件中平台使用Polarius無負本的本地卷支持了Hive數據庫和Impala數據庫滿足它們對於本地高速緩存的需求以下是一個實際使用案例這裡PostgreSQL數據庫使用雙負本的Polarius持久卷實施同步數據以實現跨幾點高可用這個案例里Kubernetes調度容器到綠色標注的Walker二基點上生成的藍色標注持久卷PVC9A什麼什麼什麼Royals的Walker二和Walker三上各生成的一個副本對應藍色標注持久卷PV名因為容器是在綠色標注的Walker二上所以只有Walker二上的副本被激活並掛在一個容器當容器飄移到黃色標注的Walker三上時Walker二的副本會自動去激活Walker三上的副本會自動激活好下面由邵晴昕女士給大家聊一聊大數據雲原生的思考和展望大家好 我是普發銀行大數據平台的技術骨幹邵晴晴在了解了普發銀行大數據雲原生探索歷程後下面由我為大家介紹雲原生在普發銀行大數據建設的後續構想未來在普發銀行我們將在服務敏捷性服務端道端平台規模雲原生等層面發揮構想立足在大數據平台的存算分離及應用層面繼續開展大數據的探索在技術探索上我們將目標設定為存儲計算集群的結偶和大數據服務的標準化輸出在服務模式上我們提出了一個新的架構設想構建了三層架構技術在傳統硬件設施構建的IS基礎層上我們利用Docker和Cubanetis等容器化技術將計算服務應用容器化處理打造存算分離容器化私有雲平台實現一件化創建和配置資源在租戶資源隔離自由最終我們在人工智能業務自主分析容器化和自研組件的研究上為上層的業務需求提供更靈活更優質的服務支持實現更加敏捷的管理和彈性控制那麼在私有雲的平台中我們構想的概念圖是這樣的存儲集群是通過阿帕奇的HDFS組件來提供海量的數據存儲服務計算集群提供了各類容器化的計算服務同時多套計算集群共享一套數據存儲集群大大的減少了我們的數據榮譽存儲集群和計算集群具備數據一致型能夠共享原數據的管理和用戶健全認證等顯出特點後續普發銀行將秉承雲原生的架構理念在幾個方面持續增強探索首先在Priorius的應用推廣上推進Priorius在大數據領域的各場景應用歷征推廣期成為雲原生存儲領域的技術標準大數據雲原生的探索在前面提到的大數據平台的存算分離雲化部署模式下的系統和應用建設構想我們期望落地並持續深耕例如在大數據層面支持業務發展和應用建設上實現應用的敏捷交付租戶的靈活管理需求恢徒發布等各方面同時提供標準的租戶Pass服務提供整合度和敏捷度更高的輸出模式最後在普發銀行大數據雲原生的探索過程中我們期望服化出更多類似於Priorius的雲原生產品通過社區為金融雲原生發展貢獻力量普發銀行將作為開放銀行的先行者順應用戶為中心數字科技為手段智能化為引領的發展趨勢在建設實踐中不斷疊帶總結探索建立科學完整規範的開放銀行建設方法體系構建形成開放銀行長期穩健發展的核心動力我們依然在雲原生的道路上前行希望明年我們可以為大家分享更多的技術成果謝謝大家