千尋CORS如何做到“每秒服務百萬用戶”-支撐千尋服務穩(wěn)定性的是一項 “高并發(fā)”技術能力
千尋CORS的穩(wěn)定性用過的人都知道。支撐千尋服務穩(wěn)定性的是一項 “高并發(fā)”技術能力。什么是“高并發(fā)”?“高并發(fā)”它是指大量用戶(終端)的快速訪問。對于網(wǎng)絡平臺來說,如果沒有良好的高并發(fā)處理能力,它會導致服務中斷或服務器死機。
千尋CORS的穩(wěn)定性用過的人都知道。支撐千尋服務穩(wěn)定性的是一項 “高并發(fā)”技術能力。
什么是“高并發(fā)”?“高并發(fā)”它是指大量用戶(終端)的快速訪問。對于網(wǎng)絡平臺來說,如果沒有良好的高并發(fā)處理能力,它會導致服務中斷或服務器死機。
2021年,千尋定位高精度定位服務平臺的高并發(fā)能力達到每秒100萬級,即每秒可為100多萬用戶提供高精度定位服務。
這不僅是行業(yè)的提升,也是整個互聯(lián)網(wǎng)的高水平能力。這是怎么做到的?下面萊佳德科技小編將從系統(tǒng)能力和運維能力兩個方面分析技術要點。
系統(tǒng)能力:水平擴展基于分布式服務架構設計的千尋位置高精度位置服務平臺,具有?“海量用戶”服務擴展能力,增加服務器可以服務更多的用戶。在具體的實現(xiàn)路徑上,主要分為四個步驟:
第一步:自主研發(fā)SpaceX高性能分布式框架千尋位置的服務具有覆蓋面廣、規(guī)模大、實時性要求高的特點需要千尋定位高精度定位服務平臺以高靈活性效率。鑒于這種情況,自2015年以來,千尋定位獨立開發(fā)了內(nèi)部代號SpaceX高性能分布式應用框架。
SpaceX框架:一個巨大的計算任務可以分為幾個小任務,并分配給每臺計算機。計算機集群通過并行處理提高了效率,在統(tǒng)一管理和控制下完成了大規(guī)模的信息處理任務。國家北斗基礎增強系統(tǒng)“全國一張網(wǎng)”解算,就是通過SpaceX框架,分為幾千個小網(wǎng)任務,分布在幾百臺機器同時解算。
第二步:快速復制數(shù)據(jù)擴展塢程序Switch千尋位置針對國家北斗地基增強系統(tǒng)的快速復制“全國一張網(wǎng)”能力,開發(fā)了一個擴展塢程序,它被命名為Switch。Switch復制算法生成的多個網(wǎng)格數(shù)據(jù),然后將復制的數(shù)據(jù)分發(fā)給下游用戶。
第三步:提高效率,集中處理提高處理性能。千尋高精度位置服務平臺中的熱點識別應用程序?qū)⒆R別用戶分布較多的區(qū)域,集中同一區(qū)域的用戶進行處理,大大提高性能,降低服務器壓力,達到降低成本率的效果。
第四步:用戶均勻分布,減少用戶連接服務的平均排隊時間,千尋位置高精度位置服務平臺將有特殊的負載平衡SLB應用程序指導用戶處理哪個服務器。這樣,每個服務器的壓力平衡,用戶的平均等待時間就減少了。
系統(tǒng)能力:服務高可用千尋位置高精度位置服務平臺不僅要支持用戶,還要保證服務的高可用性。千尋位置做了多套服務冗余備份,在數(shù)據(jù)中心下分為6個可用區(qū)和3個隔離集群。
6個可用區(qū),主要是為了防止單機房出現(xiàn)故障,可用區(qū)的概念有點像當?shù)氐臋C房;?三個隔離區(qū)群按千尋位置的業(yè)務群劃分。由于不同行業(yè)(智能電子設備、汽車、測繪等)RTK)對于不同要求和標準的高精度位置服務,隔離區(qū)群可以互補干擾。
系統(tǒng)能力:自我保護千尋位置高精度位置服務平臺在流量突然增加時擁有自我保護機制,主要是流量控制和熔斷機制。
一、流控有六個影響因素,主要包括算法A/B群灰度、鏈路規(guī)則、用戶應用、產(chǎn)品、區(qū)域、百分比,根據(jù)這六個因素的不同排列組合,可以形成適合不同用戶的策略。例如,有一種只適合廣東電力的策略,如果有這種路線規(guī)劃,你可以準確地將這項服務推給客戶。
二是保險絲機制的建設。千尋位置的服務實際上是有容量的。比如現(xiàn)在容量1億,流量突然來了2億。千尋位置的高精度位置服務平臺可以實現(xiàn)自我保護,優(yōu)先服務前1億用戶。隨著服務器的擴展,逐漸支持2億流量的涌入。
運維能力:基于系統(tǒng)可視化和智能定位能力,千尋位置高精度位置服務平臺可以快速定位問題。
系統(tǒng)可視化能力由業(yè)務監(jiān)控大屏幕、應用處理能力監(jiān)控大屏幕和云資源服務狀態(tài)監(jiān)控大屏幕組成。從這三個維度來看,系統(tǒng)完全變得透明。
業(yè)務監(jiān)控大屏幕實時顯示在線用戶數(shù)量、整體分布、定位狀態(tài)、特定用戶組和在線工具(距離測量、定位、回放);應用處理能力監(jiān)控大屏幕核心顯示用戶實時連接數(shù),每秒新增連接數(shù),每秒下線連接數(shù);云資源服務狀態(tài)監(jiān)測可查看CPU使用情況、內(nèi)存使用情況、TCP網(wǎng)絡連接狀態(tài)等。
智能定位能力由系統(tǒng)控制臺、網(wǎng)格異常分析和基站異常分析組成,主動判斷用戶服務是否正常,問題是否由基站引起,是否受周圍環(huán)境影響。
運維能力:快速恢復千尋位置高精度位置平臺具有從問題中快速恢復的能力,分為快速響應、記錄通知、啟動計劃和工具處理四個步驟。
首先,千尋位置設置7*24小時值班的應用監(jiān)控室響應問題;其次,千尋位置應急平臺記錄事件,通過電話、軟件系統(tǒng)通知相關運維、開發(fā)等處理人員;第三,日常處理計劃記錄,運維人員與系統(tǒng)流程相結合+工具、自動操作減少錯誤,實現(xiàn)快速恢復能力;最后,日常標準流程升級為工具執(zhí)行,無需人工干預,提高效率,避免人為不可控因素。
操作和維護能力:故障演練混沌工程是分布式系統(tǒng)學科。通過長時間的測試,模擬功能測試、性能測試和極端場景測試發(fā)現(xiàn)系統(tǒng)很難通過傳統(tǒng)的測試方法進行模擬和測試BUG。
混沌工程主要解決網(wǎng)絡中斷、服務器停機等極端情況。通過長時間的測試和頻繁的驗證,培養(yǎng)系統(tǒng)級的反應能力并加以鞏固,并在真正遇到問題時做出反應。
萊佳德科技提供測繪儀器以舊換新,測繪儀器維修,測繪儀器檢定,全站儀租賃銷售,工程測量業(yè)務承接。 需要購買全站儀、GPS-RTK、水準儀、經(jīng)緯儀等測繪儀器,或有測繪儀器相關問題可以聯(lián)系萊佳德科技。
版權說明|萊佳德科技南京有限公司尊重原創(chuàng),圖片和文章的版權為原作者所有,若有侵權請聯(lián)系本單位,我們會及時聲明或刪除。