標籤: 貨運

  • Python 3.9 beta2 版本發布了,看看這 7 個新的 PEP 都是什麼?

    原作:Jake Edge

    譯者:豌豆花下貓@Python貓

    英文:https://lwn.net/Articles/819853/

    隨着 Python 3.9.0b1 的發布,即開發周期中計劃的四個 beta 版本的首個,Python 3.9 的功能已經是完善了。在 10 月發布最終版本之前,還會有許多測試和穩定性方面的工作要做。

    (譯註:beta1 版本發佈於 5 月 18 日,作者文章寫於 5 月 20,而到本篇譯文發布時,beta2 剛好在今天即 6 月 9 日發布,這是一個巧合!)

    該發布說明中列出了被 3.9 接受的 7 個 Python 增強提案(PEP)。我們研究了其中的一些 PEP,看到有一些更新。現在似乎是一個介紹 Python 3.9 帶來的一些東西的好時機。

    1、字符串操作

    有時最簡單(表明上的)的事情最困難,或者至少會引起巨大的討論。其中大部分的爭議是關於命名(還能是什麼?),但是給標準字符串對象添加函數,來刪除前綴和後綴,這種想法是毫無爭議的。

    是否可以將那些詞綴(前綴和後綴的統稱)指定為序列,以便在一次調用中處理多個詞綴,這一點尚不明確,最後它被從提案中刪除了,等待着其他人再次推動更改。

    在 3 月底,Dennis Sweeney 在 python-dev 郵件列表上請求核心開發者支持 PEP 616(“字符串刪除前綴和後綴的方法”)。他指出了自 2019 年 3 月以來關於該話題的 python-ideas 討論。埃里克·史密斯(Eric V. Smith)同意支持該 PEP,這促使 Sweeney 發布並啟動了討論。

    在最初版本中,他使用 cutprefix() 和 cutsuffix() 作為要添加給字符串對象的方法名。四種類型的 Python 對象將獲得新的方法:str(Unicode 字符串),byte(二進制序列),bytearray(可變的二進制序列)和 collections.UserString(字符串對象的一種封裝)。

    它的寫法如下:

    'abcdef'.cutprefix('abc') # 返回'def'
    'abcdef'.cutsuffix('ef') # 返回'abcd'
    

    針對命名部分,出現了一大堆的建議。基本上很少有人喜歡“cut”,因此“strip”、“strim”和“remove”被提出來了,並且都獲得了一些支持。

    stripprefix() 以及 stripsuffix() 由於 PEP 中指出的一種理由,至少是被部分地反對了;現有的“strip”函數令人困惑,因此應避免重用該名稱。

    str.lstrip() 和 str.rstrip() 方法也用於刪除前導字符和尾隨字符,但是它們對於真正在尋找 cutprefix() 功能的程序員來說是一個困惑的來源。

    *strip() 在調用時接收一個字符串參數,但會將其視為一組字符,並從字符串開頭或結尾消除:

    'abcdef'.lstrip('abc') # 返回“def”,符合預期
    'abcbadefed'.lstrip('abc') # 返回'defed',完全不符合預期
    

    最終,removeprefix() 和 removesuffix() 似乎佔據了上風,這正是 Sweeney 最終改成的版本。Guido van Rossum 也支持這些名字。

    埃里克·法格倫(Eric Fahlgren)這樣搞笑地總結了命名的爭論:

    我認為如果你先寫文檔,則名稱的選擇會更容易些:

    cutprefix – 刪除指定的前綴。

    trimprefix – 刪除指定的前綴。

    stripprefix – 刪除指定的前綴。

    removeprefix – 刪除指定的前綴。廢話

    Sweeney 更新了 PEP,回應了許多評論,但還增加了提議將字符串元組作為詞綴的功能(可以在 PEP GitHub 倉庫中看到該版本)。

    但是史蒂文·達普拉諾(Steven D’Aprano)不確定這樣做是否合理。他指出,唯一接受元組參數的字符串操作是 str.startswith() 和 str.endswith(),而它們不返回字符串(只是一個布爾值)。他懷疑添加這一種接收元組參數卻返回字符串的方法,因為無論選擇何種規則來處理元組,對於某些人來說都是“錯誤的”選擇。

    例如:

    這裏的困難在於,如果兩個或多個前綴都能匹配,則“剪切這些前綴中的一個”的概念是模稜兩可的。對 startwith 沒有區別:

     "extraordinary".startswith(('ex', 'extra'))
    

    因為是從左到右,從最短到最大,甚至是隨機順序匹配都為True。但是對於 cutprefix,應該刪除哪個前綴?

    如他所說,建議的規則是使用從左到右處理元組的第一個匹配字符串,但是有些人可能想要最長的匹配或最後一個匹配;這一切都取決於使用的上下文。他建議在提交添加此類行為之前,要給該功能更多的“浸泡時間”(譯註:即預備時間):“在添加多前綴/後綴的支持之前,我們首先應該對簡單的情況進行一些實際的體驗。”

    伊桑·弗曼(Ethan Furman)同意達普拉諾(D’Aprano)的意見。但是維克托·斯汀納(Victor Stinner)強烈贊成元組參數的想法,只不過,他還想知道當傳入的元組有空字符串時,會怎麼處理。根據 PEP 提議,在處理元組時遇到空字符串(實際上可以匹配任何內容)只會返回原始字符串,這會導致令人驚訝的結果:

    cutsuffix("Hello World", ("", " World"))    # 返回 "Hello World"
    cutsuffix("Hello World", (" World", ""))    # 返回 "Hello"
    

    這個例子不太明顯;詞綴不一定是硬編碼的,因此空字符串可能會溜進意想不到的位置。Stinner 建議如果遇到空字符串,則拋出 ValueError,類似於 str.split()。但是 Sweeney 決定完全刪除元組參數功能,以便“允許對此有更強見解的人在另外的 PEP 中提出並捍衛一系列的語義”。他在 3 月 28 日發布了該 PEP 的最新版本。

    4 月 9 日,Sweeney 發起了一個指導委員會 issue,請求對其 PEP 進行評審。4 月 20 日,Stinner 代表委員會接受了該提案。

    這是一個很小的更改,但值得花時間確保它具有長期適用的接口(和語義)。我們將在 Python 3.9 中看到 removeprefix() 和removesuffix()。

    2、新解析器

    並不令人感到驚訝的是,指導委員會已經接受了我們在 4 月中旬介紹過的 CPython 新解析器。PEP 617(“CPython 新的 PEG 解析器”)由 Python 創始人即前仁慈的獨裁者(BDFL) Guido van Rossum 以及 Pablo Galindo Salgado 和 Lysandros Nikolaou 共同提出。

    它已經運行良好,並且在現有解析器的速度和內存使用方面提升了 10% 以內的性能。由於解析器是基於解析表達語法(PEG),因此也將簡化語言規範。CPython 現有的 LL(1) 解析器存在諸多缺點和一些 hack,新的解析器將會消除掉。

    這一更改為 Python 超越 LL(1) 語法鋪平了道路,儘管現有語言並不完全是 LL(1)。這一更改不會太快,因為計劃是在 Python 3.9 的命令行中提供開關,保持現有解析器可用。

    但是 Python 3.10 將刪除現有的解析器,這可能會導致語言變更。如果做了那些更改,那麼,其它的 Python 實現(例如 PyPy 和 MicroPython)就需要切換解析器的 LL(1) 實現,以便跟上語言規範的要求。這可能會使核心開發者暫停進行此類更改。

    3、更多內容

    我們在三月初查看了 PEP 615(“在標準庫中支持 IANA 時區數據庫”)。它將在標準庫中添加一個zoneinfo 模塊,該模塊將有助於從 IANA 時區數據庫中(也稱為“Olson數據庫”)獲取時區信息,以填充時區對象。在撰寫本文時,它看起來很順利。

    在 3 月底,Paul Ganssle 請求就該 PEP 作出決議。他認為在一個有趣的時間範圍內接受它,可能會很有趣:

    … 我希望(出於異想天開的原因)在 4 月 5 日(星期日)UTC 時間 02:00-04:00 或 13:00-17:30 之間接受它,因為這些時間代表着地球上某些地方的不明確時間(主要在澳大利亞)。還有另一個時機,那就是在 4 月 19 日星期日 UTC 01:00-03:00 之間,這段時間在西撒哈拉是不明確的。

    他意識到這可能難以實現,它當然不是優先考慮的事。指導委員會沒有錯過第二個時間窗太多;Barry Warsaw 於 4 月 20 日宣布接受該 PEP。

    Python 現在將具有一種機制來訪問系統的時區數據庫,以創建和處理時區。另外,Python 軟件包索引(PyPI)中有一個 tzdata 模塊,它為缺少 IANA 數據的系統提供這些數據;它將由 Python 核心開發者維護。

    PEP 593(“靈活的函數和變量註釋”)添加了一種將上下文特定的(context-specific)元數據與函數和變量關聯的方法。實際上,type hint 註解已擠出了很多年前在 Python 3.0 中實現的 PEP 3107(“函數註釋”)中設想的其它用例。PEP 593 使用註解的(Annotated)類型提示為這些用例創建了一種新的機制。

    PEP 585(“標準集合中的類型提示泛型”)提供了另一種清除方法。它將允許刪除在 typing 模塊中維護的一組并行的類型別名,以支持泛型。例如,type.List 類型將不再需要支持諸如“dict[str,list[int]]”之類的註解(例如,一個帶有字符串鍵和整數列表的值的字典)。

    字典“加法”的聯合操作也會是 Python 3.9 的一部分。它曾不時引起爭議,但是 2 月中旬,PEP 584(“給字典添加聯合操作符”)被 Van Rossum 推薦採納。指導委員會迅速同意了,該特性於 2 月 24 日合入。

    最後一個 PEP 是 PEP 602(“Python 的年度發布周期”)。如提案所書,它將發布節奏從每 18 個月更改為每年一次。但是,開發和發布周期是重疊的,因此整個功能開發需要 12 個月的時間。當第一個 Python 3.9 beta 版本發布時(即現在),Python 3.10 的功能開發就開始了。請繼續關注來年的下一輪 PEP。

    本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理

    【其他文章推薦】

    ※教你寫出一流的銷售文案?

    ※廣告預算用在刀口上,台北網頁設計公司幫您達到更多曝光效益

    ※回頭車貨運收費標準

    ※別再煩惱如何寫文案,掌握八大原則!

    ※超省錢租車方案

    ※產品缺大量曝光嗎?你需要的是一流包裝設計!

    ※推薦台中搬家公司優質服務,可到府估價

  • [原創][開源] SunnyUI.Net 主題

    [原創][開源] SunnyUI.Net 主題

    SunnyUI.Net, 基於 C# .Net WinForm 開源控件庫、工具類庫、擴展類庫、多頁面開發框架

    • Blog: https://www.cnblogs.com/yhuse
    • Gitee: https://gitee.com/yhuse/SunnyUI
    • GitHub: https://github.com/yhuse/SunnyUI
    • 幫助文檔目錄: https://www.cnblogs.com/yhuse/p/SunnyUI_Menu.html
    • 歡迎交流,QQ群:  56829229 (SunnyUI技術交流群) 

    主題

    1、Color 色彩

    SunnyUI為了避免視覺傳達差異,使用一套特定的調色板來規定顏色,為你所搭建的產品提供一致的外觀視覺感受。主要顏色參照Element(https://element.eleme.cn/

    • 主色

    SunnyUI主要品牌顏色是鮮艷、友好的藍色。

    • 輔助色

    除了主色外的場景色,需要在不同的場景中使用(例如紅色表示危險的操作)。

    • 中性色

    中性色用於文本、背景和邊框顏色。通過運用不同的中性色,來表現層次結構。

     

    2、Rect邊框

    我們對邊框進行統一規範,可用於按鈕、卡片、彈窗等組件里。

    主要屬性如下:

    • RectColor:邊框顏色
    • RectDisableColor:控件不可用時邊框顏色
    • RectSides:邊框显示方向
    • 無:不显示邊框
    • 全部:显示全部邊框
    • 頂:显示頂部邊框
    • 底:显示底部邊框
    • 左:显示左側邊框
    • 右:显示右側邊框

    注:邊框显示和圓角設置相關,如果一側的邊框兩端端點為圓角,則此邊框必定显示。

     

    3、Radius圓角

    我們提供了以下幾種圓角樣式,以供選擇。默認圓角大小為5px。

    主要屬性如下:

    Radius:圓角大小

    RadiusSides:显示四個角圓角的显示與否

    • 圓角不显示

    • 默認圓角大小為5px

    • 圓角大小與控件高度相等時,显示大圓角

    • 可通過四個角圓角的設置,對控件組合显示

     

    4、Font字體

    默認字體為:微軟雅黑, 12pt

     

    5、Style主題

    SunnyUI包含 Element 風格主題 11 個,DotNetBar 主題 3 個,其他主題 2 個,包含主題管理組件 UIStyleManager,可自由切換主題。

    •  UIStyleManager

    參考SunnyUI.Demo.exe,將UIStyleManager放置在主窗體上,通過選擇UIStyleManager的屬性Style,或者通過代碼設置統一主題風格。

    UIStyleManager.Style = style;

     

    • Style主要屬性如下:

    Style:設置主題風格

    StyleCustomMode:是否為自定義主題,設置為False時使用UIStyleManager提供的統一主題風格,設置為Ture時可手動調整控件配色,不受UIStyleManager約束。

     

    • UIStyle.Blue

    • UIStyle.Green

    • UIStyle.Orange

    • UIStyle.Red

    • UIStyle.Gray

    • UIStyle.White

    • UIStyle.DarkBlue

    • UIStyle.Black

    • UIStyle.Office2010Blue

    • UIStyle.Office2010Silver

    • UIStyle.Office2010Black

      

    原創文章,轉載請保留鏈接 Sunny’s blog

    本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理

    【其他文章推薦】

    ※超省錢租車方案

    ※別再煩惱如何寫文案,掌握八大原則!

    ※回頭車貨運收費標準

    ※教你寫出一流的銷售文案?

    ※產品缺大量曝光嗎?你需要的是一流包裝設計!

    ※廣告預算用在刀口上,台北網頁設計公司幫您達到更多曝光效益

    網頁設計最專業,超強功能平台可客製化

  • Spring Boot 教程 – Elasticsearch

    Spring Boot 教程 – Elasticsearch

    1. Elasticsearch簡介

    Elasticsearch是一個基於Lucene的搜索服務器。它提供了一個分佈式多用戶能力的全文搜索引擎,基於RESTful web接口。Elasticsearch是用Java語言開發的,並作為Apache許可條款下的開放源碼發布,是一種流行的企業級搜索引擎。Elasticsearch用於雲計算中,能夠達到實時搜索,穩定,可靠,快速,安裝使用方便。官方客戶端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和許多其他語言中都是可用的。根據DB-Engines的排名显示,Elasticsearch是最受歡迎的企業搜索引擎,其次是Apache Solr,也是基於Lucene。以後再給大家詳細介紹solr。

    它能很方便的使大量數據具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸縮性,能使數據在生產環境變得更有價值。Elasticsearch 的實現原理主要分為以下幾個步驟,首先用戶將數據提交到Elasticsearch 數據庫中,再通過分詞控制器去將對應的語句分詞,將其權重和分詞結果一併存入數據,當用戶搜索數據時候,再根據權重將結果排名,打分,再將返回結果呈現給用戶。

    Elasticsearch可以用於搜索各種文檔。它提供可擴展的搜索,具有接近實時的搜索,並支持多租戶。”Elasticsearch是分佈式的,這意味着索引可以被分成分片,每個分片可以有0個或多個副本。每個節點託管一個或多個分片,並充當協調器將操作委託給正確的分片。再平衡和路由是自動完成的。“相關數據通常存儲在同一個索引中,該索引由一個或多個主分片和零個或多個複製分片組成。一旦創建了索引,就不能更改主分片的數量。

    Elasticsearch使用Lucene,並試圖通過JSON和Java API提供其所有特性。它支持facetting和percolating,如果新文檔與註冊查詢匹配,這對於通知非常有用。另一個特性稱為“網關”,處理索引的長期持久性;例如,在服務器崩潰的情況下,可以從網關恢復索引。Elasticsearch支持實時GET請求,適合作為NoSQL數據存儲,但缺少分佈式事務。

    2. Elasticsearch深入了解

    2.1 Elasticsearch的底層實現

    • 2.1.1 lucene

      Es是一個比較複雜的搜索服務器,本身也是使用Java語言編寫的,在上面的簡介中,說明了ES是一個基於lucene的搜索服務器,lucene是什麼呢?Lucene是apache軟件基金會4 jakarta項目組的一個子項目,是一個開放源代碼的全文檢索引擎工具包,但它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構,提供了完整的查詢引擎和索引引擎,部分文本分析引擎。lucene也是使用Java語言編寫的,Java天下第一!

      Lucene是一套用於全文檢索和搜尋的開源程式庫,由Apache軟件基金會支持和提供。Lucene提供了一個簡單卻強大的應用程式接口,能夠做全文索引和搜尋。在Java開發環境里Lucene是一個成熟的免費開源工具。就其本身而言,Lucene是當前以及最近幾年最受歡迎的免費Java信息檢索程序庫。至於lucene到底是怎麼實現的,牛牛們可能要自己去百度或者谷歌一下啦。

    • 2.1.2 Elasticsearch的基本概念

      1. 集群(Cluster):就是多台ES服務器在一起構成搜索服務器,現在很多應用基本上都有集群的概念,提高性能,讓應用具有高可用性,一台服務器掛掉,可以很快有另一台ES服務器補上。

      2. 節點(Node):節點就是集群中的某一台ES服務器就稱為一個節點。

      3. 索引庫(Index Indices):就是ES服務器上的某一個索引,相當於Mysql數據庫中的數據庫的概念,一個節點可以有很多個索引庫。

      4. 文檔類型(Type):這個概念就相當於Mysql數據庫中表的概念,一個索引庫可以有很多個文檔類型,但是這個概念現在慢慢淡化了,因為在ES中一個索引庫直接存數據文檔就挺好的,這個概念現在來說有點多餘了,所以ES官方也在淡化這個概念,在ES8中,這個概念將會徹底的消失。

      5. 文檔(Doc):文檔就相當於Mysql是數據庫中某個表的一條數據記錄,現在ES已經到7.7版本了,我們也就忽略type這個概念,直接在索引庫中存文檔即可。另外需要說一下,我們一般把數據文檔存到Es服務器的某個索引庫的這個動作稱之為索引

        最後還有兩個比較重要的概念,但是可能不是那麼直觀的可以感受得到:

        分片(Shards)和副本(Replicas)

        索引可能會存儲大量數據,這些數據可能超過單個節點的硬件限制。例如,十億個文檔的單個索引佔用了1TB的磁盤空間,可能不適合單個節點的磁盤,或者可能太慢而無法單獨滿足來自單個節點的搜索請求。

        為了解決此問題,Elasticsearch提供了將索引細分為多個碎片的功能。創建索引時,只需定義所需的分片數量即可。每個分片本身就是一個功能齊全且獨立的“索引”,可以託管在群集中的任何節點上。

        分片很重要,主要有兩個原因:

        • 它允許您水平分割/縮放內容量
        • 它允許您跨碎片(可能在多個節點上)分佈和并行化操作,從而提高性能/吞吐量

        分片如何分佈以及其文檔如何聚合回到搜索請求中的機制由Elasticsearch完全管理,並且對您作為用戶是透明的。

        在隨時可能發生故障的網絡/雲環境中,非常有用,強烈建議您使用故障轉移機制,以防碎片/節點因某種原因脫機或消失。為此,Elasticsearch允許您將索引分片的一個或多個副本製作為所謂的副本分片(簡稱副本)。

        複製很重要,主要有兩個原因:

        • 如果分片/節點發生故障,它可提供高可用性。因此,重要的是要注意,副本碎片永遠不會與從其複製原始/主要碎片的節點分配在同一節點上。
        • 由於可以在所有副本上并行執行搜索,因此它可以擴展搜索量/吞吐量。

        總而言之,每個索引可以分為多個碎片。索引也可以複製零(表示沒有副本)或多次。複製后,每個索引將具有主碎片(從中進行複製的原始碎片)和副本碎片(主碎片的副本)。可以在創建索引時為每個索引定義分片和副本的數量。創建索引后,您可以隨時動態更改副本數,但不能事後更改分片數。

        默認情況下,Elasticsearch中的每個索引分配有5個主碎片和1個副本,這意味着如果集群中至少有兩個節點,則索引將具有5個主碎片和另外5個副本碎片(1個完整副本),總共每個索引10個碎片。

    • 2.1.3 Elasticsearch的索引原理

      Es作為一個全文檢索服務器,那麼它在搜索方面肯定很在行啦!那它是怎麼做到的呢?

      Es官方有這麼一句話:一切設計都是為了提高搜索的性能!

      Es能夠快速的搜索出我們需要的內容,靠的就是倒排索引的思想,或者說是一種設計!

      在沒有使用倒排索引的情況下,正常思路是根據搜索關鍵字去查找相應的內容,但是使用了倒排索引之後,ES會先將文檔的所有內容拆分成多個詞條,創建一個包含所有不重複詞條的排序列表,然後列出每個詞條出現在哪個文檔。

      例如,假設我們有兩個文檔,每個文檔的 content 域包含如下內容:

      ​ Doc_1:The quick brown fox jumped over the lazy dog

      ​ Doc_2:Quick brown foxes leap over lazy dogs in summer

      ES首先會將這兩個文檔拆分成多個單獨的詞,或者叫做詞條,然後為所有的詞條創建一個排序列表,並記錄每個詞條出現的文檔的信息。就像下面這樣:

      Term      Doc_1  Doc_2
      -------------------------
      Quick   |       |  X                        /*
      The     |   X   |								Term就是詞條,比如第一個Term就是Quick關鍵字,在Doc_1中不存
      brown   |   X   |  X							在,在Doc_2中存在,其他的以此類推。
      dog     |   X   |							*/
      dogs    |       |  X
      fox     |   X   |
      foxes   |       |  X
      in      |       |  X
      jumped  |   X   |
      lazy    |   X   |  X
      leap    |       |  X
      over    |   X   |  X
      quick   |   X   |
      summer  |       |  X
      the     |   X   |
      ------------------------
      

      現在,如果我們想搜索 quickbrown這兩個關鍵字,我們只需要查找包含每個詞條的文檔,就相當於我們查詢的時候,是通過這個索引表找到文檔,在通過文檔去找文檔內容中的搜索關鍵字,與傳統的通過關鍵字去找內容是不同的。

      倒排索引到底是個怎麼實現的,怎麼個思想,我在這裏就不一一說明了,大家可以看下官方的詳細介紹:倒排索引的原理

      還有es官方的一系列的說明也都可以了解一下:什麼是Elasticsearch?

    2.2 Elasticsearch的安裝

    本演示項目ES版本為7.0.0版本,其他版本的ES的maven依賴與其他的jar包關係請自行查閱官方文檔,保證不衝突。

    • Windows

      Es服務器的安裝很簡單,Windows版本特別的簡單,直接去官網下載,運行 bin/elasticsearch 或者bin\elasticsearch.bat

    • Linux(CentOS7)

      首先我們去官網下載ES的tar.gz包,然後自建一個文件夾放好,然後解壓tar.zg壓縮包:

      tar -xvf elasticsearch-7.0.0.tar.gz
      

      然後進入到bin目錄下:

      cd elasticsearch-7.0.0/bin
      

      然後運行elasticsearch:

      ./elasticsearch
      

      這個時候肯定會報錯的,因為沒有進行配置,所以我們先對es進行一些簡單的配置,保證能單機運行,進入elasticsearch-7.7.0/config目錄,對es的核心配置文件進行編輯:

      vim elasticsearch.yml
      

      進入到了elasticsearch.yml文件的編輯頁面:

      首先我們配置集群名稱,集群名稱自己取一個喜歡的名字就好:

      接下來配置節點名稱,就是在這個集群中,這個es服務器的名稱:

      接下來配置一些必要的參數:

      bootstrap.memory_lock: 是否鎖住內存,避免交換(swapped)帶來的性能損失,默認值是: false。

      bootstrap.system_call_filter: 是否支持過濾掉系統調用。elasticsearch 5.2以後引入的功能,在bootstrap的時候check是否支持seccomp。

      配置network為所有人都可以訪問,因為我們一般是使用ssh連接工具在其他的電腦上操作Linux系統,所以我們需要配置一下:

      到這裏就配置完成了,但是當你重新去運行.elasticsearch的可執行文件的時候,依然會報錯。

      報錯信息中可能包含以下幾個錯誤:

      • max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]

        原因:無法創建本地文件問題,用戶最大可創建文件數太小。

        解決方法:切換到root賬戶下,進入Linux系統文件夾,編輯limits.conf文件:

        vim /etc/security/limits.conf
        

        在文件的末尾加上:

        *                soft    nofile          65536
        *                hard    nofile          65536
        *                soft    nproc           4096
        *                hard    nproc           4096
        
      • max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]

        原因:最大虛擬內存太小,需要修改系統變量的最大值。

        解決方法:切換到root賬戶下,進入Linux系統文件夾,編輯sysctl.conf文件:

        vim /etc/sysctl.conf
        

        在文件的末尾加上:

        vm.max_map_count=262144
        
      • max number of threads [1024] for user [es] likely too low, increase to at least [2048]

        原因:無法創建本地線程問題,用戶最大可創建線程數太小。

        解決方法:如果你是CentOS6及以下系統,編輯的文件是90-nproc.conf這個文件,如果你和我一樣使用的是CentOS7的話,編輯的文件是20-nproc.conf文件,其實這兩個文件是一樣的,只是在不同CentOS系統中名稱不一樣而已。

        CentOS7使用這個命令:

        vim /etc/security/limits.d/20-nproc.conf
        

        CentOS6使用這個命令:

        vim /etc/security/limits.d/90-nproc.conf
        

        只需要在文件中加上以下配置:

        *          soft    nproc     4096
        

        這個配置的意思是說賦予其他用戶的可創建本地線程數為4096。在這個文件中本來就有一個配置,意思是說賦予root賬戶創建線程數不受限制。我們就把上面的配置加在本來存在的配置的下面一行就可以了。

        如果是CentOS7的使用者,還需要配置另一個文件,否則這個最大線程數是不會生效的。CentOS 7 使用systemd替換了SysV,Systemd目的是要取代Unix時代以來一直在使用的init系統,兼容SysV和LSB的啟動腳本,而且夠在進程啟動過程中更有效地引導加載服務。在/etc/systemd目錄下有一個系統的默認管理配置,這裡有登陸、日誌、服務、系統等。所以CentOS7的使用者還需要配置下面這個文件:

        vim /etc/systemd/system.conf
        

        對其中的選項進行配置,在文件的末尾加上:

        DefaultLimitNOFILE=65536
        DefaultLimitNPROC=4096
        

      上面的所以錯誤解決完畢之後,我們再運行.elasticsearch可執行文件,es才可以啟動成功。

    2.3 Elasticsearch的使用

    首先給大家介紹一個谷歌瀏覽器插件,這個插件是用來可視化展示es的索引庫數據的,這個插件叫做ElasticVue,個人感覺挺好用的,展示也比較方便,給大家截個圖看看:

    大家可以使用這個建立索引庫,然後調用es官方的es專用的語法操作es服務器進行CRUD操作,但是此處我只介紹Java語言如何調用es服務器API,廢話不多說,我們直接開始下一步。

    • 2.3.1 引入依賴

      搭建工程的過程我就不演示了,直接上pom.xml依賴文件。

      pom.xml

      <!--springboot父工程-->
          <parent>
              <groupId>org.springframework.boot</groupId>
              <artifactId>spring-boot-starter-parent</artifactId>
              <version>2.2.2.RELEASE</version>
              <relativePath/> <!-- lookup parent from repository -->
          </parent>
      
          <dependencies>
              <!--springboot-web組件-->
              <dependency>
                  <groupId>org.springframework.boot</groupId>
                  <artifactId>spring-boot-starter-web</artifactId>
                  <version>2.2.2.RELEASE</version>
              </dependency>
              <!--elasticsearch-rest-client組件-->
              <dependency>
                  <groupId>org.elasticsearch.client</groupId>
                  <artifactId>elasticsearch-rest-client</artifactId>
                  <version>7.7.0</version>
              </dependency>
              <!--elasticsearch-rest-high-level-client組件-->
              <dependency>
                  <groupId>org.elasticsearch.client</groupId>
                  <artifactId>elasticsearch-rest-high-level-client</artifactId>
                  <version>7.7.0</version>
              </dependency>
              <!--elasticsearch組件-->
              <dependency>
                  <groupId>org.elasticsearch</groupId>
                  <artifactId>elasticsearch</artifactId>
                  <version>7.7.0</version>
              </dependency>
              <!--mybatis整合springboot組件-->
              <dependency>
                  <groupId>org.mybatis.spring.boot</groupId>
                  <artifactId>mybatis-spring-boot-starter</artifactId>
                  <version>2.1.0</version>
              </dependency>
              <!--mysql數據庫連接驅動-->
              <dependency>
                  <groupId>mysql</groupId>
                  <artifactId>mysql-connector-java</artifactId>
                  <version>8.0.18</version>
              </dependency>
              <!--lombok組件-->
              <dependency>
                  <groupId>org.projectlombok</groupId>
                  <artifactId>lombok</artifactId>
                  <version>1.18.10</version>
              </dependency>
              <!--json組件gson-->
              <dependency>
                  <groupId>com.google.code.gson</groupId>
                  <artifactId>gson</artifactId>
                  <version>2.8.5</version>
              </dependency>
              <!--springboot-test組件-->
              <dependency>
                  <groupId>org.springframework.boot</groupId>
                  <artifactId>spring-boot-test</artifactId>
              </dependency>
              <!--單元測試junit組件-->
              <dependency>
                  <groupId>junit</groupId>
                  <artifactId>junit</artifactId>
                  <version>4.12</version>
                  <scope>test</scope>
              </dependency>
              <!--spring-test組件-->
              <dependency>
                  <groupId>org.springframework</groupId>
                  <artifactId>spring-test</artifactId>
                  <version>5.2.2.RELEASE</version>
                  <scope>test</scope>
              </dependency>
          </dependencies>
      
          <build>
              <!--springboot的maven插件-->
              <plugins>
                  <plugin>
                      <groupId>org.springframework.boot</groupId>
                      <artifactId>spring-boot-maven-plugin</artifactId>
                  </plugin>
                  <plugin>
                      <groupId>org.apache.maven.plugins</groupId>
                      <artifactId>maven-compiler-plugin</artifactId>
                      <configuration>
                          <compilerArgs>
                              <arg>-parameters</arg>
                          </compilerArgs>
                      </configuration>
                  </plugin>
              </plugins>
          </build>
      
    • 2.3.2 Elasticsearch的配置類和Gson配置類和應用配置文件

      application.yml

      butterflytri:
        databaseurl-port: 127.0.0.1:3306 # 數據庫端口
        database-name: student_db # 數據庫名
        host: 192.168.129.100:9200 # es服務端
      server:
        port: 8080 # 應用端口
        servlet:
          context-path: /butterflytri # 應用映射
      spring:
        application:
          name: mybatis # 應用名稱
        datasource:
          url: jdbc:mysql://${butterflytri.databaseurl-port}/${butterflytri.database-name}?useUnicode=true&characterEncoding=UTF-8&useJDBCCompliantTimezoneShift=true&useLegacyDatetimeCode=false&serverTimezone=UTC
          driver-class-name: com.mysql.jdbc.Driver
          username: root
          password: root
      mybatis:
        type-aliases-package: com.butterflytri.entity # entity別名
        mapper-locations: classpath:com/butterflytri/mapper/*Mapper.xml # mapper映射包掃描
      

      注意:yml文件中的192.168.129.100:9200是es對外的端口,使用的http協議進行操作,es服務器還有個9300端口,這個端口是es集群中各個節點進行交流的端口,使用的是tcp協議。所以我們連接的時候,端口要使用9200端口。

      項目啟動類沒有什麼特別的東西,就不展示了。

      ElasticsearchConfig.java

      package com.butterflytri.config;
      
      import org.apache.http.HttpHost;
      import org.elasticsearch.client.RestClient;
      import org.elasticsearch.client.RestHighLevelClient;
      import org.springframework.beans.factory.DisposableBean;
      import org.springframework.beans.factory.FactoryBean;
      import org.springframework.beans.factory.InitializingBean;
      import org.springframework.beans.factory.annotation.Value;
      import org.springframework.context.annotation.Configuration;
      
      /**
       * @author: WJF
       * @date: 2020/5/22
       * @description: ElasticSearchConfig
       */
      @Configuration
      public class ElasticSearchConfig implements FactoryBean<RestHighLevelClient>, InitializingBean, DisposableBean {
      
          /**
           * {@link FactoryBean<T>}:FactoryBean<T>是spring對外提供的對接接口,當向spring對象使用getBean("..")方法時,
           *                         spring會使用FactoryBean<T>的getObject 方法返回對象。所以當一個類實現的factoryBean<T>接口時,
           *                         那麼每次向spring要這個類時,spring就返回T對象。
           *
           * {@link InitializingBean}:InitializingBean接口為bean提供了初始化方法的方式,它只包括afterPropertiesSet方法,
           *                          凡是繼承該接口的類,在初始化bean的時候會執行該方法。在spring初始化bean的時候,如果該bean是
           *                          實現了InitializingBean接口,並且同時在配置文件中指定了init-method,系統則是
           *                          先調用afterPropertiesSet方法,然後在調用init-method中指定的方法。
           *
           * {@link DisposableBean}:DisposableBean接口為bean提供了銷毀方法destroy-method,會在程序關閉前銷毀對象。
           */
      
          @Value("#{'${butterflytri.host}'.split(':')}")
          private String[] host;
      
          private RestHighLevelClient restHighLevelClient;
      
          private RestHighLevelClient restHighLevelClient() {
              restHighLevelClient = new RestHighLevelClient(
      
                      RestClient.builder(new HttpHost(host[0],Integer.valueOf(host[1]),"http"))
      
              );
              return restHighLevelClient;
          }
      
          @Override
          public void destroy() throws Exception {
              restHighLevelClient.close();
          }
      
          @Override
          public RestHighLevelClient getObject() throws Exception {
              return restHighLevelClient;
          }
      
          @Override
          public Class<?> getObjectType() {
              return RestHighLevelClient.class;
          }
      
          @Override
          public void afterPropertiesSet() throws Exception {
              restHighLevelClient();
          }
      
      }
      

      ES的配置類,這個配置類實現了三個接口,三個接口的作用我也寫上了註釋,大家可以看下,需要注意的是FactoryBean這個接口,一但實現了這個接口,每當你需要使用泛型表示的對象T的時候,Spring不會從容器中去拿這個對象,而是會調用這個FactoryBean.getObject()方法去拿對象。其他的就沒有什麼了。

      Gson.java

      Gson是一個操作json數據的類,它的執行效率可能會慢一點,但是它在解析json數據的時候不會出Bug。

      package com.butterflytri.config;
      
      import com.google.gson.Gson;
      import org.springframework.context.annotation.Bean;
      import org.springframework.context.annotation.Configuration;
      
      /**
       * @author: WJF
       * @date: 2020/5/22
       * @description: GsonConfig
       */
      @Configuration
      public class GsonConfig {
      
          /**
           * {@link Gson}:一個操作json的對象,有比較好的json操作體驗,相對於Alibaba的FastJson來說速度慢一些,但是FastJson在解析
           *              複雜的的json字符串時有可能會出現bug。
           * @return Gson
           */
      
          @Bean
          public Gson gson() {
              return new Gson();
          }
      
      }
      

      Constants.java

      這是我寫的常量類,放一些ES使用的常量,直接寫字符串也行,但是我建議這樣做。

      package com.butterflytri.constants;
      
      
      /**
       * @author: WJF
       * @date: 2020/5/22
       * @description: Constants
       */
      public class Constants {
      
          /**
           * es搜索關鍵字
           */
          public static final String KEYWORD = ".keyword";
      
          /**
           * es的type類型:type字段將在 elasticsearch-version:8 中徹底刪除,本來就覺得沒得啥用。
           */
          public static final String DOC_TYPE = "_doc";
      
          /**
           * 學生信息索引類型
           */
          public static final String INDEX_STUDENT = "student_info";
      
      
          /**
           * 自定連接符
           */
          public static final String CONNECTOR = " --> ";
      
      }
      

      Student.java

      package com.butterflytri.entity;
      
      import lombok.Getter;
      import lombok.Setter;
      import lombok.ToString;
      
      import java.io.Serializable;
      
      /**
       * @author: WJF
       * @date: 2020/5/16
       * @description: Student
       */
      
      @ToString
      @Getter
      @Setter
      public class Student implements Serializable {
      
          private Long id;
      
          private String studentName;
      
          private String studentNo;
      
          private String sex;
      
          private Integer age;
      
          private String clazz;
      
      }
      

      StudentMapper.java

      package com.butterflytri.mapper;
      
      import com.butterflytri.entity.Student;
      import org.apache.ibatis.annotations.Mapper;
      
      import java.util.List;
      
      /**
       * @author: WJF
       * @date: 2020/5/16
       * @description: StudentMapper
       */
      @Mapper
      public interface StudentMapper {
      
          /**
           * 查詢所有學生信息
           * @return List<Student>
           */
          List<Student> findAll();
      
          /**
           * 通過id查詢學生信息
           * @param id:學生id
           * @return Student
           */
          Student findOne(Long id);
      
          /**
           * 通過學號查詢學生信息
           * @param studentNo:學生學號
           * @return Student
           */
          Student findByStudentNo(String studentNo);
      
      }
      

      mybatis的SQL映射文件我就不展示了,也很簡單,大家看接口方法名就應該可以想象得到SQL語句是怎樣的。

    • 2.3.3 索引數據到ES服務器

      IndexServiceImpl.java

      package com.butterflytri.service.impl;
      
      import com.butterflytri.constants.Constants;
      import com.butterflytri.entity.Student;
      import com.butterflytri.service.IndexService;
      import com.google.gson.Gson;
      import org.elasticsearch.action.ActionListener;
      import org.elasticsearch.action.index.IndexRequest;
      import org.elasticsearch.action.index.IndexResponse;
      import org.elasticsearch.client.RequestOptions;
      import org.elasticsearch.client.RestHighLevelClient;
      import org.elasticsearch.common.xcontent.XContentType;
      import org.springframework.stereotype.Service;
      
      import javax.annotation.Resource;
      import java.io.IOException;
      
      /**
       * @author: WJF
       * @date: 2020/5/22
       * @description: IndexServiceImpl
       */
      @Service
      public class IndexServiceImpl implements IndexService {
      
          @Resource
          private Gson gson;
      
          @Resource
          private RestHighLevelClient restHighLevelClient;
      
          @Override
          public String index(Student student) {
              StringBuilder builder = new StringBuilder();
              IndexRequest indexRequest = this.initIndexRequest(student);
              try {
                  // 同步索引到elasticsearch服務器,獲取索引響應IndexResponse
                  IndexResponse indexResponse = restHighLevelClient.index(indexRequest, RequestOptions.DEFAULT);
                  String statusName = indexResponse.status().name();
                  int statusCode = indexResponse.status().getStatus();
                  builder.append(statusName).append(Constants.CONNECTOR).append(statusCode);
              } catch (IOException e) {
                  builder.append("Fail").append(Constants.CONNECTOR).append(e.getMessage());
              }
              return builder.toString();
          }
      
      
          @Override
          public String indexAsync(Student student) {
              StringBuilder builder = new StringBuilder();
              IndexRequest indexRequest = this.initIndexRequest(student);
              // 異步索引到elasticsearch服務器,獲取索引響應IndexResponse
              restHighLevelClient.indexAsync(indexRequest, RequestOptions.DEFAULT,actionListener(builder));
              return builder.toString();
          }
      
      
      
          /**
           * 初始化IndexRequest,並設置數據源。
           * @param student
           * @return IndexRequest
           */
          private IndexRequest initIndexRequest(Student student) {
              // 構建IndexRequest,設置索引名稱,索引類型,索引id
              IndexRequest indexRequest = new IndexRequest(Constants.INDEX_STUDENT);
              // 可以不設置,默認就是'_doc'
              indexRequest.type(Constants.DOC_TYPE);
              // 設置索引id為studentId
              indexRequest.id(String.valueOf(student.getId()));
              // 設置數據源
              String studentJson = gson.toJson(student);
              indexRequest.source(studentJson, XContentType.JSON);
              return indexRequest;
          }
      
          /**
           * 異步索引的回調監聽器,根據不同的結果做出不同的處理
           * @param builder
           * @return ActionListener<IndexResponse>
           */
          private ActionListener<IndexResponse> actionListener(StringBuilder builder) {
              return new ActionListener<IndexResponse>() {
                  // 當索引數據到es服務器時,返回不同的狀態
                  @Override
                  public void onResponse(IndexResponse indexResponse) {
                      String statusName = indexResponse.status().name();
                      int statusCode = indexResponse.status().getStatus();
                      builder.append(statusName).append(Constants.CONNECTOR).append(statusCode);
                  }
      
                  // 當索引數據時出現異常
                  @Override
                  public void onFailure(Exception e) {
                      builder.append("Fail").append(Constants.CONNECTOR).append(e.getMessage());
                  }
              };
          }
      }
      

      上面的內容很簡單,就是將Student對象格式化為Json字符串,然後存到es服務器中,大家只要遵守一個規則就好,就是操作es服務器,不管是什麼操作都是用RestHighLevelClient這個類去操作,上面的就是student對象索引的es服務器中,使用restHighLevelClient.index(indexRequest, RequestOptions.DEFAULT),首先就是構建indexRequest對象,這個對象就是索引請求對象,具體幹了什麼看代碼上的註釋。這裏還有個restHighLevelClient.indexAsync()這個方法,這個方法和上面的index方法一樣的效果,只不過是異步調用。

      接下來我們測試一下這個代碼,請看:

      @Test
          public void indexTest() {
              List<Student> list = studentMapper.findAll();
              for (Student student : list) {
                  String message = indexService.index(student);
                  System.out.println(message);
              }
          }
      

      我們使用ElasticVue插件連接es服務器即可看到有一個索引庫:

      當我們點擊到show按鈕的時候,可以看到student_info索引庫中有幾條記錄:

      索引數據到數據庫成功了。

    • 2.3.4 獲取Es服務器數據

      獲取數據,是es提供給我們的API,這個Api只能獲取某個索引的某一條文檔,示例如下:

      GetServiceImpl.java

      	@Override
          public Student get(String id) {
              Student student = new Student();
              GetRequest getRequest = new GetRequest(Constants.INDEX_STUDENT, id);
              try {
                  GetResponse getResponse = restHighLevelClient.get(getRequest, RequestOptions.DEFAULT);
                  String source = getResponse.getSourceAsString();
                  student = gson.fromJson(source, Student.class);
              } catch (IOException e) {
                  e.printStackTrace();
              }
              return student;
          }
      

      接着我們在測試類中,調用這個方法然後打印一下結果:

      GetServiceTest.java

      	@Test
          public void getTest() {
              Student student = getService.get("1");
              System.out.println(student);
          }
      

      結果如下:

      更新數據文檔和刪除數據文檔我就不演示了,都是大同小異,大家可以拉下我的代碼,好好研究一下,都有詳細的註釋,覺得可以的話,給我點下star也是極好的。下面演示一下searchApi,這個Api是我們經常需要使用的,特別重要。

    • 2.3.5 搜索Es服務器數據

      ES的搜索API包含很多,比如說組合搜索,區間搜索,高亮显示,分詞搜索等等。我先給大家演示一下組合搜索,區間搜索其實也是組合搜索的一個子條件,其他的搜索其實也都是,代碼如下:

      SearchServiceImpl.java

      	@Override
          public List<Student> searchRange(Object from, Object to, String field, String index) {
              List<Student> list = new ArrayList<>();
              BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
              // 需要搜索的區間字段field
              RangeQueryBuilder rangeQueryBuilder = QueryBuilders.rangeQuery(field);
              // 左區間
              if (from != null) {
                  rangeQueryBuilder.from(from, true);
              }
              // 右區間
              if (to != null) {
                  rangeQueryBuilder.to(to, true);
              }
              boolQueryBuilder.must();
              SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
              searchSourceBuilder.query(boolQueryBuilder);
              SearchRequest searchRequest = new SearchRequest(index);
              searchRequest.source(searchSourceBuilder);
              try {
                  SearchResponse search = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
                  for (SearchHit hit : search.getHits()) {
                      String source = hit.getSourceAsString();
                      Student student = gson.fromJson(source, Student.class);
                      list.add(student);
                  }
              } catch (IOException e) {
                  e.printStackTrace();
              }
              return list;
          }
      

      上面的代碼其實很簡單,就是一個區間查詢構建器,查詢指定字段處於區間的所有數據,rangeQueryBuilder.from(from, true)的第一個參數就是字段的下邊界,第二個參數代表是否包含邊界。SearchResponse就是搜索的響應對象,所有的數據都在SearchHit對象中。

      接下來給大家演示一些組合查詢,這個方法搜索年齡在18到19歲並且班級為’G0305’的學生。記得ES默認是分頁的,如果想不分頁,一定要記得給搜索字段加上.keyword(字符串加,数字不支持)。

      SearchServiceImpl.java

      @Override
          public List<Student> searchBool() {
              List<Student> list = new ArrayList<>();
              BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
              boolQuery.must(QueryBuilders.rangeQuery("age").gte(18).lte(19));
              boolQuery.must(QueryBuilders.termQuery("clazz" + Constants.KEYWORD,"G0305"));
              SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
              searchSourceBuilder.query(boolQuery);
              SearchRequest searchRequest = new SearchRequest(Constants.INDEX_STUDENT);
              searchRequest.source(searchSourceBuilder);
              try {
                  SearchResponse search = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
                  for (SearchHit hit : search.getHits()) {
                      String source = hit.getSourceAsString();
                      Student student = gson.fromJson(source, Student.class);
                      list.add(student);
                  }
              } catch (IOException e) {
                  e.printStackTrace();
              }
              return list;
          }
      

      上面的代碼中的類BoolQueryBuilder就是組合查詢構建器,這個類可以用來構建組合的條件查詢。boolQuery.must()方法就是用來拼接條件的一種方式,使用這個方法代表必須滿足這個條件才會查詢出來,上面的代碼說明必須滿足年齡為18(包含18)到19(包含19)歲,並且班級為’G0305’的學生才會查詢出來。還有其他的一些常見的組合查詢方法,如下:

      • boolQuery.must():必須滿足此條件,相當於=或者&
      • boolQuery.mustNot():必須不滿足此條件,相當於!=
      • boolQuery.should():相當於||或者or
      • boolQuery.filter():過濾。

      然後是聚合查詢,很類似於MySQL中的聚合函數,這個示例我就不再解釋了,代碼註釋很清楚:

      @Override
          public void searchBoolAndAggregation() {
              BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
              boolQuery.must(QueryBuilders.rangeQuery("age").gte(18).lte(19));
              boolQuery.must(QueryBuilders.termQuery("clazz" + Constants.KEYWORD,"G0305"));
              // 聚合分組:按clazz字段分組,並將結果取名為clazz,es默認是分詞的,為了精確配置,需要加上‘.keyword’關鍵詞後綴。
              TermsAggregationBuilder aggregationBuilder = AggregationBuilders.terms("clazz").field("clazz" + Constants.KEYWORD);
              // 聚合求和:求符合查詢條件的學生的年齡的和,並將結果取名為ageSum,因為不是字符串,所以默認是精確匹配,不支持分詞。
              aggregationBuilder.subAggregation(AggregationBuilders.sum("ageSum").field("age"));
              // 聚合求平均:求符合查詢條件的學生的年齡的平均值,並將結果取名為ageAvg,因為不是字符串,所以默認是精確匹配,不支持分詞。
              aggregationBuilder.subAggregation(AggregationBuilders.avg("ageAvg").field("age"));
              // 聚合求數量:按學號查詢符合查詢條件的學生個數,並將結果取名為count,es默認是分詞的,為了精確配置,需要加上‘.keyword’關鍵詞後綴。
              aggregationBuilder.subAggregation(AggregationBuilders.count("count").field("studentNo" + Constants.KEYWORD));
              SearchSourceBuilder builder = new SearchSourceBuilder();
              builder.query(boolQuery);
              builder.aggregation(aggregationBuilder);
              // 按年齡降序排序。
              builder.sort("age", SortOrder.DESC);
              SearchRequest request = new SearchRequest("student_info");
              request.source(builder);
              try {
                  SearchResponse search = restHighLevelClient.search(request, RequestOptions.DEFAULT);
                  for (SearchHit hit : search.getHits()) {
                      String source = hit.getSourceAsString();
                      Student student = gson.fromJson(source, Student.class);
                      System.out.println(student);
                  }
                  // 使用Terms對象接收
                  Terms clazz = search.getAggregations().get("clazz");
                  for (Terms.Bucket bucket : clazz.getBuckets()) {
                      System.out.println(bucket.getDocCount());
      
                      System.out.println("=====================");
                      // 使用ParsedSum對象接收
                      ParsedSum ageCount = bucket.getAggregations().get("ageSum");
                      System.out.println(ageCount.getType());
                      System.out.println(ageCount.getValue());
                      System.out.println(ageCount.getValueAsString());
                      System.out.println(ageCount.getMetaData());
                      System.out.println(ageCount.getName());
      
                      System.out.println("=====================");
                      // 使用ParsedAvg對象接收
                      ParsedAvg ageAvg = bucket.getAggregations().get("ageAvg");
                      System.out.println(ageAvg.getType());
                      System.out.println(ageAvg.getValue());
                      System.out.println(ageAvg.getValueAsString());
                      System.out.println(ageAvg.getMetaData());
                      System.out.println(ageAvg.getName());
      
                      System.out.println("=====================");
                      // 使用ParsedValueCount對象接收
                      ParsedValueCount count = bucket.getAggregations().get("count");
                      System.out.println(count.getType());
                      System.out.println(count.getValue());
                      System.out.println(count.getValueAsString());
                      System.out.println(count.getMetaData());
                      System.out.println(count.getName());
                  }
              } catch (IOException e) {
                  e.printStackTrace();
              }
          }
      

      最後還有分詞查詢,分詞查詢就不加.keyword關鍵字即可。

      @Override
          public List<Student> searchMatch(String matchStudentName) {
              List<Student> list = new ArrayList<>();
              BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
              // 分詞查詢時不加'.keyword'關鍵字
              boolQueryBuilder.must(QueryBuilders.matchQuery("studentName",matchStudentName));
              SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
              searchSourceBuilder.query(boolQueryBuilder);
              SearchRequest searchRequest = new SearchRequest("student_info");
              searchRequest.source(searchSourceBuilder);
              try {
                  SearchResponse search = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
                  for (SearchHit hit : search.getHits().getHits()) {
                      String source = hit.getSourceAsString();
                      Student student = gson.fromJson(source, Student.class);
                      list.add(student);
                  }
      
              } catch (IOException e) {
                  e.printStackTrace();
              }
              return list;
          }
      

      請記住,一般的進行分詞都是字符串才進行分詞搜索,数字等類型只能是精準匹配。

      最後,ES功能很強大,作為搜索界的扛把子,ES的功能遠遠不止這些,它還可以高亮搜索,數據分析等等。我在這裏演示的僅僅只是皮毛,甚至都不是皮毛,僅作為初學者的參考。如有大佬覺得我哪裡寫錯了,或者有不同見解,歡迎留言。

    3. 項目地址

    本項目傳送門:

    • GitHub —> spring-boot-elasticsearch
    • Gitee —> spring-boot-elasticsearch

    此教程會一直更新下去,覺得博主寫的可以的話,關注一下,也可以更方便下次來學習。

    • 作者:Butterfly-Tri
    • 出處:Butterfly-Tri個人博客
    • 版權所有,歡迎保留原文鏈接進行轉載

    本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理

    【其他文章推薦】

    網頁設計最專業,超強功能平台可客製化

    ※自行創業缺乏曝光? 網頁設計幫您第一時間規劃公司的形象門面

    ※回頭車貨運收費標準

    ※推薦評價好的iphone維修中心

    ※教你寫出一流的銷售文案?

    台中搬家公司教你幾個打包小技巧,輕鬆整理裝箱!

    台中搬家公司費用怎麼算?

  • 一行代碼引來的安全漏洞就讓我們丟失了整個服務器的控制權

    一行代碼引來的安全漏洞就讓我們丟失了整個服務器的控制權

    之前在某廠的某次項目開發中,項目組同學設計和實現了一個“引以為傲”,額,有點擴張,不過自認為還說得過去的 feature,結果臨上線前被啪啪打臉,因為實現過程中因為一行代碼(沒有標題黨,真的是一行代碼)帶來的安全漏洞讓我們丟失了整個服務器控制權(測試環境)。多虧了上線之前有公司安全團隊的人會對代碼進行掃描,才讓這個漏洞被扼殺在搖籃里。

    下面我們就一起來看看這個事故,啊,不對,是故事。

    背景說明

    我們的項目是一個面向全球用戶的 Web 項目,用 SpringBoot 開發。在項目開發過程中,離不開各種異常信息的處理,比如表單提交參數不符合預期,業務邏輯的處理時離不開各種異常信息(例如網絡抖動等)的處理。於是利用 SpringBoot 各種現成的組件支持,設計了一個統一的異常信息處理組件,統一管理各種業務流程中可能出現的錯誤碼和錯誤信息,通過國際化的資源配置文件進行統一輸出給用戶。

    統一錯誤信息配置管理

    我們的用戶遍布全球,為了給各個國家用戶比較好的體驗會進行不同的翻譯。具體而言,實現的效果如下,為了方便理解,以“找回登錄密碼”這樣一個業務場景來進行闡述說明。

    假設找回密碼時,需要用戶輸入手機或者郵箱驗證碼,假設這個時候用戶輸入的驗證碼通過後台數據庫(可能是Redis)對比發現已經過期。在業務代碼中,只需要簡單的 throw new ErrorCodeException(ErrorCodes.AUTHCODE_EXPIRED) 即可。具體而言,針對不同國家地區不同的語言看到的效果不一樣:

    • 中文用戶看到的提示就是“您輸入的驗證碼已過期,請重新獲取”;
    • 歐美用戶看到的效果是“The verification code you input is expired, …”;
    • 德國用戶看到的是:“Der von Ihnen eingegebene Verifizierungscode ist abgelaufen, bitte wiederholen” 。(我瞎找的翻譯,不一定準)
    • ……

    統一錯誤信息配置管理代碼實現

    關鍵信息其實就在於一個 GlobalExceptionHandler,對所有Controller 入口進行 AOP 攔截,根據不同的錯誤信息,獲取相應資源文件配置的 key,並從語言資源文件中讀取不同國家的錯誤翻譯信息。

    @ControllerAdvice
    public class GlobalExceptionHandler {
    
        @ExceptionHandler(BadRequestException.class)
        @ResponseBody
        public ResponseEntity handle(HttpServletRequest request, BadRequestException e){
            String i18message = getI18nMessage(e.getKey(), request);
            return ResponseEntity.status(HttpStatus.BAD_REQUEST).body(Response.error(e.getCode(), i18message));
        }
        
        @ExceptionHandler(ErrorCodeException.class)
        @ResponseBody
        public ResponseEntity handle(HttpServletRequest request, ErrorCodeException e){
            String i18message = getI18nMessage(e.getKey(), request);
            return ResponseEntity.status(HttpStatus.OK).body(Response.error(e.getCode(), i18message));
        }
    }

     

    不同語言的資源文件示例

    private String getI18nMessage(String key, HttpServletRequest request) {
       try {
           return messageSource.getMessage(key, null, LanguaggeUtils.currentLocale(request));
       } catch (Exception e) {
           // log
           return key;
       }
    }

     

    詳細代碼實現可以參考本人之前寫的這篇文章一文教你實現 SpringBoot 中的自定義 Validator 和錯誤信息國際化配置,上面有附完整的代碼實現。

    基於註解的表單校驗(含自定義註解)

    還有一種常見的業務場景就是後端接口需要對用戶提交的表單進行校驗。以“註冊用戶”這樣的場景舉例說明, 註冊用戶時,往往會提交昵稱,性別,郵箱等信息進行註冊,簡單起見,就以這 3 個屬性為例。

    定義的表單如下:

    public class UserRegForm {
     private String nickname;
     private String gender;
     private String email;
    }

     

    對於表單的約束,我們有:

    • 昵稱字段:“nickname” 必填,長度必須是 6 到 20 位;
    • 性別字段:“gender” 可選,如果填了,就必須是“Male/Female/Other/”中的一種。說啥,除了男女還有其他?對,是的。畢竟全球用戶嘛,你去看看非死不可,還有更多。
    • 郵箱: “email”,必填,必須滿足郵箱格式。

    對於以上約束,我們只需要在對應的字段上添加如下註解即可。

    public class UserRegForm {
     @Length(min = 6, max = 20, message = "validate.userRegForm.nickname")
     private String nickname;
    
     @Gender(message="validate.userRegForm.gender")
     private String gender;
    
     @NotNull
     @Email(message="validate.userRegForm.email")
     private String email;
    }

     

    然後在各個語言資源文件中配置好相應的錯誤信息提示即可。其中, @Gender 就是一個自定義的註解。

    基於含自定義註解的表單校驗關鍵代碼

    自定義註解的實現主要的其實就是一個自定義註解的定義以及一個校驗邏輯。 例如定義一個自定義註解 CustomParam

    @Documented
    @Constraint(validatedBy = CustomValidator.class)
    @Target({FIELD, METHOD, PARAMETER, ANNOTATION_TYPE})
    @Retention(RetentionPolicy.RUNTIME)
    public @interface CustomParam {
        String message() default "name.tanglei.www.validator.CustomArray.defaultMessage";
    
        Class<?>[] groups() default {};
        Class<? extends Payload>[] payload() default { };
    
        @Documented
        @Retention(RetentionPolicy.RUNTIME)
        @Target({FIELD, METHOD, PARAMETER, ANNOTATION_TYPE})
        @interface List {
            CustomParam[] value();
        }
    }

     

    校驗邏輯的實現 CustomValidator

    public class CustomValidator implements ConstraintValidator<CustomParam, String> {
        @Override
        public boolean isValid(String s, ConstraintValidatorContext constraintValidatorContext) {
            if (null == s || s.isEmpty()) {
                return true;
            }
            if (s.equals("tanglei")) {
                return true;
            } else {
                error(constraintValidatorContext, "Invalid params: " + s);
                return false;
            }
        }
    
        @Override
        public void initialize(CustomParam constraintAnnotation) {
        }
    
        private static void error(ConstraintValidatorContext context, String message) {
            context.disableDefaultConstraintViolation();
            context.buildConstraintViolationWithTemplate(message).addConstraintViolation();
        }
    }

     

    上面例子只為了闡述說明問題,其中校驗邏輯沒有實際意義,這樣,如果輸入參數不滿足條件,就會明確提示用戶輸入的哪個參數不滿足條件。例如輸入參數 xx,則會直接提示:Invalid params: xx

    這個跟第一部分的處理方式類似,因為現有的 validator 組件實現中,如果違反相應的約束也是一種拋異常的方式實現的,因此只需要在上述的 GlobalExceptionHandler中添加相應的異常信息即可,這裏就不詳述了。 這不是本文的重點,這裏就不詳細闡述了。 詳細代碼實現可以參考本人之前寫的這篇文章一文教你實現 SpringBoot 中的自定義 Validator 和錯誤信息國際化配置,上面有附完整的代碼實現。

    場景重現

    一切都顯得很完美,直到上線前代碼提交至安全團隊掃描,就被“啪啪打臉”,掃描報告反饋了一個嚴重的安全漏洞。而這個安全漏洞,屬於很高危的遠程代碼執行漏洞。

    用前文提到的自定義 Validator,輸入的參數用: “1+1=${1+1}”,看看效果:

    太 TM 神奇了,居然幫我運算出來了,返回 "message": "Invalid params: 1+1=2"

    問題就出現在實現自定義註解進行校驗的這行代碼(如下圖所示):

    其實,最開始的時候,這裏直接返回了“Invalid params”,當初為了更好的用戶體驗,要明確告訴用戶哪個參數沒有通過校驗,因此在輸出的提示上加上了用戶輸入的字段,也就是上面的"Invalid params: " + s,沒想到,這闖了大禍了(回過頭來想,感覺這裏沒必要這麼詳細啊,因為前端已經有相應的校驗了,正常情況下回攔住,針對不守規矩的用非常規手段來的接口請求,直接返回校驗不通過就行了,畢竟不是對外提供的 OpenAPI 服務)。

    仔細看,這個方法實際上是 ConstraintValidatorContext這個接口中聲明的,看方法名字其實能知道輸入參數是一個字符串模板,內部會進行解析替換的(這其實也符合“見名知意”的良好編程習慣)。(教訓:大家應該把握好自己寫的每一行代碼背後實際在做什麼。)

    /* ......
     * @param messageTemplate new un-interpolated constraint message
     * @return returns a constraint violation builder
     */
    ConstraintViolationBuilder buildConstraintViolationWithTemplate(String messageTemplate);

     

    這個 case,源碼調試進去之後,就能跟蹤到執行翻譯階段,在如下方法中: org.hibernate.validator.messageinterpolation.AbstractMessageInterpolator.interpolateMessage

    再往後,就是表達式求值了。

    以為就這樣就完了嗎?

    剛開始感覺,能幫忙算簡單的運算規則也就完了吧,你還能把我怎麼樣?其實這個相當於暴露了一個入口,支持用戶輸入任意 EL 表達式進行執行。網上通過關鍵字 “SpEL表達式注入漏洞” 找找,就能發現事情並沒有想象中那麼簡單。

    我們構造恰當的 EL 表達式(注意各種轉義,下文的輸入參數相對比較明顯在做什麼了,實際上還有更多黑科技,比如各種二進制轉義編碼啊等等),就能直接執行輸入代碼,例如:可以直接執行命令,“ls -al”, 返回了一個 UNIXProcess 實例,命令已經被執行過了。

    比如,我們執行個打開計算器的命令,搞個計算器玩玩~

    我錄製了一個動圖,來個演示可能更生動一些。

    這還得了嗎?這相當於提供了一個 webshell 的功能呀,你看想運行啥命令就能運行啥命令,例如 ping 本人博客地址(ping www.tanglei.name),下面動圖演示一下整個過程(從運行 ping 到 kill ping)。

    我錄製了一個視頻,點擊這裏可以訪問。

    豈不是直接創建一個用戶,然後遠程登錄就可以了。後果很嚴重啊,別人想幹嘛就幹嘛了。

    我們跟蹤下對應的代碼,看看內部實現,就會“恍然大悟”了。

    經驗教訓

    幸虧這個漏洞被扼殺在搖籃里,否則後果還真的挺嚴重的。通過這個案例,我們有啥經驗和教訓呢?那就是作為程序員,我們要對每一行代碼都保持“敬畏”之心。也許就是因為你的不經意的一行代碼就帶來了嚴重的安全漏洞,要是不小心被壞人利用,輕則……重則……(自己想象吧)

    此外,我們也應該看到,程序員需要對常見的安全漏洞(例如XSS/CSRF/SQL注入等等)有所了解,並且要有足夠的安全意識(其實有時候研究一些安全問題還挺好玩的,比如這篇《RSA算法及一種”旁門左道”的攻擊方式》就比較有趣)。例如:

    • 用戶權限分離:運行程序的用戶不應該用 root,例如新建一個“web”或者“www”之類的用戶,並設置該用戶的權限,比如不能有可執行 xx 的權限之類的。本文 case,如果權限進行了分離(遵循最小權限原則),應該也不會這麼嚴重。(本文就剛好是因為是測試環境,所以沒有強制實施)
    • 任何時候都不要相信用戶的輸入,必須對用戶輸入的進行校驗和過濾,又特別是針對公網上的應用。
    • 敏感信息加密保存。退一萬步講,假設攻擊者攻入了你的服務器,如果這個時候,你的數據庫賬戶信息等配置都直接明文保存在服務器中。那數據庫也被脫走了。

    如果可能的話,需要對開發者的代碼進行漏洞掃描。一些常見的安全漏洞現在應該是有現成的工具支持的。另外,讓專業的人做專業的事情,例如要有安全團隊,可能你會說你們公司沒有不也活的好好的,哈哈,只不過可能還沒有被壞人盯上而已,壞人也會考慮到他們的成本和預期收益的,當然這就更加對我們開發者提高了要求。一些敏感權限盡量控制在少部分人手中,配合相應的流程來支撐(不得不說,大公司繁瑣的流程還是有一定道理的)。

    畢竟我不是專業研究Web安全的,以上說得可能也不一定對,如果你有不同意見或者更好的建議歡迎留言參与討論。

    這篇文章從寫代碼做實驗,到錄屏做視頻動圖等等耗時還蠻久的(好幾個周末的時間呢),原創真心不易,希望你能幫我個小忙唄,如果本文內容你覺得有所啟發,有所收穫,請幫忙點個“在看”唄,或者轉發分享讓更多的小夥伴看到。

    精彩推薦
    • 一個由跨平台產生的浮點數bug | 有你意想不到的結果。
    • RSA算法及一種”旁門左道”的攻擊方式。
    • 震驚! 阿里的程序員也不過如此,竟被一個簡單的 SQL 查詢難住。
    • 面了7輪 Google,最終還是逃不脫被掛的命運。

    文章首發於本人微信公眾號(ID:tangleithu),請感興趣的同學關注我的微信公眾號,及時獲取技術乾貨。

    本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理

    【其他文章推薦】

    ※產品缺大量曝光嗎?你需要的是一流包裝設計!

    ※自行創業缺乏曝光? 網頁設計幫您第一時間規劃公司的形象門面

    ※回頭車貨運收費標準

    ※推薦評價好的iphone維修中心

    ※超省錢租車方案

    台中搬家遵守搬運三大原則,讓您的家具不再被破壞!

    ※推薦台中搬家公司優質服務,可到府估價

  • 03 . Prometheus監控容器和HTTP探針應用

    03 . Prometheus監控容器和HTTP探針應用

    Eeporter是什麼及來源?

    是什麼?

    廣義上講所有可以向Prometheus提供監控樣本數據的程序都可以被稱為一個Exporter。而Exporter的一個實例稱為target,如下所示,Prometheus通過輪詢的方式定期從這些target中獲取樣本數據:

    來源有哪些?

    社區提供的

    Prometheus社區提供了豐富的Exporter實現,涵蓋了從基礎設施,中間件以及網絡等各個方面的監控功能。這些Exporter可以實現大部分通用的監控需求。下錶列舉一些社區中常用的Exporter:

    範圍 常用Exporter
    數據庫 MySQL Exporter, Redis Exporter, MongoDB Exporter, MSSQL Exporter等
    硬件 Apcupsd Exporter,IoT Edison Exporter, IPMI Exporter, Node Exporter等
    消息隊列 Beanstalkd Exporter, Kafka Exporter, NSQ Exporter, RabbitMQ Exporter等
    存儲 Ceph Exporter, Gluster Exporter, HDFS Exporter, ScaleIO Exporter等
    HTTP服務 Apache Exporter, HAProxy Exporter, Nginx Exporter等
    API服務 AWS ECS Exporter, Docker Cloud Exporter, Docker Hub Exporter, GitHub Exporter等
    日誌 Fluentd Exporter, Grok Exporter等
    監控系統 Collectd Exporter, Graphite Exporter, InfluxDB Exporter, Nagios Exporter, SNMP Exporter等
    其他 Blockbox Exporter, JIRA Exporter, Jenkins Exporter, Confluence Exporter等

    用戶自定義的

    除了直接使用社區提供的Exporter程序以外,用戶還可以基於Prometheus提供的Client Library創建自己的Exporter程序,目前Promthues社區官方提供了對以下編程語言的支持:Go、Java/Scala、Python、Ruby。同時還有第三方實現的如:Bash、C++、Common Lisp、Erlang,、Haskeel、Lua、Node.js、PHP、Rust等。

    Exporter的運行方式

    從Exporter的運行方式來講,又可以分為

    獨立使用的

    以我們已經使用過的Node Exporter為例,由於操作系統本身並不直接支持Prometheus,同時用戶也無法通過直接從操作系統層面上提供對Prometheus的支持。因此,用戶只能通過獨立運行一個程序的方式,通過操作系統提供的相關接口,將系統的運行狀態數據轉換為可供Prometheus讀取的監控數據。 除了Node Exporter以外,比如MySQL Exporter、Redis Exporter等都是通過這種方式實現的。 這些Exporter程序扮演了一个中間代理人的角色。

    集成到應用中的

    為了能夠更好的監控系統的內部運行狀態,有些開源項目如Kubernetes,ETCD等直接在代碼中使用了Prometheus的Client Library,提供了對Prometheus的直接支持。這種方式打破的監控的界限,讓應用程序可以直接將內部的運行狀態暴露給Prometheus,適合於一些需要更多自定義監控指標需求的項目。

    Exporter規範

    所有的Exporter程序都需要按照Prometheus的規範,返回監控的樣本數據。以Node Exporter為例,當訪問/metrics地址時會返回以下內容:

    # HELP node_cpu Seconds the cpus spent in each mode.
    # TYPE node_cpu counter
    node_cpu{cpu="cpu0",mode="idle"} 362812.7890625
    # HELP node_load1 1m load average.
    # TYPE node_load1 gauge
    node_load1 3.0703125
    

    這是一種基於文本的格式規範,在Prometheus 2.0之前的版本還支持Protocol buffer規範。相比於Protocol buffer文本具有更好的可讀性,以及跨平台性。Prometheus 2.0的版本也已經不再支持Protocol buffer。

    Exporter返回的樣本數據,主要由三個部分組成:樣本的一般註釋信息(HELP),樣本的類型註釋信息(TYPE)和樣本。Prometheus會對Exporter響應的內容逐行解析:

    如果當前行以# HELP開始,Prometheus將會按照以下規則對內容進行解析,得到當前的指標名稱以及相應的說明信息:

    # HELP <metrics_name> <doc_string>
    

    如果當前行以# TYPE開始,Prometheus會按照以下規則對內容進行解析,得到當前的指標名稱以及指標類型:

    # TYPE <metrics_name> <metrics_type>
    

    TYPE註釋行必須出現在指標的第一個樣本之前。如果沒有明確的指標類型需要返回為untyped。 除了# 開頭的所有行都會被視為是監控樣本數據。 每一行樣本需要滿足以下格式規範:

    metric_name [
      "{" label_name "=" `"` label_value `"` { "," label_name "=" `"` label_value `"` } [ "," ] "}"
    ] value [ timestamp ]
    

    其中metric_name和label_name必須遵循PromQL的格式規範要求。value是一個float格式的數據,timestamp的類型為int64(從1970-01-01 00:00:00以來的毫秒數),timestamp為可選默認為當前時間。具有相同metric_name的樣本必須按照一個組的形式排列,並且每一行必須是唯一的指標名稱和標籤鍵值對組合。

    需要特別注意的是對於histogram和summary類型的樣本。需要按照以下約定返回樣本數據:

    1 . 類型為summary或者histogram的指標x,該指標所有樣本的值的總和需要使用一個單獨的x_sum指標表示

    2 . 類型為summary或者histogram的指標x,該指標所有樣本的總數需要使用一個單獨的x_count指標表示。

    3 . 對於類型為summary的指標x,其不同分位數quantile所代表的樣本,需要使用單獨的x{quantile=”y”}表示。

    4 . 對於類型histogram的指標x為了表示其樣本的分佈情況,每一個分佈需要使用x_bucket{le=”y”}表示,其中y為當前分佈的上位數。同時必須包含一個樣本x_bucket{le=”+Inf”},並且其樣本值必須和x_count相同。

    5 . 對於histogram和summary的樣本,必須按照分位數quantile和分佈le的值的遞增順序排序。

    以下是類型為histogram和summary的樣本輸出示例

    # A histogram, which has a pretty complex representation in the text format:
    # HELP http_request_duration_seconds A histogram of the request duration.
    # TYPE http_request_duration_seconds histogram
    http_request_duration_seconds_bucket{le="0.05"} 24054
    http_request_duration_seconds_bucket{le="0.1"} 33444
    http_request_duration_seconds_bucket{le="0.2"} 100392
    http_request_duration_seconds_bucket{le="+Inf"} 144320
    http_request_duration_seconds_sum 53423
    http_request_duration_seconds_count 144320
    
    # Finally a summary, which has a complex representation, too:
    # HELP rpc_duration_seconds A summary of the RPC duration in seconds.
    # TYPE rpc_duration_seconds summary
    rpc_duration_seconds{quantile="0.01"} 3102
    rpc_duration_seconds{quantile="0.05"} 3272
    rpc_duration_seconds{quantile="0.5"} 4773
    rpc_duration_seconds_sum 1.7560473e+07
    rpc_duration_seconds_count 2693
    

    指定樣式格式的版本
    在Exporter響應的HTTP頭信息中,可以通過Content-Type指定特定的規範版本,例如:

    HTTP/1.1 200 OK
    Content-Encoding: gzip
    Content-Length: 2906
    Content-Type: text/plain; version=0.0.4
    Date: Sat, 17 Mar 2018 08:47:06 GMT
    

    其中version用於指定Text-based的格式版本,當沒有指定版本的時候,默認使用最新格式規範的版本。同時HTTP響應頭還需要指定壓縮格式為gzip。

    容器監控

    Docker是一個開源的應用容器引擎,讓開發者可以打包他們的應用以及依賴包到一個可移植的容器中,然後發布到任何流行的Linux/Windows/Mac機器上。容器鏡像正成為一個新的標準化軟件交付方式。

    例如,可以通過一下命令快速在本地啟動一個Nginx服務:

    安裝docker
    # 安裝一些必要的系統工具
    sudo yum install -y yum-utils device-mapper-persistent-data lvm2
    # 添加軟件源信息
    # docker 官方源
    sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
    
    # 阿里雲源
    sudo yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
    
    sudo yum makecache fast
    
    # CentOS7安裝 Docker-ce
    yum -y install docker-ce   
    
    
    mkdir /etc/docker
    vim /etc/docker/daemon.json
    {
    "registry-mirrors": ["https://registry.docker-cn.com"]
    }
    
    # 啟動Docker後台服務
    systemctl start docker && systemctl enable docker
    systemctl daemon-reload                 # 守護進程重啟
    
    # 運行一個nginx做測試
    docker run -itd nginx
    

    為了能夠獲取到Docker容器的運行狀態,用戶可以通過Docker的stats命令獲取到當前主機上運行容器的統計信息,可以查看容器的CPU利用率、內存使用量、網絡IO總量以及磁盤IO總量等信息。

    docker stats
    CONTAINER           CPU %      MEM USAGE / LIMIT     MEM %      NET I/O         BLOCK I/O   PIDS
    9a1648bec3b2        0.30%      196KiB / 3.855GiB     0.00%      828B / 0B       827kB / 0B  1
    # 除了使用命令以外,用戶還可以通過docker提供的http api查看容器的監控統計信息.
    

    使用CAdvisor

    CAdvisor是Google開源的一款用於展示和分析容器運行狀態的可視化工具。通過在主機上運行CAdvisor用戶可以輕鬆的獲取到當前主機上容器的運行統計信息,並以圖表的形式向用戶展示。

    在本地運行CAdvisor也非常簡單,直接運行一下命令即可:

    docker run \
      --volume=/:/rootfs:ro \
      --volume=/var/run:/var/run:rw \
      --volume=/sys:/sys:ro \
      --volume=/var/lib/docker/:/var/lib/docker:ro \
      --publish=8080:8080 \
      --detach=true \
      --name=cadvisor \
      google/cadvisor:latest
    # 通過訪問http://localhost:8080可以查看,當前主機上容器的運行狀態.
    

    CAdvisor是一個簡單易用的工具,相比於使用Docker命令行工具,用戶不用再登錄到服務器中即可以可視化圖表的形式查看主機上所有容器的運行狀態。

    而在多主機的情況下,在所有節點上運行一個CAdvisor再通過各自的UI查看監控信息顯然不太方便,同時CAdvisor默認只保存2分鐘的監控數據。好消息是CAdvisor已經內置了對Prometheus的支持。訪問http://localhost:8080/metrics即可獲取到標準的Prometheus監控樣本輸出:

    下面列舉了一些CAdvisor中獲取的典型監控指標

    指標名稱 類型 含義
    gauge 再過去10秒內容器CPU的平均負載
    container_cpu_usage_seconds_total
    指標名稱 類型 含義
    container_cpu_load_average_10s gauge 過去10秒內容器CPU的平均負載
    container_cpu_usage_seconds_total counter 容器在每個CPU內核上的累積佔用時間 (單位:秒)
    container_cpu_system_seconds_total counter System CPU累積佔用時間(單位:秒)
    container_cpu_user_seconds_total counter User CPU累積佔用時間(單位:秒)
    container_fs_usge_bytes gauge 容器中文件系統的使用量(單位:字節)
    container_network_receive_bytes_total counter 容器網絡累計接受數據總量(單位: 字節)
    container_network_transmit_bytes_total counter 容器網絡累計傳輸數據總量(單位: 字節)

    與Prometheus集成

    修改/etc/prometheus/prometheus.yml,將cAdvisor添加監控數據採集任務目標當中:

      - job_name: 'docker'
        static_configs:
        - targets: ['172.19.0.27:8080']
    
    systemctl restart prometheus
    

    啟動Prometheus服務,可以在Prometheus UI中看到當前所有的Target狀態:

    當能夠正常採集到cAdvisor的樣本數據后,可以通過一下錶達式計算容器的CPU使用率.

    sum(irate(container_cpu_usage_seconds_total{image!=""}[1m])) without (cpu)
    

    查詢容器內存使用量(單位: 字節)

    container_memory_usage_bytes{image!=""}
    

    查詢容器網絡接收量速率(單位: 字節/秒)

    sum(rate(container_network_receive_bytes_total{image!=""}[1m])) without (interface)
    

    查詢容器網絡傳輸量速率

    sum(rate(container_network_transmit_bytes_total{image!=""}[1m])) without (interface)
    

    查詢容器文件系統讀取速率

    sum(rate(container_fs_reads_bytes_total{image!=""}[1m])) without (device)
    
    # 為了方便看出效果,我們使用dd命令
    docker exec -it 628d /bin/bash
    dd if=/dev/zero of=test bs=1M count=1000
    

    • 查詢容器文件系統寫入速率(單位: 字節/秒)
    sum(rate(container_fs_writes_bytes_total{image!=""}[1m])) without (device)
    

    Prometheus網絡探測

    接下來我們主要介紹Prometheus下如何進行白盒監控,我們之前監控主機的資源用量、容器的運行狀態、數據庫中間件的運行數據。 這些都是支持業務和服務的基礎設施,通過白盒能夠了解其內部的實際運行狀態,通過對監控指標的觀察能夠預判可能出現的問題,從而對潛在的不確定因素進行優化。而從完整的監控邏輯的角度,除了大量的應用白盒監控以外,還應該添加適當的黑盒監控。
    黑盒監控即以用戶的身份測試服務的外部可見性,常見的黑盒監控包括HTTP探針、TCP探針等用於檢測站點或者服務的可訪問性,以及訪問效率等。

    黑盒監控相較於白盒監控最大的不同在於黑盒監控是以故障為導向當故障發生時,黑盒監控能快速發現故障,而白盒監控則側重於主動發現或者預測潛在的問題。一個完善的監控目標是要能夠從白盒的角度發現潛在問題,能夠在黑盒的角度快速發現已經發生的問題。

    安裝Blackbox Exporter

    Blackbox Exporter是Prometheus社區提供的官方黑盒監控解決方案,其允許用戶通過:HTTP、HTTPS、DNS、TCP以及ICMP的方式對網絡進行探測。用戶可以直接使用go get命令獲取Blackbox Exporter源碼並生成本地可執行文件:

    下載安裝blackbox_exporter

    wget https://github.com/prometheus/blackbox_exporter/releases/download/v0.16.0/blackbox_exporter-0.16.0.linux-amd64.tar.gz

    tar xvf blackbox_exporter-0.16.0.linux-amd64.tar.gz -C /usr/local/prometheus/
    mv blackbox_exporter-0.16.0.linux-amd64/ blackbox_exporter
    useradd prometheus
    chown -R prometheus:prometheus /usr/local/prometheus/
    
    vim /usr/lib/systemd/system/blackbox_exporter.service
    [Unit]
    Description=blackbox_exporter
    After=network.target
    
    [Service]
    Type=simple
    User=prometheus
    ExecStart=/usr/local/prometheus/blackbox_exporter/blackbox_exporter --config.file=/usr/local/prometheus/blackbox_exporter/blackbox.yml
    Restart=on-failure
    
    [Install]
    WantedBy=multi-user.target
    
    systemctl enable blackbox_exporter.service
    systemctl start blackbox_exporter.service
    

    運行Blackbox Exporter時,需要用戶提供探針的配置信息,這些配置信息可能是一些自定義的HTTP頭信息,也可能是探測時需要的一些TSL配置,也可能是探針本身的驗證行為。在Blackbox Exporter每一個探針配置稱為一個module,並且以YAML配置文件的形式提供給Blackbox Exporter。 每一個module主要包含以下配置內容,包括探針類型(prober)、驗證訪問超時時間(timeout)、以及當前探針的具體配置項:

    # 探針類型:http、 tcp、 dns、 icmp.
    prober: <prober_string>
    # 超時時間
    [ timeout: <duration> ]
    # 探針的詳細配置,最多只能配置其中的一個
    [ http: <http_probe> ]
    [ tcp: <tcp_probe> ]
    [ dns: <dns_probe> ]
    [ icmp: <icmp_probe> ]
    

    下面是一個簡化的探針配置文件blockbox.yml,包含兩個HTTP探針配置項

    modules:
      http_2xx:
        prober: http
        http:
          method: GET
      http_post_2xx:
        prober: http
        http:
          method: POST
    

    通過運行一下命令,並指定使用的探針設置文件啟動Blockbox Exporter實例:

    blackbox_exporter --config.file=/etc/prometheus/blackbox.yml
    or
    systemctl restart blackbox_exporter.service
    

    啟動成功后,就可以通過訪問http://172.19.0.27:9115/probe?module=http_2xx&target=baidu.com對baidu.com進行探測。這裏通過在URL中提供module參數指定了當前使用的探針,target參數指定探測目標,探針的探測結果通過Metrics的形式返回:

    # HELP probe_dns_lookup_time_seconds Returns the time taken for probe dns lookup in seconds
    # TYPE probe_dns_lookup_time_seconds gauge
    probe_dns_lookup_time_seconds 0.004359875
    # HELP probe_duration_seconds Returns how long the probe took to complete in seconds
    # TYPE probe_duration_seconds gauge
    probe_duration_seconds 0.046153996
    # HELP probe_failed_due_to_regex Indicates if probe failed due to regex
    # TYPE probe_failed_due_to_regex gauge
    probe_failed_due_to_regex 0
    # HELP probe_http_content_length Length of http content response
    # TYPE probe_http_content_length gauge
    probe_http_content_length 81
    # HELP probe_http_duration_seconds Duration of http request by phase, summed over all redirects
    # TYPE probe_http_duration_seconds gauge
    probe_http_duration_seconds{phase="connect"} 0.00105657
    probe_http_duration_seconds{phase="processing"} 0.039457402
    probe_http_duration_seconds{phase="resolve"} 0.004359875
    probe_http_duration_seconds{phase="tls"} 0
    probe_http_duration_seconds{phase="transfer"} 0.000337184
    # HELP probe_http_last_modified_timestamp_seconds Returns the Last-Modified HTTP \
    response header in unixtime
    # TYPE probe_http_last_modified_timestamp_seconds gauge
    probe_http_last_modified_timestamp_seconds 1.26330408e+09
    # HELP probe_http_redirects The number of redirects
    # TYPE probe_http_redirects gauge
    probe_http_redirects 0
    # HELP probe_http_ssl Indicates if SSL was used for the final redirect
    # TYPE probe_http_ssl gauge
    probe_http_ssl 0
    # HELP probe_http_status_code Response HTTP status code
    # TYPE probe_http_status_code gauge
    probe_http_status_code 200
    # HELP probe_http_uncompressed_body_length Length of uncompressed response body
    # TYPE probe_http_uncompressed_body_length gauge
    probe_http_uncompressed_body_length 81
    # HELP probe_http_version Returns the version of HTTP of the probe response
    # TYPE probe_http_version gauge
    probe_http_version 1.1
    # HELP probe_ip_protocol Specifies whether probe ip protocol is IP4 or IP6
    # TYPE probe_ip_protocol gauge
    probe_ip_protocol 4
    # HELP probe_success Displays whether or not the probe was a success
    # TYPE probe_success gauge
    probe_success 1
    

    從返回的樣本中,用戶可以獲取站點的DNS解析耗時,站點響應時間,HTTP響應狀態碼等等和站點訪問質量相關的監控指標,從而幫助管理員主動的發現故障和問題.

    Prometheus集成

    接下來,只需要在Prometheus下配置對Blockbox Exporter實例的採集任務即可、最直觀的配置方式.

      - job_name: 'baidu_http2xx_probe'
        params:
          module:
          - http_2xx
          target:
          - baidu.com
        metrics_path: /probe
        static_configs:
        - targets: ['172.19.0.27:9115']
    
      - job_name: 'prometheus_http2xx_probe'
        params:
          module:
          - http_2xx
          target:
          - prometheus.io
        metrics_path: /probe
        static_configs:
        - targets: ['172.19.0.27:9115']
    
    systemctl restart prometheus
    

    這裏分別配置了名為baidu_http2x_probe和prometheus_http2xx_probe的採集任務,並且通過params指定使用的探針(module)以及探測目標(target).

    那問題就來了,假如我們有N個目標站點且都需要M種探測方式,那麼Prometheus中將包含N * M個採集任務,從配置管理的角度來說顯然是不可接受的。這裏我們也可以採用Relabling的方式對這些配置進行簡化,配置方式如下:

      - job_name: 'blackbox'
        metrics_path: /probe
        params:
          module: [http_2xx]
        static_configs:
          - targets:
            - http://prometheus.io    # Target to probe with http.
            - https://prometheus.io   # Target to probe with https.
            - http://example.com:8080 # Target to probe with http on port 8080.
        relabel_configs:
          - source_labels: [__address__]
            target_label: __param_target
          - source_labels: [__param_target]
            target_label: instance
          - target_label: __address__
            replacement: 172.19.0.27:9115
    

    這裏針對每一個探針服務(如http_2xx)定義一個採集任務,並且直接將任務的採集目標定義為我們需要探測的站點,在採集樣本數據之前通過relabel_configs對採集任務進行動態配置.

    * 第一步, 根據Target實例的地址,寫入__param_target標籤中,__param_<name>形式的標籤來表示,
    	# 在採集任務時會在請求目標地址中添加<name>參數,等同於params的設置.
    * 第二步,  獲取__param_target的值,並覆寫到instance標籤中.
    * 第三步,  覆寫Target實例的__address__標籤值為BlockBox Exporter實例的訪問地址.
    

    HTTP探針

    HTTP探針是進行黑盒監控時最常用的探針之一,通過HTTP探針能夠網站或者HTTP服務建立有效的監控,包括其本身的可用性,以及用戶體驗相關的如響應時間等等。除了能夠在服務出現異常的時候及時報警,還能幫助系統管理員分析和優化網站體驗。

    Blockbox Exporter中所有的探針均是以Module的信息進行配置。如下所示,配置了一個最簡單的HTTP探針:

    modules:
      http_2xx_example:
        prober: http
        http:
    

    通過prober配置項指定探針類型。配置項http用於自定義探針的探測方式,這裡有沒對http配置項添加任何配置,表示完全使用HTTP探針的默認配置,該探針將使用HTTP GET的方式對目標服務進行探測,並且驗證返回狀態碼是否為2XX,是則表示驗證成功,否則失敗。

    自定義HTTP請求

    HTTP服務通常會以不同的形式對外展現,有些可能就是一些簡單的網頁,而有些則可能是一些基於REST的API服務。 對於不同類型的HTTP的探測需要管理員能夠對HTTP探針的行為進行更多的自定義設置,包括:HTTP請求方法、HTTP頭信息、請求參數等。對於某些啟用了安全認證的服務還需要能夠對HTTP探測設置相應的Auth支持。對於HTTPS類型的服務還需要能夠對證書進行自定義設置。

    如下所示,這裏通過method定義了探測時使用的請求方法,對於一些需要請求參數的服務,還可以通過headers定義相關的請求頭信息,使用body定義請求內容:

    http_post_2xx:
        prober: http
        timeout: 5s
        http:
          method: POST
          headers:
            Content-Type: application/json
          body: '{}'
    

    如果HTTP服務啟用了安全認證,Blockbox Exporter內置了對basic_auth的支持,可以直接設置相關的認證信息即可:

    http_basic_auth_example:
        prober: http
        timeout: 5s
        http:
          method: POST
          headers:
            Host: "login.example.com"
          basic_auth:
            username: "username"
            password: "mysecret"
    

    對於使用了Bear Token的服務也可以通過bearer_token配置項直接指定令牌字符串,或者通過bearer_token_file指定令牌文件。

    對於一些啟用了HTTPS的服務,但是需要自定義證書的服務,可以通過tls_config指定相關的證書信息:

     http_custom_ca_example:
        prober: http
        http:
          method: GET
          tls_config:
            ca_file: "/certs/my_cert.crt"
    
    • 自定義探針行為
    • 在默認情況下HTTP探針只會對HTTP返回狀態碼進行校驗,如果狀態碼為2XX(200 <= StatusCode < 300)則表示探測成功,並且探針返回的指標probe_success值為1。
    • 如果用戶需要指定HTTP返回狀態碼,或者對HTTP版本有特殊要求,如下所示,可以使用valid_http_versions和valid_status_codes進行定義:
      http_2xx_example:
        prober: http
        timeout: 5s
        http:
          valid_http_versions: ["HTTP/1.1", "HTTP/2"]
          valid_status_codes: []
    

    默認情況下,Blockbox返回的樣本數據中也會包含指標probe_http_ssl,用於表明當前探針是否使用了SSL:

    # HELP probe_http_ssl Indicates if SSL was used for the final redirect
    # TYPE probe_http_ssl gauge
    probe_http_ssl 0
    

    而如果用戶對於HTTP服務是否啟用SSL有強制的標準。則可以使用fail_if_ssl和fail_if_not_ssl進行配置。fail_if_ssl為true時,表示如果站點啟用了SSL則探針失敗,反之成功。fail_if_not_ssl剛好相反。

      http_2xx_example:
        prober: http
        timeout: 5s
        http:
          valid_status_codes: []
          method: GET
          no_follow_redirects: false
          fail_if_ssl: false
          fail_if_not_ssl: false
    

    除了基於HTTP狀態碼,HTTP協議版本以及是否啟用SSL作為控制探針探測行為成功與否的標準以外,還可以匹配HTTP服務的響應內容。使用fail_if_matches_regexp和fail_if_not_matches_regexp用戶可以定義一組正則表達式,用於驗證HTTP返回內容是否符合或者不符合正則表達式的內容。

      http_2xx_example:
        prober: http
        timeout: 5s
        http:
          method: GET
          fail_if_matches_regexp:
            - "Could not connect to database"
          fail_if_not_matches_regexp:
            - "Download the latest version here"
    

    最後需要提醒的時,默認情況下HTTP探針會走IPV6的協議。 在大多數情況下,可以使用preferred_ip_protocol=ip4強制通過IPV4的方式進行探測。在Bloackbox響應的監控樣本中,也會通過指標probe_ip_protocol,表明當前的協議使用情況:

    # HELP probe_ip_protocol Specifies whether probe ip protocol is IP4 or IP6
    # TYPE probe_ip_protocol gauge
    probe_ip_protocol 6
    

    除了支持對HTTP協議進行網絡探測以外,Blackbox還支持對TCP、DNS、ICMP等其他網絡協議![]

    本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理

    【其他文章推薦】

    ※回頭車貨運收費標準

    ※產品缺大量曝光嗎?你需要的是一流包裝設計!

    ※自行創業缺乏曝光? 網頁設計幫您第一時間規劃公司的形象門面

    ※推薦評價好的iphone維修中心

    ※教你寫出一流的銷售文案?

    台中搬家公司教你幾個打包小技巧,輕鬆整理裝箱!

    台中搬家遵守搬運三大原則,讓您的家具不再被破壞!

  • 海洋最大謎團——沒人看過鯨鯊生小孩 科學家取得腹部超音波仍無果

    環境資訊中心綜合外電;姜唯 編譯;林大利 審校

    本站聲明:網站內容來源環境資訊中心https://e-info.org.tw/,如有侵權,請聯繫我們,我們將及時處理

    【其他文章推薦】

    USB CONNECTOR掌控什麼技術要點? 帶您認識其相關發展及效能

    台北網頁設計公司這麼多該如何選擇?

    ※智慧手機時代的來臨,RWD網頁設計為架站首選

    ※評比南投搬家公司費用收費行情懶人包大公開

    ※回頭車貨運收費標準

    網頁設計最專業,超強功能平台可客製化

    ※別再煩惱如何寫文案,掌握八大原則!

  • 亞馬遜6月毀林創紀錄 巴西太空署總督導下台

    摘錄自2020年7月14日中央社報導

    巴西政府免去國家太空署(INPE)地球觀測站總督導溫海斯(Lubia Vinhas)的職位,免職書由科技部長龐特斯(Marcos Pontes)簽署,刊登在今(13日)的國家公報。

    溫海斯接受環球電視(TV Globo)訪問時說,她通過高考進入國家太空署服務23年了,所以就算被免去管理職位,也將繼續待在機關。溫海斯也表示不曉得為何被免職,說自己是通過國家公報才知道被調職。

    上週巴西國家太空署公布報告,今年6月份的毀林警報數量創下2015年以來當月最高紀錄。今年上半年累計的警報顯示,亞馬遜遭破壞面積達3069.57平方公里,與2019年上半年相比增加25%。僅6月的毀林警報範圍就達1034.4平方公里。

    溫海斯遭免職後,國際環保團體綠色和平組織(Greenpeace)發表聲明表示,基於巴西總統波索納洛(Jair Bolsonaro)政府先前的決定,溫海斯被免職並不意外,只是再次顯示「巴西政府是真理的敵人」。

    巴西經濟部長葛德斯(Paulo Guedes)今天在經濟合作暨發展組織(OECD)線上會議中表示,巴西願意配合和幫助保護環境;如果巴西的環境政策出現錯誤或過度行為,也將予以糾正。

    生物多樣性
    國際新聞
    巴西
    亞馬遜雨林
    森林

    本站聲明:網站內容來源環境資訊中心https://e-info.org.tw/,如有侵權,請聯繫我們,我們將及時處理

    【其他文章推薦】

    網頁設計一頭霧水該從何著手呢? 台北網頁設計公司幫您輕鬆架站!

    網頁設計公司推薦不同的風格,搶佔消費者視覺第一線

    ※想知道購買電動車哪裡補助最多?台中電動車補助資訊懶人包彙整

    南投搬家公司費用,距離,噸數怎麼算?達人教你簡易估價知識!

    ※教你寫出一流的銷售文案?

    ※超省錢租車方案

    ※回頭車貨運收費標準

  • 俄羅斯計畫2032年前清除七艘廢棄核潛艦

    摘錄自2020年7月14日自由時報報導

    為解決海域核污染問題,俄羅斯正在設計建造能夠打撈沉沒在大海中的核動力潛艦,整個工作預計要進行到2032年。

    《Defense World》報導,在第23屆俄羅斯-挪威聯合委員會會議中,改善核能與輻射安全成為主要議題。俄羅斯計畫清除七艘沉沒在北極海域的核潛艇,「K-159」和「K-27」從打撈到拆解預計各自花費四年時間,分別為2025至2028年、2028至2031年,另外5艘則在2029至2032年完成。

    報導指出,在1990年代,超過100艘除役的核潛艇被放置在九個不同地點,目前有兩個地點的核潛艇已被清除,自2004年起,放射性廢料減少了一半以上,從1110萬居禮下降至509萬居禮。

    能源轉型
    國際新聞
    俄羅斯
    核子潛艦
    核污染
    核能

    本站聲明:網站內容來源環境資訊中心https://e-info.org.tw/,如有侵權,請聯繫我們,我們將及時處理

    【其他文章推薦】

    網頁設計一頭霧水該從何著手呢? 台北網頁設計公司幫您輕鬆架站!

    網頁設計公司推薦不同的風格,搶佔消費者視覺第一線

    ※Google地圖已可更新顯示潭子電動車充電站設置地點!!

    ※廣告預算用在刀口上,台北網頁設計公司幫您達到更多曝光效益

    ※別再煩惱如何寫文案,掌握八大原則!

    網頁設計最專業,超強功能平台可客製化

    ※回頭車貨運收費標準

  • 大話計算機網絡一 聊聊UDP

    大話計算機網絡一 聊聊UDP

    引言

    UDP是一個簡單的面向數據報運輸層協議

    UDP不提供可靠性,它把應用程序傳給IP層得數據發送出去,不保證它們能達到目的地

    UDP首部

    端口號表示發送進程和接受進程

    UDP長度字段指的是UDP首部和UDP數據的字節長度,該字段最小值為8字節

    UDP長度是全長減去IP首部的長度

    UDP檢驗和是一個端到端的檢驗和。它由發送端計算,然後由接收端驗證。其目的是為了發現UDP首部和數據在發送端到接收端之間發生的任何改動。

     

    最大UDP數據報長度

    理論上,IP數據報的最大長度是65535字節,這是由IP首部(圖3-1)16比特總長度字段所限制的。去除20字節的IP首部和8個字節的UDP首部,UDP數據報中用戶數據的最長長度為65507字節。但是,大多數實現所提供的長度比這個最大值小。

     

    UDP校驗和

     

    UDP和TCP在首部中都有覆蓋它們首部和數據的檢驗和。UDP的檢驗和是可選的,而TCP的檢驗和是必需的。

    儘管UDP檢驗和的基本計算方法與我們在3.2節中描述的IP首部檢驗和計算方法相類似(16 bit字的二進制反碼和),但是它們之間存在不同的地方。首先,UDP數據報的長度可以為奇数字節,但是檢驗和算法是把若干個16 bit字相加。解決方法是必要時在最後增加填充字節0,這隻是為了檢驗和的計算(也就是說,可能增加的填充字節不被傳送)。

    其次,UDP數據報和TCP段都包含一個12字節長的偽首部,它是為了計算檢驗和而設置的。偽首部包含IP首部一些字段。其目的是讓UDP兩次檢查數據是否已經正確到達目的地(例如,IP沒有接受地址不是本主機的數據報,以及IP沒有把應傳給另一高層的數據報傳給UDP)。UDP數據報中的偽首部格式如圖11-3所示。

     

    在該圖中,我們特地舉了一個奇數長度的數據報例子,因而在計算檢驗和時需要加上填充字節。注意,UDP數據報的長度在檢驗和計算過程中出現兩次。

    如果檢驗和的計算結果為0,則存入的值為全1(65535),這在二進制反碼計算中是等效的。如果傳送的檢驗和為0,說明發送端沒有計算檢驗和。

    如果發送端沒有計算檢驗和而接收端檢測到檢驗和有差錯,那麼UDP數據報就要被悄悄地丟棄。不產生任何差錯報文(當IP層檢測到IP首部檢驗和有差錯時也這樣做)。

    UDP檢驗和是一個端到端的檢驗和。它由發送端計算,然後由接收端驗證。其目的是為了發現UDP首部和數據在發送端到接收端之間發生的任何改動。

     

     

    這個系列主要是對自己讀TCP/IP詳解 卷一 協議的筆記,推薦看完以後去閱讀一下這本又臭又厚的書

    电子書的鏈接地址http://www.52im.net/topic-tcpipvol1.html

    感謝這位站長的開源 

    本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理

    【其他文章推薦】

    ※回頭車貨運收費標準

    ※產品缺大量曝光嗎?你需要的是一流包裝設計!

    ※自行創業缺乏曝光? 網頁設計幫您第一時間規劃公司的形象門面

    ※推薦評價好的iphone維修中心

    ※教你寫出一流的銷售文案?

  • 給女朋友講解什麼是Git

    給女朋友講解什麼是Git

    前言

    在周六發現了Linus去Google演講的一個視頻,當時還發了一條朋友圈:

    有興趣的同學也可以去看看,一點兒也不無聊,在線看Linus大佬懟人

    https://www.bilibili.com/video/BV1xb411A7ac?from=search&seid=4239535088233137638

    朋友圈的評論有幾個人問我女朋友

    我又恰好給我女朋友科普過什麼是Git,所以這篇文章就有了。

    Git介紹

    Git是幹啥用的?它是一個版本控制軟件。

    Git這個玩意三歪曾經還給女朋友給科普過(三歪會經常給女朋友說點技術的東西,我也不知道她到底聽懂了沒有,反正她每次都說好像有點懂了)。

    當時情況是這樣的,某一天她跟三歪說:我做的Excel還沒保存,電腦藍屏死機了,東西全丟了。

    於是三歪說:這…我也沒怎麼用過Excel這類的軟件,要不看看你用的WPS或者Office?有沒有相關的備份功能或者說是自動保存?

    三歪順手找了一下WPS是有備份(自動保存)功能的,時間什麼的要自己定義一下。

    三歪還補了一句:這種情況要是在程序員的手上感覺發生的概率會低一點,程序員習慣會按ctrl+s。甚至有的時候,看着看着網頁還會按ctrl+s。不過像我們寫代碼的工具(IDEA)都不用自己手動保存了….

    過了一會,她說藍屏之前做的東西找不回來了,沒設置自動保存。

    三歪又感嘆一句:我們寫代碼還有版本控制的軟件,在這個過程中會記錄每次修改的內容,誰改了什麼東西。誰改錯了,誰要背鍋,一個都不能跑

    女朋友聽着三歪一頓亂吹,貌似也有點感興趣:“版本控制是什麼東西?這麼厲害的嗎?會計就經常要背鍋”

    三歪:“其實也沒啥,就是我們一般寫代碼往往都是多人協作的。你們會計可能是每個人負責一張表(Excel),然後把已完成好的表傳給下一個人。而寫代碼的不一樣,我們都是在同一個項目裡邊編寫的,不會單獨等着某個人做完了,其他的人再開始動手”

    女朋友:“嗯?然後呢”

    三歪:“你可以理解成,我們多個人會在同一個目錄下編寫代碼,裡邊可能會做更改或者添加文件的操作。項目組裡的所有人都可以對這個目錄修改,改完了我們會提交,然後發布上線系統。”

    女朋友:“啥?你是不是偏題了?這跟發布上線系統有啥關係?”

    三歪:“哦,我還是舉個例子吧。就比如我們寫論文的時候可能要對論文不斷修改,我們的修改是基於原有的基礎上改的”

    三歪繼續補充:”因為我們怕在原來的基礎改錯了東西,沒法恢復,所以,我們可能會有多個「畢業論文」的文件。而我們寫代碼的時候本身就是「多人協作」的,修改是無法避免的,我們不希望有多個文件的產生,又希望能夠記錄每次更改的內容。“

    三歪:”更改的內容指的就是:基於原有的基礎上更改了什麼,以及提交者是誰。這樣子,我們就沒法甩鍋了。說白了就是,我們能知道的文件被改了什麼,以及誰改了“。

    三歪:“到這裏,有問題嗎?”

    女朋友:“嗯,沒問題,你繼續”

    三歪:“「每一次的修改」我們稱為一個版本,它能夠實現版本與版本之間的來回穿梭。打個比方,我有篇文章寫了一周,這期間有10個版本,我能隨意回到我想要的版本。所以它叫做版本控制軟件”

    女朋友:“我大致聽懂了,大概就是每一次修改都會被記錄下來,然後你們就可以知道每一次版本修改了什麼,是誰改的,如果做錯了,可以通過這個軟件回到想要的版本”

    三歪:“嗯,就是這個意思”

    女朋友:“那我想問個問題,你一直提到的「多人協作」是在同一個目錄下對文件修改的,然後可以看到彼此改了什麼。那你是在你的電腦上改,你的同事是在他的電腦上改的,你們是怎麼看到彼此改了什麼?這現在有這麼厲害的東西了嗎?“

    三歪:”哦~你的意思大概就是:我們又不聯網,怎麼知道對方改了什麼,是這個意思吧?“

    女朋友:“嗯,是的”

    三歪:“你的理解是沒錯的,我們之間不聯網,是沒辦法知道對方改了什麼的。我漏了一點沒說,我們在改到一定程度下(比如說這個功能我們做完了、也可能做得差不多了),我們會把當前版本提交到遠程倉庫上”

    三歪繼續補充:“可以發現的是,提交到遠程倉庫后,即便我們電腦壞了,我們可以從遠程倉庫再把這份數據拉取下來。”

    女朋友:“所以呢?遠程倉庫到我這聽起來就是一個備份的功能吧?你們怎麼知道對方改了什麼?”

    三歪:“是這樣的,我們從遠程倉庫拉取代碼的時候除了會把有變動的代碼同步到自己的電腦上,還會把所有修改的記錄也同步到自己的電腦上。所以說,我們會知道彼此修改的內容。”

    女朋友:”聽着很有用啊,我平時用的word和excel可以用這個軟件嗎?即便我電腦壞了,我還可以去『遠程倉庫』拿到上一次我提交的數據,並且還有你所說的『版本控制』功能。又能備份,又能知道每次修改了什麼,很好用啊!“

    三歪:”很可惜,像你們那種工作場景,可能用不上,也可以說不太適合用“

    女朋友:”為什麼?“

    三歪:”之前我也想要用定時任務+GitHub的方式去保存我在本地寫的文章,發出來之後,被一頓噴。GitHub你可以簡單理解為就是那個遠程倉庫,定時任務我就是讓它隔一段時間就保存一次“

    女朋友:”我聽明白了,你想要的是備份功能,對吧?為什麼被噴的呢?“

    三歪:”他們說我瞎整,這每隔一段時間就提交到GitHub,網絡開銷可多大啊。然後給我列出一系列的產品,比如說:「堅果雲」「Dropbox」「OneDrive」等等“

    女朋友:”那你怎麼不用?“

    三歪:”我哪知道啊,有信息差的呢。反正當時覺得自己寫個定時任務實現了,就沒多想了。“

    女朋友:”那你是真的菜“

    三歪:”哦“

    三歪:”除了上面說的自動同步,你們的word、excel在用我們的工具也沒法查到歷史的版本記錄“

    女朋友:”為啥?你不是說你們寫代碼都可以的嗎?為什麼word和excel就沒法查?“

    三歪:”我們寫代碼的文件類型都是屬於文本文件,而你的word、excel本質上屬於二進制文件,很難去比對每次修改的差異,所以不支持“

    女朋友:”那聽你這樣說,在我的場景里這個「版本控制軟件」沒啥用啊,它不能記錄像Word、Excel這種文件每次版本的差異,要想用它做備份,還不如現有的雲產品。“

    三歪:”嗯,是的。其實現在雲產品也能提供版本控制的功能了,你用它們就足夠了。還有一點很重要的是,它有學習成本,可不是每個人都會用的。“

    女朋友:”聽你說了這麼多,好像雲產品就很行啊,為啥你們還要「偏執」去用你說的那東西?“

    三歪:“主要是我們寫代碼時遇到的問題會更多,我們用的「版本控制軟件」會更加靈活,它支持的功能會更多。”

    女朋友:“對了,你都說了這麼久了,你們用的那個軟件叫啥啊?”

    三歪:“Git

    三歪瞎扯

    其實本來想着直接講一下在工作中常用到的Git命令,但發現不太好寫(琢磨了很久

    看三歪文章的人可能很多都是大學生,對Git本身了解可能就不太清楚,直接上Git的命令可能看不太懂,所以就分開了兩篇。

    下一篇講一下三歪在工作中使用Git的糗事以及工作中是怎麼用Git的。

    涵蓋Java後端所有知識點的開源項目(已有8K+ star):

    • GitHub
    • Gitee訪問更快

    我是三歪,一個想要變強的男人,感謝大家的點贊收藏和轉發,下期見。

    本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理

    【其他文章推薦】

    ※別再煩惱如何寫文案,掌握八大原則!

    網頁設計一頭霧水該從何著手呢? 台北網頁設計公司幫您輕鬆架站!

    ※超省錢租車方案

    ※教你寫出一流的銷售文案?

    網頁設計最專業,超強功能平台可客製化

    ※產品缺大量曝光嗎?你需要的是一流包裝設計!