Apache Pulsar 之企業級特性-多租戶介紹

Apache Pulsar 最初誕生於雅虎，當時就是為了解決雅虎內部各個部門之間數據的協調，所以多租戶特性顯得至關重用，Pulsar 從誕生之日起就考慮到多租戶這壹特性，並在後續的實現過程中，將其不斷的完善。多租戶這壹特性，使得各個部門之間可以***享同壹份數據，不用單獨部署獨立的系統來操作數據，很好的保證了各部門間數據壹致性的問題，同時簡化維護成本。

在介紹 Pulsar 多租戶之前，先來看壹下，正常壹個系統要實現壹個多租戶需要做哪些事情：

Pulsar 的多租戶設計符合上述要求：

如下圖所示：在壹個 Pulsar 集群中，有三個概念：tenant（圖中的 property 是之前的壹種叫法，現在更習慣將其稱為：tenant）、namespace、topic。這壹點從 pulsar 中 topic 的命名組成也可以反應出來，例如： persistent://tenant/namespace/topic ，在 Pulsar 中，使用 tenant ， namespace ， topic-name 來唯壹標識壹個 topic。

tenant 代表的是租戶名，它是壹個資源的隔離單位，壹個 tenant 下可以有多個 namespace。namespace 用來管理其下面所屬的 topics，可以在 namespace 級別給 topic 設置相應的策略，比如 retention，backlog，ratelimit。壹個 namespace 下又可以有多個 topic，他們的權限大小也是由上到下。Pulsar 的多租戶通過 tenant、namespace、topic 形成多級管理系統。

開篇中提到，壹個多租戶系統需要在租戶內提供系統級別的安全性，細分來講，主要可以歸類為壹下兩點：

在 Pulsar 中，多租戶的安全性是通過身份驗證和授權機制實現的。當 client 連接到 pulsar broker 時，broker 會使用身份驗證插件來驗證此客戶端的身份，然後為其分配壹個 string 類型的 role token 。role token 主要有如下作用：

Pulsar 目前支持兩種身份認證：

當然，用戶也可以使用自己實現的身份認證程序。

當身份認證系統識別出客戶端的 role token 之後，Pulsar broker 會使用授權系統來告訴客戶端當前妳可以執行哪些操作。 授權操作是在 tenant 級別進行配置的 ，這意味著在 Pulsar 集群中，允許用戶根據不同的角色設定多個授權方案。 具體的權限操作是在 namespace 級別進行設置和管理的 ，例如：針對某壹個 topic 是否具有 produce 或 consume 的權限歸屬於 namespace 這個級別來控制。換句話來說：在 tenant 級別用戶可以配置，什麽樣的 role 擁有對哪些 tenant 操作的權限，在 namespace 級別用戶可以配置，針對某壹 topic 當前 role 擁有什麽樣的權限，又回到了開頭所介紹的，namespace 主要用來管理它所包含的 topics 的屬性。

通過認證和授權系統巧妙的將租戶與 topics 之間的執行權限等問題剝離開來，從而實現在租戶內滿足系統級別安全性的目的。

隔離性主要分為如下兩種：

在 Pulsar 中，為了保證良好的擴展性，采用了存儲和計算分離的架構設計，而存儲（bookie）和計算（broker）又是 produce 和 consume 所***享的資源，為了更好的實現隔離性，Pulsar 分別在存儲和計算層做了不同的處理。

在存儲方面，Apache Pulsar 使用了另外壹個 Apache 的頂級項目 Bookkeeper 來作為其存儲層。bookie 是 Bookkeeper 中的壹個實例，壹個 bookie 擁有多個 ledgers，每個 ledger 對應 Pulsar 中的壹個 topic。Bookkeeper 本身的 I/O 分離 能夠很好的為此做支撐。在單個 bookie 中，有壹個 journal 日誌文件（壹般有壹塊專有的 journal 盤用於 journal 文件的寫入）（類似於 LSMTree 中的 WAL 文件）會以 append 的形式將所有的寫操作追加寫入其內部。當寫入完成之後，後臺會有壹個單獨的線程來定期將 journal 文件的數據 flush 到磁盤中。這種 I/O 架構的設計實現了寫入和讀取操作之間的隔離，這樣租戶可以盡可能快的讀取數據，同時寫的吞吐量和延遲不會受到讀取操作的影響。

除了 I/O 隔離外，不同的租戶可以為不同的 namespace 配置不同的存儲配額。如果租戶內消息的大小達到了存儲配額的限制，Pulsar 會采取相應的措施，例如：阻止消息生成，拋出異常或丟棄消息等。

為了滿足 SLAs， Pulsar 在 Broker 層面也提供了多種機制。首先，在 Pulsar broker 中的壹切操作都是異步進行的。每個 Broker 使用的內存資源是有上限的，當 Broker 達到配置的 CPU 或內存使用的閾值，Pulsar 會迅速的將流量轉移到負載較小的 Broker 上來處理。在 Pulsar 中，有壹個組件 load manager component 專門用來處理這種情況，這受益於 Pulsar 優秀的架構設計：計算與存儲分離。這使得 Broker 近乎是無狀態的，Broker 本身不存儲任何數據，所以這種流量負載的轉移成本很小而且速度很快，所以在這裏並不需要擔心流量負載時租戶的特性是否會打折扣。

其次，在消息的生產和消費方面，Pulsar 都做了流量控制。在生產者方面，租戶可以配置當前消息發送到 broker 和 bookies 的速度，避免當前用戶發送消息的速度大於系統本身處理消息的能力。在消費者方面，租戶可以配置當前 broker 可以給 consumer 發送多少未完成的消息。除此之外，Pulsar 還可以限制 Broker 以指定的速率向消費者投遞消息，避免消費者的消費能力大於當前 Broker 的處理能力。

軟隔離中提到的機制可以確保 Pulsar 在***享 Broker 和 Bookies 資源時能很好的保證隔離性。但是，在某些情況下，應用程序也需要物理資源隔離。Pulsar 允許將某些租戶或名稱空間與特定 Broker 進行隔離。這可確保這些租戶或命名空間可以充分利用該特定 Broker 上的資源。

此選項還可用於測試不同的配置，調試並快速響應生產中發生的任何意外情況。例如，當前有壹個用戶可能在 Broker 觸發可能影響其他租戶性能的不良行為。在這種情況下，可以將該特定租戶物理隔離出來，然後進行確認或者修復。

除了物理隔離 Broker 上的流量之外，妳還可以隔離存儲相關的業務。可以在 namespace 級別來配置相關的 placement policy 來達到目的。