超过2个月没有动静的Mesosphere官方部落格,近日终于打破沉默,重新开张发布新消息。Mesosphere软件工程师Gaston Kleiman表示,新版的Mesos 1.2.0版,将要内建原生系统健康检查功能,「严格来说,早在Mesos 0.2.0就已经有此实验功能,但它现在将会更稳定。」他说。
Gaston Kleiman表示,Mesos会自动侦测应用程序的运作状况,并且回报给主系统,但是,并非所有应用程序出现异常后都会马上停止运作,「某些应用程序即使开始出现异常,仍然会继续运作」,要靠Mesos侦测到此类的应用程序才是真正的挑战。
在设计系统健康检查功能的两年中,Mesos也碰上了许多挑战。首先,每个模块各自具备相异的健康检查API,「必须重新实作系统功能,才能满足需要执行健康检查的模块的需求。」第二,当系统排程器与工作任务运作在不同的节点时,执行健康检查将会占用额外的网络流量。最后,健康检查会造成系统效能瓶颈,「特别是执行大量工作的系统模块,执行健康检查对系统排程器是个负担。」
而Mesosphere之所以要内建健康检查功能的动机,其中一个原因,就是免除开放者自己设计一套健康检查API的困扰。但Mesosphere认为,提供统一API只是解决了一半的问题,「对每个执行任务的executor,各别实作健康检查实在太繁琐。」因此,Mesosphere推出了一套开发函式库,除了避免系统功能过于碎片化,也可以减轻开发者的工作。
Mesos也进行了测试,在执行超过1,900次探测任务后,Marathon HTTP健康检查服务开始失效。但是在系统内原生健康检查功能后,系统可以顺利的进行水平扩充,并且执行超过4千次任务。
评论前必须登录!
注册