Uma Abordagem Baseada em Aprendizagem de Máquina para Predição de Falhas de Revogação em Instâncias Transientes

(WCGA 2018)

Jose Pergentino A. Neto, Donald M. Pianto, Célia Ghedini Ralha
Resumo
Computação em nuvem oferece seus recursos ociosos através de servidores transientes. Estes servidores são oferecidos pela Amazon como instâncias spots, que varia o seu preço de acordo com a oferta e procura. Utilizando mecanismos de tolerância a falhas e estratégias apropriadas, usuários podem executar aplicações nestas instâncias e diminuir o seu custo. Este artigo apresenta a combinação de aprendizagem de máquina e um modelo estatístico na predição do tempo até a sua revogação. Exaustivos experimentos demonstraram que a estratégia proposta atinge altos níveis de acurácia em sua predição. Com resultados que alcançam 94% de sucesso, nossa estratégia mostra a sua eficiência quando submetida a condições reais de uso dessas instâncias spots.
Abstract
Cloud computing providers has started offering their idle resources as transient servers. Spot instances are transient servers offered by Amazon, having their prices dynamically changed over time based on supply and demand. Using an appropriate strategic and fault tolerance mechanisms, users can effectively use spot instances to run applications in a lower price. This paper presents a strategy that combines both machine learning and a statistical model to predict time to instance revocation. Our experiments demonstrate that our heuristic is able to predict with high levels of accuracy. We evaluate our strategy and our results achieve 94% of success, which show that our model are effective and reaches high levels of accuracy under realistic working conditions.

2018-05-07

[Baixar PDF] [Bibtex]