De acordo com o conhecimento de seus autores, este é o primeiro conjunto de dados realista e público com raros eventos reais indesejáveis em poços de petróleo que podem ser prontamente usados como um conjunto de dados de referência para o desenvolvimento de técnicas de aprendizado de máquina relacionadas a dificuldades inerentes de dados reais.