Article image
Vagner Bellacosa
Vagner Bellacosa27/01/2023 12:04
Compartilhe

💥💥💥 Caos na NYSE: Perigos e desafios da Informática. 🖥️🖥️🖥️

    imageFalha Catastrófica na NYSE: Um simples erro, impacto profundo no Sistemas de Disaster Recovery.

    Salve jovem padawan, reiniciando nossas atividades e compartilhar conhecimentos, hoje disponibilizo nosso primeiro artigo de 2023.

    Acompanhando os noticiários me deparei com uma notícia surreal. Situando nosso contexto, recordando do princípio Peter Parker devemos sempre lembrar que com grandes poderes, vêm grandes responsabilidades. Nós profissionais de I.T. com nossa arte, podemos criar softwares lendários e gerar muita riqueza, porém o viés de nossa profissão é que também nossos erros são catastróficos, destruindo empregos, falindo empresa e até em casos extremos tirando vidas.

    Sem ser alarmista e profeta do caos, mas, mesmo assim, assustado com as maluquices, que algumas empresas e profissionais de tecnologia aprontam. Observemos o caso de uma empresa financeira no World Trade Center, que mantinha o backup no mesmo edifício e que perdeu tudo no atentado de 11 de Setembro.

    E a notícia que compartilho acontenceu em Nova Iorque, relativamente ao caos financeiro gerado por um erro do técnico de TI, que esqueceu-se de desligar o sistema de recovery na segunda-feira 23/01. Com isso na abertura dos mercados, o Sistema considerou que o sistema não fechou e continuou com as operações do dia anterior e diversos ritos necessários para precificar e abrir o Mercado não foram executados.

    Com isso o mercado financeiro foi abalado, gerando prejuízos financeiros, cancelamentos de operações e perda de credibilidade dos stackholders, imagine que uma única equipe, provavelmente um funcionário que negligenciou algumas tarefas, sua ação paralisou o mercado financeiro global, gerando repercussões em todo o mundo.

    Para entender melhor a cronologia dos eventos, saber mais sobre o evento, ao final do artigo compartilho o link da notícia, mas para se pensar, será um acidente, um ato de sabotagem, imperícia ou imprudência?

    Vamos falar um pouco sobre ações que minimizam este tipo de impacto e conhecer os processos de recuperação e prevenção de desastres informáticos, mas para isso, sente-se que la vem história.

    imageO que é Disaster Recovery?

    As empresas conforme o grau de exposição ao risco e acordos governamentais tem obrigações legais de manter o mínimo possível de inatividade dos sistemas informáticos. Em um artigo anterior falamos sobre as SLAs e os tempos de parada contratados.

    https://web.dio.me/articles/prestacao-de-servico-e-sla-saiba-mais-sobre-as-garantias

    Adiante falarei sobre o índice de disponibilidade e uma fórmula para seu cálculo, por enquanto vamos focar na Recuperação de dados e software. Existem inúmeros fatores de risco para a operação de uma empresa.

    Entre os riscos mais comuns, que podem paralisar as operações temos : incêndio, alagamento, falha de energia, falha de internet, avarias nos equipamentos, falha no software, falha nos bancos de dados, greves, atentados, sabotagem, a lista é imensa, piorando que podem ocorrer a combinação de n falhas individuais culminando com uma falha catastrófica.

    A recuperação de desastres tem como missão, recuperar os sistemas informáticos o mais rápido possível, visando minimizar os danos de parada e oferecer o mais rápido retorno as atividades. Sempre garantindo a integridade das operações e a recuperação dos dados através de backups e pontos de restauro.

    imageO que é Disponibilidade de Software?

    A disponibilidade de software é uma medida teórica, acordada cliente a cliente, em tempos de pandemia e reclusão social da quarentena, provou a nossa total dependência dos sistemas informáticos. Onde necessitamos ter acesso à internet por 24 horas por 7 dias nos 365 dias do ano.

    https://web.dio.me/articles/n1-n2-e-n3-suporte-ao-usuario

    Através disso podemos extrapolar para os sistemas de Saúde, sistemas Financeiros e de Energia e Telecomunicações, necessitam ter total Disponibilidade com o mínimo de tempo de falhas. Outros sistemas prevem menor disponibilidade.

    Lembrando que a disponibilidade depende das paradas de manutenção, paradas de evolução, paradas por fatores externos e que implica o acionamento das equipes de sustentação para subir o sistema em baixa.

    imageO que é índice de disponibilidade?

    O Índice de Disponibilidade trata-se da eficiência e a velocidade da sua manutenção feita pela equipe de suporte, os caçadores de abends. Ou seja, de acordo com os contratos de SLA, é permitido x minutos/horas de inatividade para manutenções corretivas e/ou preventivas.

    Lembrando que existe uma chinese wall, separando os ambientes de Desenvolvimento, Homologação e Produção, no caso de mainframe o RACF mantém a segurança e controle de acesso entre os sistemas.

    A fórmula para o cálculo da Disponibilidade é apresentada a seguir:

    Disponibilidade = ( MTBF / ( MTBF + MTTR ) ) * 100

    MTBF: Mean Time Between Failures = Tempo Médio Entre Falhas

    MTTR: Mean Time To Repair = Tempo Médio para Reparo

    Lembrando jovem padawan, que ao projetarmos um Sistema, devemos ter em mente a melhor performance de cada módulo, trabalhando pela sua melhor otimização e com isso garantindo menos falhas e perda de tempo essênciais. https://web.dio.me/articles/performance-e-otimizacao-primeira-olhada

    image

    Estudo de Caso: Banco Real

    O Banco Real que tinha sede na Avenida Paulista número 1374, presente nos 27 estados com mais de 2.000 agências e sucursais em mais de 20 países, mantinha seus sistemas informáticos distribuídos em 3 locais.

    Na Sede havia o mainframe principal com o CICS SP51, o Site Recovery equipado com um mainframe alternativo estava localizado na IBM Tutoia com o CICS SP11, mas distante apenas 8 quilômetros, que padecia de independência, gerando vulnerabilidades geográficas, pois estava muito próximo da sede e por isso como medida adicional de segurança, existia o mainframe CICS CA81 em Campinas distante 100 quilômetros.

    Esta alternativa que atendia todos os quesitos de segurança para um site alternativo, isolamento rede elétrica, rede telefônica e espaço geográfico, sendo que ocorria redundância de dados nos 3 ambientes CICS.

    A atualização de dados entre o SP51 e SP11 era real time, já com o CA81, devido a logística era semanal, numa altura que as linhas de dados eram lentas, usando modems, por isso a atualização era efetuada por fitas/cartridges enviados de carro a Campinas.

    Em tempos de disponibilidades, quando o SP51 caia, em 3 minutos o SP11 assumia as operações e os usuários nem notavam a indisponibilidade, por sorte, durante os anos que lá trabalhei nunca ocorreu a necessidade do CA81, assumir as operações. Porém, em testes o sistema necessitava de apenas 10 minutos para Campinas assumir o sistema.

    Conclusão

    Iniciamos este artigo com a notícia do pequeno crash da Bolsa de Nova Iorque ocorrido por descuido de um funcionário, que através de uma imperícia deixou o sistema de backups e recovery funcionando e o mesmo colidiu com o software original, na abertura do pregão da Bolsa e com isso bloqueou sistemas iniciais, mantendo os preços do ultimo pregão causando prejuizos financeiros e de imagem no softwares da Bolsa, que tem uma imagem arranhada, desde a decade de 80 do seculo passado, quando um bug no software de negociação, causou a maior quebra de sempre na Bolsa americana, até aquela data.

    Com isso alerto o jovem padawan sobre os riscos e perigos de trabalhar com tecnologia, a necessidade de respeitar os procedimentos, testar e verificar os sistemas, para evitar falhas catastrofísticas, verifique sempre suas atividades, por menor que seja, lembre-se a força de uma corrente é determinada pelo seu elo mais fraco.

    Espero ter ajudado e aguardo seu comentário.

    https://tribunaonline.com.br/internacional/funcionario-esquece-de-desligar-sistema-e-gera-caos-na-bolsa-de-nova-iorque-133249

    https://www.istoedinheiro.com.br/tag/erro-de-funcionario-causa-caosa-na-nyse/

    https://www.infomoney.com.br/mercados/funcionario-esquece-de-desligar-sistema-e-gera-caos-na-bolsa-de-nova-york/

    image

    Indice com todos os 175 artigos publicados em nossa comunidade.

    https://github.com/VagnerBellacosa/DIO_Bootcamps/blob/main/BootCamps/ArtigosDIO/

    #DIO

    image

    image Referência Bibliográfica

    WIKIPEDIA - A Enciclopédia Livre, faça parte, ajude actualizando ou criando verbetes http://www.wikipedia.org

    Google Books um repositório com milhões de livros digitalizados https://books.google.com/

    Internet Archive, tudo aquilo que um dia foi publicado veio parar aqui. https://archive.org/

    Biblioteca de ícones https://www.flaticon.com/

    image

    image Um momento jaba, divulgando um video e o canal das aventuras do Tiozão, visite El Jefe Midnight Lunch. No video de hoje apresento o primeiro video de 2023, unboxing DIO Awards, onde aproveito para falar um pouco das conquistas, me emocionar com o lindo prêmio enviado pela nossa Digital Innovation One, onde fui eleito como Best Community Influencer, muita gratidão ao seu voto, que me ajudou muito nesta conquista. Obrigado de Coração, você foi fantastico, valeu mesmo: https://www.youtube.com/watch?v=bW3ZSh9c52o

    image https://www.linkedin.com/in/vagnerbellacosa/

    image https://github.com/VagnerBellacosa/

    Pode me dar uma ajudinha no YouTube?

    image https://www.youtube.com/user/vagnerbellacosa

    Compartilhe
    Comentários (2)
    Edney Landim
    Edney Landim - 27/01/2023 16:28

    Artigo mt bom, parabéns

    Hermes Silva
    Hermes Silva - 27/01/2023 12:46

    Muito obrigado Mestre Jedi!

    Aprendi bastante hoje. Up!