記録

東証システム障害の考察してみた。#東証システム障害考察

7時4分にアラートが上がっていた?が、現場がアラートに気が付かず、後続の処理が流れ売上の前処理バッチ処理が走った時点なのかな。そこでようやく現場がアラートが出ていることに気づく、この時点でベンダーに現場が支持を仰いだのか、マニュアル通りフェイルオーバーしたんだろう。フェイルオーバーさせたけど失敗。メモリリークがおそらく原因でサーバーの切り替えが出来なかった。ここでベンダーに支持を仰いだ可能性もありそう。そしてベンダーがここらへんから介入して監視端末のログなどを調査したら、メモリリークのエラーログを確認したんだと思う。

※失敗したジョブがどこかに格納されるだろう?。フェイルオーバーさせるより後続の処理をストップさせて、ベンダーに支持を仰いだ方が良かったのかもしれないなと。でも現場は混乱していただろう。

メモリーリークが起きていたと思うと実際は前処理バッチ処理をして失敗していたんだろう。遮断して本日の東証での取引は出来ないようにしたのは正解だと思う。

メモリリークの原因は、メモリの物理的破損だったのでメモリが悪いと判断した。メモリエラーが監視端末のログにクリティカルなエラーとして表示されていたのかは不明だけど、おそらく見落としだと思う。

7時時点で相場や売上の前処理を取り込むのなら、何だか整合性がつきそうです。おそらく手動で前処理が走るのではなく全自動で前処理が走るシステムだったんだろう。従業員が端末の監視も7時からだったのかな?

資料が時系列で書かれていないので良く分からないけど、自分なりに東証システム障害を考察してみた。

現場のヒューマンエラーも疑われるけど、末端の従業員は下請け業者何だろうな?。ベンダーは常時、東証システムの現場にいたのか?とかいろいろな事が問われるかもしれないよな。

おそらく本日から正常に東証は取引できると思います。メモリを取っ替えだろうしメモリチェックもしているだろうし。

最後に頑張れ東証システムの現場!!
末端が解雇されないことを切に願う、これで直ぐに切られたら次の職には絶対につけなくなるよ。でも末端が悪いという事ならば数年後、数ヶ月後にはクビになる可能性は高いかもな。

ちなみに上記が昨日のツイートまとめになります。







    3月のライオンを今頃、前半と後半を観る。前のページ

    text形式に土日は変更。次のページ

    関連記事

    1. 記録

      順不同:ITエンジニア系を一覧化してみた。

      ITエンジニア系を一覧化してみました。有名な人からあまり知られてい…

    2. 記録

      言うは易し行うは難しだなと思います。

      朝起きて明日、明後日の記事を書き留めています。今日の夜は会社の飲み…

    3. 記録

      この頃、フリー写真素材がクオリティーが高い!!

      この頃、フリー写真素材がクオリティーが高い!!ぱくたそさんのサイト…

    4. 記録

      laravel8系以降でのルート、web.phpの記載。 #laravel

      おはようございます、寒さ対策が必要になってきましたが未だに部屋のエア…

    5. 記録

      紙の月を観てきました。若干、R15ぽっいけど。

      紙の月を観てきましたので感想なんかを記載します。ストーリーは銀行で…

    6. 記録

      Visual Studio2015Communityエディションが配布されていたので

      Visual Studio2015Communityエディションが配…

    2020年10月
     1234
    567891011
    12131415161718
    19202122232425
    262728293031  

    カテゴリー

    アーカイブ

    PAGE TOP