50年間トラブル無しのシステム
先週にIT業界人を驚愕させたのは全銀ネットの障害でした。
2023年10月10~11日に障害が発生して11の金融機関での送金が出来なくなったトラブルです。
約500万件超の送金に影響が出たとされています。
トラブル原因に関しては各金融機関が全銀システムに接続する際の中継コンピューター(RC)の更新の失敗で、
メモリー不足に起因したインデックステーブルへの不正な値の混入というところまでが公表されています。
おそらくは2017年から使われていたRC17から、RC23への移行作業中のトラブルと思われます。
RC17からRC23は設置する場所も銀行側から全銀側への変わり、かなり本格的なマイグレーション作業でしょう。
金融機関のトラブルは、これまでもメガバンクなどでも発生していたわけですが、本件が驚きなのは、顧客に影響が出るレベルのシステム障害が発生したのが1973年の稼働以来、50年間で初めてという事実です。
自分もそういえば新人のころに「全銀手順」なるプロトコルがあると教わったなあといったレベルでしか認識しておらず、まさに空気のように意識されずに、半世紀の長きにわたり、そこに存在し続けていたというわけです。
これらのシステムも構築当初から全く変わっていないというわけでなく、今回、問題を起こした接続形態についても、27年稼働ではオープン化しRC接続からAPIゲートウェイ化も予定されていることから、時代に合わせた更新がなされていたわけです。
この辺り、ご興味ある方は、全銀の中期経営計画のアクションプランなどが参考になるでしょう。
https://www.zengin-net.jp/zengin_net/pdf/4thMediumTermManagementPlan2.pdf
これからいろいろとトラブルの詳細などに関して報道されて情報が出てくると思いますが、注目するポイントとしては
・ 直接のトラブルの原因(単なるメモリ不足でデータ不正は考えにくい)
・ 長期にわたる運用に耐える技術選定
・ トラブル発生時にユーザー影響が出ないようにするシステム構成や流出対策
おそらくは初期はCOBOLで実装していたであろうシステムが、現状・将来とどのような言語を採用しているのか。
メインフレームからのレガシーマイグレーションをどのように行っているのかなど、情報が出てきたら非常に参考になるのではと思います。