データ入力のお作法
こんにちは。フィックスポイントの冨です。
DXを推進する前提として”「デジタイゼーション」「デジタライゼーション」がなされている事”という説明を良く目にします。そもそも業務のデータがデジタル化されていないと、デジタルを利用した業務改革どころではないわけですね。
いずれにせよ、紙でやり取りしているデータを電子化する必要があるわけですが、単純にPDFにしたりExcelにするだけではダメというのは、実際にシステム開発の実装を経験した方であればおわかりかと思います。「電子化」したといってもプログラムなどで処理出来る形で無いと意味が無いのですよね。
この逆の意味で有名なのは「Excel方眼紙」と呼ばれる手法ですが、紙でやりとりしていたフォーマットを、そのままの見た目でファイルにしようと、スプレッドシートを方眼紙化して利用します。見た目は従来通りですが、これをプログラムで処理しようとすると大変な困難に直面します。
これらのドキュメント化の手法は賛否両論ありますが、「スペースキーで見た目を整えるのはやめなさい」「エクセル方眼紙で文章をつくるのはやめなさい」といった書籍がヒットしたのは、記憶に新しいところでしょう。
前回のメルマガでは、政府CIOポータルの「標準ガイドライン群」が参考になるとご紹介しました。公共系のサイトでは他にもいろいろな参考になる情報が公開されており、データ入力についても良い資料があります。
総務省:統計表における機械判読可能なデータ作成に関する表記方法
https://www.soumu.go.jp/main_content/000723626.pdf
これらはデータベースのテーブル設計にも通じる所がありますが、「1セル1データ」「セル結合はしない」「項目名を省略しない」など、基本的な事項がチェックリストとして提示されています。ここまで出来ていれば、将来的にデータ処理システムを導入・利用する際にも、何とかできそうなレベルになるのではと思います。
欲を言えば、日付データや住所データの書式の統一(“2021-06-01″と “2021/6/1” や”日本電気”と”NEC”など)も気をつけてほしいところですし、半角・全角文字問題もあります。
いずれにせよデータの品質確保は、業務のデジタル化の足腰の部分ですので、ここの作りの良し悪しで業務の自動化を含めた処理効率やコストなどが大きく変わるところです。公共系のパブリック・データでも未だにPDFで配布されていて「こんなのでは処理できないだろう!」と批判されているものも、まだまだ多いのが実情ですが、全体的には徐々に改善されていると思います。
言い換えれば、データが機械判読可能であれば、自動化ソリューションの導入などで業務効率が大きく改善できるベースが整うわけなので、データを扱う方の常識になれば良いと思います。