2023年06月17日
紐づけ作業をするのはどっち側? [システム開発研究室]
こんにちは!
ナビゲータのEVEです。
ここ数日、マイナンバーの紐づけ作業をシステムで実施する方法を検討しましたが、いかがだったでしょうか?現状分析が足りないうえ、システム化の部分でもすべての材料の洗い出しができたとはいえないため、突っ込みどころ満載だと思いますが、とりあえずシステムにより紐づけ作業は可能だという判断になりました。
そのような検討でも、書き足りない部分がありますので、その点について書いていきたいと思います。
[どっち側で実施するか?]
どっち側で紐づけ作業を行うのかという問題があります。どっち側で行うのかというと、政府側または、各団体側という意味です。
私は、政府側で行う方が効率的だと思っています。
今まで、地方のシステムはバラバラでシステムで対応するのは非常に難しいという話をしてきましたが、そんなシステムでも多分パターンがあると思っています。理由は、新入社員研修で似たような研修を受けシステム業界に入り、入ってから各会社、グループの標準はあるものの、そのグループ間が閉鎖的だったというわけではないからです。
そのため、団体は無数にあるものの、パターンは、多分50はいかないと思っています。これは、山勘であり、実際のところは事前に調査が必要になりますが、その位だったら、実施可能だと考えています。加えて、今回提案する紐づけシステムは、作業をすればするほどシステム効率が良くなります。経験曲線効果が得られ最後の団体は全く問題が発生しないぐらい精度のいいシステムになっていると思っています。
ただ、昨日話したマイナンバーの紐づけ作業の正確性の確認は各団体で実施し、その内容の正当性を保証します。
[機械学習]
機械学習の言語学習で使えそうなモノが複数あります。以前、G検定で学習した資料に目を通しただけでも、言語学習で以下のような情報が出てきます。
・word2vec
・TF-IDF
・ベクトル空間モデル(vector space models)
・単語埋め込みモデル(word embedding models)
・自然言語処理(NLP:natural language processing)
・fastText
・ELMo(Embedding Language Modeling)
・マルチタスク言語モデル
・マルチタスク学習
・ニューラル画像脚注付け(Neural Image Captioning:NIC)
・シーケンス2シーケンス(Seq2Seq)
・BERT
・bag-of-words
・TF-IDF
文章的なモノが多く、住所や名前などといったものに使えるのは限定されますが、類似性やベクトルといったところは使えるのでは?っと自然言語処理分野の解説から感じました。この辺は専門家に聞いた方がいいですね?やっぱり、システム開発経験者であるのとないのとでは大きな違いがあります。
[報道内容]
今回のマイナンバーに関する報道は、基本地方自治体や各団体が悪いという論調です。ただ、どっちが悪いとは言っていません。あくまでも、なんとな〜く各団体側が悪い事実を並べています。これが、テレビをはじめとするマスコミの手口です。各団体側が悪いという方向に世論を形成しようとしています。
しかし、ここ数日間の分析から、紐づけミスという手作業を除けば、多くの部分でシステム開発会社が悪いと判断できます。
それでもなおかつ、各団体側が悪いといっているその根拠は、多分紐づけしようとした各団体の管理情報が、想定以上に正確性、統一性がないものだったのだと思います。特に年金機構なんかそんな感じじゃないかな〜って感じています。だから、システムでの紐づけ作業もできないと判断され、このような形でつるし上げのような状況になっているのだと・・・。
これも、テレビをはじめとするマスコミの報道からそう感じただけなのですが・・・。私の想像があっているかどうかは、分かりません!
報道するならニュアンスを報道するのではなく、伝えたい事実を報道すればいいのに?って感じた方は、クリックをお願いします。
↓↓↓↓↓↓
人気ブログランキング
★DB関連関数以外の修正状況(6/17までの進捗)
修正ファイル本数 19/29本(0本ファイル修正)
修正箇所 345/396(5箇所修正)