新規記事の投稿を行うことで、非表示にすることが可能です。
2023年12月24日
CBASプロジェクトマネージャー級模擬試験解説6(統計手法範囲)
CBAS データ分析実務スキル検定とは?
データ分析実務スキル検定についてや勉強方法については本ブログの最初の記事をご覧ください。
ここでは公式テキストの模擬試験について自分なりの解説をしていきます。
注1:解説はあくまで参考です。内容に間違いがあっても責任を取れませんのでご了承ください。
注2:あくまで合格するために必要な範囲までの解説です。
テキストのお買い求めはこちらから↓
データ分析実務スキル検定公式テキスト/データミックス【3000円以上送料無料】 価格:3520円 |
模擬試験統計手法範囲解説
- 問題40
A) 「年齢」のP値は0.000ということで、優位水準5%を満たしているため、除去しない方が良い。
B) 「学歴」は大卒以上だと1、その他は0というダミー変数になっている。大卒以上の回帰係数は87.203だが、これはy=ax+bで例えるとaの係数に位置するため×。切片(b)は34.366が正しい。
- 問題41
A) あくまで雑誌購買層と購買していない層から公募で集めているため、「一般消費者全体」にまで拡大して解釈することはできない。
B) 確かに上の表から雑誌購買有の方が知っている割合は多い。しかし雑誌購買無でも知っている割合は多いため、「よく知っている」とまでは言いにくい。(正直この設問は微妙だなと思いました)
- 問題42
「年齢」についての回帰係数の検定結果が非優位になっていたということで、多重共線性の可能性を検討します。
多重共線性:説明変数の中に相関係数が高い組み合わせがあること。この場合、どちらかを使わない、または2つを掛け合わせて新たな変数を作る、ことが考えられます。
つまりここでは、「年齢」と関係のある説明変数は何かを検討します。
文中に「ほとんどの社員が4,5年に1回異動を行う」と書かれており、ここから「年齢」と「異動回数」は相関が高い可能性が考えられます。
- 問題43
回帰モデル(数値予測モデル):目的変数が連続数値である場合に使う。
目的変数が数値であるものはAのみ。(店舗売上)
- 問題44
分類問題:目的変数がフラグの場合に使う。
目的変数がフラグになるものはAのみ。(迷惑メールか必要なメールか)
- 問題45
まず乗り換え予測モデルを作成するため、目的変数は乗り換えの有無となり、AかCの2択となる。
ここで目的変数は乗り換えするかしないかというフラグになるため、ロジスティック回帰モデルを選択する。
ロジスティック回帰モデル:分類問題で利用される。目的変数がフラグの2値だったり、ラベルの3値だったりするときに使う。
- 問題46
主成分分析の結果は相関係数が出る。
A) 第1主成分において、部屋の広さとバルコニーの広さはプラスの相関が出ているため〇。
B) 第2主成分において、周辺の施設数と治安レベルはプラスの相関が出ているため〇。
C) 主成分得点を求めることができるため〇。
- 問題47
A) 性別が出てきているのは40歳より高い方のみなので、全体の性別の割合は不明のため×。
B) 40歳より高く、60歳以下の男性のユーザーであれば正解。
- 問題48
k-meansアルゴリズムは、クラスタを作って各データを割り当てるものです。
説明変数が数値型のときによく使います。そのためBが正解。
- 問題49
A) 定職がある場合に融資判定をしているため〇。
B) 預金残高が〇〇万円以上の場合に融資判定をしているため〇。
C) 年齢が××歳以下の場合に融資判定をしているため〇。
最後は機械学習範囲について解説します。