SOLUTION

ソリューション

Education


教育内容

Basic Program
データ分析基礎研修

データ分析業務の概要

・レポーティング、提案のための検索・集計

・お客様データ活用支援のためのクエリ作成

・現状把握のためのデータ分析・グルーピング

・施策効果検証のためのデータ集計と統計検定

・予測や判別のためのモデル構築

・統計モデルとは

・機械学習と統計分析の違い


データ分析業務のアプローチ

・データで解決したい問題の理解

・利用できるデータの確認

・解決のために使用する分析手法の検討

・分析結果の理解と判断


統計学基礎

・量的データと質的データ

・名義尺度、順序尺度、間隔尺度、比例尺度

・離散変数、連続変数

・統計量(平均、中央値、最頻値、最大値、最小値、四分位、分散、標準偏差)

・正規化と標準化、偏差値


統計的仮説検定(z検定、t検定、フィッシャーの正確検定、分散分析、カイ二乗検定)

線形モデリング(単回帰分析、重回帰分析、ロジスティック回帰分析)

縮約(因子分析、クラスター分析)

分析のための技術

・データ操作に特化したSQL

・データ操作からPython、R、SAS

・SQLとその他言語(Python、R、SAS)の使い分けに関する考え方

・機械学習ライブラリの紹介(Pythonのみ)

Data Analytics Training
実務研修

SQL -基本操作

・選択、挿入、更新、削除

・テーブル作成・削除

・既存テーブルの問い合わせ結果からテーブル作成

・結合、マージ

・集合関数 GROUP BY

SQL -分析前処理

・サンプリング

・統計量の算出

・順位の算出

・データ分割(学習用とテスト用)

・アンダーサンプリングとオーバーサンプリング

・縦持ち・横持ち変換

・数値⇔文字列型の変換

・正規化、標準化

・外れ値の確認と対応(除去、CAP、FLOOR)

・欠損値の対応(除去、定数補完、平均値補完)

・カテゴリ値のダミー変数化

・日付データの表示形式変換


Python

・Anacondaと機械学習ライブラリ「scikit-learn」のインストール

・Pythonを使ったデータ処理(SQLと同じことを実践)

・Pythonで統計的仮説検定(t検定、カイ二乗検定)

・Pythonで線形モデリング(重回帰分析による数値予測、ロジスティック回帰による2値判別)

・PythonでPythonで縮約分析(k-meansでクラスタリング分析、主成分分析で次元圧縮と可視化)


分析演習

・重回帰問題/判別問題への取り組みと可視化を含めたレポーティング

・SASを使ったデータ処理(SQLと同じ内容を実践)

・Rを使ったデータ処理(SQLと同じ内容を実践)