有 料 講 座
データの活用・分析スキル育成プログラム

データサイエンス分析プロジェクトの進め方

受講料20,000円(税別)

学習時間の目安8時間

受講期間90日間

講座概要

皆さんの中で、「データサイエンス分析プロジェクトは決まったステップがあって、その通りやれば成果が出る」と思っている方はいませんか?実際には、データサイエンスのプロジェクトは「やってみないとわからない」という性質があり、それが一般的なプロジェクトとは異なるポイントになっています。本講座では、データサイエンスのプロジェクトを進めるうえで、どのような作業が発生するのかを理解していただき、マネジメントや業務を依頼するうえで重要なポイントを理解することがゴールです。そのためにビジネス課題から議論をスタートし、どのように考えて分析を行うかをケースを用いながら説明していきます。また、PythonとRを使ってどのように分析作業を行うのかも具体的に説明していきます。

学習目標

  • データサイエンスプロジェクトのステップを理解する
  • 機械学習を使ったデータ分析の作業ステップや押さえるべきポイントを理解する
  • Pythonで機械学習を用いたモデル構築方法を理解し、実行できる
  • ビジネスにおける統計学の使いどころを具体的に理解する
  • Rで仮説検定や回帰分析といった統計解析手法を実行することができる

講座内容

  • 機械学習-はじめに
    • イントロ〜講義の進め方について
    • 機械学習の分類
  • 予測モデルの構築プロセスの全体像
    • 予測モデルの構築プロセスの全体像
  • ビジネス課題から分析課題への翻訳
    • ビジネス課題から分析課題への翻訳
  • データの準備
    • データの準備
  • データ前処理
    • データ前処理の目的
    • Pythonを使ったデータ読み込み
    • データ理解のポイント ①要約統計量の確認
    • Pythonを使ったデータ理解 - ①要約統計量の確認
    • データ理解のポイント ②分布の確認
    • Pythonを使ったデータ理解 - ②分布の理解
    • データ理解のポイント - ③欠損値の確認
    • Pythonを使ったデータ理解 - ③欠損値の確認
    • データ加工のポイント
    • Pythonを使ったデータ加工 - ①文字列からデータ抽出
    • Pythonを使ったデータ加工 - ②カテゴリ変数の処理
    • Pythonを使ったデータ加工 – ③新たな特徴量を作成
  • モデルの構築
    • モデルの構築
    • Pythonによるモデリング
  • モデルの性能評価
    • モデルの性能評価の指標
    • Pythonによるモデルの性能評価
  • 機械学習-まとめ
    • ここまでのまとめ
  • 統計学-はじめに
    • ビジネスにおける統計学の使いどころと学び方
    • 統計学とは何か?
  • 分析例
    • 分析例① - データ可視化で課題を発見する
    • 推測統計学の手法を使った分析の例
  • 統計モデリング
    • 統計モデリングの基本的な考え方
  • 確率分布
    • Rでの確率分布と乱数の使い方
    • 確率分布の数式
    • ポアソン分布
    • 正規分布
    • 正規分布と二項分布、ポアソン分布の関係
    • 指数分布
    • 一様分布
  • 仮説検定
    • おさらい!仮説検定の考え方
    • Rで簡単!t検定のやり方
    • 2群のt検定
    • Rで簡単!2群のt検定のやり方
    • 仮説検定でよくある疑問
    • サンプルサイズの決め方
  • 回帰分析
    • 線形回帰モデルのコンセプト
    • まずは練習!Rで単回帰分析をやってみよう
    • 説明力のある変数はどれか?
    • 当てはまりの良さを表す「決定係数」
    • 実務でもよく使う重回帰分析
    • モデル選択 - どの説明変数を残すか?
    • カテゴリデータをモデルに組み込むには?
    • なんか変だなと思ったら - 多重共線性を疑え!
    • 線形回帰分析を使った予測
    • グループに分けて回帰分析を行う
    • Rでの重回帰分析の実行方法

講師紹介

堅田 洋資 | Yosuke Katada
(代表取締役社長/データサイエンティスト)
データサイエンティスト育成スクールを運営するデータミックスの代表。これまで数百人以上の社会人に対して、データサイエンスの教育を行ってきた。その他、大企業からベンチャーまでデータ分析プロジェクトの支援、データ分析チームの立ち上げの支援を行う。データミックスの創業前は、ニュースアプリベンチャーでデータサイエンティスト、監査法人トーマツにてデータ分析コンサルタント、生体センサスタートアップでサービス・アルゴリズム開発の取締役、KPMG FASにて事業再生コンサルタント、外資系メーカーでの経理・マーケティングなど幅広い経験を持つ。
学 歴
University of San Francisco, M.S. in Analytics修了
一橋大学商学部卒業(統計学・データサイエンス専攻)
著 作
「フリーライブラリで学ぶ機械学習入門」(秀和システム)
「直感でわかる! Excelで機械学習」 (インプレス)

講座の一部をご紹介

前提条件

Pythonで条件分岐や繰り返し処理など簡単なプログラムを実行することができる

Rで条件分岐や繰り返し処理など簡単なプログラムを実行することができる

修了条件

課題内容
各章問題:選択式の問題
修了条件
得点率60%以上
受講可能期間
90日間

※24時間×90日たつと講座の受講・閲覧はできなくなります。

※本講座は「開始日可変」講座です。

gaccoについて

最高の講師陣による本気の授業

提供するのは、最高の講師陣(大学教授等)による本気の講義。

最先端かつ最高の知識を学ぶことができます。

講義は、ネットで受講しやすいよう、1本あたり10分程度にまとまっています。

いつでもどこでも、スマホでも学習できる

忙しいビジネスパーソンでも、スキマ時間を活かして学習できます。

講座ご購入の流れ
ご受講の流れ

※1 受講期間は開講期間中に限られます。インターネット環境とパソコン・スマートフォン等が必要になります。

※2 受講した講座の修了証であり、大学の単位、公的資格等を証明するものではありません。

ご受講の際の注意
  • 受講にはgaccoへの登録が必要です。
  • 新規登録の方は「新規会員登録」ボタンより登録してください。
  • gaccoにログインした状態で「受講」ボタンを押すと、「ページが見つかりません」エラーになる場合があります。一度ログアウトしてから「受講」ボタンを押してください。
  • システムメンテナンス予定
  • メンテナンス期間中は、アクセスできなくなる時間が発生します。あらかじめご了承ください。
  • TOP